NVIDIA GEFORCE RTX 3090 Revisión: Benchmarks de BFGPU desatado -

¿Qué sucede cuando toma la robusta GPU que alimenta la GeForce RTX 3080, habilita un par de miles de núcleos más, amplía la interfaz de memoria, más del doble de la capacidad de memoria, aumenta las capacidades de texturizado y equipa a la bestia con un silencioso, de gran tamaño y alto? enfriador de rendimiento? Bueno, bueno te cuento. Terminas con la GeForce RTX 3090, o BFGPU, como la llamó el CEO de NVIDIA, Jensen Huang, durante su presentación oficial. Si no está familiarizado con la referencia de Doom BFG allí, le dejaremos buscarla. Tenga la seguridad de que el BF no significa Mejor Amigo.

Como quieras llamar a la GeForce RTX 3090, una cosa es segura. A partir de este momento, la GeForce RTX 3090 es la tarjeta gráfica más poderosa que el dinero puede (casi) comprar. Actualmente se encuentra en el pináculo de la pila de productos de NVIDIA y, según la compañía, permite cosas como juegos fluidos de 8K y procesamiento sin problemas de cargas de trabajo de creación de contenido masivo, gracias en parte a sus 24 GB de memoria GDDR6X integrada.

Sin embargo, una tarjeta gráfica como la GeForce RTX 3090 no es para todos. Aunque su precio de venta es aproximadamente $ 1,000 más bajo que su contraparte Titan RTX basada en Turing de la generación anterior, todavía está fuera del alcance de la mayoría de los usuarios. Y las características de rendimiento de la GeForce RTX 3090 probablemente harán que su propuesta de valor sea interesante solo para un grupo selecto de entusiastas y creadores. Bueno, haga todo lo posible para explicar mejor todo eso en las páginas siguientes. Por ahora, echemos un vistazo a las especificaciones e inspeccionemos esta bestia grande y hermosa…

NVIDIA GeForce RTX 3090

Especificaciones y características

Encuentre la tarjeta GeForce RTX 3090 en Amazon.com

Aunque NVIDIA ha calificado esta tarjeta como GeForce RTX 3090, es esencialmente el reemplazo de la Titan RTX de la generación anterior. Como tal, no es puramente una GPU enfocada en juegos. Según NVIDIA, la demanda de los distintos Titans fue más alta de lo previsto, por lo que con esta generación, además de venderlos directamente, NVIDIA está trabajando con socios de placas para ampliar la disponibilidad, por lo que también ofrecerán tarjetas de la serie GeForce RTX 3090. .

Sin embargo, antes de profundizar más en las velocidades y los feeds, debemos dirigir su atención a algunos artículos anteriores. Ya hemos cubierto gran parte de la tecnología subyacente en el corazón de la GeForce RTX 3090, por lo que no lo volveremos a hacer aquí. Sin embargo, si desea un poco de historia de fondo, le recomendamos que consulte nuestra cobertura del anuncio inicial de la serie GeForce RTX 30 de NVIDIA, la inmersión más profunda en sus nuevas características y la arquitectura Ampere, y las revisiones de GeForce RTX 3080 de las últimas semanas. Una vez que haya digerido todo eso, comprenderá gran parte de lo que se trata la GeForce RTX 3090.

Velocidad y alimentación de NVIDIA GeForce RTX 3090

Como puede ver en el desglose detallado de las especificaciones y la comparación anterior, la nueva GeForce RTX 3090 con tecnología GA102 está mejorada y es más capaz que la Titan RTX de la generación anterior en casi todos los sentidos, excepto en dos. La GeForce RTX 3090 tiene un reloj de impulso predeterminado más bajo y menos núcleos Tensor. Sin embargo, la arquitectura más nueva del GA102 y los recursos adicionales compensan con creces la frecuencia de refuerzo predeterminada más baja, y los núcleos Tensor de tercera generación de Amperios duplican con creces el rendimiento de la generación anterior, además de admitir tipos adicionales de matemáticas, como BLfoat16 (BF16) y TensorFloat-32 (TF32). En lo que respecta a la tasa de relleno de píxeles y texturas, el ancho de banda de la memoria y el rendimiento informático, la GeForce RTX 3090 es significativamente más poderosa que la Titan RTX basada en Turing, o cualquier otra cosa.

La GPU GA102 tiene un tamaño de matriz de 628,4 mm 2 y está compuesta por aproximadamente 28 000 millones de transistores. Los chips también se fabrican con un proceso Samsung de 8nm (8N) más nuevo y personalizado que sus contrapartes basadas en Turing de la generación anterior, que usaban un proceso FinFET de 12nm a TSMC. Tenga en cuenta que, a pesar de incluir casi 10 000 millones de transistores más, el tamaño de matriz del GA102 es aproximadamente 126 mm 2 más pequeño, gracias a ese proceso más avanzado.

Como mencionamos en nuestra anterior serie GeForce RTX 30 y cobertura Ampere, todos esos transistores adicionales se usaron para habilitar nuevas funciones, como la compatibilidad con PCIe Gen 4, y mejorar el rendimiento de Ampere para prácticamente todas las cargas de trabajo vinculadas a GPU. Antes de Turing, las arquitecturas GPU de NVIDIA tenían solo una ruta de datos, por ejemplo. Sin embargo, se agregó un segundo con Turing: uno para coma flotante y otro para enteros. Y con Ampere, esa segunda ruta de enteros se ha reforzado con una unidad FP32 adicional, por lo que las cargas de trabajo pesadas de punto flotante tienen mucha más potencia a su disposición.

Los núcleos RT (trazado de rayos) de segunda generación de amperios también se han optimizado para un mejor rendimiento. Los 82 núcleos RT de la GeForce RTX 3090 (frente a los 72 de la Titan RTX) ofrecen hasta 35,6 TFLOPS de rendimiento informático en múltiples niveles de precisión (frente a 16,3 32,6 TFLOPS en Turing) y los núcleos Tensor de tercera generación ofrecen hasta 284 TFLOPS de rendimiento Int8, frente a 261 en Titan RTX (el doble de esos números para Int4). También debemos señalar que los núcleos RT de segunda generación ofrecen el doble de la tasa de intersección de triángulos de Turing y los núcleos Tensor de tercera generación duplican el rendimiento matemático para matrices dispersas, por ejemplo, matrices en las que la mayoría de los elementos son cero.

La configuración de NVIDIA GA102s SM (Streaming Multiprocessor) también se ha renovado por completo. Los nuevos SM de Amperes duplican el ancho de banda L1 y el tamaño de la partición de caché y agregan un 33 % más de capacidad L1, hasta 10 496 KB en la GeForce RTX 3090.

NVIDIA descubrió que Turing a menudo tenía buenas tasas de intersección de Bounding Box, pero las tasas de intersección de triángulos eran un factor limitante con algunas cargas de trabajo, por lo que Ampere también llamó la atención en ese sentido. Ampere ahora puede procesar las tasas de intersección de Bounding Box y Triangle en paralelo para mejorar la eficiencia y el rendimiento, y gracias a los recursos de GPU adicionales disponibles, las tasas de intersección de Triangle ahora también son aproximadamente el doble de rápidas. También se ha agregado una nueva unidad de interpolación de posición triangular, que permitirá efectos de desenfoque de movimiento más precisos en futuras aplicaciones habilitadas para RTX.

Tecnología de refrigeración y memoria de última generación

Al igual que la GeForce RTX 3080, la GeForce RTX 3090 está equipada con la última tecnología de memoria GDDR6X de Microns (la próxima GeForce RTX 3070 utilizará GDDR6 estándar), que ofrece un ancho de banda mucho mayor. GDDR6X aprovecha la señalización PAM4 de 4 niveles que puede transmitir el doble de datos por reloj, duplicando efectivamente el ancho de banda por pulso. La primera ola de GeForces insignia basadas en Ampere empleará memoria GDDR6X con velocidades de datos de hasta 19,5 Gbps. Específicamente en la GeForce RTX 3090, que cuenta con 24 GB de memoria integrada, vinculada a la GPU a través de una interfaz de memoria de 384 bits, eso equivale a 936 GB/s de ancho de banda máximo, frente a los 672 GB/s de la Titan RTX. También es mucho más ancho de banda que la GeForce RTX 3080s 760GB/s.

La GPU GA102 tiene una nueva interfaz NVLink de tercera generación, que incluye cuatro enlaces x4, cada uno de los cuales proporciona hasta 14,0625 GB/s de ancho de banda bidireccional, para un total de 56,25 GB/s de ancho de banda bidireccional o 112,5 GB/s en total ancho de banda agregado entre dos GPU. Sin embargo, la GeForce RTX 3090 es actualmente la única tarjeta de la serie RTX 30 con esos enlaces. Se pueden vincular dos GeForce RTX 3090 para operar en los modos SLI tradicionales, pero las configuraciones SLI de 3 y 4 vías no son compatibles. Además, NVIDIA ha revelado que el desarrollo futuro de SLI se trasladará a los desarrolladores de juegos, en lugar de los perfiles basados en controladores.

Sin embargo, las mejoras introducidas con Ampere no tienen que ver con el rendimiento. NVIDIA también modificó algunas cosas para mejorar la eficiencia general. Por ejemplo, con arquitecturas de generaciones anteriores, NVIDIA tenía un riel de alimentación tanto para los núcleos de GPU como para el controlador de memoria. Un diseño de un solo riel significaba que si un recurso quería operar a alto voltaje, el otro también tenía que hacerlo. Sin embargo, con Ampere, NVIDIA bifurcó los rieles de energía del núcleo y la memoria en fuentes separadas, para que puedan operar de manera independiente. Los rieles de alimentación duales deberían permitir un control más detallado y ahorros de energía, lo que en última instancia significa mejores características térmicas y de potencia.

Hablando de térmicas, tenemos que hablar de la solución de refrigeración GeForce RTX 3090s. El enfriador de la GeForce RTX 3090 se parece y tiene una configuración similar a la de la 3080, pero es más grande y más capaz. De hecho, la RTX 3090 es una tarjeta de tres ranuras, la primera en un diseño construido por NVIDIA.

El enfriador GeForce RTX 3090s está equipado con ventiladores axiales duales y un diseño de disipador de calor dividido que es más silencioso que las soluciones de la generación anterior, mientras que es capaz de disipar hasta 90 vatios más de potencia. Un extremo del disipador de calor está conectado a una cámara de vapor, que está montada directamente en la GPU y la memoria. El ventilador encima de esa sección dirige el aire a través del disipador de calor y lo canaliza inmediatamente fuera del chasis a través de grandes orificios de ventilación en el soporte de la carcasa. El disipador de calor en la mitad posterior de la tarjeta, que está conectado a la cámara de vapor frontal a través de múltiples tubos de calor, permite que el aire del segundo ventilador pase por completo, donde sube a la parte superior del chasis y finalmente se agotado de un sistema, suponiendo que tenga una ventilación decente.

¿Quién es el titán ahora?

El diseño del refrigerador pasante de la GeForce RTX 3090 funciona junto con una PCB más densa y corta que tiene un conector de alimentación miniaturizado de 12 pines, como la GeForce RTX 3080 Founders Edition. NVIDIA incluye un adaptador con las tarjetas que convierte un par de conectores PCIe tradicionales de 8 pines al nuevo diseño mini de 12 pines en caso de que necesite uno, y nos dicen que los fabricantes de fuentes de alimentación también ofrecerán cables modulares con el nuevo conector. . Sin embargo, no todos los socios de placas de NVIDIA han adoptado el conector mini de 12 pines y mantendrán los conectores de 8 pines de tamaño completo en sus tarjetas.

Al igual que la RTX 3080, la GeForce RTX 3090 tiene tres DisplayPorts de tamaño completo (1.4a) y una única salida HDMI. El conector USB-C en las tarjetas Turing de gama alta, que estaba destinado a usarse con auriculares VR, no se usaba con frecuencia, por lo que NVIDIA lo rechazó con la serie RTX 30. Debemos señalar que el puerto HDMI cumple con el estándar 2.1, que permite 4K120P con G-Sync en algunos de los últimos televisores y pantallas OLED, así como una resolución de 8K con un solo cable.

La GPU GA102 está equipada con el mismo motor de codificación NVENC de séptima generación que Turing, pero tiene un motor NVDEC de quinta generación más nuevo. El nuevo decodificador de quinta generación admite la decodificación acelerada por hardware de los códecs MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 y AV1. Y hay mucho más para mencionar, como RTX IO, la tecnología de reducción de latencia NVIDIA Reflex, la aplicación de mezclador asistida por IA Omniverse Machinima y el complemento de mejora de audio y video NVIDIA Broadcast para creadores y transmisores. Cubrimos todo eso en nuestras revisiones de RTX 3080 y pieza de arquitectura Ampere. Accede a esta URL si quieres esos detalles.

Ahora pasemos a algunos números…