NVIDIA GEFORCE RTX 3080 Revisión: Ampere es un monstruo de juegos


El CEO de NVIDIA, Jensen Huang, presentó oficialmente la serie GeForce RTX 30 basada en la arquitectura Ampere de la compañía hace un par de semanas, con mucha fanfarria. Según Jensen, que posee más espátulas de las que debería tener cualquier ser humano, la serie GeForce RTX 30 representa el mayor salto generacional en la historia de la empresa. Durante la presentación, Jensen afirmó que la GeForce RTX 3080 ofrecería el doble de rendimiento que su predecesora, con una mayor eficiencia, y contaría con tecnología de punta en todo su diseño, desde el empaque de su chip hasta su PCB, una nueva solución de enfriamiento y su memoria GDDR6X.

Después de la presentación y las sesiones informativas de seguimiento posteriores, obviamente estábamos ansiosos por tener en nuestras manos la GeForce RTX 3080. Entonces, después de un breve desempaquetado y recorrido cuando llegó, la instalamos en nuestro equipo de prueba y nos metimos de lleno. páginas por delante, tenemos una gran cantidad de datos compartidos con respecto a Ampere, la GeForce RTX 3080 y un montón de competidores arriba y abajo de la pila de NVIDIA y AMD. Y usamos el término competidores de manera vaga aquí cuando vea los números, se dará cuenta de que la GeForce RTX 3080 no tiene competencia, al menos por ahora.

Aquí está ese recorrido rápido por la GeForce RTX 3080 si eres del tipo que excava el video sobre la palabra escrita. Sin embargo, por muy atractiva que sea la tarjeta, en nuestra opinión, la verdadera belleza radica en los puntos de referencia. Será mejor que dejemos de bromear y nos pongamos manos a la obra…

NVIDIA GeForce RTX 3080
Especificaciones y características

Encuentre la GeForce RTX 3080 en Amazon.com


Arriba hay una comparación detallada de las especificaciones entre la nueva GeForce RTX 3080 basada en Ampere y sus predecesoras basadas en Turing, la GeForce RTX 2080 y 2080 Super. Sin embargo, antes de profundizar, sugerimos consultar algunos artículos anteriores para sentar las bases del producto que cubriremos aquí hoy. Sería ideal leer detenidamente nuestra cobertura del anuncio inicial de la serie GeForce RTX 30 de NVIDIA y la inmersión más profunda en sus nuevas funciones y arquitectura Ampere. Sin embargo, si no tienes tiempo para eso, resumiremos gran parte del nuevo mojo de Ampere nuevamente aquí.

GeForce RTX 3080 y GeForce RTX 2080 Super

Como puede ver en la tabla anterior, la GeForce RTX 3080 es más grande y robusta que la RTX 2080/2080 Super en casi todos los sentidos, excepto en dos, la RTX 3080 tiene menos núcleos Tensor y un reloj de impulso predeterminado más bajo. Sin embargo, los recursos adicionales de las GPU son más que suficientes para compensar el reloj de impulso predeterminado más bajo, y los núcleos Ampere Tensor ofrecen más del doble de rendimiento y admiten tipos adicionales de matemáticas. En términos de tasa de llenado, ancho de banda de memoria y rendimiento informático, la GeForce RTX 3080 es significativamente más potente.

Diagrama de bloques GA102, con SM magnificado
La GPU GA102 en el corazón de la GeForce RTX 3080 incluye 28 mil millones de transistores en su matriz de 628,4 mm 2 y está fabricada en un proceso Samsung personalizado de 8 nm (8N). El Turing TA102 de la generación anterior que alimentaba el RTX 2080 usaba un proceso FinFET de 12 nm y empaquetaba menos de la mitad de la cantidad de transistores.

Todos esos transistores adicionales se usaron para mejorar el rendimiento de Amperes para prácticamente todos los tipos de cargas de trabajo que puede ejecutar en las GPU. Las arquitecturas de la generación anterior, antes de Turing, tenían solo una ruta de datos, por ejemplo. Con Turing, NVIDIA agregó una segunda ruta de datos matemática: una para coma flotante y otra para números enteros. Pero con Ampere, esa segunda ruta Integer se ha aumentado aún más con una unidad FP32 adicional, por lo que las cargas de trabajo pesadas de coma flotante tienen muchos más recursos disponibles.

Los núcleos RT de segunda generación también se han optimizado para un mejor rendimiento. Los 68 núcleos RT de la GeForce RTX 3080 (frente a los 48 de la 2080 Super) ofrecen un rendimiento de sombreado de hasta 29,8 TFLOPS (frente a 11,2 en Turing), RT-TFLOPS de hasta 58 (frente a 34 RT-TFLOPS en Turing) , y los núcleos Tensor ofrecen hasta 238 TFLOPS de Int8, frente a 89.

Los multiprocesadores de transmisión en Ampere también se han modificado. Los nuevos Ampere SM duplican el ancho de banda L1 y el tamaño de la partición de caché y agregan un 33 % más de capacidad L1, hasta 8704 KB. Además, los núcleos RT (trazado de rayos) de segunda generación de Ampere pueden procesar tasas de intersección de triángulos al doble de la velocidad de Turing y sus núcleos Tensor de tercera generación duplican el rendimiento matemático para matrices dispersas (una matriz en la que la mayoría de los elementos son cero) y admite muchos más tipos matemáticos y niveles de precisión.

Al analizar las características de rendimiento de Turing, NVIDIA descubrió que a menudo tenía buenas tasas de intersección de Bounding Box, pero las tasas de Triangle Intersection estaban frenando las cosas. Con Ampere, NVIDIA quería poder procesar las tasas de intersección de Bounding Box y Triangle en paralelo. Por lo tanto, Ampere desglosa los recursos de Bounding Box y Triangle para ejecutarse en paralelo y, junto con los recursos de GPU adicionales disponibles, las tasas de Triangle Intersection terminan siendo aproximadamente el doble de rápidas. También se ha agregado una nueva unidad de interpolación de posición triangular a Ampere para ayudar a producir efectos de desenfoque de movimiento más precisos.

La GeForce RTX 3080 basada en Ampere de gama alta y la próxima GeForce RTX 3090 también cuentan con la memoria GDDR6X de vanguardia de Microns (la 3070 que viene el próximo mes usa DDR6 estándar), que ofrece un ancho de banda significativamente mayor. GDDR6X utiliza una nueva señalización PAM4 de 4 niveles que puede transmitir el doble de datos por reloj, duplicando efectivamente el ancho de banda. Las GeForce de gama alta basadas en Ampere utilizarán memoria GDDR6X de hasta 19 Gbps. En la GeForce RTX 3080, que cuenta con una interfaz de memoria de 320 bits, eso significa que la GPU tiene hasta 760 GB/s de ancho de banda a su disposición frente a los 496 GB/s de la RTX 2080 Super.

Notarás que no hemos hablado mucho sobre SLI o multi-GPU con Ampere. Y eso es porque solo la GeForce RTX 3090 lo admite. La GPU GA102 tiene una nueva interfaz NVLink de tercera generación, que incluye cuatro enlaces x4, cada uno de los cuales proporciona hasta 14,0625 GB/s de ancho de banda bidireccional, para un total de 56,25 GB/s de ancho de banda bidireccional o 112,5 GB/s en total ancho de banda agregado entre dos GPU. Se pueden vincular dos GeForce RTX 3090 para operar en SLI, pero las configuraciones SLI de 3 y 4 vías no son compatibles.

Ampere también cuenta con una interfaz nativa PCIe Gen 4 y algunas nuevas capacidades de decodificación de video. El GA102 tiene el mismo motor de codificación NVENC de séptima generación que Turing, pero tiene un motor NVDEC de quinta generación más nuevo. El decodificador de 5.ª generación de NVIDIA admite la decodificación acelerada por hardware de los códecs MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 y AV1. Ese soporte AV1 es completamente nuevo y convierte a Ampere en la primera GPU compatible con la decodificación AV1 en el hardware de envío.

Con un chip tan grande, potente y complejo, NVIDIA realizó algunas modificaciones importantes en un intento de aumentar también la eficiencia energética. Con las arquitecturas de generaciones anteriores, NVIDIA tenía un riel de alimentación común para los núcleos de GPU y el controlador de memoria. Un diseño de un solo riel significaba que si los núcleos dejaban de funcionar a alto voltaje, la memoria también tenía que hacerlo. Eso cambia con Ampere, sin embargo. Con Ampere, NVIDIA ha dividido los rieles de energía del núcleo y la memoria en dominios separados, para que puedan operar de manera independiente. Los rieles eléctricos duales deberían permitir una mayor conservación de energía, lo que en última instancia significa mejores características térmicas y de potencia.

Para ayudar a garantizar que la parte térmica de la historia de la eficiencia sea buena, NVIDIA diseñó una solución de enfriamiento interesante para sus tarjetas de la serie GeForce RTX 30. El enfriador de la GeForce RTX 3080 cuenta con dos ventiladores axiales y un diseño de disipador de calor dividido que es más silencioso que las soluciones de la generación anterior, al tiempo que ofrece la capacidad de disipar hasta 90 vatios más de potencia. Un extremo de la matriz del disipador de calor se encuentra directamente encima de una cámara de vapor, que se fija a la GPU y la memoria. El ventilador encima de esa sección dirige el aire a través del disipador de calor y lo canaliza inmediatamente fuera del chasis a través de grandes orificios de ventilación en el soporte de la carcasa. Sin embargo, el disipador de calor en la mitad posterior de la tarjeta, que está conectado a la cámara de vapor frontal a través de tubos de calor, permite que el aire del segundo ventilador pase por completo, donde sube a la parte superior del chasis y finalmente se agotado, suponiendo que la caja del sistema tenga la ventilación adecuada.

El conector mini de 12 pines y el adaptador incluido
El nuevo enfriador de paso empujar/jalar de la GeForce RTX 3080 funciona en conjunto con un diseño de PCB más denso que tiene un borde trasero único en forma de V. La GeForce RTX 3080 de NVIDIA también cuenta con un conector de alimentación miniaturizado de 12 pines, aunque la mayoría de las placas asociadas que hemos visto usan los conectores PCIe tradicionales comunes en la actualidad. NVIDIA incluye un adaptador con su RTX 3080 que convierte un par de conectores PCIe de 8 pines al nuevo diseño mini de 12 pines, y nos dicen que los fabricantes de fuentes de alimentación también ofrecerán cables modulares con el nuevo conector.

En términos de salidas, la GeForce RTX 3080 tiene tres DisplayPorts de tamaño completo y una única salida HDMI. El conector USB-C de las tarjetas Turing de alta gama, que estaba diseñado para facilitar la conexión a los auriculares VR, no se usaba con frecuencia, por lo que NVIDIA lo rechazó. Sin embargo, debemos tener en cuenta que se trata de un puerto HDMI 2.1. La compatibilidad con HDMI 2.1 permite 4K120P con G-Sync en algunos de los últimos televisores OLED y permite 8K con un solo cable.

Aún más funciones con la serie RTX 30

La serie GeForce RTX 30 también admite una nueva característica llamada RTX IO. RTX IO minimiza la sobrecarga de la CPU al procesar datos de SSD rápidos y reduce las cargas de trabajo que solían requerir múltiples núcleos de CPU a un solo núcleo, liberando recursos para trabajar en otras cosas. Con los últimos SSD PCIe Gen 4 capaces de transferencias de ~7 GB/s, transferir datos hacia y desde las unidades y comprimirlos/descomprimirlos puede requerir una cantidad significativa de potencia de CPU. RTX IO interactúa con la próxima API de DirectStorage que llegará a DirectX para superar este posible cuello de botella, al aprovechar los recursos centrales de GPU para la compresión y descompresión y transmitir datos directamente a la memoria de GPU.

Sin embargo, debemos tener en cuenta que para usar RTX IO y DirectStorage, los juegos deberán diseñarse para admitir la función, y no hay juegos disponibles en este momento. Sin embargo, teniendo en cuenta que una tecnología similar llegará a ambas consolas de próxima generación, es una apuesta segura que los desarrolladores de juegos saltarán por todas partes ahora que algo similar estará disponible en la PC también.

NVIDIA también anunció NVIDIA Reflex durante la presentación de la serie GeForce RTX 30. NVIDIA Reflex es una tecnología de reducción de latencia que está diseñada para optimizar la latencia de un extremo a otro, a menudo denominada retraso de entrada o latencia de entrada. NVIDIA Reflex agiliza varios pasos a lo largo de la canalización de renderizado para hacer un uso más eficiente de los recursos de CPU y GPU, minimizar la sobrecarga del controlador y, según NVIDIA, reducir la latencia hasta en un 50 %. El modo de baja latencia NVIDIA Reflex se está integrando actualmente en algunos juegos de deportes electrónicos, como Apex Legends, Call of Duty: Warzone, Fortnite y Valorant, pero es probable que lleguen otros.

NVIDIA Broadcast también llegará a las GPU RTX. NVIDIA Broadcast es un complemento que aprovecha la GPU y la IA para mejorar la calidad de audio y video, y ofrece cosas como reducción de ruido, seguimiento de cámara y fondos virtuales. NVIDIA Broadcast debería estar disponible para descargar pronto y es compatible con cualquier GPU habilitada para RTX, tanto Turing como Ampere.

Ir arriba