Conecta con nosotros

A Fondo

NVIDIA AD102 frente a NVIDIA GA102, un vistazo a la GPU más potente que existe

Publicado

el

NVIDIA AD102

Ayer fue el gran día, NVIDIA presentó las GeForce RTX 40 y centró el evento en dos modelos muy esperados, la GeForce RTX 4090, que se convertirá en la tarjeta gráfica más potente del mercado, y la GeForce RTX 4080, que estará disponible en dos configuraciones, una equipada con 12 GB de memoria gráfica y otra con 16 GB. La segunda también será más potente, ya que contará con una mayor cantidad de shaders y tendrá un bus de memoria más ancho.

Durante el evento de ayer NVIDIA centró sus esfuerzos en mostraros los avances tecnológicos más importantes de esta nueva generación de tarjetas gráficas, entre los que podemos destacar el enorme aumento de rendimiento en trazado de rayos y la llegada de DLSS 3.0, una tecnología que no tiene rival y que demuestra que al final la apuesta por el hardware especializado y la inteligencia artificial aplicada al gaming fue todo un acierto por parte de NVIDIA.

La presentación fue muy interesante y ya os la contamos ayer con todo lujo de detalles, pero hoy quiero compartir con vosotros un artículo dedicado a profundizar en el núcleo gráfico AD102, un chip que da vida a la GeForce RTX 4090 y que está fabricado en el nodo de 5 nm de TSMC. Comparado con el GA102 representa un salto tecnológico importante, y gracias a las mejoras que trae a nivel de arquitectura y de tecnologías de última generación es capaz de cuadriplicar su rendimiento.

NVIDIA AD102 frente a NVIDIA GA102

El chip NVIDIA AD102 es el núcleo gráfico más potente y avanzado que existe en el mercado de consumo general. Su densidad de transistores es impresionante, no en vano llega casi a triplicar al núcleo gráfico GA102, y supera en más del doble el rendimiento de este en FP32. También hay una gran distancia en lo que respecta al nodo de fabricación y al conteo de shaders, como podemos ver en la comparativa que encontraréis justo debajo de estas líneas:

NVIDIA AD102

NVIDIA AD102

  • Arquitectura Ada Lovelace.
  • Fabricado en el nodo de 5 nm de TSMC.
  • 76.300 millones de transistores.
  • 18.176 shaders.
  • 568 unidades de texturizado.
  • 568 núcleos tensor de cuarta generación.
  • 192 unidades de rasterizado.
  • 142 núcleos RT de tercera generación.
  • Bus de memoria de 384 bits.
  • 90 TFLOPs de potencia en FP32.
  • Configurable con hasta 48 GB de memoria GDDR6 con ECC.
  • Interfaz PCIe Gen4 x16.

NVIDIA GA102

  • Arquitectura Ampere.
  • Fabricado en el nodo de 8 nm de Samsung.
  • 28.300 millones de transistores.
  • 10.752 shaders.
  • 336 unidades de texturizado.
  • 336 núcleos tensor de tercera generación.
  • 112 unidades de rasterizado.
  • 84 núcleos RT de segunda generación.
  • Bus de memoria de 384 bits.
  • 40 TFLOPs de potencia en FP32 (GeForce RTX 3090 Ti).
  • Configurable con hasta 48 GB de memoria GDDR6 con ECC.
  • Interfaz PCIe Gen4 x16.

En términos brutos las diferencias entre la GPU NVIDIA AD102 y la NVIDIA GA102 son enormes, y esto ha permitido uno de los mayores saltos generacionales que hemos visto en los últimos años. Con Ada Lovelace el gigante verde ha bajado de 8 nm a 5 nm, ha llegado casi a duplicar el número de shaders y ha introducido núcleos RT de tercera generación y núcleos tensor de cuarta generación.

Los núcleos RT de tercera generación ofrecen una potencia de hasta 200 TFLOPs con trazado de rayos, y doblan la tasa de cálculo de intersecciones rayo-triángulo frente a los núcleos RT de segunda generación. Esto ya representa una mejora importante, pero debemos añadir además el valor diferencial que representa la tecnología SER, siglas de «Shader Execution Reordering», que se encarga de reordenar los hilos de trabajo para mejorar la paralelización tanto a nivel de shaders como de núcleos RT. En total, gracias a ambas novedades el chip NVIDIA AD102 sería capaz de triplicar el rendimiento en trazado de rayos frente al GA102.

Con los núcleos tensor de cuarta generación tenemos otra gran evolución generacional. Estos alcanzan una potencia de 1.400 TFLOPs en operaciones de inteligencia artificial y aprendizaje profundo, y son compatibles con la tecnología Optical Flow Accelerator, que como os contamos en su momento es el pilar central sobre el que se construye NVIDIA DLSS 3, una técnica de reconstrucción y reescalado inteligente de la imagen que ha vuelto a llevar a NVIDIA a lo más alto, y que deja claro que los de verde no tienen rival.

A nivel de frecuencias de trabajo, NVIDIA también ha conseguido un aumento considerable con el chip AD102. La versión que ha utilizado la GeForce RTX 4090 alcanza los 2.610 MHz en modo turbo. A efectos comparativos basta recordar que la GeForce RTX 3090 tiene un modo turbo de 1.695 MHz, lo que nos deja un incremento de casi 1 GHz.

Podríamos pensar que todas estas mejoras a nivel tecnológico y de rendimiento han tenido un impacto enorme en el consumo, pero al final la cosa no ha sido para tanto. La GeForce RTX 4090, que será la primera en utilizar el núcleo gráfico NVIDIA AD102, tendrá un TGP de 450 vatios por defecto, el mismo que la GeForce RTX 3090 Ti.

NVIDIA sigue marcando el ritmo a seguir

No os voy a mentir, desde el momento en el que empezaron a aparecer las primeras filtraciones mi interés por las GeForce RTX 40 se disparó, y es normal, los que nos leéis a diario ya sabéis que el hardware es mi gran pasión. Tenía las expectativas muy altas, y debo decir que la presentación que hizo ayer NVIDIA logró superarlas por completo, sobre todo por las mejoras centradas en la especialización, es decir, en el trazado de rayos y el reescalado y la reconstrucción inteligente de la imagen.

NVIDIA llevó a cabo una apuesta arriesgada en 2018 con Turing, una arquitectura que marcó la llegada de los núcleos RT de primera generación y que llevó los núcleos tensor a su segunda generación. El trazado de rayos llegó al mundo del gaming, y la inteligencia artificial aplicada a los videojuegos empezó a demostrar sus posibilidades con el DLSS 1.0, aunque no se consagró hasta el debut del DLSS 2.0, que fue realmente rompedor.

Muchos pusieron en duda esta estrategia por parte de NVIDIA, pero al final el tiempo le ha dado la razón. El trazado de rayos ha dejado de ser una apuesta incierta a futuro para convertirse en el presente de los videojuegos. Con Ampere el gigante verde logró domar el trazado de rayos, y podemos decir que con Ada Lovelace ha sido capaz de llegar a un nivel que hace apenas unos años nos habría parecido imposible.

Mejorar el rendimiento bruto es importante, pero la especialización ha permitido dar saltos generaciones inimaginables, y al final ha quedado más que claro que NVIDIA no solo acertó con su apuesta por los núcleos RT y núcleos tensor, sino que además se ha convertido en la compañía que marca el ritmo en la industria, en el gran rival a batir. No es extraño que incluso Intel utilice a las tarjetas gráficas GeForce RTX como modelo para sus comparaciones de rendimiento.

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

Lo más leído