Conecta con nosotros

Análisis

GeForce RTX 30 Mobile a prueba: Valor más allá de la potencia bruta

Publicado

el

GeForce RTX 30 Mobile

La presentación de las GeForce RTX 30 Mobile se produjo el pasado 12 de enero. Durante las semanas inmediatamente anteriores habíamos ido viendo numerosas filtraciones que, al final, se acabaron cumpliendo en mayor o menor medida, pero sin duda lo más importante no estuvo en la potencia bruta de esta generación, sino en las nuevas tecnologías que integra.

Para entender mejor esta idea es necesario hacer una comparativa entre la forma de renderizado tradicional de los juegos, que todavía hoy se sigue aplicando, y los cambios que se produjeron con la llegada de Turing, la arquitectura con la que NVIDIA introdujo el concepto de especialización a través de dos nuevos bloques de núcleos. Vamos a utilizar, para ello, dos tarjetas gráficas tipo, la GTX 1080 Mobile y la RTX 2080 Mobile.

La GTX 1080 Mobile utiliza la arquitectura Pascal, suma 2.560 shaders, 160 unidades de texturizado, 64 unidades de rasterizado y tiene 8 GB de memoria GDDR5X a 10 GHz. Se basa, por tanto, en un diseño de GPU tradicional. Por su parte, la RTX 2080 Mobile, utiliza la arquitectura Turing, tiene 2.944 shaders, 184 unidades de texturizado, 64 unidades de rasterizado, 46 núcleos RT y 368 núcleos tensor, todo bajo un bus de 256 bits y acompañado de 8 GB de GDDR6 a 14 GHz. Este modelo utiliza un diseño de GPU especializada, con núcleos tensor y núcleos RT.

GeForce RTX 30 Mobile

Los núcleos tensor aceleran cargas de trabajo relacionadas con inteligencia artificial, inferencia, aprendizaje profundo y algoritmos, mientras que los núcleos RT están pensados para acelerar toda la carga de trabajo asociada al ray tracing o trazado de rayos. Como os contamos en su momento en este artículo, el trazado de rayos permite recrear de forma realista el comportamiento de la luz en una escena tridimensional, pero supone una carga tan grande que es inviable sin hardware especializado.

Con la GTX 1080 Mobile, esa carga de trabajo tiene un impacto tan grande que puede reducir el rendimiento hasta en un 90%. Por contra, en una RTX 2080 Mobile, el impacto en el rendimiento es mucho menor, gracias al apoyo que reciben los motores de sombreado y de geometría de los núcleos RT, y además podemos compensarlo con el DLSS 2.0, una tecnología revolucionaria que, como os contamos en su momento, permite construir imágenes de alta calidad partiendo de una combinación de imágenes con una resolución inferior a la nativa (objetivo).

La aceleración de trazado de rayos y la reconstrucción inteligente de la imagen mediante inteligencia artificial (DLSS 2.0) han sido, sin duda, dos de los avances más importantes que ha conseguido NVIDIA en la historia reciente de la GPU, tanto a nivel de escritorio como para portátiles. El gigante verde tenía el listón muy alto, pero con las GeForce RTX 30 Mobile ha demostrado que tiene recursos, y talento humano, más que suficientes para seguir subiendo ese listón, y sin ningún problema.

GeForce RTX 30 Mobile: NVIDIA sube la apuesta por la especialización

Como cabía esperar, las GeForce RTX 30 Mobile mantienen la apuesta por la especialización que introdujo NVIDIA con la generación anterior. Esto quiere decir que, además integrar los motores de geometría, sombreado y texturizado, esta nueva generación de soluciones gráficas de alto rendimiento incorpora los núcleos tensor y los núcleos RT.

Sin embargo, las GeForce RTX 30 Mobile traen cambios importantes a nivel de arquitectura que debemos tener muy en cuenta. Por un lado, tenemos el salto al proceso de fabricación de 8 nm, una reducción importante frente a la generación anterior, que estaba fabricada en proceso de 12 nm. Por otro lado, nos encontramos con:

  • Un aumento de la cantidad de shaders por cada unidad SM activa. En la serie GeForce RTX 20 Mobile cada unidad SM tenía 64 shaders, mientras que en las GeForce RTX 30 Mobile se doblan, lo que nos deja un total de 128 shaders por unidad SM activa.
  • Las GeForce RTX 30 Mobile utilizan núcleos RT de segunda generación, capaces de ofrecer una mejora de rendimiento de hasta el 70% frente a la generación anterior.
  • Integran núcleos tensor de tercera generación, que mejoran significativamente el rendimiento, y se reduce el número de núcleos tensor presentes en cada unidad SM.

Esos tres puntos apuntan en una dirección muy clara, NVIDIA no solo ha aumentado la potencia de sus GPUs a nivel general, sino que también ha dado un importante impulso al rendimiento de sus partes especializadas. Ampere dobla el rendimiento en FP32 frente a Turing, los núcleos tensor de tercera generación también doblan el rendimiento frente a la generación anterior, y como hemos dicho, los núcleos RT aumentan hasta en un 70% el rendimiento.

¿Qué significa eso? Pues que una RTX 30 Mobile es más potente que una RTX 20 Mobile en todos los sentidos, es decir, tanto en rasterización como en trazado de rayos, y también en cargas de trabajo relacionadas con la inteligencia artificial.

No obstante, debemos tener en cuenta que integrar una GPU de última generación en un portátil es una tarea muy complicada. Cuando hablamos de soluciones gráficas de escritorio, siempre hay una tendencia a buscar un equilibrio razonable en materia de rendimiento por vatio, y también en todo lo relacionado con las temperaturas de trabajo, pero el «presupuesto» que del que dispone NVIDIA es menos limitado.

Una GPU de alto rendimiento para portátiles tiene que jugar con limitaciones importantes. Por un lado tenemos el consumo, por otro lado tenemos las temperaturas de trabajo, y finalmente nos encontramos con las restricciones asociadas al sistema de refrigeración, que vienen dadas por el propio espacio disponible en un equipo portátil. Las GeForce RTX 30 Mobile no son una excepción, tienen que afrontar esas mismas barreras.

Vamos a verlo con un ejemplo. Piensa en la RTX 3080 de NVIDIA, esta tarjeta gráfica tiene un TGP de 320 vatios, cuenta con un sistema de refrigeración enorme compuesto por radiador masivo y dispone de dos ventiladores situados en posiciones opuestas para favorecer el flujo de aire. Bien, ahora piensa en la RTX 3080 Mobile, una solución gráfica que debe integrarse en portátiles muy delgados, donde el espacio es mínimo y la refrigeración es muy limitada. Su TGP mínimo es de 80 vatios, aunque en los portátiles más grandes y pesados puede superar los 135 vatios. Las diferencias son abrumadoras, ¿verdad?

He querido hacer esa comparación para poner de relieve algo muy importante, y es que ya no es viable seguir limitándonos a la potencia bruta para avanzar, y mejorar, en el sector de las GPUs de alto rendimiento para portátiles. NVIDIA supo ver esa realidad con Turing, una generación que tocó techo en muchos aspectos, y que puso de relieve que el consumo, las temperaturas y el espacio disponible generan un efecto constrictor tan marcado que se perfilaban como un muro «infranqueable».

Un vistazo  a las nuevas tecnologías que incorporan las GeForce RTX 30 Mobile

Para superar ese muro, NVIDIA ha recurrido, como hemos dicho, a la especialización. Las GeForce RTX 30 Mobile mantienen esa división en tres bloques de núcleos que vimos en Turing, introduce mejoras importantes a nivel de arquitectura, y nos deja un conjunto de prestaciones muy superiores a la generación anterior.

Pero la lista de novedades no acaba ahí. NVIDIA ha combinado tecnologías existentes con otras nuevas en las GeForce RTX 30 Mobile, y ha dado forma a un grupo de funciones muy interesantes que marcan una gran diferencia, y que os vamos a desgranar a continuación para que tengáis claro qué ofrecen y cómo marcan la diferencia.

GeForce RTX 30 Mobile Dynamic Boost

Dynamic Boost 2.0: como su propio nombre indica, se trata de una tecnología que realiza un ajuste dinámico de las frecuencias de trabajo, pero no te dejes engañar, es mucho más que un simple modo turbo. Esta tecnología utiliza inteligencia artificial para analizar, fotograma a fotograma, las necesidades reales del equipo a nivel de CPU, GPU y de memoria gráfica, y ajusta las frecuencias de trabajo y el uso de recursos de la mejor manera posible. Así, por ejemplo, si tenemos un TDP máximo disponible de 115 vatios a repartir entre CPU y GPU, esta tecnología distribuirá ese «presupuesto» de forma desigual entre ambos componentes, dejando más margen a la GPU cuando sea necesario, y a la inversa.

WhisperMode 2.0: es una tecnología que en algoritmos personalizados para cada portátil en concreto que nos permiten elegir la acústica que deseemos, esto es, el nivel de ruido que estemos dispuestos a tolerar. Una vez hecho, el sistema monitorizará la carga de trabajo y las temperaturas de la CPU y la GPU, y gestionará de forma inteligente las velocidades de los ventiladores para conseguir el mejor rendimiento posible manteniéndose dentro de ese nivel de ruido que hemos seleccionado (hay cientos de perfiles disponibles).

Resizable BAR: esta tecnología permite a la CPU acceder a toda la memoria gráfica de la GPU. Esto quiere decir que tendrá a su alcance todos los datos almacenados que se utilizan para elementos tan importantes como texturas, shaders y geometría, y que podrá completar ciclos de trabajo de una manera mucho más eficiente. Sin dicha tecnología, el procesador solo puede acceder a una pequeña porción de la memoria gráfica, con todo lo que ello supone. Tiene mucho potencial, aunque la lista de juegos compatibles, y capaces de aprovecharla, es todavía algo limitada.

DLSS 2.0: se trata de una tecnología de reconstrucción inteligente de la imagen apoyado por inteligencia artificial, que combina varias imágenes renderizadas a una resolución inferior a la nativa para crear una con una calidad de imagen igual, o incluso superior, a la nativa. Puede llegar a triplicar el rendimiento en algunos juegos, y desde luego marca una diferencia enorme.

Aceleración de trazado de rayos: nos permite disfrutar de efectos realistas en reflejos, sombras, oclusión ambiental, refracción e iluminación. Es una tecnología muy exigente, pero bien aplicada puede marcar una diferencia enorme, como hemos visto en juegos como Cyberpunk 2077.

Battery Boostesta tecnología ajusta el rendimiento del sistema para que los juegos se ejecuten a 30 FPS estables, sin problemas de «stuttering» ni de «tearing». De esta manera, se consigue un consumo de batería más eficiente, y se extiende la duración de la misma. Según NVIDIA, es posible llegar a doblar la autonomía del equipo.

¿Y qué supone todo esto para mí como usuario?

Pues se traduce en mejoras importantes que te permitirán disfrutar de tus juegos favoritos a otro nivel. Hace poco analicé un portátil ASUS ROG Strix SCAR 17 de nueva generación, y también tuve en mis manos un modelo de MSI con una RTX 3080 Mobile, así que he podido probar todas las novedades de la serie GeForce RTX 30 Mobile, y la experiencia ha sido realmente buena. Todos los resultados que vamos a ver se han obtenido con una RTX 3080 Mobile de 95 vatios.

Shadow of the Tomb Raider con trazado de rayos y sin DLSS registra medias de 30 FPS.

Hablamos de tecnologías que realmente pueden marcar una diferencia importante, tanto a nivel de rendimiento como de confort y de autonomía, aunque es importante hacer algunos matices. La tecnología Resizable BAR consigue, de momento, una mejora de rendimiento menor que ronda, de media, el 3%. Esto quiere decir que, aunque tiene mucho potencial, todavía no se aprovecha de forma efectiva.

Por otro lado, tenemos el DLSS 2.0, una tecnología que puede llegar a triplicar el rendimiento frente a la resolución nativa, pero que da lo mejor de sí en resoluciones 1440p y superiores. Esto tiene una explicación, y es que, cuando lo utilizamos en resolución 1080p, el proceso de reconstrucción de imagen se produce desde una resolución muy reducida (540p si utilizamos el modo rendimiento), lo que hace que el procesador se acabe convirtiendo en un importante cuello de botella.

Control con trazado de rayos y DLSS 2.0 en modo rendimiento.

Control con trazado de rayos y DLSS 2.0 en modo calidad.

Control con trazado de rayos y sin DLSS 2.0.

Sin embargo, cuando utilizamos el DLSS 2.0 aplicado a una resolución 1440p, la base del proceso de reconstrucción puede partir desde 720p (de nuevo configurado en modo rendimiento), un nivel más razonable que, unido a las mayores exigencias de la resolución nativa objetivo, permite alcanzar una mejora de rendimiento mucho más marcada.

Para entenderlo, vamos a ver ejemplos concretos. En Shadow of The Tomb Raider, con resolución 1440p, calidad máxima y trazado de rayos activo, la RTX 3080 Mobile logra medias de 30 FPS. Sin embargo, cuando activamos el DLSS la cosa cambia por completo y nos encontramos con medias que rondan los 60 FPS.

Cyberpunk 2077 en ultra con trazado de rayos y DLSS 2.0 en modo calidad.

Cyberpunk 2077 en ultra con trazado de rayos y DLSS 2.0 en modo rendimiento.

Cyberpunk 2077 en ultra con trazado de rayos y DLSS 2.0 en modo equilibrado.

Cyberpunk 2077 en ultra con trazado de rayos y sin DLSS 2.0.

Cyberpunk 2077, uno de los juegos más exigentes que existen actualmente, muestra también una enorme mejora gracias al DLSS 2.0. Con el juego configurado en 1440p, calidad máxima y trazado de rayos al máximo tenemos tasas de FPS inaceptables que rondan entre los 19 y los 24 FPS. Cuando activamos el DLSS 2.0 en modo calidad, el rendimiento prácticamente se dobla, y pasamos a tener medias que superan sin problema los 40 FPS. Si ajustamos el DLSS 2.0 al modo equilibrado nos acercamos a los 60 FPS, y con dicha tecnología en modo rendimiento superamos sin problemas los 60 FPS de media.

En Control, con resolución 1440p, calidad máxima y trazado de rayos al máximo, vemos una tónica similar. Con el DLSS 2.0 desactivado, nos movemos en medias de entre 22 y 30 FPS, según la carga gráfica de cada escena. Activar el DLSS 2.0 en modo calidad nos lleva a una media de 50 FPS, en modo equilibrado nos movemos por encima de los 60 FPS, y en modo rendimiento es fácil superar los 70 FPS.

Death Stranding en calidad máxima con DLSS 2.0 en modo rendimiento.

Death Stranding en calidad máxima sin DLSS 2.0.

Death Stranding en calidad máxima con DLSS 2.0 en modo equilibrado.

También quise probar el rendimiento de Death Stranding con DLSS 2.0, y el resultado fue estupendo, como cabía esperar. En resolución 1440p nativa y calidad máxima, logra medias estables de 60 FPS, mientras que con DLSS 2.0 en modo calidad sube hasta los 85 FPS. Si lo configuramos en el modo equilibrado, nos encontramos con el nivel óptimo, ya que el rendimiento sube hasta los 102 FPS. Bajar un peldaño más e irnos al modo rendimiento solo eleva la tasa de FPS hasta los 107, debido al cuello de botella que ejerce el procesador.

La conclusión que podemos sacar de todo esto es muy clara. La serie GeForce RTX 30 Mobile representa un paso en la dirección correcta, no solo por todas las mejoras que incorpora a nivel técnico y de rendimiento, sino también porque han conseguido superar todas las limitaciones a las que hemos hecho referencia, y han fijado un nuevo techo técnico creando valor más allá de la potencia en bruto.

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

Lo más leído