ATI Radeon HD 5870

ATI Radeon HD 5870
25 de septiembre, 2009

AMD llega a tiempo a su cita con Windows 7 y presenta su nueva generación de tarjetas gráficas. La serie 5xxx de tarjetas de vídeo debuta con dos modelos posicionados en la gama media-alta, basados en el mismo chip gráfico RV870. El modelo más avanzado es el bautizado como ATI Radeon HD 5870 con un precio menor de 400 dólares según las primeras especificaciones, mientras que el modelo ATI Radeon HD 5850 rondará los 300. Probamos lo último de ATi en nuestro laboratorio técnico.

La verdad es que es una grata sorpresa ver cómo esta presentación se engloba en un marco de normalidad absoluta, frente a los lanzamientos de generaciones anteriores casi siempre rodeados de problemas, retrasos y más de un maquillaje de resultados en las pruebas de rendimiento para competir con NVIDIA o viceversa, NVIDIA compitiendo con AMD. En esta ocasión, ATI compite contra ella misma, pues NVIDIA aún no ha jugado sus cartas en esta partida donde las reglas del juego las marcarán DirectX 11 y GPGPU.

Las claves de la serie 5xxx

Los tres pilares sobre los que AMD sostiene a esta nueva generación gráfica son DirectX 11, la tecnología Stream para aprovechar el paralelismo de la arquitectura del chip RV870 en tareas de propósito general y no sólo los juegos, y en la tecnología EyeFinity, que permite conectar hasta seis pantallas de 2.560 x 1.600 puntos para configurar un sistema de super-alta resolución tanto para juegos como para escenarios de productividad.

Se necesita una tarjeta con seis conexiones DisplayPort para ello, pero se puede construir, existe y en MuyComputer ya la hemos visto en acción con juegos como H.A.W.X. o Colin McRae Dirt 2, con un resultado realmente espectacular y sin que el frame rate se hubiese visto demasiado perjudicado. Esa tarjeta es la Radeon HD 5870 EyeFinity6 Edition, y apostamos a que tendrá una gran aceptación en sectores verticales para la preparación de demostraciones en el ámbito de los videojuegos, del ocio digital y también en escenarios de productividad donde se necesiten controlar múltiples pantallas simultáneamente. Con Windows 7 se pueden asignar contenidos específicos a cada monitor, o agruparlos con una enorme flexibilidad.

DirectX 11, por su parte, no es una extrema novedad en sí misma. Se trata de una evolución de DirectX 10 y DirectX 10.1, con novedades sumamente interesantes, eso sí. Teselación, DirectCompute 11, ShaderModel 5.0, compresión de texturas mejorada, o multithreading son algunos de los conceptos que se manejarán a discreción durante los años venideros en los que Windows 7 ocupe su trono como sistema operativo para PC y portátiles. En realidad no son conceptos nuevos, como la teselación, que ya se concibe con DirectX 8.1, por ejemplo, pero ahora el hardware permite implementarlos sin que suponga un coste excesivo en términos de rendimiento.

DirectCompute permite al sistema emplear tanto la CPU como la GPU para realizar cálculos complejos, dependiendo de qué componente lo haga mejor. Aplicaciones como las relacionadas con las propiedades físicas de los objetos, cálculos para Ray Tracing o inteligencia artificial son sólo algunas de las posibles dentro de un escenario muy atractivo sobre el papel a falta de su aplicación en el mundo real, por supuesto. Ejemplos ya visibles se encuentran en técnicas de mejora de la imagen con Order Independent Transparency, o la recreación de efectos como la profundidad de campo. Con DirectCompute se consigue procesar cada píxel de un modo preciso y eficiente sin interferir en los buffers alfa. De este modo se evitan artefactos derivados de las técnicas tradicionales donde se trabajaba a nivel de máscaras en vez de procesar los píxeles directamente.

Con DirectX 11 también se consigue mejorar el tratamiento de las sombras, logrando efectos mucho más realistas que antes, sobre todo en los bordes de las mismas, con un acabado mucho más “difuminado” como corresponde a sombras que inciden en superficies irregulares.

La teselación, por su parte, consigue aumentar el nivel de detalle de las geometrías sin necesidad de aumentar la complejidad de los modelos. Se generan triángulos de manera automática para teselar las geometrías implementadas en el motor de los juegos o las aplicaciones, sin que suponga un coste elevado en el rendimiento. El trabajo en varios hilos hace posible que distintas tareas relacionadas con las operaciones gráficas se realicen en paralelo. Asi,tareas como cargar una textura y calcular un shader se podrán realizar de manera concurrente sin que una tenga que esperar a que finalice la otra.

Juegos como DiRT 2 o Alien VS Predator incluirán estas nuevas tecnologías gracias a la adaptación de sus motores gráficos, con resultados notables en aspectos como el detalle de los personajes y los escenarios o el post procesado mediante aplicación de filtros como el de profundidad de campo o el difuminado de movimiento. Otra característica de DirectX 11 es la posibilidad de emular por software estas nuevas características mediante la tecnología WARP, aunque a costa de reducir el rendimiento en varios órdenes de maginitud dependiendo de la solvencia del hardware.

Stream y estándares abiertos

Bajo el paraguas de “Stream” AMD/ATI engloba las habilidades de su hardware gráfico para acelerar tareas que se beneficien del paralelismo de la arquitectura de sus chips. Con la familia 5xxx se avanza un paso más allá gracias a la compatibilidad con estándares como OpenCL y DirectCompute.

Open CL u Open Computing Language es la alternativa a las iniciativas propietarias de NVIDIA y AMD. CUDA o Compute Unified Device Architecture es la propuesta de NVIDIA para sus tarjetas gráficas y ha conseguido un nivel de penetración notable en círculos académicos y en el doméstico mercede a la implementación de plugins in software relacionado con el procesamiento multimedia sobre todo. AMD, con CTM o Close To Metal, ha tenido menos proyección debido a la ausencia de un API de programacion sencillo.

De todos modos, OpenCL, propuesto por Apple como vía para el aprovechamiento del paralelismo de los chips gráficos en aplicaciones de propóstito general, se ha convertido en una propuesta abierta de la mano de Kronos Group, del mismo modo que sucede con OpenGL como lenguaje para gráficos. Y parece que esta es la dirección buena, a falta de ver cómo evoluciona Larrabee de Intel, que en teoría se podrá programar usando las herramientas existentes para las aplicaciones X86.

De momento, los juegos son los primeros beneficiados de esta ampliación de las atribuciones de los chips gráficos a través del cálculo del a física o la inteligencia artificial o la recreación de filtros visuales como los mencionados anteriormente: profundidad de campo o difuminado de movimiento (motion blur) entre otros. La ventaja es la de emplear algoritmos para operar sobre los píxeles, de modo que la flexibilidad es mucho menor que en el trabajo con máscaras, transparencias o texturas.

También se benefician de OpenCL y DirectCompute aplicaciones multimedia como muchas de las presentes en el catálogo de Cyberlink, por ejemplo. PowerDirector o MediaShow se beneficiarán en próximas versiones de la arquitectura de los chips DirectX 11 con mucho más éxito que con generaciones anteriores. No hay más que recordar que la potencia de cálculo teórica de estas tarjetas de ATI alcanzan más de 2 TFLOPS.

El cuarto pilar: la eficiencia energética

Un cuarto factor diferencial de estas tarjetas es la eficiencia energética. En las primeras pruebas, el consumo total raramente superó los 200 vatios al tiempo que el rendimiento obtenido era muy superior al de tarjetas de generaciones anteriores, con un consumo más elevado. Más rendimiento y menor consumo son elementos diferenciales de esta nueva generación gráfica. Además, este acercamiento “sensato” permite a AMD / ATI anunciar el lanzamiento de una versión X2 de esta nueva familia dentro de pocos meses, antes de fin de año.

Esto significa que la migración a 40 nm ha sido fluida y exenta de dificultades. La ventaja de AMD radica en factores como la presencia de tecnologías muy avanzadas en su generación anterior: DirectX 10.1 estaba contemplada en la familia 4xxx, y si bien no fue de una utilidad notable en su tiempo, sí que lo es ahora, pues DirectX 11 es una evolución de DirectX 10.1. Además, la memoria GDDR5 está contemplada por ATI también en la generación anterior, lo cual implica que a la hora de diseñar el subsistema de memoria sólo ha tenido que depurar y optimizr en vez de implementar un controlador de memoria desde cero.

¿Y NVIDIA?

De momento NVIDIA parece estar topándose con dos dificultades: por un lado su aproximación monolítica para el chip, donde se diseña para ir de arriba abajo, complica los procesos de fabricación al trabajar con chips muy “grandes”. AMD trabaja con chips no demasiado ambiciosos, pero fáciles de instalar en configuraciones multichip gracias a una mejor disipación y una fabricación más fácil y con mejores “yields”. Además, NVIDIA pasa de DirectX 10 a DirectX 11, por lo que tiene que contemplar la implementación de funcionalidades extra en su arquitectura. Por no hablar del controlador de memoria, que debería pasar de GDDR3 a GDDR5. Una transición que no es trivial a la vista de las diferencias en las temporizaciones entre ambos tipos de memoria.

El apartado de la doble precisión tampoco es trivial en una generación donde habrá que trabajar con simple y doble de manera indistinta sin “letra pequeña”. AMD parece haber integrado este punto sin más problemas que la reducción en la potencia de cálculo desde algo más de 2 TFLOPS a menos de 600 GFLOPS.

De momento tenemos entre manos la primera tarjeta DirectX 11 de la mano de AMD/ATI y MuyComputer. En nuestras pruebas comparamos la tarjeta con la GeForce GTX 295 de NVIDIA y con una Radeon HD 4890 en test sintéticos y juegos “reales”.

NVIDIA GeForce
GTX 295
ATI Radeon
HD 4890
ATI Radeon HD 5850ATI Radeon HD 5870
Transistores1.400 millones959 millones2.150 millones2.150 millones
Procesadores Stream240 x 28001.4401.600
Velocidad de reloj576 MHz / 1.242 MHz procesadores stream850 (and higher)725 MHz850 MHz
Velocidad de memoria2.000 MHz 3900 MHz (effective)4.000 MHz 4.800 MHz
Memoria896 x 2 MB GDDR31024MB GDDR51.024 MB GDDR51.024 MB GDDR5
Interfaz de memoria448 bits x 2256 bits512 bits512 bits
Ancho de banda2 x 112 GB/s125 GB/s128 GB/s153,6 GB/s
Potencia de procesamiento pura1,79 TFLOP1,360 TFLOP2,09 TFLOP2.72 TFLOP
Unidades de texturizado80 x 2407280
Unidades de renderizado28 x 2163232
Tecnología de fabricación55nm55nm40 nm40 nm
Potencia consumida de pico290 W190W170 W188 W
Potencia en reposona60W27 AV27 W

Configuración del equipo de pruebas

– Placa Base Asus P7P55D Deluxe.

– Procesador Intel Core i7870 Socket LGA 1156.

– 2 x 2 Gbytes memoria Kingston HyperX DDR3 16000.

– Fuente Enermax Revolution 1.025W.

– Monitor HP LP3065, 30’’, 2.560 x 1.600 píxeles.

– Controladores: AMD ATI 8.66 RC6 Cypress.

– Controladores: NVIDIA 190.62.

3dMark Vantage Performance3DMArk Vantage Extreme 1.920 x 1.200Unigine benchmark dx10, 2.048 x 1.536 High Q, 4x fsaa, 16x afUnigine benchmark dx9, 2.048 x 1.536 High Q, 4x fsaa, 16x afUnigine benchmark dx10, 2.048 x 1.536 High Quality, 8x fsaa, 16x afH.A.W.X. 2.560 x 1.600 8x fsaa, HQ
ATI Radeon HD 587016383 / GPU 15587, CPU 193848076 / GPU 7832, CPU 1968043,3 fps, 1092 score44,5 fps

1120 score

40,7 fps

1024 score

117 fps (max 290)
Potencia total220 W200 W216 W
Temperatura58 grados64 grados69 grados
ATI Radeon HD 489011568 /GPU 10200, CPU 193664720 / GPU 4540, CPU 1935129,5 fps

743 score

28,1 fps

708 score

83 fps (max 302 fps)
Potencia total220 W210 W215 W226 W
Temperatura63 grados62 grados64 grados65 grados
NVIDIA GeForce GTX 29521299 / GPU 18289, CPU 420649261 / GPU 8894, CPU 4311420,4 fps

513 Score

136 fps (máx 350)
Potencia total326 W220 W350 W
Temperatura81 grados62 grados79 grados

Las pruebas de una tarjeta como la presentada por AMD pasan por emplear una configuración ambiciosa. De hecho, introducimos en MuyComputer las pruebas con un monitor de 30 pulgadas para aprovechar al máximo las posibilidades de esta tecnología que puede mover títulos DrectX 9 y DirectX 10 a una velocidad endiablada limitada por el procesador incluso a resoluciones por encima de 1.600 x 1.200 puntos. Sólo DirectX 11 podrá poner al límite a estas tarjetas gráficas cuando aparezcan los títulos esperados de cara a los meses venideros, con motores actualizados para aprovechar DirectX 11.

Durante las pruebas hemos observado que la temperatura del procesador gráfico, medida en la parte visible del PCB, no ha superado los 65 grados. Sin duda una noticia excelente para cualquiera que se preocupe por el consumo y la estabilidad del equipo. No es complicado intuir que los modelos de gamas medias y mainstream serán excelentes propuestas para equipos multimedia, y que incluso las soluciones “fanless” abundarán en el mercado. Por otro lado, las tarjetas “X2” tienen margen para ofrecer un rendimiento muy elevado.

Además, la temperatura baja rápidamente tan pronto como cesa la actividad en la tarjeta gráfica, lo cual corrobora el buen hacer en la eficiencia energética y el reducido consumo anunciado cuando la tarjeta no está acelerando ningún juego ni aplicación.

En esta ocasión, además hemos tenido el programa FRAPS constantemente en funcionamiento monitorizando la tasa de frames obtenida a partir de la tarjeta HD 5870. Incluso con títulos de reciente factura como Batman Arkham Ashylum la tasa de frames con la configuración máxima y 2.560 x 1.600 píxeles se mantuvo por encima de los 60 fps. Otros títulos como Resident Evil 5 mostraron más de 60 fps de media en las configuraciones más exigentes y a máxima resolución y en pruebas sintéticas como 3D Mark Vantage incluso la prueba “Extreme” se pudo evaluar con cierta soltura, aunque con tasas de frames por debajo de un nivel de jugabilidad adecuado, eso sí.

En cualquier caso, se trata de un resultado notable para una tarjeta con alimentación de 2 x 6. Juegos como FarCry 2, con la configuración Ultra, sí se resienten algo a 2.560 x 1.600 puntos con FSAA de 8x, pero tan pronto como se baja la resolución, los resultados mejoran notablemente incluso a 1.600 x 1.200, una cifra excepcional para el 90 por ciento de los usuarios con monitores de hasta 22 pulgadas.

El caso de Crysis Warhead es algo distinto, con una tasa de frames que se mantiene prácticamente constante dentro de una horquilla estrecha de variaciones, lo cual hace sospechar que es la CPU la que limita a la tarjeta gráfica. Posiblemente el motor de Crysis se beneficie enormemente de DirectCompute y Multithreading en el sistema gráfico para eliminar el cuello de botella actual.

En cuanto a la activación de las mejoras de imagen, la norma en esta ocasión ha sido utilizar un suavizado de imagen a pantalla completa de 8x en vez de los habituales 4x, y 16x para el filtrado anisotrópico allí donde se pueda configurar este parámetro. La particularidad en esta tarjeta es que el filtrado anisotrópico es perfecto, independientemente del ángulo. Y además el impacto en el rendimiento es casi inapreciable incluso pasando de un valor 4x a 8x para el FSAA (Full Screen Antialiasing). Al menos en algunos títulos, pues en otros como FarCry2 sí se aprecia una notable diferencia al pasar de 8x (31,6 fps) a desactivar FSAA (66,6 fps).

La comparación con el modelo “estrella” de la generación anterior de AMD / ATI, el Radeon HD 4890, no deja lugar a dudas acerca de la solvencia de esta nueva familia 5xxx. El modelo HD 5870 no es el más potente que se puede fabricar con esta tecnología, ni mucho menos, pero aún así supera con claridad a la 4890.

Si se compara con el modelo GTX 295 de NVIDIA, la situación depende de si el benchmark o el juego aprovechan SLI al tratarse de una tarjeta gráfica compuesta de dos GeForce GTX 285 combinadas. Donde sí se aprovecha, el rendimiento es mayor que el modelo HD 5870, aunque en resoluciones extremas las diferencias se reducen como se aprecia en los resultados con 3DMark Vantage con el modo Extremo activado. De todos modos, el consumo y la temperatura de la tarjeta GTX 295 se disparan hasta límites muy superiores. En pruebas como Resident Evil 5, aun con un consumo de 350 vatios, el rendimiento está por debajo del obtenido por la Radeon HD 5870, lo cual no deja de ser sorprendente. En última instancia se trata de una tarjeta de gama extrema sobre pruebas donde no se contempla aún DirectX 11.

En FarCry 2, el modelo GTX 295 no completó la prueba a 2.536 x 1.600 puntos, pero en las otras dos pruebas, sí estuvo algo por encima del modelo de AMD/ATI, aunque no con la contundencia que podría esperarse a partir de una configuración de doble tarjeta gráfica.

Al final, la balanza se inclina a día de hoy hacia la nueva propuesta de AMD / ATI tanto por rendimiento como por eficiencia energética.

Multimedia

AMD ha continuado mejorando las posibilidades para el ocio digital con la serie 5xxx de tarjetas gráficas. Las mejoras pasan por la posibilidad de descodificar simultáneamente dos secuencias de alta definición, así como trabajar con todo tipo de formatos de audio multicanal a través de HDMI 1.3. El códec de audio está integrado en la propia tarjeta y ahora se pueden configurar características como el contraste dinámico en pantalla. En la tarjeta de referencia se pueden encontrar conexiones DVI (dos) así como DisplayPort y HDMI. En el modelo EyeFinity hay seis salidas DisplayPort capaces de “alimentar” seis monitores de alta resolución hasta 2.560 x 1.600 puntos. La resolución “virtual” de esta pantalla es de 3 x 2.560 puntos de ancho y 2 x 1.600 puntos de alto ( 7.680 x 3.200 píxeles nada menos). Y todos estos píxeles, procesados por una única tarjeta y con potencial para jugar incluso como se pudo ver y experimentar en la presentación de la tarjeta que tuvo lugar en Londres.

De momento estamos recopilando las herramientas de software compatibles con ATI Stream y con CUDA de NVIDIA para poder realizar un estudio comparativo de igual a igual.

En conjunto, AMD parece haber mantenido el espíritu de ATI intacto en lo que a innovación y tiempos se refiere. Aún más, ha conseguido que los plazos se cumplan sin sacrificar la calidad del producto final.

El rendimiento de la familia 5xxx promete evolucionar con rapidez y ofrecer todo lo necesario para sacar el máximo partido a los títulos de ahora y los de dentro de unos meses cuando empiecen a ver sus frutos las adaptaciones de los motores gráficos a tecnologías como Tesselation o Multithreading.

El punto débil de esta ATI Radeon HD 5870 analizada es la compatibilidad con aceleración de física en los juegos. PhysX de NVIDIA está integrada en un número creciente de títulos, mientras que AMD aún está esperando a que se popularicen APIS abiertas que aprovechen DirectCompute u OpenCL.

  • Share This