Web Analytics
Conecta con nosotros

Noticias

Rendimiento multiGPU cruzado con soluciones GTX y Radeon

Publicado el
Rendimiento multiGPU cruzado con soluciones GTX y Radeon 35

Uno de los grandes atractivos que plantea DirectX 12 son las mejoras de rendimiento gracias a la introducción de nuevas tecnologías, como los shaders asíncronos, por ejemplo, y también gracias al uso de APIs de bajo nivel que permiten un mayor aprovechamiento de todos los recursos del sistema.

Ya hemos podido ver los beneficios de todo esto en Xbox One y PS4, consolas que a pesar de su baja potencia comparada con un PC de gama alta disfrutan de la optimización que permite conseguir dichas herramientas.

Dicho esto no podemos olvidarnos de las bondades que plantea también el uso de configuraciones multiGPU en DirecX 12, siendo posible no sólo sumar la memoria de vídeo de las tarjetas gráficas, sino además utilizar soluciones de fabricantes distintos.

Así, es posible usar una GTX y una Radeon en modo multiGPU, aunque como vemos los resultados que conseguimos son bastante dispares, y dejan claros algunos detalles importantes que debemos tener muy en cuenta.

mixed_1080

Por un lado salta a la vista que la tarjeta gráfica más lenta influye drásticamente en el rendimiento final, lo que supone que utilizar configuraciones como una GTX 980 Ti y una GTX 960 no sea nada recomendable.

Esto nos lleva al siguiente punto, y es que la tarjeta más potente debe ser utilizada como maestra, ya que también influye bastante en el rendimiento, aunque como podemos ver en general el escalado resulta bastante pobre.

mixed_4k

Podemos concluir que todavía queda mucho camino por recorrer, y que las primeras pruebas no son del todo alentadoras.

Más información: TechPowerUP!

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

27 comentarios
  • Al poner una AMD como primaria rinde mejor. No me parece raro tomando en cuenta esto
    SM200 (GTX 980 Ti):

    22 SMMs

    Each SMM contains 128 SIMD cores.

    Each SMM can execute 64 warps concurrently.

    Each Warp is comprised of 32 threads.

    So that’s 2,048 threads per SMM or 128 SIMD cores.

    2,048 x 22 = 45,056 threads in flight (executing concurrently).

    GCN3:

    64 CUs

    Each CU contains 64 SIMD cores.

    Each CU can execute 40 wavefronts concurrently.

    Each Wavefront is comprised of 64 threads.

    So that’s 2,560 threads per CU or 64 SIMD cores.

    2,560 x 64 = 163,840 threads in flight (executing concurrently).

  • asdf

    Yo lo que observo aquí es que los drivers son inestables. Tener una r9FX más una 980 ti a 1080 con 76fps es una perdida de tiempo y dinero. Con muchos dolores de cabeza mirando en Internet cual es el problema.

  • Christian

    jajajaja el MAGICO DrectX12 jajaja XD

  • nanduelo

    Ni tu mismo entiendes lo que has puesto sólo para darte el moco, y ahora einstein dime por que las AMD rinden más según a lo que acabas de poner.

  • Si que lo entiendo. Vengo hablando de los Async Shaders hace rato.
    Estos datos muestran que las GPU AMD pueden tener mas hilos ejecutando tareas al mismo tiempo.
    Si quieres saber de donde lo saque aca te dejo el link. http://www.overclock.net/t/1590939/wccf-hitman-to-feature-best-implementation-of-dx12-async-compute-yet-says-amd/740
    Quizas tu no entiendas ingles, pero no es dificil de entender lo que significa y
    no hay que ser Einstein.

    Aqui tienes mas

    They are but within the Graphics queue, the order of execution is not defined hence (Asynchronous). Compute commands can be executed concurrently here on NVIDIA hardware. This is because NVIDIA don’t have dedicated engines for Compute and for Graphics. Either work is processed within an SMM. In the SMM both compute and graphic work share an L1 cache. Since their share cache, they’re processed in sequence. It’s the same reason why a context switch hurts NVIDIA performance, a cache flush is required to switch between compute and graphics within an SMM.

    AMD, on the other hand, has a higher level of hardware redundancy (and higher power usage as a result). AMD can split the work across 3 seperate queues which can execute concurrently and in parallel. Fences can be used to enforce synch points between queues. The CUs are also seperate from the render units. So not only is work executed concurrently and in parallel but also processed that way. A context switch therefore only takes one cycle on GCN.

    Te traduzco lo que dice:
    El orden de ejecucion no es asincrono. Esto es porque las tarjetas Nvidia no tienen el hardware dedicado para computo y graficas. Ambos trabajos se procesan en una SMM. En la SMM tanto el computo como el trabajo grafico comparten la cache L1. Como la comparten, estos son procesados en secuencia. Por esta misma razon un cambio de contexto afecta el rendimiento de las GPU Nvidia. Un vaciado de cache es necesario para cambiar entre computo y graficos en un SMM

    En cambio AMD tiene un mayor nivel de redundancia de hardware, lo que trae un mayor consumo como resultado. Las tarjetas AMD pueden separar el trabajo en 3 colas distintas que pueden ejecutarlo concurrentemente y en paralelo. Pueden ser usadas «rejas» para forzar puntos de sincronizacion entre las colas. Las UC (unidades de computo) estan separadas de las unidades de renderizado. Entonces el trabajo no es solamente ejecutado concurrentemente y paralelamente, sino que tambien es procesado de esa forma. Un cambio de contexto solo toma un ciclo en GCN.

    Creo que lo he traducido de la forma mas sencilla. Antes de decir a los otros que no saben ni de lo que hablan, preguntales para saber si en verdad saben.

  • Isidro Ros

    Exacto, todo apunta a que la clave está en los shaders asíncronos, de hecho desde las primeras pruebas se ha visto que las Fury rendían mejor , tanto en solitario como en modo maestro.

    Saludos.

  • Algunos verdes creen que Nvidia habilitara el soporte de computo asincrono en sus GPUs. Yo no lo creo, ya que los desarrolladores tendran mas trabajo para implementarlo en las graficas Nvidia y parece que la diferencia es nula y produce latencia. Creo que sera mas facil agregar un switch para deshabilitar el computo asincrono de los juegos

  • nem

    RADEONS potenciando la carencias de computacion asyncrona de las Geforce.. CONFIRMADO! :p

  • asdf

    Osea que nos estás confirmando que Nvidia siguen siendo unos cabrones egoistas que no quieren dar saltos evolutivos en optimización gráfica y que solo quieren el dinero por chapuzas tipo gameworks para quemar gráficas y generar más beneficios a costa de seguir estafando a los consumidores.

    Como sigan así de ………… me estoy pensando en pasarme a las gráficas AMD.

  • No los estafan, sino que mienten. Decian soportar el computo asincrono y es mentira.

  • Ghoul Rul

    Y también hay que hacer notar que con las mismas tarjetas, colocando la Radeon como principal se obtienen mejores resultados

  • Obliterator

    De acuerdo, engaño total, si no lo soporta por hardware, buena kaka se puede hacer por soft, latencias, impacto en el rendimiento…ay Nvidia q nariz tan grande tienes, mas facil se coge a un mentiroso q a un cojo. Y los N-zombies que sigan esperando por todas las promesas que les va a salir un callo en el c…lo sentaditos en su silla GAYMER xD.

  • Si el hardware no te permite hacer algo, el software no va a hacer milagros.

  • Isidro Ros

    Está claro que no todo se arregla «a base de parches», veremos cómo acaba la cosa.

    Un saludo Santiago.

  • Lo que me da gracia es que parece que Pascal no soportara del todo el computo asincrono
    http://cdn.wccftech.com/wp-content/uploads/2015/04/2.png
    http://www.extremetech.com/wp-content/uploads/2015/09/NV-Preemption.png
    No tendran unidades designadas para el, sino que usaran la tecnica preemption y dependera un poco del procesador.

  • Isidro Ros

    Ahora mismo AMD está posicionada mejor que NVIDIA de cara DirectX 12, de eso no hay duda, pero vamos a esperar a ver información confirmada y rendimiento real.

    Con todo espero que tenga suerte y recupere terreno, que nadie quiere un monopolio «de color verde» ;).

    Saludos.

  • Claro. Si hay competencia mejor para todos nosotros

  • daniel

    Gente, tengo una duda, las AMD de generacion GCN 1.0 soportan Async Shaders?
    en si todas las GCN?

  • Si, pero se benefician en menor medida por tener menos unidades.

  • Leonmafioso

    El Scheduler de AMD es via hardware, mientras que el de nvidia, al menos hasta fermi era modo software. Aunque desconozco mas adelante.

  • Si, pero una utiliza la tecnica preemption y la otra las ACEs.
    El por software usa la CPU y trae mas latencia

  • Leonmafioso

    Desde la serie 7000 en adelante.

  • Leonmafioso

    Exacto, un ejemplo parecido es la ejecucion en orden / fuera de orden en el caso de los procesadores, un procesador con ejecucion fuera de orden consume mucha mas energia por un lado pero en multitarea tambien es más rápido que uno que ejecuta las instrucciones en orden.

  • Claro, por eso las GPU Amd consumen mas.
    Las maxwell consumen menos por tener menos capacidad de computo

  • Leonmafioso

    Es por eso que tambien las tarjetas AMD en GPGPU tienen rendimiento superior a las Nvidia. Y eso es desde la epoca de Directx 10.

  • daniel

    la mia es una msi r7 370 tiene 1024 stream processors,16 cu
    obviamente por mucho hay otras que tienen mas. pero pregunte como es bastante nueva, pero es basada en GCN 1.0,»temor» de no poder disfrutar de estas ventajas

  • Creo que tiene 2 ACEs, asi que disfrutaras del computo asincrono

Lo más leído