Conecta con nosotros

Análisis

Las claves de la arquitectura

Publicado

el

El rendimiento de un procesador viene determinado en parte por la velocidad en Megahertzios y el número de instrucciones por ciclo de reloj que puede procesar. Nehalem consigue procesar 4 instrucciones por ciclo de reloj y hasta 5 (algo que parece imposible a la vista de su decodificador de 4 vías) usando la técnica denominada Macrofusion. Desde luego, con una velocidad de 3,2 GHz en el momento de su lanzamiento y esta elevada tasa de instrucciones por ciclo de reloj, el rendimiento de Nehalem promete ser espectacular.

Centrándonos ya en lo que es la arquitectura de Nehalem, lo que se aprecia tras examinar los "White papers" y la documentación asociada es una excelente puesta en escena fruto de un trabajo bien hecho. Nehalem continúa integrando elementos clave de la arquitectura anterior pero mejora algunos aspectos clave de la misma.

Macrofusion: técnica que permite combinar dos instrucciones y combinarlas en una sola consiguiendo picos de hasta 5 instrucciones por ciclo de reloj decodificadas.

Prefecthing: permite "adivinar" qué datos se van a usar en la memoria para "traerlos" a la memoria caché y reducir latencias y tiempos de acceso.

Branch prediction: en este caso "adivina" (predice) qué secuencias de código se ejecutarán en el futuro cercano para comenzar a procesarlas. En Nehalem se ha ganado en profundidad a la hora de adelantarse a los acontecimientos con un aumento del paralelismo implícito y necesario para que una arquitectura "Out of Order" obtenga los mejores resultados. Además, se ha reducido la penalización asociada con predicciones equivocadas que hacen que se tenga que vaciar la pipeline.

SMT o HyperThreading: una tecnología excepcional ya conocida que permite a un núcleo procesar dos threads usando los recursos que quedan libres durante el proceso normal de decodificación de instrucciones. En algún caso se pueden dar comportamientos atípicos en algunas aplicaciones como consecuencia de tener activado Hyperthreading, pero en general es muy recomendable hacer uso de esta tecnología.

– Juegos de instrucciones propietarias SSSE 4.2: especialmente pensadas para calcular el código CRC en la transmisión de datos o acelerar el análisis de cadenas de texto como las que se encuentran en el procesamiento de documentos XML, y reconocimiento de patrones en secuencias de datos. Para poder aprovechar sus virtudes es necesario compilar las aplicaciones contra un compilador capaz de generar código compatible con estas instrucciones. Intel ya dispone de ellas, así como de módulos para adaptar herramientas de desarrollo de terceras partes a estas nuevas instrucciones SSSE 4.2.

Nueva jerarquía de memoria caché: con la de tipo L3 compartida por todos los núcleos que permite agilizar la puesta en común de los datos entre todos los núcleos. Además, las latencias de estas memorias caché L1, L2 y L3 son muy bajas.

– Controlador de memoria integrado: que permite obtener latencias también muy reducidas en el acceso a la memoria del sistema, que con tres canales consigue un ancho de banda de hasta 32 GB/s usando memoria DDR3. La única pega es que el voltaje no puede superar los 1,6 V so pena de quemar el controlador integrado y por ende el procesador. Y lo malo es que muchos fabricantes de memorias DDR3 han configurado los módulos para que trabajen hasta con 1,9V para conseguir mayores velocidades. Así que mucho cuidado con la memoria que se elija. Tampoco tiene por qué ser de extrema velocidad. Lo más importante es llenar las tres ranuras correspondientes a la configuración de triple canal.

Ahorro de energía: realiza un apagado literal de prácticamente todos aquellos transistores que no se usen. Por ejemplo, a la hora de ejecutar instrucciones en la pipeline, si se detecta un bucle, todas las etapas que no estén implicadas en la ejecución de dicho bucle se apagarán durante los ciclos de reloj que tarde en resolverse el "loop".

Una arquitectura extraordinaria sobre el papel y que se refleja en los resultados de las pruebas. Las nuevas tecnologías suelen aparentar más de lo que luego se ve reflejado en los resultados de los bancos de pruebas, pero en este caso, Nehalem no ha decepcionado.

Contenido del especial

Todo sobre Nehalem

¿Qué es Nehalem?

Las claves de la nueva arquitectura

Nuestras pruebas

Conclusiones

Lo más leído