¿Qué es Nehalem?

¿Qué es Nehalem?
4 de noviembre, 2008

Nehalem es el nombre clave con el que se conoce a la microarquitectura de siguiente generación de Intel, sucesora de la microarquitectura Core, integradas ambas dentro de la estrategia Tick-Tock.

En cierto modo, los cambios de arquitectura en un procesador son algo así como las reformas en una casa. La estructura básica sigue siendo la misma, pero periódicamente se hace necesario cambiar la distribución interna o el mobiliario para instalar tuberías nuevas con mejores tecnologías, un cableado más eficiente y moderno, o preparar la casa para alojar a más habitantes. En los procesadores lo que se mantiene constante es la compatibilidad con el juego de instrucciones x86, y lo que se cambia periódicamente es la disposición y funciones de los transistores en su interior para optimizar su funcionamiento, conseguir mayores velocidades de ejecución o incorporar características nuevas acordes con los tiempos que corren. Una especie de ampliaciones, en vez de reformas propiamente dichas.

Logotipos oficiales de la nueva arquitectura Nehalem.

De acuerdo con la estrategia Tick-Tock de Intel, el cambio de mobiliario sería un Tick, y el cambio de la distribución interna o las ampliaciones serían un Tock. La razón de ser de esta cadencia se puede entender también a partir de la analogía de la casa: si se acomete la compra de muebles al tiempo que se hace la reforma, es fácil que al final haya muebles que no encajen con las medidas preliminares, o sencillamente se tarde más tiempo en hacer habitable la casa.

De momento Intel ha cumplido a rajatabla con el calendario de ticks y tocks, que comenzaron con Merom y la arquitectura Core (Tock) usando una tecnología de fabricación de 65 nm. Luego se dio paso a Penryn que suponía el salto a los 45 nm (Tick) allá en 2006, para pasar ahora a Nehalem con tecnología de 45 nm (Tock). El siguiente Tick será Westmere, con tecnología de fabricación de 32 nm, y el siguiente Tock ya tiene nombre, Sandy Bridge, y será una nueva microarquitectura. De todos modos, en los Tock también se introducen mejoras en la tecnología de fabricación, como en este caso el uso de Hafnio para minimizar las fugas de corriente en los transistores y dejando más margen para aumentar el rendimiento aumentando la frecuencia o jugando con el nivel de disipación para ajustar dinámicamente la frecuencia de reloj o los voltajes de los componentes del equipo.

El cambio más importante de Intel en los últimos años

Con Nehalem no sólo se introduce una nueva familia de procesadores, también cambia la estructura tradicional de las plataformas de Intel donde los distintos elementos de un sistema se comunicaban mediante el tradicional FSB (Front Side Bus) paralelo. Así, si el procesador tenía que comunicarse con la memoria del sistema o con otros componentes, incluyendo otros procesadores y núcleos, debía hacerlo a través del bus del sistema y del chipset.

El cambio en la disposición de los sistemas PC se modifica en Intel del mismo modo que ocurría con AMD con su arquitectura K8 y el Athlon 64. El bus del sistema desaparece, para dejar paso a un canal de comunicación serie denominado Quick Path Interconnect o QPI. Se trata de un canal bidireccional con un ancho de banda de más de 25 GB/s que permite la comunicación directa entre el procesador y el controlador I/O de entrada/salida o entro varios procesadores. Guarda similitudes con HyperTransport de AMD, pero mejorando sus características y reduciendo la latencia en todas las operaciones que tengan que ver con acceder a la memoria o a datos almacenados en registros.

Controlador de memoria integrado

Además de QPI, la microarquitectura Nehalem contempla la integración de un controlador de memoria DDR3 de triple canal en la propia CPU. Esta solución ya la incluye AMD en sus procesadores con arquitectura K8 y K10, pero Intel añade un tercer canal a los dos tradicionales para incrementar el ancho de banda disponible. Además, se ha trabajado mucho en Intel para reducir al mínimo los accesos a memoria dando preferencia a la optimización de la memoria caché y los algoritmos que permiten maximizar la tasa de aciertos en la búsqueda de datos en memoria caché, ya sea L1, L2 o L3. La caché es de tipo inclusivo, de modo que sólo hay que realizar un comprobación en la memoria L3 para saber con exactitud si un dato está o no en caché.

Estructura modular

Los procesadores Core i7 son los primeros representantes de la familia Nehalem, pero no son representativos del tipo de procesador que Intel fabricará durante los próximos años. Todo lo contrario: Intel ha diseñado una microarquitectura modular en la que los núcleos se encuentran "separados" del resto de la lógica integrada en el procesador. De este modo, se tendrán procesadores tanto para sobremesa como para portátiles con dos, cuatro y hasta ocho núcleos. La diferenciación viene dada por los componentes "fuera" del core como el número de canales del controlador de memoria o el rendimiento de QPI. Además, el control sobre los núcleos se realiza de un modo extremadamente preciso merced al microcrontrolador PIC que se encarga de activar y desactivar los distintos núcleos de acuerdo con el tipo de aplicaciones que se ejecuten, su grado de paralelismo, el consumo de corriente o la temperatura, de modo que todas las operaciones relacionadas con el control del voltaje o la frecuencia de los núcleos ha pasado de los sistemas basados en controladores externos fuera de la CPU, al firmware del procesador embebido en sus transistores

La idea de un microcontrolador de estas características da pie a imaginar futuros desarrollos sumamente flexibles y "programables". Con el software adecuado se podrían crear perfiles de todo tipo a la medida de cada necesidad. Imaginamos que el auténtico potencial de esta flexibilidad y modularidad se podrá ver cuando Nehalem llegue al mundo de los portátiles el año próximo.

Optimización del consumo

Con más de 700 millones de transistores y un TDP de 130W, el procesador Core i7-965 es la máxima expresión del momento de la arquitectura Nehalem. Y si no dispusiese de un control detallado y preciso sobre qué componentes internos están en activo o apagados, la cantidad de calor disipada sería problemática. Por no hablar de los problemas que se derivan en los data centers del calor excesivo originado por los equipos, o de la necesidad de obtener consumos de apenas unos pocos Vatios en ordenadores portátiles. La implementación de Power Gates entre la alimentación y las tomas de voltaje en los núcleos permiten llevar a casi 0 el consumo energético de los núcleos en reposo.

Nehalem se pone el turbo

Otra característica interesante en Nehalem es el modo "turbo". A partir del control preciso sobre consumo de corriente, la potencia disipada o la temperatura, el sistema puede tomar la decisión de parar algunos de los núcleos y al mismo tiempo llevar por encima de su valor nominal la frecuencia y/o el voltaje del núcleo o los núcleos que se aprovechen realmente en escenarios con un nivel de paralelismo reducido. De este modo, se puede aumentar el rendimiento usando únicamente aquellos núcleos que son necesarios para la ejecución de un proceso o de un programa. De todos modos, la configuración de este comportamiento dinámico del procesador en la BIOS es un tanto engorrosa en estas primeras revisiones de la placa base Intel Desktop Board DX58SO Extreme Series. Para conseguir un comportamiento dinámico, hay que definir el valor máximo del multiplicador para cada posible caso: que trabajen cuatro núcleos, o sólo tres, dos o uno. Una vez configurada esta batería de multiplicadores, ya se puede trabajar de un modo dinámico en el que la velocidad de los núcleos vendrá dada por el tipo de aplicaciones.

Lo cierto es que el nivel de detalle con el que se pueden configurar los distintos parámetros de funcionamiento del sistema Nehalem es extremadamente alto. Intel ha abierto las puertas de par en par a los usuarios amantes del overclocking con el procesador Core i7-965 Extreme Edition. Y especialmente este procesador gracias a tener el multiplicador desbloqueado, que por otra parte ofrece la combinación ideal de un factor de multiplicación elevado junto con una velocidad de reloj de referencia tan reducida como 133,33 MHz. De este modo se puede jugar tanto con el valor de la velocidad del reloj de referencia como con el multiplicador, siempre y cuando se disponga del procesador Core i7-965 EE.

Otra forma de manipular los parámetros del sistema de un modo cómodo y eficaz es usando el software Intel Desktop Control Centre, que ya dispone de una versión compatible con las placas equipadas con el nuevo chipset X58. Salvo algunas opciones especialmente "profundas", se pueden realizar modificaciones sobre multiplicadores o temporizaciones de memoria sin necesidad de reiniciar el equipo.

Contenido del especial

Todo sobre Nehalem

¿Qué es Nehalem?

Las claves de la nueva arquitectura

Nuestras pruebas

Conclusiones

  • Share This