A Fondo

Obleas de silicio y chips defectuosos: ¿cómo se aprovechan los que no están a la altura?

Publicado

14 enero, 2020

por

Los chips defectuosos se han convertido en todo un clásico dentro del mundillo de los semiconductores. Las obleas de silicio son el elemento básico que se utiliza para fabricar semiconductores, el corazón de miles de millones de dispositivos tecnológicos que utilizamos a diario, pero no todos esos semiconductores alcanzan el mismo nivel de funcionalidad.

De una misma oblea de silicio podemos obtener una cantidad determinada de chips funcionales, pero también una cantidad variable de chips defectuosos. Esto se denomina como tasa de éxito por oblea, y se refiere al porcentaje de chips aprovechables que podemos obtener siguiendo un determinado proceso de fabricación. Esto último es importante, ya que cada proceso determina en gran medida los resultados que vamos a obtener por oblea.

Lo entenderemos mejor con un ejemplo. Actualmente el proceso de fabricación de 14 nm que utiliza Intel tiene un grado de madurez tan grande que la tasa de éxito por oblea que obtiene el gigante del chip es enorme, es decir, apenas obtiene chips defectuosos. Sin embargo, cuando la compañía utiliza el proceso de fabricación en 10 nm la complejidad aumenta, y con ello se reduce la tasa de éxito por oblea y aumenta la tasa de chips defectuosos.

Es importante tener en cuenta que cuando hablamos del proceso de fabricación, y de la complejidad que este presenta, no nos limitamos al tema de los nanómetros utilizados, sino al proceso en conjunto. Por ello, creo que es fundamental repasar cómo se crea una oblea de semiconductores. Esto nos permitirá valorar mejor todo lo que hay detrás de ella, asimilar esa idea de complejidad a la que hicimos referencia y entender que, en resumen, los chips defectuosos son algo normal, siempre que no concurran en cantidades desmedidas.

El mítico Intel 4004.

El primer paso se da «sobre el papel», y consiste en el diseño del chip que vamos a llevar a la oblea de silicio. Una vez que el diseño está terminado y que su viabilidad ha sido confirmada es hora de llevarlo a la oblea. La materia prima de los semiconductores es el silicio, un material que se obtiene de la arena y que se utiliza para fabricar un cristal cilíndrico, que luego es cortado para siguiendo un patrón determinado que permite crear obleas de 300 mm y 0,775 mm de grosor.

Tenemos el diseño y tenemos el material, ahora toca hablar del lugar de producción. Las instalaciones de fabricación de semiconductores están formadas por lo que se conoce como «salas limpias», lugares que están tan limpios que incluso superan a los quirófanos de operaciones. Como habréis podido imaginar esto no es casualidad, se debe a una razón muy importante, y es que las obleas de silicio son muy sensibles a la suciedad, tanto que una cantidad minúscula de polvo puede arruinar por completo una tirada y dejar todos los chips defectuosos. Suciedad, contaminación y semiconductores no se llevan bien, eso está claro.

Ahora toca repasar el instrumental. La fabricación de semiconductores tiene lugar a través de diferentes procesos en los que se utilizan herramientas muy variadas. Cuando nos movemos en niveles muy complejos, como por ejemplo aquellos que bajan de los 10 nm, es imprescindible utilizar soluciones como la litografía ultravioleta extrema, ya que es la única que permite alcanzar una tasa de éxito por oblea razonable.

Con el material, la sala y las herramientas listas comienza el proceso de fabricación de semiconductores, que queda dividido en las siguientes fases:

Fotolitografía de componentes, que permite grabar con luz un patrón determinado en la oblea. Es lo que se utiliza para trasladar los patrones del diseño del chip a la oblea. Esto define aspectos tan importantes como los patrones del chip, sus elementos y sus interconexiones. Un proceso más pequeño (menos nanómetros) hace que esta etapa se más completa al reducir el tamaño, y aumenta las probabilidades de obtener chips defectuosos.
Implantación de iones de forma selectiva en la oblea manera selectiva a la oblea que permite modificar de manera controlada sus propiedades eléctricas. Los ingenieros pueden modificar a través de esta técnica la conductividad eléctrica del silicio. Como podemos ver en el vídeo esos iones se distribuyen de forma aleatoria en la capa de silicio y se fijan y ordenan aplicando calor.
Ahora se produce una limpieza exhaustiva que permite eliminar de forma selectiva restos de materiales no deseados que hayan podido quedar en la oblea de silicio.
Tras esa etapa se procede a aplicar una capa aislante que evitará que se produzcan interconexiones no deseadas entre los transistores. Es un paso fundamental, dado que trabajamos en escala nanométrica.
El siguiente paso tiene como protagonista al cobre, un material que se aplica para crear finísimas interconexiones que comunican los miles de millones de transistores que forman un chip.
Una vez aplicado el cobre se reduce el exceso de dicho material para aislar cada una de las interconexiones.
Cada empresa realiza sus propios controles de calidad para determinar el volumen de chips funcionales y los chips defectuosos.
El paso final para la comercialización de los chips es el encapsulado de estos, algo que depende del producto al que vayan a dar forma (procesadores, tarjetas gráficas, unidades SSD, memoria RAM, étc).

En el vídeo que os dejamos a continuación podéis ver esos ocho pasos perfectamente ilustrados. Intel confirmó en 2018 que está barajando el salto al cobalto como sustituto del cobre en las interconexiones de los transistores, pero el cobre sigue dominando el sector, de hecho es el material utilizando en los chips Zen 2 de AMD que, como sabemos, están fabricados en proceso de 7 nm.

Chips defectuosos, chips funcionales y chips no aprovechables

Ya sabemos como se crean los semiconductores, pero antes de continuar es importante establecer una diferenciación clara entre lo que debemos entender como chips funcionales, chips defectuosos y chips no aprovechables. Estos son los tres grandes tipos de semiconductores que podemos obtener de una oblea, y las diferencias que presentan son muy fáciles de asimilar.

Los chips totalmente funcionales son aquellos que llegan al nivel deseado, es decir, los que cumplen con todos y cada uno de los mínimos necesarios para integrarse en el producto objetivo.
Por contra, los chips defectuosos son aquellos que no llegan a ese nivel deseado pero que, sin embargo, pueden ser aprovechados para utilizarse en otro tipo de productos que no eran el objetivo principal.
Finalmente tenemos los chips no aprovechables, que son los que han quedado totalmente inutilizados durante el proceso de fabricación, o que tienen una funcionalidad tan limitada que no sirven «para nada».

Vamos a ver ejemplos concretos de cada uno de esos chips para entender mejor las definiciones que hemos dado. Imagina que AMD necesita fabricar una cantidad determinada de procesadores Ryzen 9 3950X. Estos procesadores utilizan la arquitectura Zen 2, cuentan con 16 núcleos y 32 hilos, y tienen, además, que alcanzar y mantener de forma estable unas velocidades de trabajo determinadas.

Pues bien, AMD necesitaría dos chips totalmente funcionales fabricados en proceso de 7 nm capaces de trabajar a unas velocidades elevadas y un chip en proceso de 12 nm, la unidad I/O. Cada chip de 7 nm debe tener sus ocho núcleos activos y funcionar sin problemas a las velocidades requeridas (4,3 GHz). Esto quiere decir que los que no cumplan esos dos requisitos serán considerados como chips defectuosos, pero esto no significa que no se puedan aprovechar.

Por ejemplo, los chips defectuosos que tengan seis núcleos activos se podrán utilizar para dar forma a procesadores Ryzen 9 3900X, que tienen 12 núcleos y 24 hilos, y también para fabricar procesadores Ryzen 5 3600 y 3600X, que tienen 6 núcleos y 12 hilos. Aquí es importante añadir otro detalle importante, y es que los chips defectuosos que tengan problemas para llegar a frecuencias más elevadas se utilizarán en los primeros, que vienen a frecuencias más bajas de fábrica, y los que puedan llegar a velocidades más elevadas irán a parar a los segundos.

Los procesadores que utilizan chips defectuosos funcionan sin problema, es decir, no son productos de mala calidad, simplemente utilizan semiconductores que no han dado la talla para ser integrados en soluciones superiores. Hoy ya no es habitual, pero hace unos años esta estrategia dio muchas alegrías a los usuarios que compraban procesadores con núcleos deshabilitados por ser defectuosos y descubrían que podían activarlos sin sacrificar rendimiento ni estabilidad, una realidad que también se ha extendido a las GPUs.

Y hablando de GPUs, vamos con otro ejemplo, esta vez centrado en el sector de las tarjetas gráficas. Tanto NVIDIA como AMD mantienen el mismo enfoque hemos indicado anteriormente, ya que les permite aprovechar chips defectuosos para crear productos de gama alta, gama media y gama baja.

Vamos con ejemplos concretos. NVIDIA utiliza el núcleo gráfico TU104 en cinco tarjetas gráficas de consumo general: RTX 2080 Super, RTX 2080, RTX 2070 Super, RTX 2070 y RTX 2060 Super. Sí, una misma GPU da vida a cinco tarjetas gráficas muy distintas, tanto que la RTX 2080 Super supera en más de un 30% el rendimiento de la RTX 2060 Super. Por su parte AMD hace lo mismo con el núcleo gráfico Navi 10, utilizado en las RX 5700 XT, RX 5700 y RX 5600 XT.

La clave está, de nuevo, en esa idea de aprovechar chips defectuosos. El núcleo gráfico TU104 tiene en un diseño totalmente funcional, es decir, perfecto, 48 Streaming Multiprocesors (SM), lo que equivale a 3.072 shaders. De una oblea de silicio pueden salir una cantidad determinada de chips con todas las unidades SM activas, pero también otros defectuosos con menos unidades activas, lo que significa que tendrá una cantidad de shaders inferior.

Pues bien, los chips con 3.072 shaders activos se utilizan para fabricar las RTX 2080 Super, mientras que los chips defectuosos con 2.944 shaders, 2.560 shaders, 2.304 shaders y 2.176 shaders se utilizan para dar forma a las RTX 2080, RTX 2070 Super, RTX 2070 y RTX 2060 Super.

En el caso de AMD tenemos el mismo escenario. El núcleo gráfico Navi 10 tiene, en su configuración perfecta, un total de 40 Compute Units (CU), lo que equivale a 2.560 shaders. Los chips que salgan de la oblea siendo totalmente funcionales se utilizarán para fabricar las RX 5700 XT, mientras que aquellos con 2.304 shaders activos servirán para producir las RX 5700 y RX 5600 XT.

Tened presente que en caso de que sea necesario, es decir, por cuestiones de oferta, producción y demanda, cualquier compañía puede «recortar» voluntariamente las especificaciones de un chip para crear productos con unas características concretas, y que también existen soluciones concretas dirigidas a la gama media y gama baja, es decir, no todos los semiconductores que se utilizan para crear productos más económicos se basan en chips defectuosos que iban destinados a la gama alta.

Sé lo que estáis pensando, ¿y qué ocurre con los chips que tienen defectos tan profundos que no se pueden aprovechar? Es una buena pregunta, y la respuesta es muy sencilla. En algunos casos hemos visto que se han utilizado para crear productos de gama básica, con un nivel de prestaciones muy limitado y pensados para cubrir nichos muy concretos, pero lo normal es que acaben siendo desechados.

Con todo, en momentos concretos algunas compañías han optado por aprovechar esos chips defectuosos de formas muy curiosas. Por ejemplo, AMD utilizó los núcleos gráficos Vega 20 no funcionales como elementos decorativos con los que promocionar la Radeon VII, algo que también han hecho otras compañías como NVIDIA, Intel e incluso Microsoft con el SoC de Xbox One X.

¿Por qué mantienen esta estrategia los grandes del sector?

Todo obedece a una cuestión de costes y de eficiencia. Crear semiconductores es muy complicado, ya lo hemos visto en la primera parte del artículo, y obliga a asumir además una serie de riesgos determinados. Cuando se utiliza un proceso de fabricación muy maduro y se recurre a un fabricante de confianza la rentabilidad obtenida por oblea puede ser muy alta, pero esa no es la norma habitual.

Diseñar una estrategia de productos que giren alrededor de esa idea de chips totalmente funcionales, chips defectuosos y chips aprovechables es clave para optimizar al máximo el rendimiento obtenido por oblea, para minimizar el riesgo de la inversión realizada en un proceso determinado y para exprimir al máximo la rentabilidad de un diseño o de una arquitectura concreta.

No es un tema baladí, esto último es consecuencia directa del primer paso al que hemos hecho referencia, al tema del diseño del chip sobre papel, y nos permite entender a la perfección por qué es tan rentable la arquitectura MCM que utiliza AMD en Ryzen, y por qué la idea de construir cinco tarjetas gráficas diferentes a partir de un único núcleo gráfico puede ser muy beneficioso para NVIDIA.

Crear un diseño único sobre papel que nos permita fabricar un chip con el que dar forma a diferentes productos agrupados en gamas muy distintas supone una reducción de costes enorme que aplica en todas las fases necesarias para su creación y permite, además, un aprovechamiento óptimo de casi todos los chips defectuosos obtenidos en cada oblea de silicio. Ya lo hemos dicho anteriormente, AMD puede aprovechar dos chips con seis núcleos activos de un total de ocho para crear un chip de doce núcleos. Bajo una arquitectura de núcleo monolítico esto no sería posible, ya que solo podríamos aprovechar los chips con doce núcleos activos en una única pastilla de silicio.

AMD utiliza, además, ese diseño único de chiplets de ocho núcleos cada uno como base sobre la que construye prácticamente todos y cada uno de los procesadores que utiliza, lo que se traduce en una simplicidad tan apabullante como efectiva en términos económicos y productivos, gracias al menor impacto de los chips defectuosos.

Volviendo al ejemplo que pusimos sobre NVIDIA y el TU104 como base de cinco tarjetas gráficas distintas la esencia es prácticamente idéntica, ya que se aprovecha un mismo diseño para crear cinco productos distintos. Esto permite rentabilizar al máximo el diseño del chip, la arquitectura del mismo y todas las claves técnicas que tiene asociadas.

No quiero terminar este artículo sin volver a destacar un matiz importante sobre los chips defectuosos. El hecho de que una serie de productos concretos utilicen chips defectuosos no quiere decir que no funcionen correctamente, y tampoco que vayan a dar problemas a corto, medio o largo plazo, simplemente utilizan un semiconductor que se fabricó con el objetivo de que llegara a un nivel determinado pero no alcanzó el estándar que se había fijado. A pesar de todo su uso en un nivel inferior se determinó como perfectamente viable, y por ello se utilizó para crear productos más económicos.

Esta práctica se mantiene desde hace décadas y como dije ha sido muy beneficiosa para el consumidor. Recuerdo, por ejemplo, lo buenas que salieron las GeForce 8800 GT a pesar de contar con un núcleo gráfico G92 con 112 shaders activos del total de 128 que tenía dicha GPU, o los excelentes resultados que ofreció en su momento la GTX 970, equipada con un núcleo gráfico GM204 con solo 1.664 shaders activos de los 2.048 shaders que tenía dicho chip.

Los grandes del sector van a mantener esta estrategia en sus próximos productos, lo que significa que tanto las GeForce RTX serie 30 como las Radeon Navi de nueva generación, así como los nuevos procesadores de Intel y AMD, seguirán aprovechando los chips defectuosos para dar forma a productos de gama alta más económicos, y también a soluciones de gama media y baja con un coste inferior.

Relacionados:Chips destacado Silicio Tecnología

A continuación

PS5 y Xbox Series X: diez preguntas y respuestas que resumen todas las claves de la nueva generación de consolas

No te pierdas

Qué es la tasa de refresco variable, por qué es importante en juegos y cuáles serán las novedades para 2020

Isidro Ros

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.