A Fondo

Los pilares de la IA, descubre de qué están hechas las aplicaciones de IA que utilizamos

Publicado

10 abril, 2024

por

Toda tecnología que aspire a cambiar y transformar el mundo debe establecerse sobre unos cimientos sólidos. Los pilares de la IA no son una excepción, esta tecnología se ha construido sobre una base muy importante que conocemos como modelos fundacionales, que son los que han permitido el desarrollo de una serie de avances que están transformando por completo la manera en la que trabajamos, creamos y nos relacionamos.

Bien, ¿y qué son los modelos fundacionales? Sé que muchos de vosotros os estaréis haciendo esta pregunta, y obviamente no os voy a dejar con la duda. Un modelo fundacional es una red neural de IA entrenada con una enorme cantidad de datos en bruto, y generalmente con un aprendizaje no supervisado. Esto lo convierte en un tipo de inteligencia artificial que es capaz de entender el lenguaje humano, y de generarlo.

Os pongo un ejemplo muy sencillo para que se entienda mejor. Imaginad que le damos a un ordenador una enorme biblioteca con una ingente cantidad de conocimientos sobre diferentes temas. Al leerlos, ese ordenador aprende numerosas cosas, y también descubre la importancia del contexto y del significado que hay detrás de las palabras y de las frases completas, de la misma manera que lo haría un ser humano.

Pues bien, esto es lo que permite a los pilares de la IA, esos modelos fundacionales, tener conocimientos profundos y ser capaces de comunicarse en un lenguaje totalmente natural. Pueden ser utilizados para potenciar aplicaciones de IA en una gran cantidad de sectores, incluyendo desde la generación de contenidos (creación de imágenes, vídeos, textos, resúmenes y otros) hasta la producción asistida, el análisis de código, la transcripción de audio y la síntesis de voz.

Los modelos fundacionales suelen ser muy complejos y muy exigentes a nivel de hardware, y por ello en la mayoría de los casos las aplicaciones que se apoyan en ellos se ofrecen bajo un modelo de servicio online, es decir, no se ejecutan de forma local en nuestro PC. Esto genera dudas en materia de privacidad y seguridad, aunque por suerte poco a poco esto está cambiando, gracias al aumento de potencia que están experimentando los componentes especializados en IA.

Un buen ejemplo de ese cambio lo tenemos en ChatRTX, un chatbot que se ejecuta en local utilizando Llama2 13B INT4 y Mistral 7B INT4, gracias a la aceleración de IA que ofrecen las tarjetas gráficas GeForce RTX. Dependiendo del modelo que tengamos, y de su cantidad de memoria gráfica, podremos acceder a uno u otro modelo, siempre el primero el más exigente y complejo.

Pilares de la IA: usos de los modelos fundacionales

Sin duda uno de los modelos fundacionales más conocido es ChatGPT. Este modelo multimodal se perfila como un chatbot que ha alcanzado su cuarta versión, lo que significa que ha recibido importantes mejoras durante todo su proceso evolutivo, y es capaz de generar respuestas tanto mediante texto como de imágenes.

Interesante, pero los modelos fundacionales se puede utilizar para aplicaciones que van más allá de la generación de respuestas y de imágenes. Es un tema que ya os he adelantado anteriormente, y sobre el que vamos a profundizar ahora mismo partiendo de cuatro grandes puntos:

Procesamiento del lenguaje, lo que permite al modelo entender y generar texto.
Generación de código: en este caso es posible analizar y depurar código de computación en diferentes lenguajes.
Procesamiento visual: que abre las puertas al análisis y la generación de imágenes.
Habla: para poder convertir texto en voz y transcribir voz a texto.

Los modelos fundacionales son muy capaces, y además pueden ser entrenados para realizar una segunda tarea que esté relacionada con aquella para la que fueron entrenados en primer lugar, lo que les confiere también una gran versatilidad. Así, por ejemplo, un LLM diseñado para hablar con humanos puede ser entrenado para servir como chatbot en soporte al cliente.

Tipos de modelos fundacionales

Actualmente están en uso más de 100 modelos fundacionales de IA, un número que no deja de crecer. Los más populares son los LLMs y los generadores de imágenes, ya que son los que más se utilizan a diario. De hecho, las imágenes que encontrarás en este artículo han sido generadas con IA, y como ya sabrán muchos de nuestros lectores estamos utilizando cada vez más esta tecnología para crear imágenes atractivas con las que mejorar nuestros artículos.

Los modelos LLMs son, precisamente, los que potencian ChatRTX, que como dije anteriormente se ejecuta en local. Entre los modelos fundacionales más populares dentro de esta categoría se encuentran Google Gemma, Llama 2 de Meta y Mistral, mientras que en la categoría de generación de imágenes destacan las soluciones Stable Difussion y SDXL Turbo.

También podemos encontrar otros tipos de modelos fundacionales como Kosmos 2, que adopta un enfoque multimodal y es capaz de entender los elementos visuales que están presentes en diferentes imágenes. Impresionante, sin duda. Si quieres profundizar más sobre este tema no te pierdas la nueva entrega de la serie NVIDIA AI Decoded.

Imágenes generadas con IA.

Relacionados:ia NVIDIA NVIDIA AI Decoded

A continuación

Los chips Apple Silicon M4 también pondrán el foco en la IA

No te pierdas

Windows 12, a qué está esperando Microsoft y cuándo podría llegar

Isidro Ros

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.