Fundamentos de la inteligencia artificial, todo lo que debes saber para entenderla

Guías

Fundamentos de la inteligencia artificial, todo lo que debes saber para entenderla

Publicado

6 abril, 2023

por

David Salces

Durante los últimos meses la inteligencia artificial se ha convertido en un tema de información-conversación recurrente. Primero fue por los modelos generativos de imágenes, como DALL-E 2, Midjourney Stable Diffusion y similares, después por los chatbots como ChatGPT, el nuevo Bing, Poe y el esperado Bard, y de manera más reciente por su salto a las soluciones de productividad, con los anuncios de la integración de la IA en Gmail y Docs de Google, y en Microsoft 365 con Copilot.

Todavía no está claro cuánto hay de burbuja en todo lo que está ocurriendo, si es que hay algo, puesto que estamos viendo a diario como más aplicaciones y servicios adoptan la inteligencia artificial para funciones de lo más diversas. Es posible que, pasado este pico, veamos decaer dicho ritmo de implantación, e incluso que algunos de los que la están adoptando en estos tiempos, más por subirse a la ola que por utilidad real, terminen por dar marcha atrás.

Sin embargo, el potencial de la inteligencia artificial en muchos de las actividades en las que ya ha empezado a ganar posiciones es, sencillamente, indiscutible. Los chatbots con capacidad de interpretar el lenguaje natural pueden facilitar sustancialmente la búsqueda de información en Internet, la creación de contenidos, el análisis de datos, la optimización de procesos… la lista es extensa y de categoría, y aunque los responsables de los modelos todavía tienen que solventar algunos problemas importantes, como las alucinaciones, constantemente se producen avances importantes en este sentido.

Dicho de otra manera, la inteligencia artificial ha llegado para quedarse, y en los próximos meses y años podemos esperar bastantes avances, tanto en su fiabilidad como en su llegada a nuevos campos, algunos ya imaginables en la actualidad y otros que, muy probablemente, nos sorprenderán. Seguramente su ritmo de implantación no sea tan acelerado como el que vivimos estos meses, pero sí que será constante, además de mucho más planificado que en la actualidad.

Así pues, de cara a esta nueva realidad que ya empieza a ser presente, además de estar al día de los últimos avances también es importante tener claros algunos conceptos intrínsecamente asociados a la inteligencia artificial. Son términos que escuchamos habitualmente, pero cuyo significado no siempre tenemos claro. ¿Y qué mejor momento que este para darles un repaso y definirlos? De esta manera, cuando vuelvas a escuchar cualquiera de ellos, tendrás mucho más claro a qué se refiere.

Vamos pues, sin más, a repasar los fundamentos de la inteligencia artificial, abordando los conceptos fundamentales de la misma.

Inteligencia artificial

La inteligencia artificial (IA) es una rama de la informática dedicada al diseño y desarrollo de sistemas capaces de realizar tareas que, hasta hace poco, solo podían ser realizadas por seres humanos. Esta disciplina se enfoca en la creación de algoritmos y programas que permiten a los modelos procesar información de manera inteligente, aprender de la experiencia y adaptarse al contexto para, de este modo, ofrecer las mismas o mejores respuestas (que pueden ser de cualquier tipo) de las que daría un ser humano.

Dataset

Conjunto de datos organizados en una estructura que permite su análisis y procesamiento por parte de algoritmos de aprendizaje automático. Los datasets son la materia prima fundamental para el entrenamiento de los modelos de IA, ya que estos se alimentan de los datos para aprender y mejorar su desempeño en las tareas para las que han sido diseñados.

Los datasets pueden ser de distintas formas y tamaños, dependiendo del tipo de problema que se quiera resolver. Por ejemplo, en el procesamiento de imágenes se utilizan datasets de imágenes etiquetadas con información sobre su contenido, mientras que en la detección de patrones de compras se pueden emplear datos no etiquetados obtenidos de redes sociales, registros clientes, etcétera.

Son varios los puntos que debemos tener en cuenta a la hora de crear o elegir un dataset, pues la calidad del mismo determinará la fiabilidad y calidad de la salida. Estos son los más importantes:

Completo: un dataset debe contener todos los datos necesarios para entrenar el modelo de manera efectiva. Esto significa que debe ser lo suficientemente grande y abarcar todos los casos relevantes para el problema que se está intentando resolver.
Representativo: un dataset debe ser representativo del problema que se está intentando resolver. Es decir, debe reflejar las características y la variabilidad de los datos en el mundo real para que el modelo pueda aprender de manera efectiva.
Etiquetado (para aprendizaje supervisado y semi-supervisado): los datos en un dataset deben estar etiquetados correctamente para que el modelo pueda aprender de manera efectiva.El etiquetado consiste en asociar cada dato de entrada con una etiqueta que lo clasifique en una categoría o clase específica.
Libre de errores: un dataset debe estar libre de errores y redundancias para que los modelos de inteligencia artificial puedan aprender de manera efectiva. Los datos con errores pueden generar resultados inexactos y afectar a la calidad del modelo y sus respuestas.
Respetuoso con la privacidad y con la propiedad intelectual: los datos que componen el dataset deben ser respetuosos de la privacidad, además, no emplear contenidos protegidos por derechos de autor de cualquier tipo. Por lo tanto, es muy importante que los datos se recolecten de manera ética y se utilicen de manera responsable.
Actualidad: en muchos casos un dataset debe estar lo más actualizado posible, especialmente si se trata de datos que cambian con el tiempo, como el clima, las noticias, precios de productos, etcétera. Un dataset desactualizado puede generar resultados inexactos y limitar la eficacia del modelo.
Variado: debe incluir una variedad de datos y casos para que el modelo pueda aprender a reconocer patrones y características relevantes en diferentes contextos y situaciones. La falta de diversidad en el proceso de aprendizaje puede dar lugar a sesgos, inexactitud y a la no detección de patrones y resultados que se alejen de los elementos empleados en el entrenamiento.
Balanceado: un dataset debe estar balanceado en cuanto a la cantidad de datos que pertenecen a cada clase o categoría. Si hay una desproporción significativa entre las clases, el modelo puede tener un sesgo hacia las clases con mayor representación, lo que afectaría su capacidad para generalizar y hacer predicciones precisas.
Calidad: los datos en un dataset deben tener una calidad suficiente para que el modelo pueda aprender de manera efectiva. Esto incluye la precisión de las mediciones, la resolución de las imágenes, la claridad del texto, entre otros aspectos.
Interpretabilidad: un dataset debe ser interpretable y fácil de entender para los seres humanos, especialmente para los expertos en el problema que se está intentando resolver. Esto permitirá validar los resultados del modelo y detectar posibles errores o sesgos.

Como puedes comprobar, un buen dataset es imprescindible para que un modelo se entrene y valide correctamente. La buena noticia es que puedes encontrar bastantes repositorios públicos desde los que podrás descargarlos y emplearlos si te decides a dar tus primeros pasos en el mundo de la inteligencia artificial. Por darte una referencia, personalmente me gusta mucho el repositorio de la Donald Bren School of Information and Computer Sciences de la Universidad de California, que además recientemente ha empezado a probar un nuevo diseño, que facilita mucho la búsqueda de datasets. Puedes encontrarlo en este enlace.

Redes neuronales

Las redes neuronales son una técnica de inteligencia artificial que imita el funcionamiento del cerebro humano para procesar información. Se basan en un conjunto de algoritmos interconectados que imitan el comportamiento de las neuronas del cerebro para realizar tareas complejas como el reconocimiento de patrones, la clasificación de datos y la toma de decisiones.

Las redes neuronales se componen de capas de nodos interconectados, que procesan la información y la transmiten a la siguiente capa. Cada nodo tiene una función de activación, que determina la salida del nodo en función de su entrada y los pesos de las conexiones que tiene con otros nodos. Durante el entrenamiento, la red ajusta automáticamente los pesos y las conexiones entre los nodos para minimizar el error en la predicción de los resultados.

Machine Learning

El machine learning, también conocido como aprendizaje automático, es una técnica dentro del campo de la inteligencia artificial que permite a los ordenadores aprender a través de la experiencia. En lugar de programar explícitamente una solución a un problema, los algoritmos de machine learning son capaces de analizar datos y aprender patrones para poder tomar decisiones y realizar tareas específicas. Existen tres tipos principales de algoritmos de machine learning: el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje por refuerzo, los veremos en detalle algo más adelante.

El machine learning se aplica en una amplia variedad de campos, desde la industria del entretenimiento y la publicidad hasta la medicina y la seguridad. Por ejemplo, el reconocimiento de voz y de imagen, la detección de fraude y la recomendación de productos son aplicaciones comunes de esta tecnología. El machine learning también se utiliza para crear chatbots, asistentes virtuales y otros sistemas de inteligencia artificial que pueden mejorar la eficiencia y la productividad de las empresas y organizaciones.

Deep Learning

Deep Learning es una técnica dentro del campo de machine learning que utiliza redes neuronales profundas para procesar grandes cantidades de datos y extraer patrones complejos y características de alto nivel. A diferencia del machine learning convencional, Deep Learning es capaz de aprender de forma autónoma a través de múltiples capas de procesamiento, lo que permite obtener resultados más precisos y sofisticados.

La arquitectura de una red neuronal profunda está compuesta por múltiples capas de procesamiento, que permiten al algoritmo aprender de forma jerárquica a partir de los datos de entrada. Cada capa procesa la información y la transmite a la siguiente capa, y así sucesivamente, hasta que se llega a la capa de salida. Durante el entrenamiento, la red ajusta automáticamente los pesos y las conexiones entre las neuronas para minimizar el error en la predicción de los resultados. Así, como puedes deducir, las múltiples capas y la capacidad de balancear la salida de cada capa proporciona una salida mucho más precisa, si tanto el algoritmo como el proceso de entrenamiento son adecuados.

Deep learning se emplea en una gran variedad de aplicaciones, desde el reconocimiento de voz hasta el procesamiento de imágenes y video, pasando por la traducción automática y el diagnóstico médico y los sistemas de conducción autónoma. No obstante, un ejemplo especialmente reconocido del uso de Deep Learning lo encontramos en DLSS, el sistema de super-escalado inteligente de NVIDIA.

Aprendizaje supervisado y no supervisado

Como ya habrás deducido o sabrás, el aprendizaje no es otra cosa que el proceso en el que alimentamos al algoritmo de inteligencia artificial con datos que empleará para aprender. Podemos estar hablando de textos, imágenes, sonidos, documentos en múltiples formatos…Esto dependerá, claro, de la función que queremos que cumpla el modelo una vez entrenado. Y también dependerá de eso que optemos por una u otra modalidad de aprendizaje.

En el aprendizaje supervisado, todos los elementos que empleamos para este proceso están etiquetados, es decir, que hacemos saber al algoritmo qué es lo que contienen. Por ejemplo (y no será la última vez que empleemos este ejemplo en particular, te lo aseguro), imagina que quieres crear un modelo de inteligencia artificial que sepa distinguir si el animal que se muestra en una imagen es un gato o un perro. En tal caso, en el entrenamiento emplearemos fotos de gatos y fotos de perros, indicándole al algoritmo a qué categoría pertenece cada una de las imágenes.

En el aprendizaje no supervisado… efectivamente, lo has deducido, entrenamos a la IA con los datos, pero no los etiquetamos. ¿Por qué? Porque en este caso lo que queremos es que el modelo sea capaz de detectar patrones ocultos en los mismos. De este modo, será la IA la que analice el contenido del dataset en búsqueda de datos que pueda relacionar entre sí y las potenciales implicaciones de dichas relaciones. Un ejemplo común de aprendizaje no supervisado lo encontramos en el aprendizaje de grandes datasets de perfiles sociales o de compras, que pueden arrojar sorprendentes resultados relacionados con potencial de compra de determinado tipo de productos o consumo de un tipo en particular de contenidos.

Existe, por si te lo estaba preguntando, la modalidad de aprendizaje semisupervisado, en la que el modelo se alimenta con un dataset de datos etiquetados, pero además analiza los mismos en busca y captura de patrones basados en datos presentes en los mismos pero que no han sido etiquetados. Este tipo de modelo combina lo mejor de los dos en los que se basa, si bien también puede reproducir los problemas de ambos, además de ser más complejo de desarrollar.

Aprendizaje por refuerzo

Es una técnica de aprendizaje automático en la que el modelo aprende a tomar decisiones mediante la interacción con su entorno y el retorno recibido por parte del mismo, que lo premiará ante las respuestas acertadas. El aprendizaje por refuerzo se inspira en la forma en que los seres humanos, tanto en su propio aprendizaje como también cuando educan a otras formas de vida, aprenden a través de la experiencia y el ensayo y error mediante un sistema de recompensa.

En la práctica, el aprendizaje por refuerzo se utiliza en una amplia variedad de aplicaciones, desde robótica y automatización industrial hasta juegos y simulaciones. Por ejemplo, un modelo de aprendizaje por refuerzo puede ser entrenado para jugar al ajedrez, mejorando gradualmente su habilidad a través de la experiencia y el obtenido en cada partida. También se ha utilizado en la optimización de procesos industriales, donde un modelo aprende a maximizar la eficiencia y minimizar los costes en un entorno de producción complejo.

Procesamiento del lenguaje natural

Esta es una de las disciplinas más importantes de cara a la popularización de la inteligencia artificial, pues es la responsable de que los modelos puedan recibir entradas (prompts) escritos por los usuarios y entender qué es lo que se indica en ellas. En mayor o menor medida, siempre hemos adaptado (o lo hemos intentado) nuestro lenguaje al propio de la máquina. Ya sea con los lenguajes de programación o con frases especialmente sintéticas para optimizar los resultados de una búsqueda, es el ser humano el que intenta formular sus consultas del modo más claro posible para el sistema o servicio que está empleando.

El procesamiento del lenguaje natural camina en sentido contrario, haciendo que sea el sistema el que es capaz de interpretar el lenguaje humano, con sus múltiples giros, variantes, expresiones e incluso errores y faltas de ortografía, para de ese modo ser capaz de saber cómo darle respuesta. «Hablar» con un chatbot ya es una experiencia parecida, por el uso del lenguaje que hacemos, a hacerlo con otra persona, fruto de los avances en esta área.

Visión artificial

Dado que tú eres más sensible al contexto que la inmensa mayoría de las IA (y eso que han evolucionado mucho a este respecto), seguro que tras leer la explicación anterior ya te imaginas de qué vamos a hablar en este punto. No te equivocas, efectivamente la visión artificial es la rama de la inteligencia artificial que se enfoca en el desarrollo de algoritmos y sistemas que pueden procesar y entender imágenes y videos. Es decir, busca replicar la capacidad humana de ver y comprender el contenido visual, utilizando técnicas y algoritmos de aprendizaje automático y procesamiento de imágenes.

La visión artificial se utiliza en diversas aplicaciones, como reconocimiento facial, detección de objetos en imágenes, identificación de patrones en imágenes médicas, vigilancia y seguridad, entre otras. También es un componente importante en la automatización de procesos en la industria, en la robótica y en la conducción autónoma de vehículos. Si quieres ver un ejemplo reciente de visión artificial, puedes encontrarlo en el repaso que hicimos de las novedades de GPT-4.

Agentes inteligentes y sistemas expertos

Aunque los agentes inteligentes y los sistemas expertos comparten algunas similitudes, no son exactamente lo mismo. En común tienen, que no es poco, que ambos son herramientas de inteligencia artificial diseñadas para llevar a cabo tareas específicas y tomar decisiones informadas, es decir, que son soluciones que permiten automatizar tareas y funciones. Eso sí, se diferencian en cómo se aborda la toma de decisiones.

Un sistema experto es un algoritmo que utiliza reglas lógicas y conocimiento experto en un dominio específico para realizar tareas de diagnóstico, toma de decisiones y resolución de problemas. El conocimiento se incorpora al sistema mediante la definición de reglas y relaciones lógicas entre los datos. Estas reglas se aplican a los datos de entrada para inferir una salida o una recomendación. Es decir, que responderá siempre en base a lo aprendido en su entrenamiento/codificación.

Por otro lado, un agente inteligente es un programa que interactúa activamente con su entorno para lograr un objetivo específico. El agente puede recibir información del entorno, procesarla y tomar decisiones para lograr su objetivo. A diferencia de los sistemas expertos, los agentes inteligentes pueden adaptarse y aprender de su entorno, y ajustar su comportamiento en función de las recompensas o los castigos que reciban. Por decirlo de una manera resumida, es sensible al contexto y aprende del mismo, lo que hace que sea más adaptable.

Imágenes generadas con Microsoft Bing Image Creator.

A continuación

Intel dice adiós a los Core 11 y aquí aprovechamos para ordenar su catálogo

No te pierdas

10 aplicaciones de gestión de tareas para aprovechar nuestro valioso tiempo

David Salces

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnología... pues sí, tendría las canas que tengo. Por lo demás, música, fotografía, café, un eReader a reventar y una isla desierta. ¿Te vienes?