Conecta con nosotros

Noticias

ChatGPT tenía una extraña obsesión con los goblins

Publicado

el

ChatGPT tenía una extraña obsesión con los goblins

OpenAI ha explicado recientemente uno de los comportamientos más curiosos detectados en sus modelos de inteligencia artificial: la tendencia de ChatGPT a mencionar goblins, gremlins y otras criaturas en metáforas o ejemplos dentro de sus respuestas. Lo que al principio parecía un simple detalle anecdótico terminó llamando la atención tanto de usuarios como de los propios investigadores de la compañía. Con el paso de los meses, el patrón se hizo cada vez más evidente y terminó motivando una investigación interna para entender por qué el modelo estaba adoptando ese tipo de lenguaje de forma cada vez más frecuente.

Las primeras señales claras aparecieron tras el lanzamiento de GPT-5.1. Poco después de su llegada, algunos usuarios comenzaron a notar que el modelo utilizaba con mayor frecuencia referencias a criaturas fantásticas para explicar conceptos complejos o ilustrar determinadas situaciones. Aunque en muchos casos se trataba de metáforas aparentemente inofensivas o incluso divertidas, la frecuencia con la que aparecían empezó a crecer lo suficiente como para que el equipo de OpenAI decidiera analizar el fenómeno con más detalle.

Al revisar los datos de uso del modelo, los investigadores detectaron que la presencia de palabras como goblin o gremlin había aumentado de forma significativa respecto a versiones anteriores. El incremento no era masivo en términos absolutos, pero sí claramente perceptible en determinadas variantes del modelo y en ciertos estilos de respuesta. Este patrón indicaba que no se trataba de una simple coincidencia lingüística, sino de un comportamiento emergente que podía estar relacionado con el propio proceso de entrenamiento.

La investigación interna terminó señalando a una característica concreta del sistema: una personalidad opcional llamada “Nerdy”, diseñada para ofrecer respuestas más juguetonas, entusiastas y cargadas de metáforas. Este estilo pretendía hacer las explicaciones más cercanas y entretenidas, especialmente en temas científicos o técnicos. Sin embargo, durante el entrenamiento de esa personalidad se introdujeron incentivos que premiaban especialmente el uso de comparaciones creativas, lo que acabó favoreciendo la aparición de criaturas fantásticas en muchas respuestas.

ChatGPT tenía una extraña obsesión con los goblins

Ese sistema de recompensas provocó que las respuestas que incluían palabras como goblin o gremlin obtuvieran puntuaciones ligeramente más altas durante el proceso de aprendizaje del modelo. Con el tiempo, ese pequeño incentivo terminó amplificando el comportamiento de forma progresiva. Además, algunos de esos ejemplos generados por el propio modelo se reutilizaron posteriormente en fases adicionales de entrenamiento, lo que contribuyó a que ese tic lingüístico se extendiera incluso fuera del contexto específico de la personalidad “Nerdy”.

Para corregir el problema, OpenAI decidió retirar esa personalidad del sistema, eliminar las señales de recompensa que favorecían ese tipo de metáforas y filtrar datos de entrenamiento que contenían referencias excesivas a criaturas. También se introdujeron ajustes adicionales en el proceso de entrenamiento para evitar que este tipo de patrones lingüísticos se propaguen de forma inesperada en futuras versiones del modelo.

Más allá de lo anecdótico, el caso de los goblins ilustra bien cómo pequeños ajustes en los sistemas de recompensa pueden influir de forma significativa en el comportamiento de modelos complejos como GPT. También pone de relieve la importancia de auditar constantemente estos sistemas, ya que incluso detalles aparentemente menores en el entrenamiento pueden acabar moldeando la forma en la que una inteligencia artificial explica conceptos o se comunica con los usuarios.

Más información

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnología... pues sí, tendría las canas que tengo. Por lo demás, música, fotografía, café, un eReader a reventar y una isla desierta. ¿Te vienes?

Lo más leído