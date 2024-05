Ya ha pasado un día desde que OpenAI nos mostrara GPT-4o y todo lo que este nuevo LLM es capaz de hacer al implementarlo en ChatGPT, y muchos todavía estamos impresionados por el excepcional salto que supone con respecto a su precedente. Mira Murati, CTO de la tecnológica, rompió el hielo dando los primeros datos sobre lo que habían estado preparando, pero fue con las live demos, para las que Mark Chen y Barret Zoph se sumaron a Murati, cuando descubrimos el salto cualitativo en la interacción por voz que supone esta nueva generación.

La letra o en el nombre del nuevo modelo, GPT-40, hace referencia a «omni», y es que podemos definir este modelo como multimodal, pero OpenAI ha preferido categorizarlo como omnimodal, dando a entender (acertadamente, en verdad) su gran nivel de competencia, tanto para la entrada como la salida, con texto, voz e imagen. Así, en lo referido a la interacción natural entre humano e IA, esta evolución apunta a equipararla en no pocos sentidos a la comunicación entre humanos, que evidentemente es uno de los objetivos perseguidos por OpenAI.

Esto, lógicamente, ha provocado un gran entusiasmo entre los más interesados en la inteligencia artificial, las conversaciones mantenidas por Chen, Murati y Zoph con OpenAI nos dejaron a muchos con la boca abierta y, sin duda, deseando poder probar todas las capacidades de GPT-4o en ChatGPT lo antes posible. Y algo común en estos casos es buscar referencias con las que ilustrar lo ocurrido, algo para lo que, en este caso, se está recurriendo a «Her», la sensacional distopía de Spike Jonze en la que una IA, diseñada inicialmente como la interfaz de un sistema operativo, evoluciona hasta enamorarse de Joaquin Phoenix, que también se enamora de ella.

En la capa más superior esta analogía es más que comprensible, pues la interacción mediante voz mostrada ayer no tiene nada que envidiarle a la interpretada por Scarlett Johansson en la película (excepcionalmente bien doblada por Inés Blázquez en España). Ahora bien, aunque esas interacciones jugaban un papel muy importante en Her, la relación, primero de complicidad y posteriormente romántica entre Samantha y Theodore tenía, al igual que en la mayoría de las relaciones en el mundo real, el nivel de conocimiento de cada uno con respecto al otro. Dicho de otra manera, ambos contaban con una ventana de contexto enorme, capaz de recordar todas sus conversaciones y demás interacciones.

Cuando OpenAI empiece a desplegar GPT-4o en ChatGPT, estoy seguro de que muchas personas jugarán a emular, de algún modo, la relación entre Samantha y Theodore, una prueba que reconozco que yo también querría llevar a cabo. Sin embargo, y aunque ChatGPT ya cuenta con cierta memoria, más pronto que tarde empezarán a dejarse ver las primeras lagunas, lo que nos llevará a que, en este punto, la herramienta puede servir para simular un flirteo, pero no una relación con un nivel de profundad como el representado por Jonze en la película.

Ahora bien, ¿en qué contexto encontraría un modelo con estas prestaciones, pero también estas limitaciones, un encaje excepcional? Efectivamente, en la evolución de los asistentes de voz actuales. Hace solo unos días supimos que Apple y OpenAI ya lo tienen todo prácticamente listo para firmar su colaboración, y sabemos también que uno de los principales objetivos de los de Cupertino es renovar, en profundidad, su asistente de voz, Siri.

Esto, claro, es pura especulación, y hay muchas razones que nos invitan a pensar que no ocurrirá o, para ser más exactos, que al menos no lo hará con el nivel que vimos en las demos de ayer. Sin embargo, Apple lleva meses adelantando que este WWDC 2024 nos sorprenderá con sus avances en inteligencia artificial, y todo apunta a que Siri estará en la lista de protagonistas de los cambios que están por llegar. Así, lo que vimos ayer tiene cierta similitud con Her, pero a lo que señala, o al menos debería hacerlo, es a Siri.