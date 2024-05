Aunque finalmente no tuvo el protagonismo que esperábamos, Android sí que estuvo presente en la keynote inaugural del Google I/O 2024 que se celebró ayer, y de cuyos principales anuncios te informamos en esta publicación, aunque también, como en el resto del evento, con el foco puesto en la inteligencia artificial. La guerra de la IA se ha vuelto a recrudecer, con los recientes anuncios de Google y OpenAI, a los que se sumarán los de Microsoft la semana que viene y Apple (con OpenAI) el próximo mes de junio.

El primer gran enfrentamiento tuvo lugar durante el primer semestre del año pasado, con la eclosión de los chatbots nacidos como respuesta del gran precursor en este sentido, ChatGPT, y tuvo como principales protagonistas a Bard (ahora Gemini) y Bing (ahora Copilot). Sin embargo, aquello solo fueron los entremeses, pues pronto empezaron a llegar las integraciones de la IA en otros servicios, las mejoras de los modelos, el crecimiento en las capacidades multimodales, etcétera.

Por su parte, 2024 va a marcar el pistoletazo de salida de dos puntos clave para el futuro de la IA. Por una parte, ya hemos empezado a ver la llegada de los primeros chips (procesadores, APUs y SOCs) en los que la NPU es la gran estrella, y es que tanto las preocupaciones por la privacidad como el interés, por parte de las tecnológicas, de descargar un poco sus infraestructuras de tanta carga de trabajo, están actuando como aceleradores de la capacidad de cómputo de inteligencia artificial en el cliente.

El otro punto clave, que ya ha quedado claramente dibujado en los últimos días, es el del futuro de los asistentes virtuales basados en inteligencia artificial, un mercado abierto hace ya bastantes años por Apple con Siri, al que rápidamente se sumaron el asistente de Google, Alexa, el ya desaparecido Cortana, Nixby y otros muchos desarrollos de terceros. Tras cerca de década y media del debut de Siri, ahora parece que nos acercamos a la primera gran evolución de estos sistemas, que en Google estará encarnada en Project Astra, que nos fue mostrado ayer por primera vez, y en ChatGPT con GPT-4o, el pasado lunes.

Así las cosas, era difícil que nos mostraran algo más, en relación con el futuro de Android, que nos pudiera sorprender más que lo que nos espera dentro del algún tiempo (los planes iniciales pasan por empezar a probar esta tecnología «en el mundo real» a finales de año). No obstante, se produjeron otros anuncios importantes, referidos principalmente a Android en general, pero también con un (esperado) anuncio relativo, exclusivamente, a Android 15. Un anuncio que, por otra parte, ya te adelantamos hace algunos días.

Empecemos pues, por este último, y es que desde hoy mismo ya está disponible la beta 2 de Android 15, una versión que ya puedes probar si tienes un smartphone Google Pixel de las generaciones 6, 7 y 8 (incluidas las versiones Na), y que próximamente se podrá instalar también en dispositivos de otras marcas, inicialmente de Samsung y de Xiaomi. Recordemos que esta beta, que desgranaremos en otra publicación próximamente, es la última de la fase previa a la búsqueda de la estabilidad del sistema. Dicho de otra manera, lo mejor será que ni se te ocurra instalarla en tu teléfono si es el que empleas de manera habitual.

Android 15 Beta 2

La única novedad que se circunscribe específicamente a Android 15, o al menos que esto se explicitara en la keynote del Google I/O 2024, es la liberación de la beta 2, por lo que todo lo que vamos a ver a continuación apunta a llegar también a Android 14, si bien entendemos que no a todos los dispositivos capaces de emplear esta versión del sistema operativo, solo a aquellos que cumplan con las especificaciones técnicas necesarias para su correcto funcionamiento.

Detección de estafas en tiempo real

De las novedades mostradas ayer, sin duda la que más interés despertó fue la futura capacidad de Android de identificar si una llamada de teléfono es fraudulenta en función de su contenido. Esto, claro, conlleva que la inteligencia artificial estará «supervisando» la llamada en tiempo real, y en la demo se nos mostró como, en un llamada con número oculto en la que un estafador intentaba que su víctima realizara un movimiento bancario peligroso (correspondía a un tipo de ataque ya conocido), el sistema operativo automáticamente emitirá una alertará al usuario.

Soy consciente del miedo que puede dar pensar que Google escucha tus llamadas, aún siendo para un fin tan adecuado como éste. Lo que me lleva precisamente a lo que mencionaba al principio, la necesidad de impulsar la IA en cliente. Y a este respecto, en este caso en concreto, la buena noticia es que esta función, actualmente en fase de pruebas, emplea Gemini Nano, la versión del modelo de Google optimizada para funciones que se ejecutan en el cliente, es decir, que la escucha y el análisis de la misma se llevan a cabo en local, sin que los datos se suban a los servidores de Google.

No hay, de momento, una fecha prevista para el lanzamiento de esta función, que alertará al usuario en casos como si un supuesto representante de un banco te pide que hagas una transferencia de fondos urgente, realices un pago con una tarjeta regalo o te solicita información personal como tu PIN o contraseña, pero sí que sabemos que su uso será opcional, y que Google facilitará más información sobre la misma en unos meses.

Este tipo de estafas se han popularizado bastante en los últimos tiempos, y aunque todos hacemos esfuerzos para alertar sobre estos riesgos, el desconocimiento y el nivel de sofisticación que alcanzan algunos de estos ataques hacen que sea una amenaza global muy preocupante. Por lo tanto, creo que Google debería priorizar los trabajos para pulir esta función lo antes posible, pues puede marcar un antes y un después más que destacables para muchas personas. Y, probablemente, te haya ocurrido lo mismo que a mí, seguro que has pensado al menos en una persona que te gustaría que contara con dicha protección.

Circle to Search vuelve a crecer

Circle to Search no ha dejado de crecer desde que se iniciara su despliegue, a principios de este año. Presente ya en las últimas generaciones de los dispositivos Pixel(N, Na, N Pro, Fold y Tablet), y también de los Galaxy S, Galaxy Z y Galaxy Tab, inicialmente nos permitía seleccionar parte del contenido que se muestra en pantalla para, posteriormente, realizar una búsqueda del mismo como la que podríamos realizar con Google Lens.

Con el tiempo, hemos ido viendo señales de nuevas funciones, algunas de ellas confirmadas oficialmente por Google, otras descubiertas gracias al análisis en profundidad de las betas que se han ido publicando hasta el momento. Así, con lo visto hasta ahora, y como ya he indicado en alguna otra ocasión, podemos decir que el nombre completo debería ser Circle to Search, Circle to Translate y Circle to Share… a lo que, ahora, también debemos sumar Circle to Learn.

Con esta novedad, que ya está disponible para los usuarios de Circle to Search, la herramienta también puede ser empleada para seleccionar diversos tipos de problemas, como una ecuación, y automáticamente obtendremos las indicaciones necesarias para poder resolverlo. En la imagen superior puedes ver la respuesta de la herramienta al capturar una ecuación, y Google menciona que actualmente también es capaz de interpretar enunciados de problemas de física o matemáticas. Pero esto es solo el principio, pues nos han adelantado que más adelante, pero este mismo año, también será capaz de resolver problemas todavía más complejos, como cálculo algebraico, diagramas, gráficos y más.

Gemini Nano será multimodal

En su versión inicial, Google Nano se centra en el texto, pero Google ya está preparando una nueva versión del mismo que será multimodal, es decir, que será capaz de procesar texto, imagen y sonido, y esto tiene una gran importancia, puesto que si el LLM es multimodal de manera nativa, y ha sido optimizado para determinado tipo de plataformas, resultará mucho más eficiente a la hora de llevar a cabo aquellas tareas que impliquen la entrada y/o salida de información en varios formatos.

De nuevo no hay fechas concretas, pero Google ha adelantado que su debut se producirá dentro de unos meses, inicialmente en dispositivos Pixel. En este punto será muy importante, claro, comprobar si por sus requisitos técnicos se limita a los futuros Pixel 9 con Android 15 o si, por el contrario, su grado de optimización es tal que puede funcionar, sin problema, en la generación actual e incluso en alguna de sus predecesoras.

Talkback con Gamini Nano hará Android aún más accesible

La accesibilidad es, afortunadamente, un asunto al que cada vez se le concede más importancia (de hecho, todavía queda bastante camino por recorrer, pero eso no debe impedirnos celebrar los avances), y en este sentido Talkback juega un papel clave en Android, y la futura llegada de la versión multimodal de Gemini Nano supondrá una gran mejora para esta herramienta, pues dará soporte a un tipo de contenido que, desgraciadamente, sigue suponiendo una barrera en una gran cantidad de casos: las imágenes.

Según datos facilitados por la tecnológica, los usuarios de Talkback suelen encontrarse cada día, de media, con 90 imágenes sin etiquetar, lo que las convierte en un tipo de contenido totalmente inaccesible. Sin embargo, con la futura versión de esta herramienta, ya con soporte multimodal, los usuarios podrán obtener información detallada del contenido de las imágenes que se muestran, y que además se adaptará al contexto. Y, claro, al basarse en Gemini Nano, no será necesario contar con conexión a Internet para hacer uso de esta función.

Más información