Web Analytics
Conecta con nosotros

Noticias

Dibújame una foto: GauGAN2 de NVIDIA sube el listón con una función que convierte texto en imágenes

Publicado el
GauGAN2 de NVIDIA

Dicen que una imagen vale más que mil palabras, pero lo cierto es que GauGAN2 de NVIDIA solo necesita una pequeña frase para crear, de la nada, una fantástica imagen de alta calidad que encajará por completo con la descripción que le hayas dado. ¿Crees que es magia? En absoluto, es el poder de la inteligencia artificial, aunque la verdad es que los resultados que consigue GauGAN2 de NVIDIA son tan buenos que resulta imposible negar que tienen un toque mágico.

GauGAN2 de NVIDIA está respaldado por un modelo de aprendizaje profundo basado en inteligencia artificial que, gracias al entrenamiento al que ha sido sometido, es capaz de entender distintos tipos de peticiones realizadas por escrito, y de convertirlas en imágenes. Así, por ejemplo, si escribimos «una puesta de sol en la playa», dicha inteligencia artificial identificará lo que queremos decir y creará una imagen altamente realista que, además, se ajustará a la perfección a lo que hemos escrito.

Si no estamos contentos con el resultado, o si queremos conseguir algún ajuste más preciso, solo tenemos que añadir el adjetivo, lo os adjetivos, que creamos pertinentes. Por ejemplo, en lo anterior podríamos añadir «puesta de sol en la playa con piedras», y la imagen mostraría un diseño más concreto para ajustarse a esa nueva descripción. También podríamos cambiar atardecer por amanecer, y GauGAN2 de NVIDIA ajustaría de nuevo la imagen a esa petición.

GauGAN2 de NVIDIA: ¿Cómo convierte palabras en imágenes?

GauGAN2 de NVIDIA en Canvas

Que esta plataforma de NVIDIA sea capaz de identificar lo que escribimos y de convertirlo en imágenes es ya, por sí solo, algo verdaderamente impresionante, pero que además lo haga con una calidad fotorrealista es simplemente increíble. Para ello, se combinan segmentación de mapeados, pintado y generación de texto a imagen en un único modelo GAN.

Gracias a ese enfoque, GauGAN2 de NVIDIA es capaz de trabajar más rápido y ofrece, al mismo tiempo, un funcionamiento muy sencillo, tanto que podemos decir que está al alcance de cualquier usuario. Este solo tiene que pensar en qué imagen le gustaría recrear y describirla con un conjunto de palabras, sin más. GauGAN2 de NVIDIA se ocupará del resto.

Sé lo que estáis pensando, que GauGAN2 de NVIDIA funciona bien con cosas «de este mundo», pero que no podría ayudarnos a recrear otro tipo de imágenes que encuadran dentro de lo que podemos considerar como ciencia ficción. Pues nada más lejos de la realidad, ya que podemos introducir descripciones muy ricas y variadas, y luego podemos utilizar la base que nos brinda para añadir otros elementos manualmente.

Para conseguir estos resultados, GauGAN2 de NVIDIA recibió un entrenamiento intensivo basado en la friolera de 10 millones de imágenes de países en alta calidad. El gigante verde nos ha confirmado que se utilizó el superordenador NVIDIA Selene, un sistema NVIDIA DGX SuperPOD que tiene el orgullo de estar ubicada en el top 10 de los superordenadores más potentes del mundo.

En cuanto a la interpretación de las palabras, y su vinculación con imágenes concretas, los investigadores recurrieron a una red neuronal que fue capaz de llevar a cabo ese complicado proceso. Así, cuando esa red neuronal lee «niebla» sabe perfectamente qué imágenes están asociadas a esa palabra, y lo mismo ocurre con otras como «invierno» o «soleado». Sí, la idea es, en esencia, la misma sobre la que se apoya el pensamiento humano.

Obvia decir que esto representa un importante avance para diseñadores, creativos y artistas, ya que puede ayudarles a ahorrar tiempo al generar imágenes de alta calidad sin esfuerzo, sobre las que podrán trabajar posteriormente, de forma manual, para darles ese toque personal que tenían en mente, y crear diseños únicos con mayor rapidez sin tener que renunciar a una calidad totalmente profesional. Os recuerdo que la aplicación NVIDIA Canvas incorpora los últimos avances de la tecnología GauGAN, y es compatible con las GPUs GeForce RTX serie 20 y superiores.

Editor de la publicación on-line líder en audiencia dentro de la información tecnológica para profesionales. Al día de todas las tecnologías que pueden marcar tendencia en la industria.

2 comentarios
  • Virtualbox Vbox

    Este proyecto es similar y bastante chulo:https://colab.research.google.com/drive/1go6YwMFe5MX6XM9tv-cnQiSTU50N9EeT#scrollTo=wSfISAhyPmyp

    Por si a alguien le apetece jugar un poco.

  • doc

    Bueno, es muy interesante el avance de las IA en algunos campos. De todos modos lo veo mas como un servicio para que el creativo promedio de respuestas rápidas y de calidad. La inspiración y capacidad humana con herramientas convencionales hace rato que da muestras de ser muy difícil de alcanzar, un burdo pero claro ejemplo es la bóveda de la Capilla Sixtina hecha a pincel e imaginación pura. Las mismas IA son fruto y copia de la imaginación y el conocimiento humanos.
    De todos modos representa un avance que espero quede al alcance de todos y se siga perfeccionando.

Lo más leído