Conecta con nosotros

Noticias

NVIDIA crea magic3D, su IA de texto a imagen

Publicado

el

NVIDIA crea magic3D, su IA de texto a imagen

La relación de NVIDIA con la inteligencia artificial es más que evidente, si bien una de sus varias vertientes es menos conocida que las otras. En primer lugar, claro, tenemos que hablar de DLSS, su tecnología de reescalado inteligente basada en Deep Learning, gracias a la cual un mismo sistema nos puede proporcionar una mayor calidad de imagen sin tener que actualizar los componentes del PC. DLSS 2 disponible para todas las tarjetas gráficas GeForce RTX, y DLSS 3 como exclusiva para las RTX 40, suponen un antes y un después en lo que la IA puede hacer con el apartado gráfico de los juegos.

Por otra parte, las tarjetas gráficas de NVIDIA son una elección prioritaria para el montaje de sistemas, estaciones de trabajo y servidores que se van a emplear para cualquier tarea relacionada con la inteligencia artificial. Y es la inteligencia artificial requiere de una gran capacidad de cómputo de coma flotante, algo en lo que las tarjetas gráficas ofrecen unas prestaciones infinitamente superiores a los procesadores. Esto siempre ha sido así, pero con la proliferación de la IA, los fabricantes como NVIDIA han recogido ese balón y, en consecuencia, optimizan sus soluciones más profesionales para que su rendimiento, en este sentido, sea aún mayor.

Estas dos son, como habrás imagina, las vertientes más conocidas de la relación de NVIDIA con la inteligencia artificial. Sin embargo hay una tercera que, sin ser desconocida (de hecho ya te hemos hablado aquí de ella en algunas ocasiones), no es tan conocida por el gran público, y es la del desarrollo de soluciones para la creación automática de contenidos, más concretamente de contenidos gráficos (imágenes y vídeo) que se apoyan, claro, en su hardware.

El ejemplo más conocido de ello es GauGAN 2, una IA integrada en su aplicación NVIDIA Canvas. En su primera generación, GauGAN nos ofrece un selector de «materiales» (nubes, mar, tierra, hierba, arena, montañas, etcétera. Así, tan solo tenemos que rellenar las zonas del lienzo con el tipo de elemento que queremos incluir y, automáticamente, Canvas irá generando un paisaje en base a nuestro borrador. Y con su segunda versión, además de seguir disponiendo de este modo de diseño, también podemos simplemente introducir una descripción de texto de lo queremos. Ésta será procesada por la IA que, automáticamente, nos devolverá una imagen que se corresponda a nuestra descripción.

Otro ejemplo de solución de IA diseñada por NVIDIA lo tenemos en Instant NeRF, un desarrollo presentado a principios de este año y que, en base a varias fotografías normales, es capaz de generar toda la información volumétrica necesaria para transformarla en una escena tridimensional.

Y hoy sabemos de un nuevo proyecto en este sentido, Magic3D, un paso bastante importante por parte de NVIDIA, ya que en este caso ya nos encontramos con una IA texto a imagen en 3D de propósito general, es decir, capaz de generar imágenes de cualquier tipo, del mismo modo que lo hacen algunas de las soluciones de este tipo que se han popularizado mucho durante el último año, pero claro, con la particularidad de las tres dimensiones, frente a las imágenes 2D que vemos en los modelos más comunes en la actualidad.

Como puedes ver en el vídeo, Magic3D responde a cualquier tipo de petición de imagen y, para su creación, usa un proceso de dos etapas que toma un modelo grueso generado en baja resolución que posteriormente es reescalado y optimizado, algo que ya conocemos muy bien gracias a DLSS. Adicionalmente, Magic3D también la edición basada en indicaciones de mallas 3D. Así, podremos partir de un modelo 3D de baja resolución y un mensaje base e ir modificando el texto para cambiar el modelo resultante. Y un aspecto clave en este punto es que es posible preservar el mismo estilo durante las sucesivas generaciones de imágenes (un concepto que suele denominarse coherencia) y aplicar el estilo de una imagen 2D (como una pintura) a un modelo 3D.

NVIDIA no ha liberado, al menos de momento, el código de Magic3D, pero dado que afirma que su intención es democratizar la creación de imágenes tridimensionales, del mismo modo que lo hacen otras IA con los bidimensionales, podemos contar con que más pronto que tarde empezará a llegar a los usuarios.

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnología... pues sí, tendría las canas que tengo. Por lo demás, música, fotografía, café, un eReader a reventar y una isla desierta. ¿Te vienes?

Lo más leído