Google crea imágenes superrealistas con solo una descripción texto

reino unido

La tecnología también puede generar imágenes con descripciones basadas en ubicaciones específicas o incluso texto complejo

Google ha demostrado repetidamente de lo que son capaces sus diversos algoritmos de aprendizaje automático, como MUM o LaMDA, y continúa reflejandolos con un nuevo modelo de inteligencia artificial llamado ‘Imagen’.


Banner_frasco-suscripcion-800x250

Según Jeff Dean, jefe de IA de la compañía, esto promete “liberar la creatividad conjunta entre humanos y computadoras” y poder generar imágenes a partir de una sola descripción de texto, breve y simple.

‘Imagen’ es muy similar a DALL-E-2, la inteligencia artificial desarrollada por Open AI (empresa fundada por Elon Musk) que también permite crear una imagen a partir de una descripción escrita. Sin embargo, existen algunas diferencias entre los dos modelos, como el nivel de detalle y la eficiencia a la hora de crear esta imagen.

En concreto, Google asegura que su IA

Proporciona resultados con un nivel de detalle mucho más preciso que otros sistemas. Para verificar esto, la compañía ha creado un benchmark llamado DrawBench, que compara su modelo de IA con modelos similares, y presenta los resultados uno al lado del otro para que puedan ser vistos por el usuario. El “evaluador humano” puede distinguir entre ellos y elegir el más realista.

Estas personas, según la empresa, concluyeron que las fotografías producidas por ‘Imagen’ eran de mayor calidad y “imágenes alineadas al texto descrito”, siendo mejor que el resto de los modelos.

Una inteligencia artificial más eficiente que otras

‘Imagen’, la IA de Google que genera una imagen a partir de una breve descripción de texto, también es “más eficiente computacionalmente, más eficiente en memoria y converge más rápido” gracias a su arquitectura patentada llamada AT. Como resultado, las imágenes surrealistas se producen con mayor precisión que cualquier otro modelo y de cualquier tipo de descripción de texto.

“Una escultura transparente de un pato hecha de vidrio. La escultura está frente a una pintura de un paisaje”, “una pareja de robots para cenar con la Torre Eiffel de fondo”, o “un perro mirándose curiosamente en el espejo, viendo a un gato”, son frases que Google usa como ejemplo para demostrar de lo que es capaz su modelo de IA.

Conoce más aquí

Banner_azules
Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉