Dall-E 2, la sorprendente IA viral que genera imágenes de cualquier cosa que le pidas
La sucesora de las anteriores versiones crea imágenes de la nada. Te contamos cómo pedir acceso para usarla.
Hace una semana os hablamos de Dall-e Mini, un generador de imágenes con inteligencia artificial que es la última sensación viral, ya que su IA le permite crear composiciones de la ‘nada’ mediante las órdenes que le damos, desde Mickey Mouse vestido de Bugs Bunny a Terminator en una playa bajo el estilo visual de Monet.
Pero no es la única en marcha, ya que oficialmente existe Dall-E 2, sucesora de la primera Dall-E y de Dall-E mini y una herramienta creativa más potente y perfeccionada, capaz de generar imágenes más realistas y precisas con una resolución 4 veces mayor.
Dall-E 2, la IA pintora
Al igual que las otras versiones, DALL-E 2 es un sistema de IA que puede crear imágenes y arte realistas a partir de una descripción de texto, combinando conceptos, atributos y estilos. Puedes darle por ejemplo pedirle a Dall-e que cree un astronauta montando a caballo en un estilo fotorrealista, y como vemos en la siguiente imagen y en estos ejemplos, es lo que hace.
DALL-E 2 puede realizar ediciones realistas en imágenes existentes a partir de un pie de foto en lenguaje natural. Puede añadir y eliminar elementos teniendo en cuenta las sombras, los reflejos y las texturas, creando diferentes variaciones de la misma inspiradas en la original.
¿Cómo funciona? La IA ha sido entrenada para aprender la relación entre las imágenes y el texto utilizado para describirlas. Según sus autores, Dall-e 2 “utiliza un proceso llamado "difusión", que comienza con un patrón de puntos aleatorios y altera gradualmente ese patrón hacia una imagen cuando reconoce aspectos específicos de esa imagen”.
Limitaciones
De cara a conseguir una máxima interactividad con quien usarla, pero al mismo tiempo evitar creaciones incómodas, irrespetuosas o directamente ofensivas, los creadores de Dall-e 2 han impuesto una serie de limitaciones a la capacidad creativa de la IA:
Prevención de generaciones dañinas
“Hemos limitado la capacidad de DALL-E 2 para generar imágenes violentas, de odio o para adultos. Al eliminar el contenido más explícito de los datos de entrenamiento, hemos minimizado la exposición de DALL-E 2 a estos conceptos. También hemos utilizado técnicas avanzadas para evitar las generaciones fotorrealistas de rostros de personas reales, incluidas las de personajes públicos”.
Frenar el mal uso
“Nuestra política de contenidos no permite a los usuarios generar contenidos violentos, para adultos o políticos, entre otras categorías. No generamos imágenes si nuestros filtros identifican indicaciones de texto y subidas de imágenes que puedan infringir nuestras políticas. También contamos con sistemas de supervisión automatizados y humanos para evitar el uso indebido”.
Despliegue por fases basado en el aprendizaje
Sus autores están probando DALL-E 2 con un “número limitado de usuarios de confianza que nos ayudarán a conocer las capacidades y limitaciones de la tecnología. Tenemos previsto invitar a más personas a que realicen una vista previa de esta investigación a medida que vayamos aprendiendo y mejorando nuestro sistema de seguridad".
El motivo principal de DALL-E 2 es permitir a las personas "expresarse de forma creativa". DALL-E 2 también nos ayuda a entender cómo los sistemas avanzados de IA ven y entienden nuestro mundo, lo que es fundamental para "nuestra misión de crear una IA que beneficie a la humanidad".
Cómo acceder a Dall-e 2
A diferencia de Dall-e Mini, que está disponible en este enlace web, Dall-e 2 no está abierta aún al público en general. Pero sus autores han habilitado una lista de espera en la que te puedes apuntar aquí para solicitar acceso y usar la IA.