Muchos de nosotros hemos escuchado el nombre DALL-E dando vueltas, pero es posible que no esté seguro de qué se trata. En resumen, es un modelo de IA generativa que puede crear imágenes que nunca antes existieron, todo lo que tienes que hacer es decirle lo que quieres crear.
Cuando se lanzó la versión de seguimiento, llamada DALL-E 2, saltó a la fama. Las imágenes que podía producir eran de tan alta calidad y tan bien generadas que difícilmente podrías decir que una máquina las hizo.
Esto es lo que necesita saber sobre DALL-E y cómo funciona.
¿Qué es DALL-E?
DALL-E es un modelo de IA generativa desarrollado por Open AI que puede generar imágenes y arte a partir de un mensaje de texto. En otras palabras, puede escribir una oración que describa exactamente lo que quiere ver y DALL-E puede crear esa imagen para usted en cuestión de segundos.
DALL-E se lanzó por primera vez en enero de 2021 y desde entonces se ha actualizado significativamente en su segunda versión llamada DALL-E 2. Fue uno de los pocos generadores de arte de IA diferentes que se hizo muy popular por su capacidad para crear bellas imágenes y arte desde cero.
Dado que solo necesita escribir unas pocas palabras descriptivas para generar una imagen, ha atraído a muchos no artistas que encuentran la herramienta increíblemente divertida y fácil de usar.
Las imágenes que produce DALL-E son tan convincentes que fácilmente se confunden con arte hecho por un humano. Además de tener la capacidad de representar objetos y paisajes del mundo que nos rodea, puede representar estas imágenes en un estilo específico, como arte digital, acuarela o impresionismo.
DALL-E recibe su nombre del artista Salvador Dalí y un robot llamado WALL-E de una película animada de Pixar. El nombre de DALL-E ciertamente nos da una idea de cómo la empresa buscaba combinar el arte y la tecnología de inteligencia artificial.
Puedes enterarte de todo cómo usar Dall-E 2 para crear imágenes de IA en nuestra guía detallada, que incluye cómo obtener acceso y cómo editar partes específicas de la imagen.
¿Cómo funciona DALL-E?
Hay bastantes tecnologías diferentes detrás de DALL-E. Pero sin sumergirnos en las matemáticas complejas, comencemos con cómo se entrenó DALL-E en millones de imágenes de Internet.
Las imágenes utilizadas para el entrenamiento provienen de conjuntos de datos que contienen una enorme cantidad de imágenes que tienen una leyenda de texto. Como puede imaginar, con suficientes datos, el modelo de IA puede aprender a reconocer qué es un objeto y cómo se vería en una imagen.
El conjunto de datos utilizado para entrenar DALL-E no se ha revelado, sin embargo, aún puede averigua si tus imágenes han entrenado un modelo de IA y optar por no participar.
DALL-E también se creó utilizando un modelo de lenguaje llamado GPT-3, o Transformador preentrenado generativo. Se popularizó en gran medida cuando Open AI lanzó ChatGPT, un chatbot de IA con el que puede hablar fácilmente en lenguaje humano natural. Esta tecnología cierra la brecha entre el texto y la imagen y ayuda a convertir las palabras que escribe en una imagen en la pantalla compuesta de píxeles.
Otra parte central de DALL-E es el uso de un modelo de difusión. Este modelo toma una imagen ruidosa (piense en una imagen altamente pixelada que no es reconocible) y trabaja hacia atrás para producir una imagen clara que coincida con la descripción del texto que ingresó.
¿Qué puedes hacer con DALL-E?
La gente está usando DALL-E para todo tipo de cosas. Puede intentar ser un artista de IA, usarlo para remezclar una obra de arte famosa o tomar una obra de arte original y ampliarla con las funciones de edición de DALL-E.
Outpainting es una función de DALL-E que le permite crear obras aún más grandes al permitirle adjuntar paneles de imágenes recién generados a una obra de arte existente. Aprender cómo usar outpainting en Dall-E 2 para ver hasta dónde puede expandir sus imágenes generadas por IA.
Cree imágenes generadas por IA con DALL-E
DALL-E es una herramienta de IA de fácil acceso que puede usar para hacer arte o generar imágenes, ninguna de las cuales ha existido antes. Hace uso de increíbles avances en aprendizaje automático, incluidos GPT-3 y modelos de difusión. El conocimiento de DALL-E sobre el mundo humano, incluida la historia del arte, proviene de millones de imágenes que probablemente se recopilaron de Internet.
La combinación de varias tecnologías nuevas en la IA generativa significa que puedes disfrutar dando vida a tu imaginación usando solo palabras para pintar una imagen.