Enfrentemos a los jugadores de arte de IA más grandes entre sí y veamos cuál sale ganando. ¿DALL-E, Midjourney o difusión estable?
La inteligencia artificial ha recorrido un largo camino en el campo de la generación de imágenes. Las aplicaciones generativas como DALL-E, Midjourney y Stable Diffusion han tenido un profundo efecto en la forma en que interactuamos con el contenido digital.
En este artículo, compararemos cada aplicación para ver cuál es mejor en general para generar imágenes basadas en indicaciones de texto. ¡Empecemos!
DALL-E 2
DALL-E 2 tiene una interfaz simple que es fácil de entender y es fácil comenzar a generar imágenes sin tener que registrarse en una plataforma de terceros. Simplemente vaya al sitio web e ingrese su texto en el Generar cuadro para crear una imagen. DALL-E 2 luego producirá cuatro versiones del mensaje, que puede editar o descargar.
Característica destacada
Una característica destacada de DALL-E 2 es la capacidad de crear, editar y fusionar varias imágenes. Una vez que seleccione la imagen que desea y haga clic en
Editar, tendrá la capacidad de utilizar el Agregar cuadro de generación función para agregar generaciones de imágenes adicionales a la existente.Una vez que coloque el marco, ingrese un nuevo mensaje y DALL-E 2 generará un nuevo conjunto de imágenes con la opción de fusionar cualquiera de ellas en la imagen original.
Luego puede usar cualquiera de las funciones de edición para crear la imagen a la perfección. Por ejemplo, puede utilizar el Borrar para borrar los píxeles existentes y luego ingrese el texto nuevo en el cuadro Generar para completarlo. Puede hacer esto varias veces para obtener los resultados que desea.
Pero recuerda que cada vez que haces clic en Generar, usas créditos. Y una vez que se use su asignación, tendrá que comprar más créditos para continuar.
ventajas
- Fácil de usar
- Mucha flexibilidad creativa
- No se necesita una plataforma de terceros
Contras
- Imágenes simplistas
- No es un alto grado de precisión.
- Solo puede crear imágenes cuadradas
Cubrimos el conceptos básicos de DALL-E 2 si nunca lo has usado antes.
a mitad de camino
a mitad de camino es posiblemente el generador de texto a imagen de IA para vencer. Con su potente conjunto de funciones, puede producir imágenes altamente artísticas y creíbles que otros competidores de IA aún no han logrado de manera consistente. Pero a diferencia de DALL-E 2, debe crear una cuenta de Discord antes de comenzar a usarlo.
Incluso con las capas añadidas de complejidad y a pesar del hecho de que tienes que escribir comandos como /imagine para generar tus imágenes, pronto perdonarás a Midjourney por el hermoso arte que puedes crear con unas pocas palabras.
Al igual que con DALL-E 2, se crean cuatro versiones y puede seleccionar una o más de ellas para descargar o crear variaciones. Pero hay más flexibilidad con las relaciones de imagen; puede hacer cualquier proporción que prefiera agregando cada imagen con --Arkansas y luego seguido por la relación, en nuestro ejemplo, 3:2.
La calidad de los resultados es la inconfundible magia de Midjourney.
Característica destacada
Una de las características más emocionantes y poderosas de Midjourney es la capacidad de cargar sus propias imágenes y luego hacer que Midjourney cree indicaciones para ellas que puede usar para crear imágenes completamente nuevas. Escribiendo /describe, se le pide que cargue una de sus imágenes.
Una vez cargado, Midjourney ofrecerá cuatro indicaciones con su propia interpretación de lo que está viendo.
Luego puede usar estas indicaciones para crear un conjunto de imágenes completamente diferente.
Con tanta flexibilidad creativa, Midjourney ofrece posibilidades casi infinitas.
ventajas
- Imágenes de alta calidad
- Los usuarios pueden programar proporciones personalizadas
- Mucha flexibilidad para controlar los parámetros de la imagen
Contras
- Más complicado de usar
- Requiere que los usuarios se registren en Discord
- El tiempo de generación de imágenes aumenta drásticamente una vez que se agotan las horas rápidas
Puede cree impresionantes fondos para retratos con Midjourney para que tus fotos destaquen.
Difusión estable
Stable Diffusion representa el Lejano Oeste de las aplicaciones generativas de IA. Con muchas aplicaciones basadas en web y opciones de instalación disponibles, no es fácil comparar Stable Diffusion con DALL-E 2 y Midjourney. Esto se debe principalmente a la disparidad entre las versiones web y los modelos de instalación con respecto a las opciones y la calidad de salida. En otras palabras, las versiones de Stable Diffusion instaladas generalmente le darán mejores resultados y libertad creativa.
Veremos el sitio web oficial de Stable Diffusion, DreamStudio de Stability AIy le mostrará cómo comenzar a usar la aplicación para darle una idea básica de sus capacidades.
El diseño de Stable Diffusion en DreamStudio está más abarrotado que DALL-E 2 y Midjourney, pero sigue siendo fácil de usar. Los usuarios de prueba obtienen 200 créditos gratis para crear avisos, que se ingresan en el Inmediato caja. Pero además, también hay un Indicación negativa recuadro donde puede adelantarse a la Difusión estable para dejar cosas fuera.
Hay varias otras características esenciales en el menú de la izquierda a considerar que afectarán la imagen general y el uso de crédito. Hay una Estilo caja de opciones, Cargar imagen, y Ajustes (para la relación y el número de imágenes a generar). En el Avanzado ficha, hay Fuerza rápida, Pasos de generación, Semilla, y Modelo.
Cuando pasa el cursor sobre cada una de estas opciones, hay una breve descripción de cada función. Pero para comprender verdaderamente lo que cada uno de ellos hace en la práctica, solo tiene que probarlos. Pero vigile sus créditos porque este no es un sistema de un crédito para una imagen.
Característica destacada
El Indicación negativa es probablemente la característica más destacada de Stable Diffusion de DreamStudio. Supuestamente, también es una tremenda herramienta en otras versiones de Stable Diffusion que ayuda con la calidad general de la imagen. En esas versiones, escribir declaraciones negativas ayuda a los algoritmos a producir imágenes más precisas y de mayor calidad.
Cuando las indicaciones negativas funcionan, funcionan bien. Pero gastará créditos tratando de perfeccionar el aspecto que desea en muchos casos.
ventajas
- Múltiples opciones para versiones web e instaladas
- Más libertad creativa (puedes crear imágenes sin censura en algunas versiones)
- Muchos controles para personalizar los parámetros de la imagen.
Contras
- Quema a través de créditos en versiones pagas
- Curva de aprendizaje empinada
- La calidad de la imagen es muy impredecible, según la versión que tenga
Si necesita ayuda para crear avisos, le mostramos cómo usar ChatGPT para crear imágenes de IA.
¿Cuál es la mejor aplicación?
Entonces, ¿cuál es la mejor aplicación, DALL-E 2, Midjourney o Stable Diffusion? Es una pregunta difícil porque los usuarios tendrán diferentes expectativas y hay diferentes versiones de estas aplicaciones que hacen que las comparaciones directas no sean realistas. Sin embargo, podemos evaluar cada uno de nuestros ejemplos por estas categorías.
Clasificación de calidad de imagen
Midjourney produjo las imágenes de mejor calidad en nuestros ejemplos. Eran más realistas y más hermosos que DALL-E 2 y Stable Diffusion.
Facilidad de uso
Fuera de la caja, DALL-E 2 fue el más fácil de usar. No requería una aplicación de terceros para usar, y el menú era sencillo y optimizado.
Características y capacidades
Midjourney supera a sus competidores porque tiene más características y capacidades que producen imágenes de alta calidad de manera más consistente.
Velocidad
DALL-E 2 produce imágenes más rápido (alrededor de 12 segundos), superando a la difusión estable por un segundo más o menos, y Midjourney (en modo rápido) por un margen mayor.
Flexibilidad y personalización
Stable Diffusion es único en su clase por su flexibilidad y personalización. Hay un número creciente de versiones que permiten a los usuarios no solo crear imágenes que generalmente están censuradas, pero hay versiones que incluso producen imágenes de alta calidad que se modelan directamente a partir de Midjourney imágenes
Midjourney y DALL-E 2 empatan en el primer lugar en la cantidad de categorías que ganaron, pero el ganador general tendría que ser Midjourney, basándose únicamente en la calidad de la imagen.
A medida que se intensifica la competencia, se atiende mejor a los usuarios de contenido de IA
Lo máximo que podemos ofrecer es una instantánea de los mejores resultados entre DALL-E 2, Midjourney y Stable Diffusion, en un momento dado. El campo de la tecnología de inteligencia artificial está en constante evolución, con numerosos competidores que se unen al mercado todos los días. Esto es muy beneficioso para los usuarios de aplicaciones de IA generativa, ya que fomenta la innovación y reduce los costos para que todos nosotros accedamos a estas increíbles herramientas creativas.