Los generadores de arte de IA tienen mala reputación por producir representaciones inexactas de manos. Enfrentemos Midjourney v5 contra Dall-E 2 para ver cuál lo hace mejor.

Los generadores de arte de IA continúan impresionando, permitiéndonos crear casi cualquier cosa que podamos imaginar. Sin embargo, la tecnología parece haber topado con una pared de ladrillos cuando se trata de generar manos de aspecto realista.

Aquí, observamos dos de las principales aplicaciones de arte generativo y las enfrentamos cara a cara, o mano a mano, para ver cuál puede generar mejores manos, Midjourney v5 o Dall-E 2. ¿Alguna de estas aplicaciones ha dominado las manos? ¡Vamos a averiguar!

El problema de la IA con las manos

Desde que el arte generado por IA se generalizó en Internet, ha habido críticas con respecto a la calidad de las manos dibujadas por IA. A pesar de las actualizaciones recientes, como se muestra en nuestras comparaciones en paralelo, los resultados no han sido satisfactorios.

Ambos contendientes han estado mejorando sus capacidades y la calidad de sus resultados con cada iteración. La última actualización,

instagram viewer
Versión 5 de Midjourney, ha mostrado un progreso impresionante. Sin embargo, el problema con las manos dibujadas por la IA sigue sin resolverse y no se puede ignorar.

Comparación 1: uso de las indicaciones "Mano" y "Manos"

Nuestras comparaciones contendrán exactamente las mismas indicaciones para Dall-E 2 y Midjourney v5. Diseñaremos las indicaciones para que sean específicas de la mano en lugar de simplemente crear personas para ver cómo se ven las manos. También le damos a cada aplicación solo una oportunidad (tirar) para cada indicación.

Mano

Comencemos con el mensaje más básico y relevante: "mano".

Medio viaje v5:

Dall-E 2:

¡No hemos tenido un buen comienzo!

Midjourney tomó la ruta inusual de asociar una mano con situaciones bastante creativas. En lugar de enfocarnos solo en una mano, vemos un mago, guantes, un esqueleto y una pequeña figura. A la imagen de los guantes también le falta un dedo.

Dall-E 2 adopta el enfoque opuesto y nos ofrece una sola mano sobre un fondo liso. Pero curiosamente, hay algunas posturas extrañas, particularmente con los pulgares, que no parecen naturales ni cómodas. Cada mano también está cortada en uno de los lados de las imágenes.

¿Quién gana esta ronda? Se lo daremos a Dall-E 2 para una precisión general.

Manos

Ahora, hagamos que el indicador sea plural, "manos", y veamos qué se les ocurre a las IA.

Medio viaje v5:

Dall-E 2:

El intento de "manos" de Midjourney resulta mejor esta vez. Pero las cuatro imágenes están en blanco y negro, y nos faltan algunos dedos. Tras una inspección más cercana, también puede ver que algunos de los dígitos tienen una forma extraña o se transforman entre sí.

Dall-E 2 sigue presentando manecillas con un fondo liso. No faltan dígitos, pero las manos están recortadas en la tercera imagen y las otras versiones parecen un poco torpes en la composición y carecen de creatividad por completo.

Llamemos a esta comparación un empate. Dall-E 2 ganaría en precisión si ese fuera el único factor, pero Midjourney logra crear algunos hermosas imágenes en sus versiones en blanco y negro, incluso si las cuatro versiones no son muy realista.

Tu siempre puedes usa Photoshop para arreglar tu arte de Midjouney, incluidas las manos.

Comparación 2: gestos con las manos

Comparemos un par de gestos con las manos que son reconocidos casi universalmente.

Dedos cruzados

Primero, intentemos "cruzar los dedos".

Medio viaje v5:

Dall-E 2:

Es seguro decir que Midjourney arruinó por completo este aviso. Nos faltan dedos y ninguna de las versiones se ve natural en absoluto.

Felicitaciones una vez más a Dall-E 2 por obtener el conteo de dedos correcto, pero esa es la única buena noticia. Cada versión parece que los dedos están haciendo sus propias poses de yoga en un juego de Twister.

No hay ganador en esta comparación.

Pulgares hacia arriba

A continuación, vamos con "pulgares arriba".

Medio viaje v5:

Dall-E 2:

Midjourney obtiene el conteo de dedos correcto mientras trata cada indicación de manera creativa. ¿Notas la introducción de un estilo ilustrativo?

Dall-E 2 también obtiene puntos por su precisión sin intentar cambiar el rumbo con nada creativo agregado a cada resultado.

Aquí no hay un ganador claro.

Comparación 3: Manos con objetos

Ahora, aumentaremos la complejidad incitando a las manos a interactuar con los objetos.

Bola de cristal de explotación de mano

Comencemos con un objeto aleatorio, usando el mensaje "mano sosteniendo una bola de cristal".

Medio viaje v5:

Dall-E 2:

A medida que aumentamos la complejidad, Midjourney comienza a brillar. Aparte de un par de interpretaciones que parecen antinaturales, las manecillas y las bolas de cristal se ven hermosas. Midjourney incluso se toma el tiempo para crear reflejos en el vidrio que sin duda se suman a la creatividad general.

Pero por primera vez, vemos que a Dall-E 2 le falta un dígito en al menos una de las manos, con la cuarta mano luciendo simplemente extraña. Las bolas de cristal tampoco se ven tan impresionantes en comparación con las de Midjourney.

Midjourney obtiene su primera victoria.

Agua de explotación de mano

Intentemos algo aún más complejo con el mensaje "mano sosteniendo agua".

Medio viaje v5:

Dall-E 2:

Midjourney solo logra mostrar una imagen con el número correcto de dígitos. Aunque bellamente representado, una vez más comenzamos a ver las grietas en el departamento de credibilidad.

Dall-E 2 también tiene dificultades para lograr manos naturales, pero lo hace mucho mejor. También cambia el color en el fondo para una cierta variedad.

Le daremos esta ronda a Dall-E 2.

Comparación 4: Manos que trabajan

Para esta comparación, crearemos avisos que tengan las manos involucradas en actividades.

Manos Moldeando Arcilla

Veamos cómo les va a los modelos de IA con "manos moldeando arcilla".

Medio viaje v5:

Dall-E 2:

Midjourney perdió un dedo en dos imágenes, pero todo lo demás se ve muy bien.

Las imágenes de Dall-E 2 se ven confusas y abarrotadas, recurriendo a agregar las manos de otra persona en la mitad de las versiones.

El borde va a Midjourney.

Manos presionando la masa

Intentemos una actividad similar, "manos presionando la masa".

Medio viaje v5:

Dall-E 2:

Las imágenes de Midjourney se ven muy bien en general. Pero una vez más, a la mitad de ellos les faltan dígitos. Pero las imágenes no pueden fallar por su estilo artístico.

A las versiones de Dall-E 2 también les faltan dedos en la mitad de las interpretaciones e incluso agregan uno a la última mano del conjunto.

Llamemos a esto un empate.

Si quieres probar estas comparaciones por ti mismo, te mostramos cómo usar Midjourney para crear arte de IA.

¿Qué nos dicen los resultados?

Es divertido hacer comparaciones y determinar un ganador general. Y si tuviéramos que elegir, lo llamaríamos a favor de Midjourney v5. Aunque Dall-E 2 creó manos con el número correcto de dedos con más frecuencia, fue Midjourney el que creó imágenes más atractivas y artísticamente representadas.

Pero ambas aplicaciones tienen un lugar en el mercado para los artistas que reutilizan las imágenes de Dall-E 2 y Midjourney para su trabajo. Ambos son capaces de crear manos que se pueden usar como recortes o compuestos para uso artístico, editorial y comercial. Es solo una cuestión de preferencia personal.

La IA finalmente conquistará las manos

Las aplicaciones de arte generativo como Dall-E 2 y Midjourney han recorrido un largo camino en su capacidad para crear arte realista y fantástico. Todavía luchan con la generación de manos, pero dada la aceleración de la tecnología generativa, solo podemos esperar mejoras en el futuro cercano.