noticias

"Black Myth: Wukong" modificado mágicamente para derrotar a Midjourney. Este artefacto de dibujo de IA vuelve adicta a la gente.

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Cuando los ideogramas de IA compiten por el realismo y el arte, Ideogram ha abierto un camino complicado: puede generar texto con precisión en imágenes, y las fuentes y diseños son hermosos.

Esta demanda no es un nicho;Genere carteles e ilustraciones con un solo clic sin utilizar imágenes P, lo que ahorra muchos problemas y es muy adecuado para la gente común que no sabe nada sobre diseño.

Anteriormente escribimos sobre la versión 1.0 de Ideogram. El 21 de agosto llegó la versión 2.0. El realismo es mejor, los carteles están más diseñados y la habilidad especial del texto también es más fuerte.

Quizás nunca hayas oído hablar de él. Este es un producto de inteligencia artificial desarrollado por ex empleados de Google. Tiene muchas deficiencias, pero el longboard puede "superar" a Midjourney en las curvas.

AI quiere saber, ¿de qué Wukong estás hablando?

Ideogram tiene una característica particularmente amigable para los principiantes: "Consejos mágicos".

Ingresas directamente la palabra china y te ayudará a traducirla al inglés y optimizarla al mismo tiempo. Como producto extranjero, este tipo de operación puede ganarse el corazón de la gente.

Al mismo tiempo, Ideogram se centra en cinco estilos:Ordinario, realista, diseño, 3D, animación., son todos fáciles de entender, por lo que la elección no será confusa.

Permítanme comenzar con una simple palabra china, "Sun Wukong sosteniendo un garrote dorado", estilo anime, deje que AI me ayude a traducirla y optimizarla, y ver cómo se puede usar libremente.

Cuando salió la versión de Wukong de "Dragon Ball" de Shui Lingling, me sorprendió cuando vi las indicaciones.La IA tradujo a Sun Wukong a "Son Goku", entonces no es de extrañar.

Además, también quiero preguntarle a Ideogram si es demasiado descarado pagar regalías.

Para evitar más malentendidos por parte de la IA, dejé de ser perezoso al ingresar la palabra inicial y enfaticé que "Sun Wukong" es "Sun Wukong", no "Son Goku".

Esta vez, adoptamos un estilo realista y proporcionamos una escena más detallada. El gran sabio lleva una armadura y sostiene un aro dorado en su mano. Su expresión es solemne y majestuosa. Está de pie frente a la cueva budista. tono, la parte inferior de la imagen dice "Black Myth: Wukong" (Mito Negro: Wukong).

No hay errores en el texto, las letras mayúsculas tienen un fuerte impacto y también se crea la atmósfera de la cueva budista. Sin embargo, el temperamento del "Gran Sabio" está un poco apagado, la imagen es un poco atávica y. no hay luz en sus ojos.

Utilice la misma palabra rápida para dejar A mitad de caminoUna vez generado, el texto tiene errores y no tiene sentido de diseño, pero el "Rey Mono" un poco más atractivo y el estilo del juego web compensan esto.

generado a mitad del viaje

No queriendo reconciliarme, probé el estilo 3D nuevamente. La palabra inicial siguió siendo básicamente la misma, pero el texto en la parte inferior se cambió a "Lanzamiento del juego el 20 de agosto".

Como resultado, el resultado generado por Ideogram es muy similar a la imagen promocional de cierta versión Q de estilo chino de la serie Blind Box. La imagen es muy limpia, pero en mi opinión no es en absoluto el estilo de juego 3D. El Rey Mono también se parece a Erlang Shen.

y La IA también se expuso. Aunque era muy buena reproduciendo texto en inglés, no sabía nada de chino. Esta falla continuó desde la versión 1.0 a la 2.0.

Parece que los productos extranjeros no comprenden lo suficiente la cultura tradicional nacional. El desempeño de Ideogram en la primera ronda fue un poco decepcionante, pero también interesante.

El equipo de Ideogram ha dicho que la versión 2.0 es tan buena como Flux y DallE. Recientemente, las fotografías de discursos TED generadas por la versión real de LoRA de Flux han engañado a muchos internautas porque es difícil saber si son reales o falsas. Entonces probémoslo,El ideograma genera resultados que se parecen más a fotografías.

Generación de flujo

Después de elegir el estilo realista, ingresé las palabras clave en chino, las fotos de la charla TED y el título de la diapositiva era "Lanzamiento de Ideograma 2.0". Había tres puntos clave: "texto preciso", "bueno en diseño" y "más real". ". La oradora estaba parada frente a la pizarra, al fondo había algunas personas.

Se puede ver que la comprensión semántica de Ideogram es buena y tiene todos los elementos necesarios. El logotipo de TED es casi falso, las expresiones del orador y la audiencia son muy vívidas y el cabello y la piel son relativamente naturales.

pero,Los detalles no se manejan lo suficientemente bien. Aunque no hay problema con el texto que se requiere generar, algunos caracteres pequeños que aparecen aleatoriamente estropean el bote, y los dedos y cuerpos de los personajes no están del todo bien, pero ya es mucho. mejor que la versión 1.0 anterior.

En cuanto al diseño de carteles, se puede decir que Ideogram se encuentra en la "zona de confort" de otras IA vicencianas.

Si el éxito de taquilla "Alien: Death Ship" se utiliza como pregunta de prueba, ¿puede la IA diseñar esa indescriptible sensación de terror?

Elegí un estilo de diseño, utilicé palabras inspiradoras para describir los elementos de la imagen y mencioné específicamente que escribí una oración en la parte inferior del cartel: "Los espectadores menores de edad miran con precaución".

El efecto general es llamativo y se ha generado con éxito una larga cadena de texto. Solo hay un pequeño error, pero no es realista y se parece más al estilo de un cómic, que no coincide con la película de acción real.

Luego usé la mala película de verano "A Dream of Red Mansions" como inspiración y le pedí a Ideogram que generara un póster. El fondo, las decoraciones e incluso los personajes mencionados en las palabras clave estaban incluidos en él. Las palabras clave son realmente buenas.

Por supuesto, el título de la película está escrito correctamente, pero la fuente parece tomada de El Señor de los Anillos, es un poco dramática y el estilo general se parece más a la película animada de Mulan.

El “estilo de diseño” de Ideogram es más bidimensional y único, pero a la inversa, esto también limita los escenarios de uso de los carteles.

Para resumir,Ideogram es un producto gráfico de IA con sus propias características. El nivel de realismo es similar al de Flux y el sentido artístico es diferente al de Midjourney.

patrón "verano lluvioso"

peroTiene un nivel de generación de texto único y es más adecuado para generar carteles, ilustraciones, anuncios, emoticones, impresión de camisetas, etc.

Los resultados de la evaluación humana muestran que Ideogram 2.0 es mejor que Flux Pro y DALL·E 3 en términos de alineación rápida de palabras, rendimiento general y calidad de representación del texto.

Pero esta es la propia declaración de Ideogram.

Altamente jugable y con los pies en la tierra, también podrías tener más “postres” de IA como este

Ideogram se anunció el 22 de agosto del año pasado, exactamente un año después del lanzamiento de 2.0.

El equipo fundador cuenta con un total de 7 personas de Google Brain, la Universidad de California, Berkeley, la Universidad Carnegie Mellon y la Universidad de Toronto, 4 de los cuales son los autores del artículo de investigación Imagen del modelo de difusión de gráficos de Google Vincent.

Además de lanzar 2.0 esta vez, Ideogram también lanzó una aplicación para iOS, que se puede descargar directamente en China. Está previsto que la versión de Android se lance más adelante, desde páginas web hasta terminales móviles, podemos generar imágenes en cualquier momento y en cualquier lugar.

Interfaz móvil

Actualmente, Ideogram está abierto a todos los usuarios de forma gratuita, pero la cuota es muy limitada. Después de generar un total de 20 fotos 5 veces, Ideogram me recordó que se han agotado 10 puntos, vuelve mañana.(Por supuesto, el Midjourney de al lado genera 25 fotos gratis, lo que no parece muy impresionante).

Si rara vez entras en contacto con cuadros vicencianos, te gustaría tener uno.Diagrama vicenciano AI Para empezar, Ideogram es una buena opción.

Ingresar palabras en chino y usar "indicaciones mágicas" para traducir y optimizar es una cosa. Además, Ideogram también tiene muchas opciones para ayudarlo a generar imágenes que se acerquen más a lo que desea.

Proporcionar una gama limitada de opciones para que los usuarios "hagan clic",En comparación con completar "entrada" en un cuadro de entrada en blanco, la interacción es más sencilla.Cualquiera que sea la proporción, el estilo y el tono de la imagen que desee, Ideogram le permite elegir.

Diferentes tonos de "La chica del pendiente de perla comiendo en McDonald's"

Si no sabes cómo escribir palabras clave, también puedes dibujarlas y dejar que Ideogram nos ayude a convertir lo mundano en mágico.

Lamento mis malas habilidades para dibujar, pero La IA puede comprender el significado, optimizar las líneas y los colores, agregar un fondo y el estilo mejora repentinamente. Con IA, ¿quién no es la pluma mágica Ma Liang?

Además, debajo del cuadro de entrada de la versión web, hay trabajos generados por otros. Cuando encontramos los que nos gustan, podemos ver y consultar las palabras clave. Ideogram dice que sus usuarios generaron más de mil millones de imágenes visibles públicamente el año pasado.

Si desea generar un objeto específico pero no sabe cómo escribir la palabra solicitada, esta vez también se lanzó Ideogram.La capacidad de buscar texto en la biblioteca de creación pública, pero esta característica actualmente requiere membresía.

Resultados de búsqueda para "gato"

Considerándolo todo, Ideogram es un producto jugable de Vincent.

Puede generar con mayor precisión el contenido de texto requerido por los usuarios y adaptarse a varios estilos de imágenes. Tiene una amplia gama de campos laborales.

Fuente de la imagen: Blog de Ideogramas

En ocasiones, puede aportar valor emocional y expresar ambición a través de imágenes, aunque los emoticones producidos están demasiado sesgados hacia la estética de Internet europea y americana.

Paquete de emoticonos "Quiero jugar" Black Myth: Wukong ""

La calidad general de Ideogram no es mala, la función de texto es poderosa, amigable para principiantes, fácil de usar y la interacción es agradable. Cuando las herramientas de IA combinan creatividad, conveniencia y valor compartido, es fácil que las personas se enganchen.

Un mundo creado a partir de moldes es demasiado aburrido. También es muy interesante discernir una pequeña necesidad y luego convertir la solución en la primera de la industria.

Hay muchos productos en el mundo y, con más audiencias, podemos esperar más “postres” de IA.