nouvelles

"Black Myth : Wukong" modifié par magie pour vaincre Midjourney. Cet artefact de dessin d'IA rend les gens accros.

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Lorsque les idéogrammes IA rivalisent pour le réalisme et le talent artistique, Ideogram a ouvert une voie délicate : il peut générer avec précision du texte sur des images, et les polices et mises en page sont magnifiques.

Cette demande n’est pas une demande de niche ;Générez des affiches et des illustrations en un seul clic sans utiliser d'images P, ce qui peut éviter bien des problèmes et convient très bien aux gens ordinaires qui ne connaissent rien au design.

Nous avons déjà parlé de la version 1.0 d'Ideogram. Le 21 août, la version 2.0 est arrivée. Le réalisme est meilleur, les affiches sont plus conçues et la compétence particulière du texte est également plus forte.

Vous n'en avez peut-être jamais entendu parler. Il s'agit d'un produit d'IA développé par d'anciens employés de Google. Il présente de nombreux défauts, mais le longboard peut « dépasser » Midjourney dans les virages.

AI veut savoir, de quel Wukong parlez-vous ?

Ideogram possède une fonctionnalité particulièrement adaptée aux débutants : « Magic Tips ».

Vous entrez directement le mot d'invite chinois, et cela vous aidera à le traduire en anglais et à l'optimiser en même temps. En tant que produit étranger, ce type d’opération peut gagner le cœur des gens.

Parallèlement, Ideogram se concentre sur cinq styles :Ordinaire, réaliste, design, 3D, animation, sont tous faciles à comprendre, le choix ne sera donc pas déroutant.

Permettez-moi de commencer par un simple mot chinois, "Sun Wukong tenant un gourdin d'or", style anime, laissez l'IA m'aider à le traduire et à l'optimiser, et voir comment il peut être utilisé librement.

Lorsque la version "Dragon Ball" de Wukong de Shui Lingling est sortie, j'ai été choqué. Quand j'ai vu les invites,AI a traduit Sun Wukong en "Son Goku", alors ce n’est pas surprenant.

De plus, je veux aussi demander à Ideogram si c'est trop flagrant pour payer des royalties.

Afin d'éviter d'autres malentendus de la part de l'IA, j'ai arrêté d'être paresseux en saisissant le mot d'invite et j'ai souligné que « Sun Wukong » est « Sun Wukong » et non « Son Goku ».

Cette fois, nous avons adopté un style réaliste et fourni une scène plus détaillée. Le grand sage porte une armure et tient un cerceau doré à la main. Son expression est solennelle et majestueuse. Il se tient devant la grotte bouddhiste. ton, le bas de l'image indique "Black Myth : Wukong" (Black Myth : Wukong).

Il n'y a pas d'erreurs dans le texte, les majuscules ont un fort impact, et l'atmosphère de la grotte bouddhiste est également créée. Cependant, le tempérament du « Grand Sage » est un peu décalé, l'image est un peu atavique, et. il n'y a pas de lumière dans ses yeux.

Utilisez le même mot d'invite pour laisser À mi-parcoursUne fois généré, le texte comporte des erreurs et aucun sens du design, mais le "Monkey King" légèrement plus beau et le style du jeu Web compensent cela.

Généré à mi-parcours

Ne voulant pas me réconcilier, j'ai réessayé le style 3D. Le mot d'invite est resté fondamentalement le même, mais le texte en bas a été remplacé par « Lancement du jeu le 20 août ».

En conséquence, le résultat généré par Ideogram est très similaire à l'image promotionnelle d'une certaine version Q de style chinois de la série blind box. L'image est très nette, mais ce n'est pas du tout le style de jeu 3D dans mon esprit. Le Roi Singe ressemble également à Erlang Shen.

et L'IA s'est également révélée. Bien qu'elle soit très efficace pour restituer le texte anglais, elle ne connaissait rien au chinois. Cette faille a persisté de la version 1.0 à la version 2.0.

Il semble que les produits étrangers ne comprennent pas suffisamment la culture traditionnelle nationale. La performance d'Ideogram au premier tour a été un peu décevante, mais elle était également intéressante.

L'équipe Ideogram a déclaré que la version 2.0 est aussi bonne que Flux et DallE. Récemment, les photos de discours TED générées par la version réelle de LoRA de Flux ont trompé de nombreux internautes car il est difficile de dire si elles sont réelles ou fausses. Alors testons-le,Ideogram génère des résultats qui ressemblent davantage à des photos.

Génération de flux

Après avoir choisi le style réaliste, j'ai saisi les mots d'invite chinois, les photos de la conférence TED et le titre de la diapositive était "Ideogram 2.0 Release". Il y avait trois points clés : "texte précis", "bon en design" et "plus réel". ". L'oratrice se tenait devant le tableau blanc, il y a quelques personnes en arrière-plan.

On peut voir que la compréhension sémantique d'Ideogram est bonne et qu'il contient tous les éléments nécessaires. Le logo TED est presque faux, les expressions de l'orateur et du public sont très vives et les cheveux et la peau sont relativement naturels.

mais,Les détails ne sont pas assez bien gérés. Même s'il n'y a pas de problème avec le texte à générer, certains petits caractères qui apparaissent au hasard gâchent la cagnotte, et les doigts et les corps des personnages ne sont pas tout à fait corrects, mais c'est déjà beaucoup. mieux que la version 1.0 précédente.

En ce qui concerne la conception d’affiches, on peut dire qu’Ideogram bat la « zone de confort » des autres IA vincentiennes.

Si le succès du box-office "Alien" est utilisé comme question test, l'IA peut-elle créer ce sentiment de terreur indescriptible ?

J'ai choisi un style de conception, utilisé des mots rapides pour décrire les éléments de l'image et mentionné spécifiquement que j'avais écrit une phrase au bas de l'affiche : « Les téléspectateurs mineurs regardent avec prudence ».

L'effet global est accrocheur et une longue chaîne de texte a été générée avec succès. Il n'y a qu'une petite erreur, mais elle n'est pas réaliste et ressemble davantage à un style de bande dessinée, qui ne correspond pas au film d'action réelle.

J'ai ensuite utilisé le mauvais film d'été "A Dream of Red Mansions" comme source d'inspiration et j'ai demandé à Ideogram de générer une affiche. L'arrière-plan, les décorations et même les personnages mentionnés dans les mots d'invite y étaient tous inclus. les mots rapides sont vraiment bons.

Bien sûr, le titre du film est écrit correctement, mais la police semble avoir été empruntée au Seigneur des Anneaux, c'est un peu dramatique et le style général ressemble plus au film d'animation Mulan.

Le « style de conception » d’Ideogram est plus bidimensionnel et unique, mais à l’inverse, cela limite également les scénarios d’utilisation des affiches.

Pour résumer,Ideogram est un produit graphique d'IA avec ses propres caractéristiques. Le niveau de réalisme est similaire à Flux et le sens artistique est différent de Midjourney.

motif "été pluvieux"

maisIl possède un niveau de génération de texte unique et est plus adapté à la génération d'affiches, d'illustrations, de publicités, d'émoticônes, d'impression de T-shirts, etc.

Les résultats de l'évaluation humaine montrent qu'Ideogram 2.0 est meilleur que Flux Pro et DALL·E 3 en termes d'alignement des mots rapides, de performances globales et de qualité de rendu du texte.

Mais c'est la propre déclaration d'Ideogram

Très jouable et terre-à-terre, autant avoir plus de « desserts » IA comme celui-ci

Ideogram a été annoncé le 22 août de l'année dernière, exactement un an après la sortie de la version 2.0.

L'équipe fondatrice compte au total 7 personnes de Google Brain, de l'Université de Californie, Berkeley, de l'Université Carnegie Mellon et de l'Université de Toronto, dont 4 sont les auteurs du document de recherche Imagen du modèle de diffusion de graphes Google Vincent.

En plus de sortir cette fois la version 2.0, Ideogram a également lancé une application iOS, qui peut être téléchargée directement en Chine. La version Android devrait être publiée plus tard. Des pages Web aux terminaux mobiles, nous pouvons générer des images à tout moment et n'importe où.

Interface mobile

Ideogram est actuellement ouvert gratuitement à tous les utilisateurs, mais le quota est très limité. Après avoir généré 5 fois un total de 20 photos, Ideogram m'a rappelé que 10 points ont été utilisés, merci de revenir demain.(Bien sûr, le Midjourney d’à côté génère 25 photos gratuitement, ce qui ne semble pas très impressionnant.)

Si vous entrez rarement en contact avec des images vincentiennes, vous en aimeriez uneDiagramme vincentien IA Pour commencer, Ideogram est un bon choix.

Saisir des mots d'invite chinois, utiliser des « invites magiques » pour traduire et optimiser est une chose. De plus, Ideogram propose également de nombreuses options pour vous aider à générer des images plus proches de ce que vous voulez dans votre esprit.

Fournir une gamme limitée d'options permettant aux utilisateurs de "cliquer",Par rapport au fait de remplir « saisie » dans une zone de saisie vide, l'interaction est plus simple.Quels que soient la proportion, le style et le ton de l'image que vous souhaitez, Ideogram vous permet de choisir.

Différentes nuances de "Fille à la boucle d'oreille en perle mangeant McDonald's"

Si vous ne savez pas comment écrire des mots rapides, vous pouvez également les dessiner et laisser Ideogram nous aider à transformer le banal en magie.

Je suis désolé pour mes faibles compétences en dessin, mais L'IA peut comprendre la signification, optimiser les lignes et les couleurs, ajouter un arrière-plan, et le style s'améliore soudainement. Avec l'IA, qui n'est pas le stylo magique Ma Liang ?

De plus, sous la zone de saisie de la version Web, il y a des œuvres générées par d'autres. Lorsque nous rencontrons celles que nous aimons, nous pouvons visualiser et nous référer aux mots d'invite. Ideogram affirme que ses utilisateurs ont généré plus d'un milliard d'images visibles publiquement au cours de l'année écoulée.

Si vous souhaitez générer un objet spécifique mais que vous ne savez pas comment écrire le mot d'invite, Ideogram est également lancé cette fois.La possibilité de rechercher du texte dans la bibliothèque de création publique, mais cette fonctionnalité nécessite actuellement un abonnement.

Résultats de recherche pour "chat"

Dans l’ensemble, Ideogram est un produit Vincent jouable.

Il peut générer avec plus de précision le contenu textuel requis par les utilisateurs et s'adapter à différents styles d'images. Il couvre un large éventail de domaines d'emploi.

Source de l'image : Blog Idéogramme

Parfois, il peut apporter une valeur émotionnelle et exprimer une ambition à travers des images, même si les émoticônes produites sont trop biaisées en faveur de l'esthétique de l'Internet européen et américain.

Pack d'émoticônes "Je veux jouer à "Black Myth: Wukong""

La qualité globale d'Ideogram n'est pas mauvaise, la fonction texte est puissante, conviviale pour les novices, facile à utiliser et l'interaction est agréable. Lorsque les outils d’IA allient créativité, commodité et partage de valeur, il est facile pour les gens de devenir accros.

Un monde taillé dans des moules est trop ennuyeux. Il est aussi très intéressant de discerner un petit besoin et ensuite de faire de la solution la première de l'industrie.

Il existe de nombreux produits dans le monde, et avec des audiences plus nombreuses, nous pouvons nous attendre à davantage de « desserts » IA de ce type.