nouvelles

Le statut de Midjourney est-il instable ? Un autre cheval noir dans le dessin IA apparaît, avec des tests directs de 4 produits

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Cercle AI, génération d'images à livre ouvert à nouveau.

Une série de développements rassemblés :

21 aoûtIdeogram lance officiellement la version 2.0, prétendant avoir des capacités de rendu de texte plus puissantes.

C'est vrai, c'est le projet qui a été fondé en août de l'année dernière par les quatre grands de Google AI Painting qui ont collectivement quitté leur emploi pour démarrer une entreprise. Il a reçu des investissements de plusieurs grands de l'IA.

Cette fois, l'idéogramme aussiDéfi ouvert à Flux, le responsable a déclaré avec assurance que son évaluation humaine est nettement meilleure que celle de Flux Pro.

Vous savez, Flux a été créé par l'équipe originale de Stable Diffusion, et il est récemment devenu populaire sur les principaux réseaux pour générer des « photos » de conférences TED qui ressemblent à de vraies.

De plus, il y a une semaine, Google a officiellement publiéImage 3, dans les évaluations officielles, il est censé être plus performant que DALL-E 3, Midjourney v6, Stable Diffusion 3 et d'autres modèles de dessin.

Peut-être grâce à une stimulation (doge), Midjourney a également fait la transition et a été lancé directement à tous les utilisateurs le 22 août.Version Internet gratuite

Il y a quelque chose de bien à regarder maintenant !

Puisque tout le monde prétend être fort, autant mettre tout le monde à la même table et avoir un PK en face à face.

Quelle est l'IA de dessin la plus puissante ?

Invitons d’abord nos 4 candidats (tous utilisant la version web) :

Concurrent n°1 : Idéogramme 2.0.Il y a 10 points gratuits chaque jour, 1 point peut générer 4 images et un maximum de 40 images peuvent être générées par jour ;

Joueur n°2 : Flux.1.Black Forest propose officiellement une démo gratuite sur Hugging Chat (sélectionnez la version FLUX.1 Schnell) ;

Concurrent n°3 : Image 3.Utilisation gratuite et illimitée sur Image FX ;

Joueur n°4 : À mi-parcours.Pendant la période d'essai gratuite, vous n'avez la possibilité de générer qu'un total de 25 images ;

Nous entrons désormais officiellement dans la phase de compétition.

Les singes noirs tous renversés

Premièrement, afin de tester ces IA étrangèresComprenez-vous les mots-clés chinois ?, profitons également de la popularité des meilleurs singes noirs d’aujourd’hui.

invite : Le personnage du jeu est un singe, portant une armure, une couronne dorée avec des plumes de phénix sur la tête et tenant un cerceau doré à la main, debout sur une falaise.

Comme prévu, un accident s'est produit...

Je crois que tout le monde a été attiré par la grande croix rouge du n°3 au premier coup d'œil. C'est vrai, sous le même mot d'invite, il n'y a que Imagen 3Demande de build refusée

Quand j'ai vu cela, ma première réaction a été de savoir si nos paroles rapides déclenchaient la protection du droit d'auteur. J'ai donc d'abord supprimé le "personnage du jeu" dans le mot d'invite, mais le résultat a été que le rappel n'a pas pu être généré.

Est-ce parce que Google Imagen 3 ne prend pas en charge le chinois ? J'ai donc changé au hasard le mot d'invite en un mot plus simple, et cette fois il y avait une image.

C'est juste que le résultat était une grosse erreur, et plusieurs mots d'invite chinois ont été modifiés, et à la fin, ils étaient tous des images de texture non pertinentes.

Il sembleGoogle Imagen 3 n'est en effet pas d'accord avec les mots d'invite chinois

Après que le numéro 3 ait échoué sur la liste, en regardant les autres, il n'y avait queL’idéogramme n°1 2.0 est le plus performant

Le n°2 peut encore voir l'ombre des bandes dessinées chinoises, mais le n°4 Midjourney s'est complètement laissé aller~ (le thème principal n'a absolument aucun rapport)

Enfin, je voudrais féliciter Ideogram 2.0 pour avoir abordé avec précision tous les éléments clés.

Bien que ce ne soit pas ce que je veux dans mon cœur (je veux la mythologie noire), il n'y a vraiment rien de mal à restaurer les mots rapides.

Est-ce une personne réelle ou une IA ? Idiot, je ne peux pas faire la différence

Ensuite, entrez dans la zone de confort de chaque joueur——Génération de portraits

À cette époque, Midjourney est devenu populaire sur Internet avec une photo d'un couple sur le toit ; aujourd'hui, Flux est même populaire sur Internet avec une série d'images de discours TED...

Qui est le meilleur ? La réponse sera bientôt révélée.

invite : Un jeune homme aux cheveux auburn, portant une chemise à carreaux bleu sarcelle et crème, capturé avec un objectif 50 mm pour un look vintage. Couleurs riches, mise au point nette et une touche de charme rétro.

Un jeune homme aux cheveux auburn, vêtu d'une chemise à carreaux bleu sarcelle et crème, capturé avec un objectif 50 mm dans un style rétro. Les couleurs sont riches et la mise au point est nette avec une touche de charme vintage.

En regardant d'abord les n°2 et n°4, il est évident que Midjourney a gagné !

En regardant les détails, n°2Flux.1 est légèrement désactivé, il existe deux autres couleurs de vêtements, ce qui est particulièrement important parmi les chemises à carreaux bleues et vertes.

De plus, nous avons également découvert Imagen 3 au débutUn petit moment unique: Encerclez le mot-clé avant le début de la génération.

Avec le travail effectué, nous pouvons simplement tester les performances de plusieurs joueurs.éléments clés(Chemise à carreaux bleu-vert, objectif 50 mm, etc.).

On constate que dans l'ensemble, plusieurs joueurs se sont bien comportés (sauf le n°2), avec un haut degré de restauration et tous tournés vers la caméra.

De plus, si ceux-ci n’étaient pas générés par moi-même à l’aide de l’IA, je ne serais pas en mesure de faire immédiatement la différence avec de vraies personnes. (Honteux)

Enfin, je voudrais dire tranquillement que le candidat n°4, Midjourney, a le plus beau look.

Grosse difficulté : texte affiché sur l'image

Après avoir réussi à tromper tout le monde, il est temps de laisser l'IA souffrir un peu——

Ajouter du texte aux images

Cette question a toujours été un problème de longue date, et elle est également devenue l'une des normes pour tester le niveau de dessin de l'IA.

Sans plus tarder, laissons quelques candidats créer un panneau d’affichage exquis. Tous les lecteurs, veuillez apporter votre propre rôle de père de la partie A.

invite : Un panneau horizontal en laiton portant l'inscription « Saison des fêtes » dans une écriture élégante, entouré de pin et de houx sur un fond en bois foncé, avec un gros plan sur les lettres dorées.

Un panneau horizontal en laiton indiquant « Festive Season » en caractères élégants est entouré de branches de pin et de houx sur un fond en bois sombre, avec un gros plan mettant l'accent sur les lettres dorées.

Après un rapide coup d'œil, sont-ils tous plutôt bons ? Il semble qu'ils aient restauré les mots d'invite à un haut degré ?

Cependant, une fois les yeux perçants du père du parti A révélés, le n°2 ne peut pas les cacher.

Faites attention, numéro 2Flux.1 a coupé les coins ronds, il manque la lettre "S" au mot "Saison".

Mais à l'exception du n°2, les autres sont plutôt bons. Il semble que diverses sociétés d'IA se portent bien.Fonction de rendu de texteTous les efforts ont été déployés.

La prochaine étape est donc que chacun ait ses propres préférences en matière de radis et de légumes verts, et que chacun fasse un choix en fonction de ses préférences personnelles. (Personnellement voté pour Midjourney)

À propos, No. 1 Ideogram a spécialement promu la fonction « rendu de texte » dans cette mise à niveau du modèle. Vous souhaiterez peut-être l'essayer davantage.

Référez-vous à McDonald's, tout l'intérêt de la publicité IA

Récemment, McDonald's a embauché 11 beautés de l'IA pour appeler leurs frites, ce qui les a rendues très populaires~

En fait, le principe est relativement simple : il s’agit simplement d’utiliser l’IA pour générer des images de différents personnages faisant la promotion de frites, puis de les assembler dans une vidéo.

De manière inattendue, l’effet a été étonnant. Rien que sur Twitter, la vidéo concernée a été vue près de 10 millions de fois.

Après avoir maîtrisé le code de la richesse, nous avons officiellement commencé à travailler en tant que Chinois.L'IA aide les agriculteursVous devez monter et descendre ~

invite : Dans le contexte d'une métropole de style cyberpunk, une fille fait la promotion de produits agricoles biologiques dans ses mains.

Dans un décor urbain de style cyberpunk, une jeune fille fait la promotion des produits biologiques qu'elle tient entre les mains.

Très bien, le joueur n°3 a encore "échoué". Cependant, cette vague est vraiment déroutante. Les mots d'invite ne sont ni en chinois ni quoi que ce soit de visiblement interdit...

Après l'élimination du n°3, le concurrent n°1 Idéogramme 2.0 a apporté la plus grande variété de produits, notamment du chou chinois, des tomates, du chou violet, etc.

Et c'est le seul qui a tapésigne de texteJe suis venu ici pour promouvoir l'alimentation biologique, et je vois qu'ils travaillent très dur~

De plus, si vous regardez attentivement, vous pouvez voir que seul le n°1 fait de son mieux pour imiter la vraie personne, tandis que les n°2 et n°4 sont complètementsinge à deux épines

u1s1, si l’on se réfère au style publicitaire de Maimai, cette génération à court terme n’a pas obtenu l’effet escompté. (J'espère plus proche de la réalité)

Mais heureusement, ces outils d’IA sont actuellement disponibles gratuitement. Il n’est pas impossible de les essayer plusieurs fois. L’accent est toujours mis sur la méthodologie. 🐶

Ne partez pas précipitamment, il existe en fait un moyen plus fiable de gagner de l'argent——

Utilisez l'IA pour contrôler facilement les prises de vue en studioaffiches commerciales, ne serait-il pas bien d'économiser de l'argent sur les photographes, les lieux et la post-production.

Un tube de rouge à lèvres élégant brille sur un fond sophistiqué, mettant en valeur la richesse des pigments et la douceur de la glisse. Évoquez le luxe avec une mise au point nette et une touche de brillance.

Un tube de rouge à lèvres élégant brille sur un fond sophistiqué, mettant en valeur une couleur intense et une application douce. Évoquez un sentiment de luxe avec une mise au point nette et une touche de miroitement.

Testons tout le monde, si vous deviez choisir un rouge à lèvres pour une femme de votre entourage, lequel choisiriez-vous ? (Le test de la mort arrive)

Héhé, alors quelqu'un a-t-il choisi le n°4 ?

Bien que la couleur grise du No. 4 Midjourney semble très haut de gamme, la couleur noire peut être un peu niche. (Choisissez avec soin)

En dehors de cela, les prochains meilleurs interprètes sontImage 3, le tissu velours en dessous fait ressortir une sensation de luxe, et surtout, la texture du rouge à lèvres est bien réelle.

En comparaison, le n°1 et le n°2 semblent un peu faux, avec une « sensation plastique ».

Par conséquent, au total, le joueur n°3 a remporté ce tour.

En résumé, la performance globale des quatre joueurs a été très bonne. Sous les mots d'invite chinois, le joueur de cheval noir Ideogram 2.0 a obtenu les meilleurs résultats.

Qui est Idéogramme ?

En février de cette année, Ideogram a lancé la version 1.0. En seulement six mois, il a encore évolué et a lancé la version 2.0.

En fait, Ideogram et Google sont étroitement liés.

Fondée en août de l'année dernière, les quatre premiers membres de l'équipe fondatrice étaientAuteur de l'article d'Imagen sur la recherche sur les graphes vincentiens de Google

PDG Mohammed Norouzi, co-auteur de l'article, il a reçu la bourse de doctorat Google ML alors qu'il étudiait pour un doctorat en informatique à l'Université de Toronto.

Après avoir obtenu son diplôme, il a rejoint Google Brain et a travaillé pendant 7 ans, accédant au poste de chercheur scientifique principal.Générer un modèle

De plus, il est un membre original de l'équipe de traduction automatique neuronale de Google et co-auteur du cadre d'apprentissage contrastif auto-supervisé SimCLR de l'équipe Hinton.

William Chan, directeur technique(Chen Junle), co-auteur de l'article, a étudié à l'Université de Waterloo et à l'Université Carnegie Mellon au Canada.

Lorsqu'il a rejoint Google en 2012, il a d'abord travaillé sur des projets publicitaires d'apprentissage automatique, puis a rejoint Google Brain pour effectuer des recherches en PNL.

Co-fondateur Jonathan Ho, diplômé d'un doctorat de l'UC Berkeley, a travaillé chez OpenAI pendant un an, puis a rejoint Google.

En plus d'être l'un des principaux contributeurs à l'article Imagen, il a également jeté les bases du modèle de diffusion par débruitage.« Modèles probabilistes de diffusion avec débruitage »Pieter Abbeel, l'un des co-auteurs de cet article, est également un investisseur dans Ideogram AI.

Co-fondateur Chitwan Saharia, co-auteur de l'article, est diplômé du Bombay Institute of Technology avec une licence. Il a rejoint Google en 2019, où il est principalement chargé de diriger les travaux sur le modèle de diffusion image à image.

Les trois autres personnes de l'équipe fondatrice,Shayaan AbdallahIl était ingénieur en apprentissage automatique chez Twitter. Il a quitté son emploi en avril de l'année dernière et a ensuite rejoint Ideogram AI.

Jacob LuIngénieur logiciel, il a travaillé dans des entreprises comme Amazon avant de rejoindre Ideogram ;Jenny LeiJe suis stagiaire en génie logiciel et j'ai effectué un stage chez Google avant de rejoindre Ideogram AI.

On peut voir qu'Ideogram est composé des meilleures équipes de recherche sur les modèles de diffusion et a reçu des faveurs en capital depuis sa création.

Le cycle de lancement d’Ideogram a été financé para16zetIndex VenturesA dirigé l'investissement d'un montant de 16,5 millions de dollars américains (environ 120 millions de RMB à l'époque).

Il existe également des investisseurs individuels tels qu'Andrej Karpathy, le gourou de l'apprentissage par renforcement Pieter Abbeel et le co-fondateur de GitHub, Tom Preston-Werner.

De plus, en février de cette année, plusieurs sources ont rapporté qu'Ideogram avaitnouvelle ronde de financement

aurait été élevé avec succès80 millions de dollars américains(environ 5,7 milliards de yuans) Financement de série A, dirigé par Andreessen Horowitz, et les autres investisseurs participants comprennent Index Ventures, Redpoint Ventures, Pear VC et SV Angel.

Il semble qu'Ideogram, qui possède de l'argent et de la technologie, soit sans aucun doute un cheval noir dans le domaine de la cartographie de l'IA.

Roulez, continuez à rouler.