2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Tout le monde se souvient encore de Stable Diffusion, l'IA de génération d'images qui était autrefois aussi célèbre que DALL·E et Midjourney.
expérimentéLe patron s'est enfui,Les principaux membres du développement démissionnent, Stability AI, qui remuait le marché de l'IA d'image, est devenu un gâchis en interne.
Ces derniers mois, à ce sujetLa chaîne du capital est brisée, chercher à se vendreLa nouvelle n'a jamais été annoncée.
Alors que l'ancien club se trouvait dans une situation embarrassante et cherchait un moyen de se sauver, le groupe de membres partis au début de l'année était exactement la cible.Diffusion stableUne nouvelle société a été crééeLaboratoire de la Forêt Noire(Laboratoire de la Forêt Noire).
Juste au début de ce mois, lorsqu'ils ont annoncé la création d'une nouvelle société, ils ont également publiétroisDiagramme de Vincent modèle FLUX.1 de différents volumes.
Il y a le big cup pro qui se concentre sur la qualité de l'image ; le medium cup dev qui prend en compte à la fois la vitesse et la qualité de l'image et le small cup schnell qui est connu sous le nom de « tourbillon de vitesse ».
Selon leur site officiel, le FLUX de la Coupe Dazhong est devenu la principale caractéristique de toutes les images d'IA.L'existence la plus puissante。
Les différentes capacités séparées, telles que la qualité visuelle, la variabilité de la taille, la diversité des sorties, etc., sont également bien meilleures que les autres modèles.
Non seulement le responsable le dit, mais dans la bouche de nombreux internautes et médias, le nouveau FLUX est également arrivé.Coup de poing à mi-parcours, coup de pied à DALL·Eétendue.
La lecture des commentaires sur Internet a éveillé l'intérêt de Shichao. FLUX est-il vraiment aussi puissant que tout le monde le dit ? Cette fois, nous l'avons apporté ?À mi-parcours, combinez-le avecGrande tasse de FLUXAssemblez-les et testez-les.
Au début, nous commencerons par une question test régulière pour nous échauffer, en leur demandant de dessiner une peinture à l'encre de Chine.
Les résultats sont plutôt bons et tout le contenu des mots d'invite tels que pêcheurs, montagnes, roseaux, etc. est dessiné. Cependant, le soleil peint ici à Midjourney est un peu trop grand et ne ressemble pas à un coucher de soleil.
Mots rapides :
Style de peinture à l'encre de Chine, un pêcheur solitaire dans un bateau en bois traditionnel dérive doucement sur un lac tranquille au coucher du soleil, style de peinture à l'encre de Chine, les tons bleus chauds reflètent l'eau calme, les coups de pinceau doux capturent la tranquillité de la soirée, au loin Les montagnes ici sont silhouette dans la lumière qui change progressivement, cabanes traditionnelles sur le rivage, roseaux se balançant dans la brise, résolution 8K, sensation de film, atmosphère nostalgique et paisible
FLUX (à gauche), Midjourney (à droite)
Les amis qui prêtent attention à l'IA en image devraient savoir que"La génération de texte est trop mauvaise"C’est là que presque toutes les IA échouent. DALL·E a également optimisé cette faiblesse une fois auparavant, mais il commet encore des erreurs de temps en temps.
Mais cette fois, on dit que FLUX est déjà très compétent dans ce domaine, j'ai donc spécialement sélectionné quelques mots d'invite pour générer du texte et je les ai lancés à lui ainsi qu'à Midjorney.
Laissez-les d’abord générer chacun un sac avec la marque Prada, et les réponses finales étaient plutôt bonnes, sans erreurs dans le texte.
L'effet global de l'image est égalementChacun a ses propres mérites, FLUX a non seulement écrit le texte correctement, mais a même dessiné le LOGO en triangle inversé de Prada, tandis que celui de Midjourney semble plus à la mode.
Astuce : Un grand sac à main "Prada" blanc avec de petites figurines construites en glace et entourées de neige et de glace, conçues comme une publicité de mode, inspirées des publicités des magazines Prouce, de photographies haute résolution et d'un design typographique inspiré de la publicité.
FLUX (à gauche), Midjourney (à droite)
La prochaine foisAugmente la difficulté, laissez-les concevoir une image rétro pour les chemises à manches courtes et ajoutez deux mots anglais.
Aucun d'eux n'a commis de grosses erreurs cette fois, mais en termes d'effet global, Shichao estime personnellement que celui de Midjourney est meilleur.
Astuce : ce t-shirt d'inspiration rétro présente un coureur de dragsters vintage avec un drapeau à damier et les textes "Lagertha" et "Semper Fi" sur un fond monochrome. Lagertha, qui tient un drapeau, a des tatouages. Le style de cette œuvre d'art la capture dans des poses d'action, mettant en valeur la vitesse et la puissance du pouvoir viking. C’est une illustration très contrastée qui met en valeur leurs vêtements de sport et leur typographie de texte en gras.
FLUX (à gauche), Midjourney (à droite)
Regarder la capacité d'un modèle d'image, un problème classique"Peintre"Cela ne peut certainement pas être contourné.
Midjourney est encore un peu instable. Les mains générées sont bonnes et mauvaises Comme l'image de droite, c'est inexplicable en comparaison.petit doigt supplémentaire。
Les deux images ont été générées par Midjourney
Pour être honnête, l’effet de FLUX est assez surprenant, qu’il s’agisse de style clip art ou de style réaliste.Il n'y a presque aucun défaut sur les mains.。
Les deux images ont été générées par FLUX
Jusqu'à présent, FLUX a assez bien géré certains détails de l'image et certains problèmes mineurs.
Bien sûr, dans une certaine mesure, l'IA d'image est aussi un outil pour aider chacun à réaliser son imagination, donc Shichao a perdu encore un peuMots de rappel réfléchis。
Mot rapide : Une jeune fille vêtue d’une robe rouge est assise à côté d’un dragon aux dents et aux yeux énormes. Elle l’a affronté de front, comme s’ils étaient amis ou de bons flics. Cette scène se déroule parmi la neige et les rochers des montagnes. La vie secrète des loups, tourné dans le style de James Cameron, un film des années 70.
FLUX (à gauche), Midjourney (à droite)
euh. . . Il n'est pas nécessaire que Shichao aide tout le monde à tirer des conclusions sur qui est bon et qui est fondamentalement mauvais.IA en un seul coup d'œilDans la mesure où, en regardant Midjourney, cela ressemble vraiment un peu à des effets spéciaux réels.
Après cela, Shichao a donné à FLUX une invite plus simple : « La destruction de la civilisation moderne » pour voir à quoi ressemblait sa propre imagination.
En conséquence, cette fois,Lui et Midjourney ont échoué.。
Rien qu'en regardant l'effet d'image, Midjourney sera meilleur. Il capture vraiment le sentiment épique, mais en le regardant de face et de dos, ce bâtiment n'a rien à voir avec la civilisation moderne. . .
FLUX (à gauche), Midjourney (à droite)
Il est intéressant de noter que FLUX est assez doué pour générer des caricatures exagérées de portraits de célébrités. Comme Musk et Jobs, lors de sa génération, les traits du visage étaient capturés avec précision.
Les deux images ont été générées par FLUX
Après l'expérience globale, Shichao estime que le véritable niveau de FLUX est toujours bon.Sans parler d'un match parfait, mais pas bien pire.
Après tout, il a été créé par l'équipe originale de Stable Diffusion, et il est presque au même échelon que Midjourney.
Par ailleurs, lorsque la nouvelle société Forêt-Noire a lancé FLUX au début du mois, elle a également annoncé officiellement l'avancement de son financement, qui est désormais bouclé.31 millions de dollarsfinancement.
Plus important encore, bien que tout le monde en Forêt-Noire ait quitté Stability AI, ils ont toujours hérité de sa vertu traditionnelle d'open source. Les FLUX moyens et petits sont open source.
Ce n’est pas encore fini. Le lancement de Picture AI semble n’être qu’une partie de leurs efforts de rattrapage. Sur le site officiel, ils ont également expliqué les prochaines étapes.SOTA dans l'IA vidéo。
Mais cela dit, la commercialisation de l’IA d’image est un sujet qui est presque en discussion.
Stability AI, l'ancien propriétaire de Black Forest, était dans une situation difficile en raison de problèmes de commercialisation. Quant à lui-même, il est désormais open source et dispose d’un modèle payant, qui est fondamentalement le même que le précédent Stability AI.
Nous ne pouvons qu'attendre de voir s'il y aura d'autres nouvelles avancées en termes de commercialisation à l'avenir. Après tout, cela vient tout juste de sortir.
Ne suivez pas l’ancienne voie de Stability AI et recommencez. . .
Écrire un article:écureuil
modifier:Jiangjiang
Editeur artistique:Xuan Xuan
Images, sources:
FLUX, à mi-parcours