Nachricht

Als es zum ersten Mal herauskam, wurde es als das Stärkste bezeichnet, aber diese Bild-KI scheint genau das zu sein. .

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Jeder erinnert sich noch an Stable Diffusion, die Bilderzeugungs-KI, die einst so berühmt war wie DALL·E und Midjourney.

erfahrenDer Chef ist weggelaufenKernentwicklungsmitglieder treten zurück, Stabilitäts-KI, die früher den Markt für Bild-KI aufwühlte, ist intern zu einem Chaos geworden.

In den letzten Monaten darüberDie Kapitalkette ist unterbrochen, man versucht sich zu verkaufenDie Nachricht wurde nie verbreitet.


Als sich der ehemalige Verein in einer peinlichen Situation befand und einen Weg zur Rettung suchte, war die Gruppe der zu Jahresbeginn ausgetretenen Mitglieder genau das Ziel.Stabile DiffusionEin neues Unternehmen wurde gegründetSchwarzwaldlabor(Schwarzwaldlabor).

Erst zu Beginn dieses Monats, als sie die Gründung eines neuen Unternehmens bekannt gaben, gaben sie auch freidreiVincent-Diagrammmodell FLUX.1 mit verschiedenen Volumina.

Es gibt den Big Cup Pro, der sich auf die Bildqualität konzentriert; den Medium Cup Dev, der sowohl Geschwindigkeit als auch Bildqualität berücksichtigt, und den Small Cup Schnell, der als „Speed ​​Whirlwind“ bekannt ist;

Laut ihrer offiziellen Website ist FLUX des Dazhong Cups zum Hauptmerkmal aller Bild-KI geworden.Die mächtigste Existenz


Auch die verschiedenen Funktionen wie visuelle Qualität, Größenvariabilität, Ausgabevielfalt usw. sind deutlich besser als bei anderen Modellen.


Das sagt nicht nur der Beamte, sondern auch in den Mündern vieler Internetnutzer und Medien ist das neu veröffentlichte FLUX angekommenSchlag Midjourney, tritt DALL·EAusmaß.


Das Lesen der Kommentare im Internet weckte Shichaos Interesse. Ist FLUX wirklich so mächtig, wie alle sagen? Dieses Mal haben wir es mitgebrachtMitten auf der Reise, kombiniere es mitGroße Tasse FLUXHabe sie zusammengesetzt und getestet.

Zu Beginn beginnen wir mit einer regulären Testfrage zum Aufwärmen und bitten sie, ein chinesisches Tuschegemälde zu zeichnen.

Die Ergebnisse sind ziemlich gut und der gesamte Inhalt der Aufforderungswörter wie Fischer, Berge, Schilf usw. wird gezeichnet. Allerdings ist die hier in Midjourney gemalte Sonne etwas zu groß und fühlt sich nicht wie ein Sonnenuntergang an.

Aufforderungsworte:

Chinesischer Tuschemalerei-Stil, ein einsamer Fischer in einem traditionellen Holzboot treibt sanft auf einem ruhigen See bei Sonnenuntergang, chinesischer Tuschemalerei-Stil, warme Blautöne spiegeln das ruhige Wasser wider, sanfte Pinselstriche fangen die Ruhe des Abends ein, in der Ferne sind die Berge hier Silhouetten unter dem sich allmählich ändernden Licht, traditionelle Hütten am Ufer, im Wind wiegendes Schilf, 8K-Auflösung, filmähnliches Gefühl, nostalgische und friedliche Atmosphäre

FLUX (links), Midjourney (rechts)


Freunde, die auf Bild-KI achten, sollten das wissen„Textgenerierung ist zu schlecht“Hier versagt fast jede KI. DALL·E hat diese Schwäche auch schon einmal optimiert, macht aber dennoch gelegentlich Fehler.

Aber dieses Mal heißt es, dass FLUX in diesem Bereich bereits sehr kompetent ist, also habe ich speziell ein paar Aufforderungswörter ausgewählt, um Text zu generieren, und sie darauf und Midjorney geworfen.

Lassen Sie sie zunächst jeweils eine Tasche mit dem Markenzeichen von Prada erstellen, und die endgültigen Antworten waren ziemlich gut, ohne Fehler im Text.

Die Gesamtwirkung des Bildes ist ebenfalls vorhandenJeder hat seine eigenen Vorzüge, FLUX hat nicht nur den Text richtig geschrieben, sondern sogar das umgekehrte Dreiecks-LOGO von Prada gezeichnet, während das von Midjourney modischer aussieht.

Tipp: Eine große weiße „Prada“-Handtasche mit winzigen Figuren aus Eis, umgeben von Schnee und Eis, im Stil einer Modewerbung, inspiriert von Anzeigen in Prouce-Magazinen, hochauflösender Fotografie und von der Werbung inspiriertem typografischem Design.

FLUX (links), Midjourney (rechts)


Das nächste MalErhöhen Sie den SchwierigkeitsgradLassen Sie sie ein Retro-Bild für Kurzarmhemden entwerfen und zwei englische Wörter hinzufügen.

Diesmal hat keiner von ihnen große Fehler gemacht, aber was die Gesamtwirkung angeht, ist Shichao persönlich der Meinung, dass Midjourneys besser ist.

Tipp: Dieses Retro-inspirierte T-Shirt-Design zeigt einen Vintage-Drag-Racer mit einer Zielflagge und den Texten „Lagertha“ und „Semper Fi“ vor einem monochromen Hintergrund. Lagertha, die eine Flagge hält, hat Tätowierungen. Der Stil dieses Kunstwerks fängt sie in Aktionsposen ein und zeigt die Geschwindigkeit und Kraft der Wikingermacht. Es handelt sich um eine kontrastreiche Illustration, die ihre Sportkleidung und die kräftige Texttypografie hervorhebt.

FLUX (links), Midjourney (rechts)


Schauen Sie sich die Fähigkeit eines Bildmodells an, ein klassisches Problem"Maler"Es kann sicherlich nicht umgangen werden.

Midjourney ist immer noch etwas instabil. Die erzeugten Hände sind wie auf dem Bild rechts unerklärlich.zusätzlicher kleiner Finger

Beide Bilder wurden von Midjourney erstellt


Ehrlich gesagt ist die Wirkung von FLUX ziemlich überraschend, egal ob es sich um einen ClipArt-Stil oder einen realistischen Stil handelt.Es gibt fast keine Mängel an den Händen.

Beide Bilder wurden von FLUX generiert


Bisher hat FLUX einige Bilddetails und kleinere Probleme recht gut gemeistert.

Natürlich ist Bild-KI bis zu einem gewissen Grad auch ein Werkzeug, das jedem hilft, seine Fantasie zu verwirklichen, also hat Shichao noch etwas verlorenNachdenkliche Erinnerungsworte

Promptes Wort: Ein junges Mädchen in einem roten Kleid sitzt neben einem Drachen mit riesigen Zähnen und Augen. Sie stand der Sache frontal gegenüber, als wären sie Freunde oder gute Polizisten. Diese Szene spielt zwischen Schnee und Felsen in den Bergen. Das geheime Leben der Wölfe, gedreht im Stil von James Cameron, einem Film aus den 70er Jahren.

FLUX (links), Midjourney (rechts)


emmm. . . Es ist nicht nötig, dass Shichao allen dabei hilft, Schlussfolgerungen darüber zu ziehen, wer im Grunde gut und wer schlecht istKI auf einen BlickInsofern fühlt es sich im Rückblick auf „Midjourney“ tatsächlich ein wenig wie echte Spezialeffekte an.

Danach gab Shichao FLUX eine einfachere Aufforderung: „Die Zerstörung der modernen Zivilisation“, um zu sehen, wie seine eigene Vorstellung war.

Als Ergebnis, dieses Mal,Sowohl es als auch Midjourney scheiterten.

Wenn man sich nur den Bildeffekt ansieht, wird Midjourney das epische Gefühl wirklich einfangen, aber wenn man es von vorne und von hinten betrachtet, hat dieses Gebäude nichts mit der modernen Zivilisation zu tun. . .

FLUX (links), Midjourney (rechts)


Interessanterweise ist FLUX ziemlich gut darin, übertriebene Karikaturen von Porträts von Prominenten zu erstellen. Wie bei Musk und Jobs wurden die Gesichtszüge bei der Erstellung genau erfasst.

Beide Bilder wurden von FLUX generiert


Nach dem Gesamterlebnis ist Shichao der Meinung, dass das wahre FLUX-Niveau immer noch gut ist.Ganz zu schweigen von der perfekten Übereinstimmung, aber nicht viel schlimmer.

Schließlich wurde es vom ursprünglichen Team von Stable Diffusion entwickelt und steht fast auf derselben Stufe wie Midjourney.

Darüber hinaus gab das neue Unternehmen Black Forest mit dem Start von FLUX Anfang des Monats auch offiziell den Finanzierungsfortschritt bekannt, der nun abgeschlossen ist.31 Millionen DollarFinanzierung.

Noch wichtiger ist, dass, obwohl alle im Schwarzwald Stabilitäts-KI verlassen haben, sie immer noch deren traditionelle Tugend von Open Source erben. Sowohl das mittlere als auch das kleine FLUX sind Open Source.

Dies ist noch nicht vorbei. Die Einführung der Bild-KI scheint nur ein Teil ihrer Aufholbemühungen zu sein. Auf der offiziellen Website erläuterten sie auch ihre nächsten Schritte.SOTA in Video-KI


Dennoch ist die Kommerzialisierung von Bild-KI ein Thema, das geradezu diskutiert wird.

Stability AI, der frühere Eigentümer von Black Forest, befand sich aufgrund von Kommerzialisierungsproblemen in einer schwierigen Lage. Was es selbst betrifft, ist es jetzt Open Source und verfügt über ein kostenpflichtiges Modell, das im Grunde das gleiche ist wie die vorherige Stability AI.

Wir können nur abwarten, ob es in Zukunft noch weitere Kommerzialisierungsschritte geben wird. Schließlich ist es gerade erst herausgekommen.

Folgen Sie nicht dem alten Weg der Stabilitäts-KI und beginnen Sie noch einmal von vorne. . .

Schreiben Sie einen Artikel:Eichhörnchen

bearbeiten:Jiangjiang

Kunstredakteur:Xuanxuan

Bilder, Quellen

FLUX, Reisemitte