Nachricht

Magisch modifizierter „Black Myth: Wukong“, um Midjourney zu besiegen. Dieses KI-Zeichenartefakt macht Menschen süchtig.

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Wenn KI-Ideogramme um Realismus und Kunstfertigkeit konkurrieren, hat Ideogram einen kniffligen Weg eingeschlagen: Es kann Text auf Bildern präzise generieren und die Schriftarten und Layouts sind wunderschön.

Diese Nachfrage ist keine Nische;Erstellen Sie Poster und Illustrationen mit einem Klick, ohne P-Bilder zu verwenden. Dies kann viel Ärger ersparen und ist sehr gut für normale Leute geeignet, die keine Ahnung von Design haben.

Wir haben bereits über Version 1.0 von Ideogram geschrieben. Am 21. August kam Version 2.0. Der Realismus ist besser, die Poster sind besser gestaltet und auch die besondere Textkompetenz ist stärker.

Sie haben vielleicht noch nie davon gehört. Dies ist ein KI-Produkt, das von ehemaligen Google-Mitarbeitern entwickelt wurde. Es weist viele Mängel auf, aber das Longboard kann Midjourney in Kurven „überholen“.

AI möchte wissen, von welchem ​​Wukong du sprichst?

Ideogram verfügt über eine besonders einsteigerfreundliche Funktion: „Magic Tips“.

Sie geben das chinesische Eingabeaufforderungswort direkt ein und es hilft Ihnen, es ins Englische zu übersetzen und gleichzeitig zu optimieren. Als Überseeprodukt kann diese Art von Operation die Herzen der Menschen erobern.

Gleichzeitig konzentriert sich Ideogram auf fünf Stile:Gewöhnlich, realistisch, Design, 3D, Animation, sind alle leicht zu verstehen, sodass die Auswahl nicht verwirrend ist.

Lassen Sie mich mit einem einfachen chinesischen Aufforderungswort beginnen: „Sun Wukong hält einen goldenen Knüppel“ im Anime-Stil. Lassen Sie mich von der KI bei der Übersetzung und Optimierung helfen und sehen Sie, wie es frei verwendet werden kann.

Als Shui Linglings „Dragon Ball“-Version von Wukong herauskam, war ich schockiert, als ich die Aufforderungen sah.KI übersetzte Sun Wukong in „Son Goku“, dann ist es nicht verwunderlich.

Darüber hinaus möchte ich Ideogram auch fragen, ob es zu offensichtlich ist, Lizenzgebühren zu zahlen.

Um weitere Missverständnisse durch die KI zu vermeiden, habe ich bei der Eingabe des Aufforderungsworts aufgehört, faul zu sein, und betont, dass „Sun Wukong“ „Sun Wukong“ und nicht „Son Goku“ ist.

Diesmal haben wir einen realistischen Stil gewählt und eine detailliertere Szene geschaffen. Der große Weise trägt eine Rüstung und hält einen goldenen Reifen in der Hand. Er steht in warmem Orange vor der buddhistischen Höhle Ton, am unteren Rand des Bildes steht „Black Myth: Wukong“ (Schwarzer Mythos: Wukong).

Es gibt keine Fehler im Text, die Großbuchstaben haben eine starke Wirkung und es entsteht auch die Atmosphäre der buddhistischen Höhle. Allerdings ist das Temperament des „Großen Weisen“ etwas abweichend, das Bild ist etwas atavistisch und In seinen Augen ist kein Licht.

Verwenden Sie dasselbe Aufforderungswort, um zu lassen Mitten auf der ReiseEinmal generiert, weist der Text Fehler und keinen Sinn für Design auf, aber das etwas hübschere „Monkey King“ und der Stil des Webspiels machen das wieder wett.

Midjourneygeneriert

Da ich mich nicht damit abfinden wollte, probierte ich es noch einmal mit dem 3D-Stil. Das Eingabeaufforderungswort blieb im Wesentlichen dasselbe, aber der Text unten wurde in „Spielstart am 20. August“ geändert.

Daher ähnelt das von Ideogram generierte Ergebnis sehr dem Werbebild einer bestimmten Q-Version der Blind-Box-Serie im chinesischen Stil. Das Bild ist sehr sauber, entspricht aber meiner Meinung nach überhaupt nicht dem 3D-Spielstil. Der Affenkönig soll auch wie Erlang Shen aussehen.

Und Auch wenn die KI sehr gut darin war, chinesischen Text wiederzugeben, blieb dieser Fehler von 1.0 bis 2.0 bestehen.

Es scheint, dass ausländische Produkte die inländische traditionelle Kultur nicht ausreichend verstehen. Die Leistung von Ideogram in der ersten Runde war etwas enttäuschend, aber auch interessant.

Das Ideogram-Team hat gesagt, dass Version 2.0 genauso gut ist wie Flux und DallE. Kürzlich haben die von Flux‘ echter Version von LoRA generierten TED-Sprachfotos viele Internetnutzer getäuscht, weil es schwer zu sagen ist, ob sie echt oder gefälscht sind. Dann lass es uns testen,Ideogram generiert Ergebnisse, die eher wie Fotos sind.

Flusserzeugung

Nachdem ich den realistischen Stil ausgewählt hatte, gab ich die chinesischen Eingabeaufforderungswörter und TED-Talk-Fotos ein und der Folientitel lautete „Ideogram 2.0 Release“. Es gab drei Schlüsselpunkte: „genauer Text“, „gut im Design“ und „realer“. ". Die Sprecherin stand vor dem Whiteboard, im Hintergrund sind ein paar Leute.

Es ist ersichtlich, dass das semantische Verständnis von Ideogram gut ist und alle notwendigen Elemente vorhanden sind. Das TED-Logo ist fast eine Fälschung, die Ausdrücke des Sprechers und des Publikums sind sehr lebendig und die Haare und die Haut sind relativ natürlich.

Aber,Die Details werden nicht gut genug behandelt, obwohl es kein Problem mit dem zu generierenden Text gibt, einige kleine Zeichen, die zufällig auftauchen, und die Finger und Körper der Zeichen sind nicht ganz in Ordnung, aber es ist schon viel besser als die vorherige Version 1.0.

Was das Plakatdesign betrifft, kann man sagen, dass Ideogram die „Komfortzone“ anderer vinzentinischer KI übertrifft.

Wenn der Kassenschlager „Alien“ als Testfrage herangezogen wird: Kann KI dieses unbeschreibliche Gefühl des Schreckens erzeugen?

Ich wählte einen Designstil, beschrieb die Elemente des Bildes mit prägnanten Worten und erwähnte ausdrücklich, dass ich am Ende des Posters einen Satz geschrieben hatte: „Minderjährige Zuschauer schauen mit Vorsicht zu.“

Der Gesamteffekt ist auffällig und es wurde erfolgreich eine lange Textfolge generiert. Es gibt nur einen kleinen Fehler, der jedoch nicht realistisch ist und eher wie ein Comic-Stil aussieht, der nicht zum Realfilm passt.

Ich habe mich dann von dem schlechten Sommerfilm „A Dream of Red Mansions“ inspirieren lassen und Ideogram gebeten, ein Poster zu erstellen. Der Hintergrund, die Dekorationen und sogar die Charaktere, die in den Aufforderungswörtern erwähnt wurden, waren alle darin enthalten Die prompten Worte sind wirklich gut.

Natürlich ist der Titel des Films korrekt geschrieben, aber die Schriftart sieht aus, als wäre sie dem Herrn der Ringe entlehnt, sie ist etwas dramatisch und der Gesamtstil erinnert eher an den Mulan-Animationsfilm.

Der „Designstil“ von Ideogram ist eher zweidimensional und einzigartig, was aber umgekehrt auch die Einsatzmöglichkeiten von Postern einschränkt.

Zusammenfassend:Ideogram ist ein KI-Grafikprodukt mit eigenen Eigenschaften. Der Grad des Realismus ähnelt Flux und der künstlerische Sinn unterscheidet sich von Midjourney.

Muster „regnerischer Sommer“.

AberEs verfügt über eine einzigartige Textgenerierungsebene und eignet sich besser zum Generieren von Postern, Illustrationen, Anzeigen, Emoticons, T-Shirt-Druck usw.

Die Ergebnisse der menschlichen Bewertung zeigen, dass Ideogram 2.0 hinsichtlich der schnellen Wortausrichtung, der Gesamtleistung und der Qualität der Textwiedergabe besser ist als Flux Pro und DALL·E 3.

Aber das ist die eigene Aussage von Ideogram

Sehr gut spielbar und bodenständig, Sie könnten genauso gut mehr KI-„Desserts“ wie dieses haben

Ideogram wurde am 22. August letzten Jahres angekündigt, genau ein Jahr nach der Veröffentlichung von 2.0.

Das Gründungsteam besteht aus insgesamt 7 Personen von Google Brain, der University of California, Berkeley, der Carnegie Mellon University und der University of Toronto, von denen 4 die Autoren des Google Vincent Graph Diffusion Model Imagen-Forschungspapiers sind.

Zusätzlich zur Veröffentlichung von 2.0 hat Ideogram dieses Mal auch eine iOS-App herausgebracht, die direkt in China heruntergeladen werden kann. Die Veröffentlichung der Android-Version ist für einen späteren Zeitpunkt geplant. Von Webseiten bis hin zu mobilen Endgeräten können wir jederzeit und überall Bilder generieren.

Mobile Schnittstelle

Ideogram steht derzeit allen Benutzern kostenlos zur Verfügung, aber das Kontingent ist sehr begrenzt. Nachdem ich insgesamt 20 Fotos 5 Mal erstellt habe, erinnerte mich Ideogram daran, dass 10 Punkte aufgebraucht waren. Bitte kommen Sie morgen wieder.(Natürlich generiert das Midjourney nebenan 25 Fotos kostenlos, was nicht sehr beeindruckend erscheint.)

Wenn Sie selten mit vinzentinischen Bildern in Berührung kommen, möchten Sie einesVincentianisches Diagramm AI Für den Einstieg ist Ideogram eine gute Wahl.

Das Eingeben chinesischer Eingabeaufforderungen und die Verwendung von „magischen Eingabeaufforderungen“ zum Übersetzen und Optimieren ist eine Sache. Darüber hinaus bietet Ideogram auch viele Optionen, mit denen Sie Bilder erstellen können, die Ihren Vorstellungen näher kommen.

Bieten Sie den Benutzern eine begrenzte Auswahl an Optionen zum „Klicken“.Im Vergleich zur „Eingabe“ in ein leeres Eingabefeld ist die Interaktion einfacher.Welche Bildproportionen, welchen Stil und welchen Farbton Sie auch immer wünschen, mit Ideogram haben Sie die Wahl.

Verschiedene Schattierungen von „Mädchen mit Perlenohrring isst McDonald's“

Wenn Sie nicht wissen, wie man Aufforderungswörter schreibt, können Sie sie auch zeichnen und Ideogram uns dabei helfen lassen, das Alltägliche in Magie zu verwandeln.

Es tut mir leid für meine schlechten Zeichenfähigkeiten, aber KI kann die Bedeutung verstehen, die Linien und Farben optimieren und einen Hintergrund hinzufügen, und der Stil verbessert sich plötzlich. Wer ist mit KI nicht der Zauberstift Ma Liang?

Darüber hinaus befinden sich unter dem Eingabefeld der Webversion Werke, die von anderen erstellt wurden. Wenn wir diejenigen treffen, die uns gefallen, können wir die Eingabeaufforderungswörter anzeigen und darauf verweisen. Laut Ideogram haben seine Nutzer im vergangenen Jahr mehr als eine Milliarde öffentlich sichtbare Bilder generiert.

Wenn Sie ein bestimmtes Objekt generieren möchten, aber nicht wissen, wie man das Eingabeaufforderungswort schreibt, wird dieses Mal auch Ideogram gestartetDie Möglichkeit, die öffentliche Autorenbibliothek mit Text zu durchsuchen, diese Funktion erfordert derzeit jedoch eine Mitgliedschaft.

Suchergebnisse für „Katze“

Alles in allem ist Ideogram ein spielbares Vincent-Produkt.

Es kann den vom Benutzer benötigten Textinhalt genauer generieren und sich an verschiedene Bildstile anpassen. Es verfügt über ein breites Einsatzspektrum.

Bildquelle: Ideogram Blog

Gelegentlich kann es durch Bilder einen emotionalen Wert vermitteln und Ehrgeiz zum Ausdruck bringen, obwohl die erzeugten Emoticons zu stark auf die Ästhetik des europäischen und amerikanischen Internets ausgerichtet sind.

„Ich möchte „Black Myth: Wukong“ spielen“-Emoticon-Paket

Die Gesamtqualität von Ideogram ist nicht schlecht, die Textfunktion ist leistungsstark, für Anfänger geeignet, einfach zu bedienen und die Interaktion ist angenehm. Wenn KI-Tools Kreativität, Komfort und Mehrwert vereinen, ist es für Menschen leicht, süchtig zu werden.

Eine aus Formen geformte Welt ist zu langweilig. Es ist auch sehr interessant, einen kleinen Bedarf zu erkennen und dann die Lösung zur ersten in der Branche zu machen.

Es gibt viele Produkte auf der Welt, und mit mehr Zielgruppen können wir mehr solcher KI-„Desserts“ erwarten.