Nachricht

Jenseits des unheimlichen Tals! Fünf Millionen Internetnutzer auf der ganzen Welt wurden getäuscht, und keiner der beliebten TEDx-Sprecher war ein echter Mensch?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



  Neuer Weisheitsbericht

Herausgeber: Aeneas so schläfrig
[Einführung in die neue Weisheit]In letzter Zeit sind diese TED-Sprecher im Internet viral geworden. Aber es sind keine echten Menschen? ! Nachdem die Antwort bekannt wurde, waren fünf Millionen Internetnutzer einfach schockiert. Wie viele Fehler können Sie in diesen 5 Bildern finden?

In letzter Zeit erfreuen sich diese „TED-Sprecher“ im Internet großer Beliebtheit und können als viral bezeichnet werden.

Schauen Sie genauer hin. Können Sie Probleme feststellen?

Die Antwort liegt auf der Hand: Keine dieser fünf Personen ist eine echte Person!

Der Typ, der online nach jemandem sucht, wird weinen

So lebensecht und nahezu makellos, dass diese Art der fotogenerierenden KI die Internetnutzer direkt schockierte.
Selbst die KI-Erkennungssoftware kann nicht erkennen, dass es sich um ein KI-generiertes Bild handelt.

„Es sieht echt aus, liegt es nicht daran, dass es ein echtes Foto ist?“

„Keiner von ihnen ist ein echter Mensch? Es ist so gruselig!“

Netizens kommentierten: Dies hat das unheimliche Tal überschritten und das „hyperreale Tal“ erreicht.

In nur wenigen Stunden hatte der Beitrag, in dem dieses Bild geteilt wurde, mehr als 5 Millionen Aufrufe auf Twitter.

Später wurde auch der Autor enthüllt – es handelte sich um Leo Kadieff, ein ehemaliges Mitglied des Stable Diffusion-Teams.

Er enthüllte: Diese TEDx-Lautsprecher wurden alle mit der neuesten Flux-Real-Version von LoRA hergestellt.

Früher entsprachen KI-generierte Bilder dem menschlichen Auge etwas, aber dieses Mal sind die Bilder so lebensecht. Es ist das verbesserte Modell mithilfe der LoRA-Technologie, das den Realitätssinn erheblich steigert.

Darüber hinaus sagte der Autor, dass dieser Workflow auch den Vorteil habe, komplexe Aufforderungswörter erheblich zu vereinfachen.

Diese Nachricht versetzt die prompten Wortmeister einfach in Ekstase.

Diese kleine 22-MB-Datei erspart uns die Mühe, in jedes Eingabeaufforderungswort eine Reihe von authentischitätsbezogenen Token zu schreiben.

Ein Satz „Ein surreales RAW-Foto, UHD, 8k“ reicht aus. Liebhaber des Realismus lieben dieses Tool absolut.

Der Autor bringt es auf den Punkt: Müssen wir unsere realistischen Modelle noch verfeinern?

- Bei diesen Bildern handelt es sich um Rohausgaben von Flux+LoRA ohne jegliche Hochskalierung oder Nachbearbeitung

Lora: https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI: https://we.tl/t-zrC5tPFG17

Echte Version von LoRA, hervorragende Wirkung

Anhand der beiden Bilder unten ist nicht schwer zu erkennen, dass der Vergleich der Auswirkungen der Verwendung von LoRA und der Nichtverwendung von LoRA tatsächlich sehr offensichtlich ist.

Netizens haben Spaß

Gleichzeitig versuchte auch Kyranio, der Sharer von „TED Speaker“, es mit Midjourney zu reproduzieren.

Die ersten Aufforderungswörter lauten wie folgt:

Eine Frau spricht auf der Bühne, von Google, weißer Hintergrund, Firmenlogo verschwommen, Tech-Konferenz – Style Raw – Version 6.1

Es ist ersichtlich, dass der Generierungseffekt nicht schlecht ist, aber es gibt immer noch eine große Lücke zu den von Leo Kadieff generierten Bildern.

Dann nahm der Blogger einige Verbesserungen vor:

Eine junge Frau lächelt und spricht auf der Bühne, von Google, weißer Hintergrund, Firmenlogo verschwommen, Tech-Konferenz – Style Raw – Version 6.1

Und nach mehreren Generationen habe ich das nächstgelegene Ergebnis versucht:

Zur gleichen Zeit, als Google Imagen 3 öffentlich verfügbar wurde, probierten Internetnutzer diese Reihe von Eingabeaufforderungen zum ersten Mal aus.

Eine Zeit lang breitete sich der Hype um die KI-Fotogenerierung überall im Internet aus.

Bild 3 steht jedem zur Verfügung


Richtig, wie gerade erwähnt, ist Googles leistungsstärkstes vinzentinisches Diagrammmodell, Imagen 3, offiziell verfügbar.

Eingabeaufforderung: Foto eines Mannes in New York City, der ein Schild mit der Aufschrift „Imagen ist jetzt fast so gut wie Midjourney“ hält.

Quelle: Risphere

Netizen Chrypnotoad sagte, dass er noch nie eine KI gesehen habe, die den Schild des Achilles so gut beherrscht!

Imagen 3 ist nicht zu unterschätzen, da es derart komplexe Eingabeaufforderungen problemlos verarbeiten kann.

Der bekannte Blogger „Guizang“ sagte nach der Erfahrung:

Der generierte Inhalt ist korrekt, aber die Bildästhetik ist schlecht. Solange es sich um Charaktere handelt, muss man sich gut überlegen, wie man die Aufforderungen schreibt, sonst ist die Wahrscheinlichkeit groß, dass das Bild nicht zustande kommt.

Glücklicherweise gelang ihnen die Interaktion mit prompten Worten gut:

LLM analysiert den Worttyp der Eingabeaufforderung und gibt Ihnen verwandte Wörter, die Sie direkt wechseln können.

Quelle: Guizang