Oltre la valle misteriosa! Cinque milioni di netizen in tutto il mondo sono stati ingannati e nessuno dei famosi oratori di TEDx era una persona reale?

2024-08-10

Nuovo rapporto sulla saggezza

Redattore: Enea così assonnato

[Introduzione alla Nuova Saggezza]Recentemente, questi relatori TED sono diventati virali su Internet. Ma non sono persone reali? ! Dopo che la risposta è stata rivelata, cinque milioni di netizen sono rimasti semplicemente scioccati. Quanti insetti riesci a trovare in queste 5 immagini?

Recentemente, questi "oratori TED" sono diventati molto popolari su Internet e possono essere definiti virali.

Dai un'occhiata più da vicino. Riesci a trovare qualche problema?

La risposta è rivelata: nessuna di queste cinque persone è una persona reale!

Il ragazzo che cerca qualcuno online piangerà

Così realistico e quasi impeccabile, questo livello di intelligenza artificiale che genera foto ha scioccato direttamente gli utenti della rete.

Anche il software di riconoscimento AI non è in grado di riconoscere che si tratta di un'immagine generata dall'intelligenza artificiale.

"Sembra reale, non è forse perché è una foto vera?"

"Nessuno di loro è una persona reale? È così inquietante!"

I netizen hanno commentato: Questo ha superato la valle misteriosa e ha raggiunto la "valle iperreale".

In poche ore, il post che condivideva questa foto ha avuto più di 5 milioni di visualizzazioni su Twitter.

Successivamente è stato rivelato anche l'autore: era Leo Kadieff, un ex membro del team Stable Diffusion.

Ha rivelato: Questi altoparlanti TEDx sono stati tutti prodotti utilizzando l'ultima versione Flux Real di LoRA.

In passato, le immagini generate dall'intelligenza artificiale sarebbero in qualche modo incoerenti con l'occhio umano, ma questa volta le immagini sono così realistiche. È il modello migliorato che utilizza la tecnologia LoRA che aumenta notevolmente il senso della realtà.

Inoltre, l'autore ha affermato che questo flusso di lavoro ha anche il vantaggio di semplificare notevolmente le parole complesse.

Questa notizia non fa altro che estasiare i maestri della parola pronta.

Questo piccolo file da 22 MB ci risparmia la fatica di scrivere una serie di token relativi all'autenticità in ogni parola del prompt.

È sufficiente una frase: "Una foto surreale RAW, UHD, 8k". Gli amanti del realismo adorano assolutamente questo strumento.

L'autore lo dice senza mezzi termini: abbiamo ancora bisogno di mettere a punto i nostri modelli realistici?

- Queste immagini sono output grezzi di Flux+LoRA senza alcun upscaling o post-elaborazione

Lora: https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI: https://we.tl/t-zrC5tPFG17

Versione reale di LoRA, effetto eccezionale

Non è difficile vedere dalle due immagini sottostanti che il confronto tra gli effetti dell'utilizzo di LoRA e del non utilizzo di LoRA è davvero molto ovvio.

I netizen si divertono

Allo stesso tempo, anche Kyranio, il condivisore di "TED Speaker", ha provato a riprodurlo con Midjourney.

Le parole iniziali del prompt sono le seguenti:

Una donna che parla sul palco, da Google, sfondo bianco, logo aziendale sfocato, conferenza tecnologica --stile grezzo --v 6.1

Si può vedere che l'effetto di generazione non è male, ma c'è ancora un grande divario con le immagini generate da Leo Kadieff.

Quindi, il blogger ha apportato alcuni miglioramenti:

Una giovane donna che sorride e parla sul palco, da Google, sfondo bianco, logo aziendale sfocato, conferenza tecnologica --style raw --v 6.1

E dopo più generazioni, ho provato il risultato più vicino:

Allo stesso tempo, quando Google Imagen 3 è diventato pubblicamente disponibile, anche gli utenti della rete hanno provato per la prima volta questa serie di istruzioni.

Per un certo periodo, la mania della generazione di foto tramite intelligenza artificiale è iniziata su Internet.

L'immagine 3 è disponibile per tutti

Esatto, come appena accennato, il modello grafico vincenziano più potente di Google, Imagen 3, è ufficialmente disponibile.

prompt：Foto di un uomo che tiene in mano un cartello con la scritta: "Imagen è ora quasi valido quanto Midjourney" a New York City.

Fonte: Risfera

Il cripnotoad di Netizen ha detto di non aver mai visto nessuna IA in grado di eseguire lo Scudo di Achille così bene!

Essendo in grado di contenere facilmente istruzioni così complesse, Immagine 3 non può essere sottovalutata.

Il noto blogger "Guizang" ha detto dopo l'esperienza:

Il contenuto generato è accurato ma l'estetica dell'immagine è scarsa. Finché sono coinvolti i personaggi, devi considerare attentamente come scrivere le istruzioni, altrimenti c'è un'alta probabilità che l'immagine non venga prodotta.

Fortunatamente, hanno fatto un buon lavoro interagendo con parole immediate:

LLM analizzerà il tipo di parola richiesta e ti fornirà parole correlate che puoi cambiare direttamente.

Fonte: Guizang

notizia