Além do vale misterioso! Cinco milhões de internautas em todo o mundo foram enganados e nenhum dos palestrantes populares do TEDx era pessoa real?

2024-08-10

Novo Relatório de Sabedoria

Editor: Enéias com tanto sono

[Introdução à Nova Sabedoria]Recentemente, esses palestrantes do TED se tornaram virais na Internet. Porém, não são pessoas reais? ! Depois que a resposta foi revelada, cinco milhões de internautas ficaram simplesmente chocados. Quantos bugs você consegue encontrar nessas 5 fotos?

Recentemente, esses “alto-falantes TED” se tornaram muito populares na Internet e podem ser chamados de virais.

Dê uma olhada mais de perto. Você consegue encontrar algum problema?

A resposta é revelada: nenhuma dessas cinco pessoas é uma pessoa real!

O cara que procura alguém online vai chorar

Tão realista e quase perfeito, esse nível de IA geradora de fotos chocou diretamente os internautas.

Mesmo o software de reconhecimento de IA não consegue reconhecer que esta é uma imagem gerada por IA.

“Parece real, não é porque é uma foto real?”

“Nenhum deles é pessoa real? É tão assustador!”

Internautas comentaram: Isso ultrapassou o vale misterioso e alcançou o “vale hiperreal”.

Em apenas algumas horas, a postagem com essa foto teve mais de 5 milhões de visualizações no Twitter.

Mais tarde, o autor também foi revelado - era Leo Kadieff, ex-membro da equipe Stable Diffusion.

Ele revelou: Esses alto-falantes TEDx foram todos produzidos usando a versão real mais recente do Flux do LoRA.

No passado, as imagens geradas por IA seriam um tanto inconsistentes com o olho humano, mas desta vez as imagens são tão realistas. É precisamente por causa do modelo aprimorado usando a tecnologia LoRA que o realismo aumentou bastante.

Além disso, o autor disse que esse fluxo de trabalho também tem a vantagem de simplificar bastante palavras de prompt complexas.

Esta notícia simplesmente deixa os mestres da palavra em êxtase.

Este pequeno arquivo de 22 MB nos poupa do trabalho de escrever vários tokens relacionados à autenticidade em cada palavra do prompt.

Uma frase, “Uma foto surreal RAW, UHD, 8k” é suficiente. Amantes do realismo, adoram esta ferramenta.

O autor diz sem rodeios: Ainda precisamos de afinar os nossos modelos realistas?

- Essas imagens são saídas brutas do Flux+LoRA sem qualquer upscaling ou pós-processamento

Lora：https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI：https://we.tl/t-zrC5tPFG17

Versão real do LoRA, efeito excelente

Não é difícil ver pelas duas imagens abaixo que a comparação dos efeitos do uso do LoRA e do não uso do LoRA é realmente muito óbvia.

Os internautas estão se divertindo

Ao mesmo tempo, Kyranio, compartilhador do "TED Speaker", também tentou reproduzi-lo com Midjourney.

As palavras iniciais do prompt são as seguintes:

Uma mulher falando no palco, do Google, fundo branco, logotipo corporativo desfocado, conferência de tecnologia --style raw --v 6.1

Percebe-se que o efeito de geração não é ruim, mas ainda há uma grande lacuna com as imagens geradas por Leo Kadieff.

Então, o blogueiro fez algumas melhorias:

Uma jovem sorrindo e falando no palco, do Google, fundo branco, logotipo corporativo desfocado, conferência de tecnologia --style raw --v 6.1

E depois de várias gerações, tentei o resultado mais próximo:

Ao mesmo tempo, quando o Google Imagen 3 se tornou disponível publicamente, os internautas também experimentaram esse conjunto de instruções pela primeira vez.

Por um tempo, a mania da geração de fotos por IA começou em toda a Internet.

A imagem 3 está disponível para todos

É isso mesmo, como acabamos de mencionar, o modelo gráfico vicentino mais poderoso do Google, Imagen 3, está oficialmente disponível.

prompt：Foto de um homem segurando uma placa que diz: "Imagen agora é quase tão bom quanto Midjourney" na cidade de Nova York.

Fonte: Risphere

O cripnotoad internauta disse que nunca viu nenhuma IA que pudesse fazer o Escudo de Aquiles tão bem!

Sendo capaz de reter facilmente esses prompts complexos, a Imagem 3 não pode ser subestimada.

O conhecido blogueiro "Guizang" disse após a experiência:

O conteúdo gerado é preciso, mas a estética da imagem é ruim. Contanto que haja personagens envolvidos, você deve considerar cuidadosamente como escrever as instruções, caso contrário, há uma grande probabilidade de que a imagem não seja produzida.

Felizmente, eles fizeram um bom trabalho ao interagir com palavras imediatas:

O LLM analisará o tipo de palavra do prompt e fornecerá palavras relacionadas que você pode alternar diretamente.

Fonte: Guizang

notícias