Au-delà de l’étrange vallée ! Cinq millions d'internautes à travers le monde ont été trompés, et aucun des orateurs populaires de TEDx n'était de vraies personnes ?

2024-08-10

Nouveau rapport de sagesse

Editeur : Énée si endormi

[Introduction à la nouvelle sagesse]Récemment, ces intervenants TED sont devenus viraux sur Internet. Cependant, ne sont-ils pas de vraies personnes ? ! Après que la réponse ait été révélée, cinq millions d’internautes ont été tout simplement choqués. Combien de bugs pouvez-vous trouver dans ces 5 images ?

Récemment, ces « enceintes TED » sont devenues très populaires sur Internet et peuvent être qualifiées de virales.

Regardez de plus près. Pouvez-vous trouver des problèmes ?

La réponse est révélée : aucune de ces cinq personnes n’est une vraie personne !

Le gars qui cherche quelqu'un en ligne va pleurer

Si réaliste et presque impeccable, ce niveau d’IA génératrice de photos a directement choqué les internautes.

Même le logiciel de reconnaissance de l'IA ne peut pas reconnaître qu'il s'agit d'une image générée par l'IA.

"Ça a l'air réel, n'est-ce pas parce que c'est une vraie photo ?"

"Aucun d'entre eux n'est de vraies personnes ? C'est tellement effrayant !"

Les internautes ont commenté : Cela a dépassé la vallée étrange et atteint la « vallée hyperréaliste ».

En quelques heures seulement, la publication partageant cette photo a été vue plus de 5 millions de fois sur Twitter.

Plus tard, l'auteur a également été révélé : il s'agissait de Léo Kadieff, un ancien membre de l'équipe de Stable Diffusion.

Il a révélé : Ces enceintes TEDx ont toutes été produites à l'aide de la dernière version réelle Flux de LoRA.

Dans le passé, les images générées par l'IA étaient quelque peu incompatibles avec l'œil humain, mais cette fois, les images sont si réalistes. C'est précisément grâce au modèle amélioré utilisant la technologie LoRA que le réalisme est considérablement augmenté.

De plus, l’auteur a déclaré que ce flux de travail présente également l’avantage de simplifier considérablement les mots d’invite complexes.

Cette nouvelle rend simplement les maîtres du mot prompt extatiques.

Ce petit fichier de 22 Mo nous évite d'avoir à écrire un tas de jetons liés à l'authenticité dans chaque mot d'invite.

Une phrase, « Une photo RAW surréaliste, UHD, 8k » suffit. Amateurs de réalisme, j’adore cet outil.

L’auteur le dit sans ambages : devons-nous encore peaufiner nos modèles réalistes ?

- Ces images sont des sorties brutes de Flux+LoRA sans aucune mise à l'échelle ni post-traitement

Lora : https://huggingface.co/XLabs-AI/flux-RealismLora/tree/main

ComfuUI : https://we.tl/t-zrC5tPFG17

Version réelle de LoRA, effet exceptionnel

Il n'est pas difficile de voir sur les deux images ci-dessous que la comparaison des effets de l'utilisation de LoRA et de la non-utilisation de LoRA est en effet très évidente.

Les internautes s'amusent

Au même moment, Kyranio, le partageur de « TED Speaker », a également tenté de le reproduire avec Midjourney.

Les mots d’invite initiaux sont les suivants :

Une femme s'exprimant sur scène, de Google, fond blanc, logo d'entreprise flou, conférence technique --style brut --v 6.1

On voit que l'effet de génération n'est pas mauvais, mais il y a encore un grand écart avec les images générées par Léo Kadieff.

Ensuite, le blogueur a apporté quelques améliorations :

Une jeune femme souriante et parlant sur scène, de Google, fond blanc, logo d'entreprise flou, conférence technique --style brut --v 6.1

Et après plusieurs générations, j'ai essayé le résultat le plus proche :

Dans le même temps, alors que Google Imagen 3 devenait accessible au public, les internautes ont également essayé cet ensemble d'invites pour la première fois.

Pendant un certain temps, l’engouement pour la génération de photos par l’IA a commencé partout sur Internet.

Imagen 3 est accessible à tous

C'est vrai, comme je viens de le mentionner, le modèle de graphique vincentien le plus puissant de Google, Imagen 3, est officiellement disponible.

invite : Photo d'un homme tenant une pancarte sur laquelle est écrit : « Imagen est désormais presque aussi bon que Midjourney » à New York.

Source : Risphère

L'internaute chrypnotoad a déclaré qu'il n'avait jamais vu d'IA capable de faire aussi bien le Bouclier d'Achille !

Étant capable de gérer facilement des invites aussi complexes, Imagen 3 ne peut pas être sous-estimé.

Le célèbre blogueur « Guizang » a déclaré après l'expérience :

Le contenu généré est précis mais l'esthétique de l'image est médiocre. Tant que des personnages sont impliqués, vous devez soigneusement réfléchir à la façon d'écrire les invites, sinon il y a une forte probabilité que l'image ne soit pas produite.

Heureusement, ils ont fait du bon travail en interagissant avec des mots rapides :

LLM analysera le type de mot d'invite et vous donnera des mots associés que vous pourrez changer directement.

Source : Guizang

nouvelles