nouvelles

Toutes les beautés de l’IA ont été anéanties ! Transformé collectivement en « fantômes » sous le miroir cyber-magique, le code de l'IA a perturbé la production d'images de l'IA.

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

  • Mingmin Kresi du temple Aofei
    Qubits | Compte public QbitAI

Sous le miroir cyber-magique, toutes les beautés de l’IA se sont transformées en fantômes.

Venez voir ses dents



Lorsque la saturation de l'image est complètement augmentée, les dents du portrait AI deviendront très étranges et les limites seront floues.

La couleur de l'image globale est normale, mais la partie microphone est encore plus étrange.

contrastePhotos de vraies personnes, ça devrait être comme ça.

Les dents sont claires et les taches de couleur sur la photo sont uniformes.



Cet outil est ouvert et tout le monde peut l'essayer avec des photos.

Une certaine image de la vidéo générée par l'IA ne peut pas échapper à cette méthode.



Les photos de dents manquantes peuvent également révéler des problèmes.



Mais BTW, cet outilpar Claude. Utilisez l'IA pour déchiffrer l'IA, une merveilleuse boucle fermée.



En fait, les portraits d'IA sont récemment devenus trop réalistes et ont suscité de nombreuses discussions. Par exemple, dans une série de « vidéos de conférenciers TED » populaires, aucun d'entre eux ne représente réellement de vraies personnes.



Non seulement il est difficile de distinguer les visages, mais même l’écriture, autrefois défaut de l’IA, peut désormais être complètement fausse.



Plus important encore, le coût de génération de tels portraits IA n’est pas élevé. Cela peut être fait en seulement 5 minutes et pour 1,5 dollar américain (environ 10 yuans) toutes les 20 secondes.



Désormais, les internautes ne pouvaient plus rester assis et ont lancé les uns après les autres des concours anti-contrefaçon d’IA.

Près de 5 000 personnes sont venues discuter pour savoir laquelle de ces deux photos représente la vraie personne.



Les raisons invoquées variaient. Certains trouvent le texte et les détails des motifs très abstraits, tandis que d'autres trouvent les yeux des personnages vides...

Les règles selon lesquelles l'IA la plus avancée génère des portraits sont progressivement découvertes.

C'est difficile à dire sans regarder les détails

En résumé, l’ajustement de la saturation peut être le moyen le plus rapide de l’identifier.

Les portraits de groupe d’IA sont ainsi exposés de manière plus approfondie.



Il y a cependant un problème avec ça. Cette méthode peut ne pas fonctionner si l'image est compressée à l'aide de l'algorithme JPEG.

Par exemple, assurez-vous que la photo est une vraie photo.



Cependant, en raison de problèmes de compression d'image et d'éclairage, les dents du personnage sont également un peu floues.



Par conséquent, les internautes ont également répertorié d’autres moyens de savoir si un portrait est synthétisé par l’IA.

En termes simples, la première méthode consiste à s’appuyer sur la connaissance et le jugement humains.

Étant donné que la façon dont l’IA apprend les images n’est pas cohérente avec celle des humains, il est inévitable qu’elle ne puisse pas saisir 100 % des informations visuelles du point de vue humain.

Le résultat est que les images générées par l’IA contiennent souventNe correspond pas au monde réelCela fournit un point de départ pour l’identification des images.

Utilisez l’image du début comme exemple.

Dans l'ensemble, la peau du personnage est trop lisse et aucun pores n'est visible. Cette caractéristique trop parfaite ajoute en fait au sentiment d'irréalité.

Bien entendu, cette « sensation irréaliste » n’est pas tout à fait équivalente à « faux ». Après tout, les pores ne sont pas visibles sur les images traitées par microdermabrasion.

Mais ce n’est pas le seul facteur de jugement. Il se peut que l’IA ne laisse pas qu’un seul écart par rapport au bon sens.



En fait, si vous regardez les détails suivants de cette image, vous pouvez voir une caractéristique relativement évidente——La méthode de connexion particulière du crochet au-dessus de la plaque signalétique



Il existe également des microphones qui présentent des défauts en mode saturation élevée, et les indices sont visibles directement à l'œil nu après amplification.



Ce qui est encore plus subtil, c'est qu'il y a plusieurs poils au bout des cheveux qui sont dans des positions très déraisonnables, mais une telle caractéristique nécessiterait probablement une vision au niveau de Leeuwenhoek pour être vue.

Cependant, avec l'avancement de la technologie de génération, les fonctionnalités que l'on peut trouver deviennent de plus en plus cachées, ce qui est une tendance inévitable.



Une autre façon consiste à regarder le texte. Même si l'IA surmonte progressivement le problème des « caractères fantômes » dans la représentation des polices, il existe encore certaines difficultés pour restituer correctement le texte avec la signification réelle correcte.

Par exemple, certains internautes ont découvert que sur le badge porté par la personne sur la photo, les deux lettres de la dernière ligne sous le logo Google sont « CA », ce qui signifie Californie, et la longue chaîne devant devrait être le nom de la ville.

Mais en fait, aucune ville de Californie ne porte un nom aussi long.



En plus des détails des objets eux-mêmes, des informations telles que la lumière et l’ombre peuvent également être utilisées pour déterminer l’authenticité.

Cette image est extraite d'une vidéo, et il y a une telle image dans la vidéo où elle se trouve.

Sur le côté droit du microphone, il y a une ombre très étrange. Cette ombre correspond à l'une des mains du personnage. Visiblement, le traitement de l'IA fait ici défaut.



Lorsqu’il s’agit de vidéos, en raison de la cohérence du contenu avant et après, l’IA est plus susceptible de révéler des défauts que dans les images statiques.



Certaines fonctionnalités ne sont pas non plus des « erreurs de bon sens », mais reflètent également certaines préférences de l'IA lors de la génération d'images.

Par exemple, ces quatre images sont toutes des « personnes moyennes » synthétisées par l'IA. Avez-vous trouvé quelque chose en commun ?



Certains internautes ont déclaré qu'aucune des personnes sur ces quatre images n'avait un visage souriant, ce qui semble refléter certaines caractéristiques des images générées par l'IA.



C'est effectivement vrai pour ces images, mais il est difficile de former un système pour ce type de jugement. Après tout, différents outils de dessin d'IA ont des caractéristiques différentes.

Bref, pour faire face aux progrès progressifs de l'IA, d'une part, on peut augmenter l'intensité de « Leewenhoek », et d'autre part, on peut également introduire des techniques de traitement d'image comme l'augmentation de la saturation.

Mais si de tels « changements quantitatifs » s’accumulent de plus en plus, il deviendra de plus en plus difficile de juger à l’œil nu, et la saturation de l’image pourrait un jour être brisée par l’IA.

Par conséquent, les gens changent également leur façon de penser et leur réflexion sur la méthode « modèle par modèle », en utilisant des images générées par l'IA pour former des modèles de détection et analyser davantage de caractéristiques à partir des images.

Par exemple, les images générées par l’IA présentent de nombreuses caractéristiques en termes de spectre, de répartition du bruit, etc. Ces caractéristiques ne peuvent pas être capturées à l’œil nu, mais l’IA peut les voir clairement.

Bien entendu, cela n’exclut pas la possibilité que la méthode de détection soit à la traîne et ne puisse pas suivre les modifications du modèle, ni que les développeurs de modèles se spécialisent même dans le développement contradictoire.

Par exemple, dans l’image présentée ci-dessus, un outil de détection d’IA n’a qu’une probabilité de 2 % qu’il soit synthétisé par l’IA.



Cependant, le processus de jeu entre la fraude par l'IA et la détection de l'IA est en soi un « jeu du chat et de la souris ».

Par conséquent, en plus de la détection, les développeurs de modèles devront peut-être également assumer certaines responsabilités, comme l’ajout de filigranes invisibles aux images générées par l’IA afin que la fraude par l’IA n’ait nulle part où se cacher.

L'IA mesure un pied de plus

Il convient de mentionner que bon nombre des portraits d'IA qui ont semé la panique, comme mentionné ci-dessus, proviennent du film récemment populaire.FluxGénérer/participer à la production.

Tout le monde a même commencé à supposer que les effets trop beaux pour être distingués sont produits par Flux.



Il a été créé par l’équipe originale de Stable Diffusion et a provoqué un tollé sur Internet seulement 10 jours après sa sortie.

Ces belles photos de fausses conférences TED sont toutes réalisées par lui.



D'autres ont utilisé Flux et Gen-3 ensemble pour créer de belles publicités pour des produits de soins de la peau.



Et divers effets de synthèse sous plusieurs angles.



Il résout très bien des problèmes tels que les peintres IA et le texte généré par l'IA dans les images.



Cela conduit directement au fait que les humains ne peuvent plus regarder directement les mains et les mots pour distinguer les dessins de l'IA, mais ne peuvent que deviner sur la base d'indices.



Flux aurait dû renforcer la formation disponible, le texte et d'autres indicateurs.

Cela signifie également que si l'IA actuelle continue de travailler dur sur l'entraînement aux détails de texture, aux couleurs, etc., au moment où le modèle de dessin d'IA de nouvelle génération sortira, les méthodes de reconnaissance humaine pourraient redevenir inefficaces...

De plus, Flux est open source et peut être exécuté sur des ordinateurs portables. De nombreuses personnes sont désormais présentes à Forget Midjourney.

Il a fallu 2 ans pour passer de Stable Diffusion à Flux.

Il a fallu 1 an pour passer de « Will Smith mangeant des nouilles » à « Tedx Speaker ».

Je ne sais vraiment pas quelles astuces les humains devront trouver à l'avenir pour distinguer la génération d'IA...

Liens de référence :
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/these_are_all_ai/
[4]https://x.com/levelsio/status/1822751995012268062