révéler le secret de l'ia qui a falsifié l'enregistrement de xiao yang : aucun coût, seulement trois secondes

révéler le secret de l'ia qui a falsifié l'enregistrement de xiao yang : aucun coût et ne prend que trois secondes

2024-09-30

l'« enregistrement de lu wenqing » exposé lors de l'incident de xiao yang a d'abord provoqué un tollé général en raison de l'ampleur du contenu, puis il a été découvert que tout avait été falsifié par l'ia.

au fil du temps, la technologie de l’ia a de nouveau été poussée au premier plan.

photo/réponse officielle de yanyu technology

que la technologie soit bonne ou mauvaise, l'enregistrement synthétisé par l'ia peut être compris comme une sorte de deepfake, qui utilise des algorithmes d'apprentissage en profondeur pour simuler et forger l'audio et la vidéo, c'est-à-dire via le modèle d'apprentissage en profondeur de la technologie de l'intelligence artificielle. , les voix, les expressions faciales et les mouvements corporels des gens sont assemblés dans un faux contenu très réaliste.

d'un point de vue technique, elle est neutre. en plus de la simulation vocale, des méthodes similaires incluent également le changement de visage par l'ia, la synthèse de visage, la génération de vidéo, etc., collectivement appelées contrefaçon profonde.

cependant, une technologie neutre ne peut empêcher les utilisateurs de poursuivre de mauvaises intentions.

lan mediahui a consulté lin hongxiang, fondateur et pdg de fengping intelligence, l'une des principales sociétés nationales d'ia humaine numérique. concernant ce type d'incident, lin hongxiang a déclaré franchement que l'amélioration de l'efficacité de la production apportée par l'ia est globale, mais en pleine expansion. "d'application", si l'on veut isoler complètement les violations, des réglementations systématiques et une mise en œuvre efficace peuvent être nécessaires.

selon le niveau technique actuel de l'industrie, les utilisateurs n'ont besoin que de trouver quelques minutes de matériel dispersé comme échantillons d'apprentissage de l'ia pour cloner rapidement une voix humaine complète de l'ia. certaines pauses de parole, émotions et intonations de l'enregistrement peuvent être ajoutées, soustraites et ajustées par des moyens techniques.

de plus, en ce qui concerne les applications pratiques, le coût de copie d'un ensemble de voix humaines de l'ia n'est « désormais pas élevé ». de nombreuses applications sur le marché offrent des entrées gratuites. en prenant comme exemple le modèle concerné, le modèle reecho propose des entrées gratuites. service de clonage vocal, version plus professionnelle nécessite des frais supplémentaires.

une section de l'émission en direct de boss lu interceptée sur internet a été convertie en audio et importée en quelques secondes seulement, la voix de l'ia de boss lu a été clonée.

ensuite, nous avons imité un enregistrement de l'incident original qui contenait des émotions et un texte très scandaleux, et nous l'avons utilisé comme modèle d'importation de script pour créer un enregistrement de lu wenqingrui commentant musk, et nous avons terminé.

"xiao ma et les autres sont partis, n'est-ce pas ? je vous le dis, celui que je veux être populaire peut l'être, comprenez. je connais beaucoup de pdg, et je ne félicite personne que je loue. ne mentionnez pas musk pour moi, ça ne marche pas, tu sais, ça ne marche pas, ça ne marche pas même quand on boit, qui est-il sans trois moutons, qui lui vendra des marchandises, tu comprends ça ? »

franchement, si vous avez écouté trop de fois ce genre d'appels frauduleux de l'ia, ou si vous êtes sensible aux voix humaines, vous pouvez en fait dire que l'audio de l'ia a une "sensation de machine" - l'intonation est trop stable du début à la fin. fin, et cela ne sonnera jamais lorsque les gens seront émotionnellement excités. ce sera comme ça. mais ce n’est que le modèle de version normale le plus basique et la fonction de clonage instantané. s'il y a un corpus plus suffisant et que la fonction de clonage professionnel est sélectionnée, l'effet sera plus « réel ».

alors, est-il possible que l’audio et la vidéo synthétisés par l’ia soient aussi intuitifs qu’un détecteur de mensonge pour distinguer l’authenticité grâce aux données ?

au niveau technique, c'est faisable. lin hongxiang a déclaré qu'en plus de l'autorisation de l'utilisateur lui-même, il existe effectivement des normes pertinentes en cours d'élaboration dans l'industrie humaine numérique de l'ia, exigeant que toutes sortes de contenus générés par l'ia soient ajoutés avec des « marques de caractéristiques » identifiables spéciales.

cette étiquette n'ajoute pas simplement un filigrane « généré par xx ai » dans le coin. en prenant comme exemple le son synthétisé par l'ia, elle ajoutera des bandes de fréquences de bruit supplémentaires en dehors de la bande de fréquences des sons parlants humains, même dans la plage des sons visibles. ajoutez certaines bandes de fréquences caractéristiques.

cette fréquence caractéristique peut être identifiée par la machine. si une identification est requise, l'appareil peut extraire ces bandes de fréquences, et théoriquement l'authenticité peut être déterminée.

mais à l'heure actuelle, peu d'entreprises sont disposées à populariser cette fonction. le facteur limitant est le coût d'une procédure supplémentaire. bien que le coût d'un modèle à usage unique ne soit pas élevé, chaque modèle audio et vidéo est préinstallé. dans la phase de formation et les coûts engagés pour développer le modèle audio et vidéo de nouvelle génération après une sortie progressive exercent encore une forte pression sur les entreprises d'ia à ce stade.

à l'heure actuelle, l'industrie audio et vidéo de l'ia en est encore à ses débuts. comment acquérir des clients tout en couvrant les coûts pendant la phase de promotion est un sujet que les praticiens ne peuvent éviter.

mais ce ne sont évidemment pas des choses que les criminels mal intentionnés envisageraient. la question de savoir si des feux d’artifice ou des bombes dépend de la manière dont la poudre à canon est utilisée.

il y a plus de six mois, la police de hong kong a révélé une affaire de fraude impliquant un montant total de 200 millions de dollars de hong kong. dans cette affaire, les employés de la succursale de hong kong d'une entreprise multinationale ont reçu un avis du directeur financier du siège social, indiquant que le siège social prévoyait une « transaction secrète » et devait transférer les fonds de l'entreprise vers plusieurs comptes locaux à hong kong pour plus tard. utiliser.

ensuite, les employés ont été invités à participer à une « vidéoconférence multi-personnes » lancée par le siège social et, conformément aux exigences de la réunion, 200 millions de dollars de hong kong ont été transférés 15 fois sur 5 comptes bancaires.

source/nouvelles de vidéosurveillance

en fait, dans cette vidéoconférence à plusieurs personnes, à l'exception des employés de la succursale, les autres « personnes » étaient des images d'intelligence artificielle synthétisées par des fraudeurs à l'aide de tranches audio et vidéo publiques, puis utilisaient la vidéoconférence pour changer de visage et de voix. l'équipe chargée de la fraude devient directement l'équipe de direction qui prend les devants.

dans le cas de hong kong, les criminels équivalent à utiliser le changement de visage et le changeur de voix de l'ia pour apparaître sur la scène. cependant, l'enregistrement falsifié de l'ia de xiao yang a cette fois été entièrement synthétisé par un grand modèle après avoir appris les documents audio pertinents de lu. wenqing de three sheep company, les émotions sont proches de l'intégralité de l'audio d'une personne réelle. le processus est aussi simple que cela : l'audio et la vidéo synthétisés par l'ia constituent déjà une technologie mature, et les produits associés sont également devenus une industrie complète.

cependant, le courant dominant de l’audio et de la vidéo synthétisés par l’ia n’est certainement pas faux. dans l'intrigue de the wandering earth part 2, tu hengyu, joué par andy lau, a ressuscité yaya sous la forme d'une vie numérique. en dehors de l'intrigue, la célèbre star de cinéma ng meng-tat est également apparue à l'écran grâce à l'ia.

par conséquent, s'il y a un autre incident comme celui de l'enregistrement de xiao yang à l'avenir, avant de discuter si la technologie est coupable ou innocente, nous devrions d'abord essayer de contrôler les gens.

prenez soin de l’humanité et sauvez l’ia.

nouvelles

révéler le secret de l'ia qui a falsifié l'enregistrement de xiao yang : aucun coût et ne prend que trois secondes

introduction

mes coordonnées