rivelare il segreto dell'intelligenza artificiale che falsifica la registrazione di xiao yang: costo zero e richiede solo tre secondi

2024-09-30

la "registrazione di lu wenqing" esposta nell'incidente di xiao yang ha prima causato una protesta pubblica a causa della portata del contenuto, e poi si è scoperto che era tutta contraffatta dall'intelligenza artificiale.

nel corso del tempo, la tecnologia dell’intelligenza artificiale è stata nuovamente portata in primo piano.

immagine/risposta ufficiale di yanyu technology

indipendentemente dal fatto che la tecnologia sia buona o cattiva, in sostanza, la registrazione sintetizzata dall'intelligenza artificiale può essere intesa come una sorta di deepfake, che utilizza algoritmi di deep learning per simulare e falsificare audio e video, cioè attraverso il modello di deep learning nella tecnologia dell'intelligenza artificiale. , le voci delle persone, le espressioni facciali e i movimenti del corpo sono uniti in contenuti falsi molto realistici.

dal punto di vista tecnico, oltre alla simulazione vocale, metodi simili includono anche il cambio del volto tramite intelligenza artificiale, la sintesi del volto, la generazione di video, ecc., collettivamente definiti deep contraffazione.

tuttavia, la tecnologia neutrale non può impedire agli utenti di perseguire intenzioni malvagie.

lan mediahui ha consultato lin hongxiang, fondatore e ceo di fengping intelligence, una delle principali società nazionali di intelligenza artificiale digitale. per quanto riguarda questo tipo di incidenti, lin hongxiang ha affermato francamente che il miglioramento dell'efficienza produttiva apportato dall'intelligenza artificiale è completo, ma nel mezzo dell'espansione. di "applicazione", se si vuole isolare completamente le violazioni, potrebbero essere necessarie regolamentazioni sistematiche e un'attuazione efficace.

secondo l'attuale livello tecnico del settore, gli utenti devono solo trovare pochi minuti di materiale sparso come campioni di apprendimento dell'ia per clonare rapidamente una voce umana umana ai completa. alcune pause del discorso, emozioni e intonazioni nella registrazione possono essere aggiunte, sottratte e regolate attraverso mezzi tecnici.

inoltre, quando si tratta di applicazioni pratiche, il costo per copiare una serie di voci umane ai "non è ora elevato". molte applicazioni sul mercato forniranno alcuni ingressi gratuiti. prendendo come esempio il modello in questione, il modello reecho fornisce voce gratuita servizio di clonazione, la versione più professionale richiede un costo aggiuntivo.

una sezione della trasmissione in diretta di boss lu intercettata da internet è stata convertita in audio e importata. in pochi secondi, la voce ai di boss lu è stata clonata.

poi abbiamo imitato una registrazione dell'incidente originale con emozioni e testo oltraggiosi, e l'abbiamo usata come modello di importazione della sceneggiatura per creare una registrazione di lu wenqingrui che commenta musk, e il gioco è fatto.

"xiao ma e gli altri se ne sono andati, vero? te lo dico, chiunque io voglia essere popolare può essere popolare, capisci. conosco molti amministratori delegati e non lodo nessuno che lodo. non menzionarli musk per me, non funziona, sai, non funziona, e non funziona quando beviamo chi è lui senza tre pecore, chi gli venderà la merce, lo capisci? "

francamente, se hai ascoltato troppe volte questo tipo di chiamate truffaldine con l'intelligenza artificiale, o se sei sensibile alle voci umane, puoi effettivamente dire che l'audio dell'intelligenza artificiale ha una "sensazione di macchina" - l'intonazione è troppo stabile dall'inizio alla fine. finirà, e non suonerà mai quando le persone saranno emotivamente eccitate. sarà così. ma questo è solo il modello di versione normale più basilare e la funzione di clonazione istantanea. se c'è più corpus sufficiente e viene selezionata la funzione di clonazione professionale, l'effetto sarà più "reale".

quindi, è possibile che l’audio e il video sintetizzati dall’intelligenza artificiale siano intuitivi come una macchina della verità per distinguere l’autenticità attraverso i dati?

a livello tecnico è fattibile. lin hongxiang ha affermato che oltre all'autorizzazione dell'utente stesso, ci sono effettivamente standard pertinenti in costruzione nel settore dell'intelligenza artificiale umana digitale, che richiedono che tutti i tipi di contenuti generati dall'intelligenza artificiale siano aggiunti con speciali "marchi caratteristici" identificabili.

questa etichetta non aggiunge semplicemente una filigrana "generato da xx ai" nell'angolo. prendendo come esempio il suono sintetizzato dall'intelligenza artificiale, aggiungerà ulteriori bande di frequenza del rumore al di fuori della banda di frequenza dei suoni del parlato umano, anche all'interno della gamma dei suoni visibili. aggiungi alcune bande di frequenza caratteristiche.

questa frequenza caratteristica può essere identificata dalla macchina. se è necessaria l'identificazione, il dispositivo può estrarre queste bande di frequenza e teoricamente è possibile determinarne l'autenticità.

ma al momento non sono molte le aziende disposte a rendere popolare questa funzione. il fattore limitante è il costo di un'ulteriore procedura. sebbene il costo di un modello monouso non sia elevato, ogni modello audio e video è preinstallato nella fase di formazione e i costi sostenuti per lo sviluppo del modello audio e video di prossima generazione dopo la produzione graduale esercitano ancora una forte pressione sulle aziende di intelligenza artificiale in questa fase.

allo stato attuale, l'industria audio e video dell'intelligenza artificiale è ancora nelle sue fasi iniziali. come acquisire clienti coprendo i costi durante la fase di promozione è un argomento che i professionisti non possono evitare.

ma queste ovviamente non sono cose che i criminali con cattive intenzioni prenderebbero in considerazione. se si tratti di fuochi d'artificio o di bombe, dipende da come viene utilizzata la polvere da sparo.

più di sei mesi fa, la polizia di hong kong ha scoperto un caso di frode per un importo totale di 200 milioni di dollari di hong kong. nel caso, i dipendenti della filiale di hong kong di una multinazionale hanno ricevuto un avviso dal direttore finanziario della sede centrale, in cui si informava che la sede stava pianificando una "transazione segreta" e aveva bisogno di trasferire i fondi della società su diversi conti locali a hong kong per poi utilizzo.

successivamente, i dipendenti sono stati invitati a partecipare a una "videoconferenza multi-persona" avviata dalla sede centrale e, in conformità con i requisiti della riunione, 200 milioni di hk $ sono stati trasferiti 15 volte su 5 conti bancari.

fonte/notizie cctv

infatti, in questa videoconferenza tra più persone, ad eccezione dei dipendenti della filiale, le altre "persone" erano immagini ai sintetizzate dai truffatori utilizzando porzioni audio e video pubbliche, e poi utilizzavano la videoconferenza per cambiare volti e voci. il team antifrode diventa direttamente il team esecutivo che prende le decisioni.

nel caso di hong kong, i criminali equivalgono all'uso del cambio volto ai + del cambio voce ai per apparire sulla scena. tuttavia, la registrazione contraffatta dell'ia di xiao yang questa volta è stata completamente sintetizzata da un modello di grandi dimensioni dopo aver appreso i materiali audio pertinenti di lu. wenqing di three sheep company, le emozioni sono vicine all'intero audio di una persona reale. il processo è proprio semplice: l'audio e il video sintetizzati dall'intelligenza artificiale sono già una tecnologia matura e anche i prodotti correlati si sono sviluppati in un settore completo.

tuttavia, il mainstream dell’audio e del video sintetizzati dall’intelligenza artificiale non è assolutamente falso. nella trama di the wandering earth part 2, tu hengyu, interpretato da andy lau, ha resuscitato yaya sotto forma di vita digitale. al di fuori della trama, anche la famosa star del cinema ng meng-tat è apparsa sullo schermo tramite l'intelligenza artificiale.

pertanto, se in futuro si verificasse un altro incidente come quello della registrazione di xiao yang, prima di discutere se la tecnologia è colpevole o innocente, dovremmo prima cercare di controllare le persone.

prenditi cura dell'umanità e salva l'intelligenza artificiale.

notizia

rivelare il segreto dell'intelligenza artificiale che falsifica la registrazione di xiao yang: costo zero e richiede solo tre secondi

introduzione

le mie informazioni di contatto