contrattacco korea n room 2.0! quando le persone comuni furono completamente sconfitte dal cambio di volto dell'ia, usarono la magia per sconfiggere magic

contrattacco korea n room 2.0! quando le persone comuni furono completamente sconfitte dal cambio di volto dell'ia, usarono la magia per sconfiggere la magia.

2024-09-09

il recente incidente "room n 2.0" in corea del sud ha riportato in primo piano il tema banale del deepfake.

gli autori del reato si sono riuniti su telegram e hanno utilizzato l'intelligenza artificiale per sintetizzare le foto femminili in foto di nudo, il che dimostra che la cerchia dei deepfake si è già estesa dalle star dello spettacolo e dai politici alle persone comuni come te e me.

in quest’epoca in cui l’intelligenza artificiale è diventata una scienza di spicco, vogliamo capire come questa tecnologia, che non sembra nuova ma è diventata sempre più popolare negli ultimi anni, influisce sulla vita quotidiana.

fino a che punto si sono evoluti i deepfake e quali danni causeranno? come utilizzare la tecnologia per combattere il deepfake? in che modo le persone comuni prevengono i deepfake?

abbiamo parlato di questi problemi con il dottor chen peng, uno scienziato del ruilai intelligent algorithm. ruilai wisdom è stata fondata nel 2018 ed è stata incubata dall'istituto di ricerca sull'intelligenza artificiale dell'università di tsinghua da molti anni.

chen peng ci ha detto che la gente comune ha fallito miseramente nell’identificare deepfake e che l’anti-deepfake dipende ancora dall’intelligenza artificiale.

una foto, pochi secondi, deepfake diventa sempre più facile

il deepfake è emerso per la prima volta nel 2017 su reddit, la "versione americana di tieba". la forma principale è quella di sostituire i volti delle celebrità con protagonisti di video pornografici o di falsificare personaggi politici.

oggi, diffondere voci e dedicarsi alla pornografia sono ancora gli usi principali dei deepfake, ma sono appena diventati più facili.

chen peng ha spiegato che raccogliere una foto è sufficiente per cambiare il volto. naturalmente, più dati verranno raccolti, i dettagli del volto come nei e i lineamenti del viso saranno modellati meglio e più realistico sarà l'effetto di cambiamento del volto. .

nell'aprile di quest'anno, il progetto di performance art di due artisti tedeschi ne è un esempio vivente.

hanno progettato una fotocamera ai nuca. il corpo della fotocamera è stampato in 3d e ha un obiettivo grandangolare da 37 mm incorporato. le foto scattate verranno trasmesse al cloud, dove l'ia si "toglierà i vestiti" e la foto verrà scattata essere "tirato fuori" in meno di 10 secondi.

nuca in realtà non sa che aspetto ha il tuo corpo nudo, analizza solo il tuo sesso, il viso, l'età, la forma del corpo, ecc. per presentare il tuo corpo nudo agli occhi dell'intelligenza artificiale.

ruvido? forse non importa. in pochi secondi sei stato esposto all'intelligenza artificiale e altri potrebbero credere che sei tu.

anche la "room n 2.0" della corea del sud è stata esposta con dettagli simili: una chat room di telegram con 227.000 persone, un robot integrato che sintetizza le foto femminili in foto di nudo e può regolare il seno e genera contenuti deepfake in 5-7 secondi.

▲screenshot della chat room, che spiega come utilizzare deepfake

cambiare volto e togliersi i vestiti è solo un'applicazione di deepfake.

l’utilizzo di modelli di intelligenza artificiale generativa (gan, vae, modello di diffusione, ecc.) per sintetizzare o creare contenuti realistici, inclusi testo, immagini, audio e video, può essere chiamato deepfake.

tra questi, anche il deepfake audio è abbastanza comune.

all'inizio del 2023, il giornalista tecnologico joseph cox ha chiamato la hotline del servizio automatizzato della banca, ha riprodotto la voce ai "la mia voce è la mia password" che ha clonato con elevenlabs e ha chiesto di controllare il saldo. inaspettatamente, la verifica vocale ha avuto successo.

chen peng ha detto che questo non è sorprendente. in passato, ci volevano diversi minuti o dozzine di minuti per acquisire le informazioni sull'impronta vocale, ma ora possono essere catturate approssimativamente in mezzo minuto o dozzine di secondi. se riceviamo altre chiamate moleste, le nostre voci potrebbero trapelare.

naturalmente, se vuoi clonare in modo più accurato e copiare il tono e altri stili di conversazione, come lasciare che guo degang parli inglese cross talk o lasciare che swift parli cinese, hai ancora bisogno di più corpus.

anche il testo è un'area profondamente falsificata. il testo generato dall’intelligenza artificiale è stato a lungo visto ovunque ed è stato utilizzato dagli studenti per imbrogliare e affrontare i compiti, causando grattacapi agli insegnanti, ma potremmo non essere consapevoli dei rischi che ne derivano.

le false notizie e le voci sono le aree più colpite dal deepfake di testo. chen peng ha affermato che in passato gli esseri umani dovevano ancora scrivere la copia da soli, ma ora l'intelligenza artificiale può generare vari commenti su un determinato evento e quindi pubblicarli automaticamente sui social media. .

deepfake è più veloce e più semplice secondo chen peng, ci sono tre ragioni principali.

in primo luogo, ci sono stati progressi nelle tecnologie di intelligenza artificiale generativa come vincent pictures e vincent videos. in secondo luogo, la potenza di calcolo è diventata più popolare e le schede grafiche di livello consumer possono già eseguire modelli di intelligenza artificiale generativa.

un altro punto molto importante è che la tecnologia deepfake è stata ottimizzata in vari strumenti con soglie inferiori.

prendiamo ad esempio il cambio di volto. esistono molti progetti open source per deepfake, come deepfacelive e deep-live-cam su github. gli utenti possono scaricare il codice dal sito web e configurare l'ambiente di esecuzione localmente.

▲ trasmissione in diretta ai musk, utilizzando deep-live-cam

se i principianti che non capiscono la tecnologia hanno ancora difficoltà, ci sono anche professionisti che si mettono il riso direttamente in bocca, confezionano i modelli e scrivono software semplici e facili da usare che i giocatori possono scaricare gratuitamente, e guadagnano qualche soldo. spese pubblicitarie da sole, comprese molte app con un clic per lo stripping.

per quanto riguarda il deepfake audio, esistono già società commerciali mature che consentono agli utenti di utilizzare facilmente servizi sotto forma di sdk (kit di sviluppo) o api (interfaccia di programmazione dell'applicazione).

gli utenti non hanno nemmeno bisogno di un dispositivo con una scheda grafica per implementare il programma, ma caricano invece contenuti come l'audio sul sito web, attendono che i risultati vengano generati e quindi li scaricano.

pertanto, dietro le quinte si nascondono principi tecnici complessi e ciò che si trova davanti agli utenti sono interfacce “fuori dagli schemi”. anche gli adolescenti possono creare informazioni false a piacimento.

in poche parole, la conclusione di chen peng è:

deepfake è arrivato al punto in cui la gente comune può facilmente ottenerlo.

gli esseri umani potrebbero non essere riusciti a identificare deepfake a occhio nudo

quando una tecnologia “vola nelle case della gente comune”, le persone che hanno maggiori probabilità di esserne colpite sono proprio le persone comuni.

la frode è uno dei modi più comuni con cui i deepfake fanno del male.

all'inizio di quest'anno la filiale di hong kong di una multinazionale è stata defraudata di 25 milioni di dollari a causa dell'intelligenza artificiale. la vittima ha partecipato a una videoconferenza e gli altri erano truffatori che avevano subito il "cambio di volto dell'ia" e il "cambio di voce dell'ia".

▲la polizia ha dimostrato come utilizzare deepfake per simulare una videoconferenza tra più persone

ora che le cose sono arrivate a questo, cosa possiamo fare per proteggerci?

se qualcuno usa deepfake per ingannarti, sfruttare le lacune dell'intelligenza artificiale è uno dei modi, ma ha una durata di conservazione.

ad esempio, durante una videochiamata, se sospettiamo che il volto dell'interlocutore sia stato sostituito dall'intelligenza artificiale, possiamo guidare l'interlocutore a compiere azioni specifiche, come mettere la mano davanti al viso e scorrere velocemente alcune volte, o girare la testa in modo significativo.

se il modello dietro la sostituzione del volto con l'ia non è specificatamente ottimizzato per l'occlusione della mano, verrà esposto e il volto potrebbe apparire sul dorso della mano oppure potrebbe risultare improvvisamente distorto.

il principio della rotazione della testa è lo stesso. se durante la fase di raccolta dei dati, l'altra parte non raccoglie deliberatamente il materiale ruotando la testa di oltre 45 gradi, l'adattamento del viso risulterà innaturale.

ma in futuro tali difetti visibili diminuiranno gradualmente.

▲test di “risoluzione dei problemi” della northwestern university: generato dall’intelligenza artificiale o reale?

chen peng ha scherzato dicendo che se i truffatori pensano che tu sia una pecora grassa in attesa di essere macellata e vogliono deliberatamente ingannarti, strappare le tue informazioni sui social media e dedicare diversi giorni a ottimizzare il tuo modello, allora questi metodi non sono garantiti per essere efficaci.

se un video non presenta questi difetti significa che è un video vero? questo non è vero.

per quanto riguarda l’efficacia o meno, certamente non può essere completamente efficace o efficace al 100%, ma lo è fino a un certo punto.

per dirla in termini più professionali, la percezione visiva umana funziona molto bene a livello semantico, ad esempio è in grado di distinguere facilmente il significato di oggetti o scene, ma quando si tratta di elaborare sfumature di basso livello a livello di pixel, la percezione l'abilità non è buona come quella del modello ai.

da questo punto di vista, chen peng ritiene che la gente comune abbia fallito miseramente nel distinguere i deepfake. gli esperti potrebbero ancora essere in grado di combattere, perché hanno visto troppo e hanno capacità di analisi relativamente complete e possono vedere che qualcosa non è conforme alle regole.

nessuno di noi è leeuwenhoek, né abbiamo la vista acuta, ma la natura umana rimane immutata. possiamo quindi anche alzare la tradizionale linea di difesa psicologica che non ha nulla a che fare con la tecnologia: attenzione quando si naviga.

le truffe spesso seguono lo stesso schema: rubare la privacy, usare la paura, l'avidità e il valore emotivo per inventare storie, fingere di essere conoscenti o impacchettarsi per guadagnare fiducia, con il denaro come obiettivo finale.

▲il prodotto realbelieve di realai smart emetterà avvisi tempestivi durante le videochiamate.

tienilo a mente e quindi sii più vigile non fare clic su collegamenti sconosciuti, non fornire codici di verifica casualmente, cercare di non esporre eccessivamente il tuo viso, la voce, le impronte digitali e altre informazioni biometriche personali su internet, ricevere telefonate sospette, ecc. e avere menti multiple quando si tratta di soldi. modi per verificare l'identità dell'altro, come chiedere cose che solo l'altro conosce.

come dice il vecchio proverbio, la cosa migliore da fare è attaccare il cuore. una volta che ci rendiamo conto che potremmo essere ingannati, potremmo non essere ingannati.

magia contro magia, l'ia sconfigge l'ia

aumentare la consapevolezza antifrode non è sufficiente. l’incidente della “room n 2.0” della corea del sud mostra un’altra forma di deepfake malvagio. le persone sono sedute a casa e le pentole vengono dal cielo.

le vittime di foto di nudo false potrebbero incontrare il "revenge porno": gli autori minacciano di diffondere materiali deepfake per ricattare e molestare le vittime, causando danni secondari più gravi.

ma questa falce può anche essere sollevata sopra le nostre teste: immagina che una banda di truffatori abbia preso le tue foto dal nulla, le abbia combinate in video volgari, ti abbia inviato sms per minacciarti e se non trasferisci i soldi, verrà smascherato ovunque su internet. come puoi metterti alla prova?

ruilai wisdom, dove lavora chen peng, ha effettivamente riscontrato questo tipo di affari personali. l'altra parte ha detto che il suo volto è stato cambiato in un video e potrebbe essere scagionato?

naturalmente ci sono modi: magia contro magia, intelligenza artificiale che sconfigge intelligenza artificiale.

chen peng ha spiegato che esistono due principali percorsi tecnici per la contraffazione dell'ia: difesa attiva e rilevamento passivo.

parliamo prima di difesa attiva. quando pubblichiamo foto sui social media e non vogliamo che vengano utilizzate da altri, possiamo incorporare in esse del rumore visivamente impercettibile.

se qualcun altro utilizza le nostre foto per addestrare il modello, l'intelligenza artificiale non sarà in grado di estrarre bene la rappresentazione visiva a causa di questa interferenza invisibile e il risultato finale potrebbe essere distorto o sfocato. questo si chiama "attacco del campione contraddittorio". "

la "filigrana semi-vulnerabile" è un altro metodo di difesa attiva. dopo aver aggiunto una filigrana, se qualcun altro modifica la nostra foto, la filigrana verrà distrutta e sapremo che l'immagine è stata elaborata e non è affidabile.

le filigrane non possono impedire direttamente che le immagini siano deepfake, ma possono rilevare e certificare l'autenticità delle immagini.

▲esistono esplorazioni simili all'estero. adobe ha avviato lo standard c2pa, utilizzando i parametri dei metadati come metodo per determinare la fonte delle immagini.

naturalmente, la soglia per la difesa attiva è più alta, quindi dobbiamo prendere precauzioni prima che si verifichino ed elaborare in anticipo le immagini.

una situazione più comune è che non abbiamo modo di prevederlo. riceviamo "foto di nudo" di noi stessi, ma è anche la prima volta che siamo "schietti" con noi stessi. in questo momento è necessario utilizzare il rilevamento passivo.

realai intelligence offre una serie di prodotti di intelligenza artificiale responsabili del rilevamento della contraffazione, tra cui la piattaforma di rilevamento dei contenuti di intelligenza artificiale generativa deepreal, il firewall di sicurezza face ai realguard e così via.

▲deapreal

per dirla semplicemente, l'utilizzo dell'intelligenza artificiale per identificare l'intelligenza artificiale è diviso in due passaggi. innanzitutto, estrarre un gran numero di caratteristiche di falsificazione e quindi modellare sulla base di questi campioni per consentire all'ia di apprendere le regole di identificazione della falsificazione.

colori distorti, trame irragionevoli, espressioni innaturali, audio e video non sincronizzati, forme irregolari dell'iride e luci incoerenti dei due alunni sono tutti materiali di apprendimento per l'intelligenza artificiale.

tra questi, l'accuratezza della contraffazione video può essere superiore a quella delle immagini, perché il video è costituito da una serie di immagini continue, che forniscono più informazioni che possono essere utilizzate per la contraffazione rispetto a una singola immagine, come l'aspetto di un personaggio tra diversi frame. continuità d'azione.

in sostanza, la contraffazione dell’intelligenza artificiale è un po’ come usare gli occhi umani per trovare i difetti, e sfrutta anche i difetti del modello di intelligenza artificiale stesso.

▲ i ricercatori dell'accademia cinese delle scienze hanno reso open source al mondo il modello ai per il rilevamento di deepfake

ma i difetti miglioreranno sicuramente gradualmente, quindi sorge una domanda molto critica: c'è prima la falsificazione e poi l'autenticazione? se così fosse, la contraffazione non sarebbe sempre mezzo passo indietro rispetto alla falsificazione?

chen peng ha risposto che la tecnologia generata potrebbe essere leggermente più avanti rispetto alla tecnologia di contraffazione, ma hanno un laboratorio interno di attacco e difesa rosso-blu che simula deepfake mentre si difende da deepfake e migliora continuamente le capacità di rilevamento di deepfake.

se esce una nuova tecnologia deepfake, possono riprodurla rapidamente e quindi verificarla sul prodotto di rilevamento. "quando esce una nuova tecnologia, anche se non l'ho vista, riesco ancora a rilevarla in una certa misura."

inoltre, il modello stesso ha anche una certa capacità di generalizzazione, ha visto molti contenuti deepfake e può identificarli e rilevarli accuratamente in una certa misura se incontra contenuti invisibili.

▲ piattaforme come bilibili etichetteranno i contenuti di intrattenimento che cambiano il volto dell'intelligenza artificiale

in breve, la falsificazione dell’intelligenza artificiale e il rilevamento delle contraffazioni sono un “gioco del gatto e del topo” di confronto a lungo termine e competizione reciproca.

questo è il motivo per cui chen peng ha studiato gli algoritmi di contraffazione dell’intelligenza artificiale:

l'anti-deepfake è troppo conflittuale e richiede investimenti a lungo termine. a differenza di molti prodotti di intelligenza artificiale, puoi dimenticartene dopo averlo finito.

nonostante ciò, è ancora relativamente ottimista: "utilizzare leggi e regolamenti per supervisionare, le piattaforme gestire i contenuti, l'industria fornisce tecnologia e strumenti e i media sensibilizzano più persone sui rischi. se la governance multiforme raggiunge un certo livello, ci sarà sarà sicuramente un allentamento."

in futuro, navigando in internet, potremmo cadere in uno scenario un po' assurdo: il codice di verifica permette di dimostrare "sono un essere umano" e il deepfake permette di dimostrare "non sono me".

la tecnologia non è in grado di rilevare completamente tutti gli intenti dannosi, ma gli esseri umani non devono essere troppo ansiosi. il successo di deepfake è solo il risultato finale, ma la prevenzione del deepfake può iniziare in qualsiasi momento.

come ha affermato chen peng, anche un prodotto ai molto semplice è un progetto molto sistematico.

facciamo parte di un sistema più ampio. lasciamo che i feriti parlino apertamente, lasciamo che i colpevoli siano puniti, lasciamo che la tecnologia intervenga per fermare le azioni malvagie e eleviamo di un centimetro il concetto di società. solo allora potremo lavorare insieme verso una tecnologia che non sia temuta ma giusta utilizzo del futuro.

notizia

contrattacco korea n room 2.0! quando le persone comuni furono completamente sconfitte dal cambio di volto dell'ia, usarono la magia per sconfiggere la magia.

introduzione

le mie informazioni di contatto