uutiset

vastahyökkäys korea n huone 2.0! kun tavalliset ihmiset voittivat täysin tekoälyn kasvojenmuutoksen, he käyttivät taikuutta kukistaakseen taikuuden.

2024-09-09

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

äskettäinen "room n 2.0" -tapaus etelä-koreassa on jälleen kerran nostanut deepfaken arkipäiväisen aiheen etualalle.

tekijät kokoontuivat telegramissa ja syntetisoivat tekoälyllä naisvalokuvia alastomukuviksi, mikä osoittaa, että deepfakesien piiri on jo laajentunut viihdetähdistä ja poliitikoista tavallisiin ihmisiin, kuten sinä ja minä.

tällä aikakaudella, jolloin tekoälystä on tullut merkittävä tiede, haluamme ymmärtää, kuinka tämä tekniikka, joka ei vaikuta uudelta, mutta on tullut yhä suositummaksi viime vuosina, vaikuttaa jokapäiväiseen elämään.

missä määrin syväväärennökset ovat kehittyneet ja mitä haittaa ne aiheuttavat? kuinka käyttää tekniikkaa taistellaksesi deepfakea vastaan? kuinka tavalliset ihmiset estävät deepfakesia?

keskustelimme näistä ongelmista ruilai intelligent algorithmin tutkijan tohtori chen pengin kanssa. ruilai wisdom perustettiin vuonna 2018, ja sitä inkuboi tsinghuan yliopiston tekoälyn tutkimuslaitos. se on ollut syvästi mukana tekoälyn väärennösten havaitsemisessa useiden vuosien ajan.

chen peng kertoi meille, että tavalliset ihmiset ovat epäonnistuneet surkeasti deepfaken tunnistamisessa, ja anti-deepfake on edelleen riippuvainen tekoälystä.

kuva, muutama sekunti, deepfake on tulossa helpommaksi ja helpommaksi

deepfake ilmestyi ensimmäisen kerran vuonna 2017 redditissä, "tieban amerikkalaisessa versiossa". päämuoto on korvata julkkisten kasvot pornografisten videoiden päähenkilöillä tai huijata poliittisia hahmoja.

nykyään huhujen levittäminen ja pornografiaan osallistuminen ovat edelleen deepfakesin yleisiä käyttötarkoituksia, mutta niistä on juuri tullut helpompaa.

chen peng selitti, että yhden valokuvan kerääminen riittää tietysti kasvojen vaihtamiseen, mitä enemmän tietoja kerätään, sitä paremmin kasvojen yksityiskohdat, kuten luomi ja kasvonpiirteet, mallinnetaan ja mitä realistisempi on kasvoja muuttava vaikutus. .

tämän vuoden huhtikuussa kahden saksalaisen taiteilijan performanssitaideprojekti on elävä esimerkki.

he suunnittelivat tekoälykameran nuca. kameran runko on 3d-tulostettu ja siinä on sisäänrakennettu 37 mm:n laajakulmaobjektiivi. otetut kuvat siirretään pilveen, jossa tekoäly "riisuu" "poistetaan" alle 10 sekunnissa.

nuca ei itse asiassa tiedä, miltä alastomasi vartalosi näyttää. se analysoi vain sukupuolesi, kasvosi, ikäsi, vartalon muotosi jne. esittääkseen alaston vartalosi tekoälyn silmissä.

karkea? ehkä sillä ei ole väliä muutaman sekunnin kuluttua olet altistunut tekoälylle, ja muut saattavat uskoa, että se olet sinä.

etelä-korean "room n 2.0" on myös paljastettu samanlaisilla yksityiskohdilla: telegram-chat-huone, jossa on 227 000 ihmistä, sisäänrakennettu robotti, joka syntetisoi naisten valokuvat alastonkuviksi ja pystyy säätämään rintoja ja luo syväfake-sisältöä 5-7 sekunnissa.

▲ kuvakaappaus chat-huoneesta, jossa selitetään deepfaken käyttöä

kasvojen vaihtaminen ja vaatteiden riisuminen ovat vain yksi deepfaken sovellus.

generatiivisten ai-mallien (gan, vae, diffuusiomalli jne.) käyttöä realistisen sisällön, mukaan lukien tekstin, kuvien, äänen ja videon, syntetisoimiseen tai väärentämiseen voidaan kutsua deepfakeksi.

niiden joukossa äänen syväfake on myös melko yleinen.

vuoden 2023 alussa teknologiatoimittaja joseph cox soitti pankin automatisoituun palvelupuhelimeen, soitti elevenlabsin kloonaaman tekoälyäänen "my voice is my password" ja pyysi tarkistamaan saldon. äänivahvistus onnistui yllättäen.

chen peng sanoi, että tämä ei ole yllättävää. aikaisemmin äänijälkitietojemme kaappaamiseen kului useita minuutteja, mutta nyt se voidaan kaapata karkeasti puolessa minuutissa tai kymmenissä sekunnissa. jos saamme muutaman häiritsevän puhelun lisää, äänemme voi vuotaa.

tietenkin, jos haluat kloonata tarkemmin ja kopioida sävyä ja muita puhetyylejä, kuten antaa guo degangin puhua englantia cross talk tai antaa swiftin puhua kiinaa, tarvitset silti lisää korpusta.

jopa teksti on alue, joka on syvästi väärennetty. tekoälyn luomaa tekstiä on nähty jo pitkään kaikkialla, ja oppilaat ovat käyttäneet sitä huijaamiseen ja kotitehtävien suorittamiseen, mikä aiheuttaa päänsärkyä opettajille, mutta emme ehkä ole tietoisia sen takana olevista riskeistä.

väärät uutiset ja huhut ovat pahiten tekstin väärennösten kohteet. chen peng sanoi, että ennen ihmisten piti vielä kirjoittaa kopio itse, mutta nyt tekoäly voi luoda erilaisia ​​kommentteja tietystä tapahtumasta ja julkaista ne sitten automaattisesti sosiaalisessa mediassa. .

deepfake on nopeampi ja yksinkertaisempi chen pengin mukaan siihen on kolme pääasiallista syytä.

ensinnäkin generatiivisissa tekoälytekniikoissa, kuten vincent picturesissa ja vincent videoissa, on tapahtunut läpimurtoja. toiseksi laskentatehosta on tullut suositumpi, ja kuluttajatason näytönohjaimet voivat jo käyttää generatiivisia tekoälymalleja.

toinen erittäin tärkeä seikka on, että deepfake-tekniikka on optimoitu erilaisiksi työkaluiksi, joilla on alhaisemmat kynnykset.

esimerkkinä kasvojen muuttaminen deepfakelle on olemassa monia avoimen lähdekoodin projekteja, kuten deepfacelive ja deep-live-cam githubissa. käyttäjät voivat ladata koodin verkkosivustolta ja määrittää toimintaympäristön paikallisesti.

▲ai muskin suora lähetys käyttää deep-live-camia

jos aloittelijat, jotka eivät ymmärrä tekniikkaa, kokevat sen edelleen vaikeaksi, on myös ammattilaisia, jotka laittavat riisin suoraan suuhunsa, kapseloivat mallit ja kirjoittavat yksinkertaisia ​​ja helppokäyttöisiä ohjelmistoja, jotka pelaajat voivat ladata ilmaiseksi ja ansaita mainontamaksut itse, mukaan lukien monet yhden napsautuksen sovellukset poistamiseen.

mitä tulee audiodeepfakeen, on jo olemassa kypsiä kaupallisia yrityksiä, joiden avulla käyttäjät voivat helposti käyttää palveluita sdk:n (kehityspaketti) tai api:n (sovellusohjelmointirajapinta) muodossa.

käyttäjät eivät edes tarvitse laitetta, jossa on näytönohjain ohjelman käyttöönottoon, vaan lataavat sen sijaan sisältöä, kuten ääntä, verkkosivustolle, odottavat tulosten luomista ja lataavat ne sitten.

siksi monimutkaiset tekniset periaatteet ovat piilossa kulissien takana, ja käyttäjien edessä ovat "out-of-the-box" -käyttöliittymät.

lyhyesti sanottuna chen pengin johtopäätös on:

deepfake on saavuttanut pisteen, jossa tavalliset ihmiset voivat helposti saada sen.

ihmiset ovat saattaneet täysin epäonnistua tunnistamaan deepfakea paljaalla silmällä

kun tekniikka "lentää tavallisten ihmisten koteihin", ihmiset, jotka todennäköisimmin kärsivät siitä, ovat tavallisia ihmisiä.

petos on yksi yleisimmistä tavoista, joilla deepfakes tekee pahaa.

tämän vuoden alussa monikansallisen yrityksen hongkongin sivuliikkeeltä huijattiin 25 miljoonaa dollaria tekoälyn vuoksi. uhri osallistui videoneuvotteluun, ja muut olivat huijareita, joille oli tehty "ai-kasvojen vaihtaminen" ja "ai-äänenvaihto".

▲poliisi osoitti, kuinka deepfakea käytetään usean hengen videoneuvottelun väärentämiseen

nyt kun asiat ovat tulleet tähän, mitä voimme tehdä suojellaksemme itseämme?

jos joku käyttää deepfakea huijatakseen sinua, tekoälyn porsaanreikkien hyödyntäminen on yksi keino, mutta sillä on säilyvyysaika.

jos esimerkiksi videopuhelun aikana epäilemme, että toisen osapuolen kasvot on korvattu tekoälyllä, voimme ohjata toista osapuolta tekemään tiettyjä toimia, kuten asettamalla kätensä kasvojensa eteen ja pyyhkäisemään muutaman kerran nopeasti, tai kääntää päätään merkittävästi.

jos tekoälyn kasvojen vaihdon takana olevaa mallia ei ole erityisesti optimoitu käden okkluusiota varten, se paljastuu ja kasvot voivat näkyä käden takaosassa tai se voi yhtäkkiä vääristyä.

pään kääntämisen periaate on sama, jos toinen osapuoli ei tietoisesti kerää pään käännösmateriaalia yli 45 astetta, niin kasvojen istuvuus on luonnoton.

mutta tulevaisuudessa tällaiset paljaalla silmällä näkyvät puutteet vähenevät varmasti vähitellen.

▲northwestern universityn "vianetsintä"-testi: tekoälyn luoma vai todellinen?

chen peng vitsaili, että jos huijarit pitävät sinua lihavana lampaana, joka odottaa teurastusta ja haluavat tahallaan pettää sinut, riisua sosiaalisen median tiedot ja viettää useita päiviä mallisi optimointiin, näiden menetelmien tehoa ei taata.

jos videossa ei ole näitä puutteita, tarkoittaako se, että se on todellinen video? tämä ei ole totta.

mitä tulee siihen, onko se tehokas vai ei, se ei todellakaan voi olla täysin tehokas tai 100% tehokas, mutta se on tehokas tietyssä määrin.

ammattimaisesti sanottuna ihmisen visuaalinen havainto toimii erittäin hyvin semanttisella tasolla, kuten se pystyy helposti erottamaan esineiden tai kohtausten merkitykset, mutta kun on kyse matalan tason vivahteiden käsittelystä pikselitasolla, havainto kyky ei ole yhtä hyvä kuin ai-mallilla.

tästä näkökulmasta katsottuna chen peng uskoo, että tavalliset ihmiset ovat epäonnistuneet deepfaken erottamisessa. asiantuntijat saattavat silti pystyä taistelemaan, koska he ovat nähneet liian paljon ja heillä on suhteellisen kattavat analyysiominaisuudet ja he voivat nähdä, että jokin ei ole sääntöjen mukainen.

kukaan meistä ei ole leeuwenhoek, eikä meillä ole teräviä silmiä, mutta ihmisluonto pysyy ennallaan. siksi voimme vetää ylös myös perinteistä psykologista puolustuslinjaa, jolla ei ole mitään tekemistä tekniikan kanssa - ole varovainen purjehtiessasi.

huijaukset noudattavat usein samaa kaavaa: yksityisyyden varastaminen, pelon, ahneuden ja emotionaalisen arvon käyttäminen tarinoiden keksimiseen, tuttavuuksien esittäminen tai itsensä pakkaaminen luottamuksen saamiseksi rahan perimmäisenä tavoitteena.

▲realai smartin tuote realbelieve antaa varhaisia ​​varoituksia videopuheluiden aikana.

pidä tämä mielessä ja ole sitten valppaampi. älä klikkaa tuntemattomia linkkejä, älä anna vahvistuskoodeja satunnaisesti, älä paljasta liikaa kasvojasi, ääntäsi, sormenjälkiäsi ja muita henkilökohtaisia ​​biometrisiä tietojasi, ota vastaan ​​epäilyttäviä puheluita, ja sinulla on monia mielipiteitä rahasta, tapoja varmistaa toistensa henkilöllisyys, kuten kysyä asioita, jotka vain toiset tietävät.

kuten vanha sanonta kuuluu, parasta on hyökätä sydämeen kun ymmärrämme, että meitä voidaan pettää, meitä ei ehkä petetä.

taikuutta vastaan ​​taikuutta, tekoäly voittaa tekoälyn

petostentorjuntatietoisuuden lisääminen ei riitä etelä-korean "huone n 2.0" -tapaus osoittaa toisenlaisen syvän väärennöksen. ihmiset istuvat kotona ja ruukut tulevat taivaasta.

väärennettyjen alastonkuvien uhrit voivat kohdata "kostopornoa" - tekijät uhkaavat levittää syvää väärennettyä materiaalia kiristääkseen ja ahdistellakseen uhreja aiheuttaen vakavampaa toissijaista haittaa.

mutta tämä sirppi voi myös nousta päämme yli: kuvittele, että huijarijoukko sai valokuvasi tyhjästä, yhdisti ne mauttomiksi videoiksi, lähetti sinua uhkailevia tekstiviestejä, ja jos et siirrä rahaa, ne paljastuvat. kaikkialla internetissä, kuinka voit todistaa itsesi?

ruilai wisdom, jossa chen peng työskentelee, on todellakin törmännyt tällaiseen henkilökohtaisiin asioihin. toinen osapuoli sanoi, että hänen kasvonsa muuttuivat videolla, ja voisiko hänet siivota?

tietenkin on olemassa tapoja: taikuutta vastaan ​​taikuutta, tekoäly voittaa tekoälyn.

chen peng esitteli, että tekoälyn väärentämisessä on kaksi tärkeintä teknistä reittiä: aktiivinen puolustus ja passiivinen havaitseminen.

puhutaan ensin aktiivisesta puolustuksesta kun julkaisemme kuvia sosiaalisessa mediassa emmekä halua muiden käyttävän niitä, voimme upottaa niihin visuaalisesti huomaamatonta melua.

jos joku muu käyttää kuviamme mallin kouluttamiseen, tekoäly ei pysty poimimaan visuaalista esitystä hyvin tämän näkymättömän häiriön vuoksi, ja lopputulos voi vääristyä tai sumea. "

"puolihaavoittuva vesileima" on toinen aktiivinen puolustusmenetelmä. jos joku muu muokkaa kuvaamme vesileiman lisäämisen jälkeen, vesileima tuhoutuu ja tiedämme, että kuva on käsitelty eikä se ole luotettava.

vesileimat eivät pysty suoraan estämään kuvien syvää väärennöksiä, mutta ne voivat havaita ja varmentaa kuvien aitouden.

▲ ulkomailla on samankaltaisia ​​tutkimuksia. adobe käynnisti c2pa-standardin käyttämällä metatietoparametreja tapana määrittää kuvien lähde.

tietysti aktiivisen puolustuksen kynnys on korkeampi, joten meidän on ryhdyttävä varotoimiin ennen kuin ne tapahtuvat ja käsiteltävä kuvia etukäteen.

yleisempi tilanne on, että emme voi ennustaa sitä. saamme "alastomia kuvia" itsestämme, mutta se on myös ensimmäinen kerta, kun olemme "rehellisiä" itsellemme. tässä vaiheessa on käytettävä passiivista tunnistusta.

realai intelligencellä on sarja tekoälytuotteita, jotka vastaavat väärennösten havaitsemisesta, mukaan lukien generatiivinen ai-sisällöntunnistusalusta deepreal, kasvojen tekoälyn suojapalomuuri realguard ja niin edelleen.

▲deapreal

yksinkertaisesti sanottuna tekoälyn käyttö tekoälyn tunnistamiseen on jaettu kahteen vaiheeseen. poimi ensin suuri määrä väärennösominaisuuksia ja mallinna sitten näiden näytteiden perusteella, jotta tekoäly oppii väärennösten tunnistamisen säännöt.

vääristyneet värit, kohtuuttomat tekstuurit, epäluonnolliset ilmeet, epäsynkronoitu ääni ja video, epäsäännölliset iiriksen muodot ja kahden oppilaan epäjohdonmukaiset kohokohdat ovat kaikki tekoälyn oppimateriaaleja.

niistä videoväärennösten tarkkuus voi olla suurempi kuin kuvien, koska video koostuu sarjasta jatkuvia kuvia, jotka tarjoavat enemmän väärentämiseen käytettävää tietoa kuin yksittäinen kuva, kuten hahmon esiintyminen eri kuvien välillä. toiminnan jatkuvuutta.

pohjimmiltaan tekoälyn väärentäminen on vähän kuin ihmisen silmien käyttämistä vikojen etsimiseen, ja se hyödyntää myös itse tekoälymallin puutteita.

▲ kiinan tiedeakatemian tutkijat loivat avoimen lähdekoodin tekoälymallin deepfaken havaitsemiseen maailmalle

mutta viat paranevat varmasti vähitellen, joten herää erittäin kriittinen kysymys: onko ensin väärennös ja sitten todennus? jos näin on, eikö väärentäminen ole aina puoli askelta jäljessä väärentämisestä?

chen peng vastasi, että luotu tekniikka saattaa olla hieman väärennösteknologiaa edellä, mutta heillä on sisäinen puna-sininen hyökkäys- ja puolustuslaboratorio, joka simuloi deepfakea puolustaen samalla deepfakea vastaan ​​ja parantaa jatkuvasti deepfaken havaitsemiskykyä.

jos uutta deepfake-tekniikkaa tulee ulos, he voivat nopeasti toistaa sen ja sitten tarkistaa sen tunnistustuotteessa "kun uusi tekniikka tulee ulos, vaikka en olisi nähnyt sitä, voin silti havaita sen jossain määrin."

lisäksi mallilla itsessään on tietty yleistyskyky. se on nähnyt paljon deepfake-sisältöä, ja se pystyy tunnistamaan ja havaitsemaan sen tietyssä määrin, jos se kohtaa näkymättömiä.

▲ bilibilin kaltaiset alustat merkitsevät tekoälyn kasvoja muuttavaa viihdesisältöä

lyhyesti sanottuna tekoälyn väärentäminen ja väärennösten havaitseminen on "kissa-hiiri-leikkiä", joka koostuu pitkäaikaisesta vastakkainasettelusta ja keskinäisestä kilpailusta.

tästä syystä chen peng on tutkinut tekoälyn väärentämisalgoritmeja:

anti-deepfake on liian ristiriitainen ja vaatii pitkän aikavälin investointeja toisin kuin monet tekoälytuotteet, voit unohtaa sen, kun olet valmis.

tästä huolimatta hän on edelleen suhteellisen optimistinen: "käytä lakeja ja määräyksiä valvomaan, alustat hallitsevat sisältöä, ala tarjoaa teknologiaa ja työkaluja ja media saa ihmiset tietoisiksi riskeistä. jos monipuolinen hallinto saavuttaa tietyn tason, varmasti helpotus."

jatkossa internetissä surffaillessamme saatamme joutua sellaiseen hieman absurdiin skenaarioon: vahvistuskoodin avulla voit todistaa "minä olen ihminen" ja deepfaken avulla "en ole minä".

tekniikka ei pysty täysin havaitsemaan kaikkia haitallisia aikomuksia, mutta ihmisten ei tarvitse olla liian huolissaan deepfaken menestys on vain lopputulos, mutta deepfaken estäminen voi alkaa milloin tahansa.

kuten chen peng sanoi, jopa hyvin yksinkertainen tekoälytuote on hyvin systemaattinen projekti.

olemme osa suurempaa järjestelmää, anna haavoittuneiden puhua, rikosten tekijöiden tulla väliin ja nostaa yhteiskunnan käsitettä tuuman verran tulevaisuuden käyttöä.