tekoälyn äänikloonausyritys käytti three sheep'sin tallennustekniikkaa harjoittaakseen "itsemurhamarkkinointia"?

2024-09-29

kolmen lampaan tapaus aiheutti melkoisen kohua. yllättäen uhriksi tuli tekoäly.

hefein poliisi julkaisi toissailtana ilmoituksen "three sheep groupin perustajan lu wenqingin nauhoitustapahtumasta", jossa todettiin, että laajalti levitetty ääni oli tekoälyn tuottamaa ja että epäiltyyn oli kohdistettu rikosoikeudellisia pakkokeinoja. lakia.

viimeisenä sanana tämä ilmoitus ei antanut vain virallista kantaa, vaan myös löi "ensimmäistä henkilöä kotimaisessa tekoälyssä", josta muutama päivä sitten huhuttiin " tuohon aikaan oli "ai voice -kloonaustekniikka ei ole vielä niin silkinpehmeää."

mutta vieläkin yllättävämpää on, että tekoälyyritys hyppäsi eilen "antamaan lausunnon" sanoen, että epäilty oli tuottanut äänisisällön itse kehittämällä tekoälyäänitys suurella mallilla.

myös verkkokäyttäjät olivat järkyttyneitä kaiken tämän jälkeen. onko tekoäly rullien kuningas? seurasimme lausunnossa mainittua yritystä löytääksemme lausunnon lähteen ja löysimme samannimisestä weibosta vastaavaa sisältöä. tiliä ei kuitenkaan ole virallisesti sertifioitu, joten emme voi tehdä lopullista johtopäätöstä.

keskustelu tämän väitteen ympärillä kuitenkin lisääntyy yhä enemmän .”

kokeile vain... asianomaisten yritysten ja tuotteiden nimien peittämisen perusteella teimme tuotteelle joitain varsinaisia testejä. on huomattava, että seuraavat testit ovat vain populaaritieteellisiä tarkoituksia työkalu perustuu siihen, miten käyttäjät käyttävät sitä, emme koskaan tue ketään, joka käyttää tekoälyä lain rajojen testaamiseen.

samaan aikaan olemme myös konsultoineet asianomaisia lakimiehiä saadaksemme tietää, onko tällaisille tekoälyn kloonausäänen loukkaustapauksille olemassa ennakkotapauksia ja mihin oikeudellisiin ongelmiin sisällöntuottajien ja alustojen on kiinnitettävä huomiota käyttäessään tai mainostaessaan uusia teknologioita. .

ai kloonaa ihmisen äänen,

vain muutaman sekunnin ääninäyte

kirjoita tekstiä, määritä rooleja, segmentoi teksti automaattisesti lause kerrallaan ja luo se yhdellä napsautuksella.

astuttuamme tuotesivulle kävimme läpi yllä olevat vaiheet, ja kesti vain 1 minuutti saada jiang wen lukemaan liu zin rivit "let the bullets fly".

isä, olen etsinyt kaiken, mutta ei ole rahaa, ei tavaroita eikä hopeaa. vain kaksi ihmistä on elossa, pitäisikö meidän tappaa heidät vai ei?

tällä poljinnopeudella ja sävyllä en tiedä, luulinko jiang wenin liu zi:n roolin. itse asiassa liu zi näytteli poikaa elokuvassa ja jiang wen liu zin isänä.

tämä ääni luotiin käyttämällä tuotteessa olevaa äänihahmoa "jiang wen".

tällä hetkellä tässä tuotteessa on monia äänihahmoja, mukaan lukien tunnetut internet-julkkikset, kuten "sun xiaochuan" ja "ding zhen", sekä supertähtiä kulttuuri- ja urheilupiireissä, kuten "kobe bryant" ja "jay chou". .

kaikki nämä äänihahmot ovat yhteisön käyttäjien lataamia. napsauttamalla alustan virallisia hahmoja tulee näkyviin teksti "tulossa pian, joten pysy kuulolla."

yhteisön käyttäjien lataamien äänihahmojen käytön lisäksi alustalla on myös helppo kloonata julkkiksen ääni.

tänne olemme ladaneet todellisen haastattelutallenteen muskista, jossa ai musk "henkilökohtaisesti" sanoi "sinä joutsen, hän sammakko! (ripikonna haluaa syödä joutsenen lihaa)", chinglish-lause, joka on erittäin suosittu ulkomailla.

alusta edellyttää, että näyteäänen pitää olla vain pidempi kuin 2 sekuntia, ja näytteen laatu on pituutta tärkeämpi, joten äänikloonausta suoritettaessa aikaa vievin vaihe on löytää selkeä äänite muskista.

viranomaisten mukaan tätä tallennetta käytetään määrittämään hahmon oletusääninen suorituskyky, mukaan lukien ääni, tunteet, puhenopeus, intonaatio, rytmi jne. jos haluat eri äänityylejä samalle hahmolle, voit myös lisätä äänihahmosta erilaisia tyylinäytteitä.

tällä hetkellä olemme ladanneet vain äänikappaleen tässä versiossa, ja käytämme edelleen alustan nopeaa kloonaustilaa maksullisen ammattikloonaustilan sijaan (virallisesti sanottiin, että tilan sointi- ja tunnepalautusaste on jopa 99,9 %). lyhyiden lauseiden suorituskyky on jo 6-7 pistettä samanlainen kuin muskin oma ääni.

sisältömuodon näkökulmasta generatiivinen tekoäly on "tunkeutunut" tekstiin, ääneen, videoon ja jopa 3d-sisältöön. niiden joukossa äänen voidaan sanoa olevan yksi kypsimmistä tekniikan sovelluksista.

ai-äänen kloonaus on vain tekoälyn äänen luomisen alajako. muita sovelluksia ovat tekoälyn luoma musiikki ja tekoälyn luomat äänitehosteet.

kauan ennen generatiivisen tekoälyn tuloa tekoälyn äänikloonaus oli todella olemassa. tuolloin halusin kloonata ääniä, mikä perustui perinteiseen tts-tekniikkaan (text-to-speech, text-to-speech). se vaati tekoälykirjaston rakentamista ja suuren määrän ihmisääninäytteiden keräämistä myöhemmin se jouduttiin simuloimaan manuaalisen virheenkorjauksen avulla.

tai avoimen lähdekoodin projekteihin, kuten bert vitsiin, perustuen uusinta syväoppimisen puhesynteesiteknologiaa voidaan käyttää tekstin suoraan muuntamiseen puheeksi sointin palauttamiseksi, mutta laitteet ja tekniset vaatimukset ovat suhteellisen korkeat.

kuvan lähde: gpt-sovits opetusohjelma station b:n up-masterista "henji weizi"

nykyään aigc-aallon alla "rullatut" ai-työkalut vaativat vain 10 sekuntia tai vähemmän ääninäytteitä toistaakseen äänen tarkasti.

aiemmin esittelimme ai-äänen kloonaustekniikan periaatteen suorassa lähetyksessä, joka on yleensä jaettu vaiheisiin, kuten äänen kerääminen, ominaisuuksien purkaminen, mallin koulutus ja puhesynteesi. aiheeseen liittyviä työkaluja ovat fish audio, cosyvoice, elevenlabs, cutting jne ., sallien äänen kloonaustoimintojen kynnys on laskenut. (aiheeseen liittyvien suorien lähetysten uusintoja varten voit seurata "ai new list" -videotiliä tai skannata alla olevan kuvan qr-koodi nähdäksesi)

siksi on teknisesti mahdollista, että "three sheep recording gate" tuottaa tekoäly. varsinkin "varovaisten ihmisten" käsissä voidaan tekoälyn sukupolven lisäksi käyttää myös manuaalista virheenkorjausta, jälkieditointia ja muita menetelmiä väärennettyjen ja todellisten efektien aikaansaamiseen.

puhumattakaan siitä, että kiertävissä tallennuksissa on paljon monimutkaisia ympäristömeluja ja puhujan "humalatilan" asetuksia, jotka vaikeuttavat huomattavasti tallenteiden aitouden tunnistamista. ei ole yllättävää, että monet verkkokäyttäjät spekuloivat, että tekoäly toimii vain "väliaikaisena työntekijänä" ja voi vastustaa kaikkea.

itse asiassa tämä heijastaa myös siltä puolelta, että tekoälyteknologian nopean iteraation myötä meidän tavallisten ihmisten ja etulinjan harjoittajien välillä on tietokuilu siitä, mitä tekoäly voi tehdä ja missä määrin se pystyy.

lisäksi "three sheep recording gate" -tapahtuma paljasti myös oikeudellisia ongelmia, kuten alustan valvonnan puutteen ja sisällöntuottajien virheellisen käytön.

keskustelua tekoälyn ääniloukkauksista sisältöalustoilla

itse asiassa tämä ei ole ensimmäinen tekoälyn väärentämisen aiheuttama ääniloukkaustapaus.

tämän vuoden huhtikuussa pekingin internet-tuomioistuin käsitteli maan ensimmäistä "ai-äänen loukkaustapausta".

kantaja yin moumou on jälkiäänitaiteilija ja on äänittänyt monia ääniteoksia. hän huomasi vahingossa, että hänen äänensä oli muunnettu tekoälyksi ja myyty "magic sound workshop" -nimisessä sovelluksessa. tuomioistuin päätti lopulta, että vastaajan tekemä kantajan äänen käyttö ilman kantajan lupaa oli loukkaus, ja korvasi kantajalle 250 000 yuania erilaisista menetyksistä.

kiinan kansantasavallan siviililain pykälän 1023 mukaan luonnollisen henkilön ääni on lailla suojattu, ja sen suojausmenetelmä on samanlainen kuin muotokuvaoikeuden. tämä tarkoittaa, että jos tekoälyn tuottama ääni on tunnistettavissa ja yleisö voi yhdistää sen tiettyyn luonnolliseen henkilöön, äänen käyttäminen ilman kyseisen luonnollisen henkilön lupaa voi olla loukkausta.

li yunkai, kiinan ensimmäisen tekoälymaalauksen tekijänoikeusjutun kantaja ja beijing tianyuan -lakitoimiston kumppani, kertoi "ai new listille":

tällä hetkellä lakejamme ei tarvitse muuttaa. koska tekoälyteknologia on vielä kehitysvaiheessa, uusia tekniikoita voidaan toistaa kahden vuoden kuluttua laki on itse asiassa siitä tuli paperinpala.

nykyiset lakimme ovat jo luoneet peruskehyksen, mikä kaipaa muokkausta, on se, miten näitä lakeja tulkitaan ja miten asiaankuuluvia oikeudellisia asenteita muotoillaan tyypillisten tapausten kautta. vasta kun tekniikka on todella kypsä, meidän tulee edistää lainsäädäntöä, joka selventää oikeuskäytännössä vahvistettuja sääntöjä.

oikeuskäytännön loukkaustapausten lisäksi tekoälyn puheloukkaukset sisältöalustoilla on laajempaa ja salaperäisempää.

tällä hetkellä tekoälytyökalujen loputon ilmaantuminen on laskenut luomisen kynnystä huomattavasti, ja aigc:stä on tullut suosittu sisällöntuotantomenetelmä pgc:n ja ugc:n jälkeen.

on hyvin yleistä käyttää tekoälyn äänikloonaustekniikkaa populaarimusiikin uudelleenluomiseen, anime- ja pelihahmojen esittämiseen tekoäly-covereihin tai kuolleiden julkkisten puhumiseen kotimaisilla ja ulkomaisilla sisältöalustoilla.

kliseelliseen fanien luomiseen verrattuna tekoälyn käyttö toissijaiseen luomiseen on laajempi käsite. faniteokset rajoittuvat yleensä faniryhmien luomuksiin, kun taas toissijaiset luomukset voivat tulla tavallisilta tekoälytekniikan harrastajilta, ja tekoälytekniikan siunauksen myötä mielikuvitukselle on enemmän tilaa sopeutumiselle ja innovaatioille.

tekoälyäänen toisen sukupolven korkealaatuiset ja määrälliset teokset eivät vain tavoita fanikuntaa hyödyntämällä alkuperäisen ip:n tai julkkisten itsensä suosiota, vaan niillä on myös mahdollisuus murtautua ympyrän läpi.

yleisesti ottaen, ottaen huomioon toisen sukupolven sisällön nykyinen määrä ja vaikutus sekä sisältöalustojen ekologia, tekijänoikeussuoja perustuu pääasiassa tekijöiden, tekijänoikeuksien omistajien tietoisuuteen ja julkiseen valvontaan.

jos alkuperäinen teos ja tekijänoikeuksien haltija eivät nosta vaatimuksia toisen sukupolven teosta vastaan, oikeudellisia ongelmia ei yleensä synny.

useimmat sisältöympäristöt sallivat myös sisällön kasvaa vapaasti asettaen samalla tiettyjä rajoituksia. liian tiukka tekijänoikeusvalvontahan väistämättä vaimentaa tekijöiden innostusta ja estää sisällön leviämisen, mikä on myös valtava menetys sisältöalustoille.

samalla kun sisältöinnovaatioita rohkaistaan, sisältöalustojen on tietysti myös parannettava vastaavia tarkistus-, merkintä- ja valvontamekanismeja.

kiinan kyberavaruushallinto julkaisi 14. syyskuuta 2024 "measures for labeling of synthetic content generated by artificial intelligence (draft for comments)", joka selvensi edelleen aigc-sisältömerkintöjen lisäämistä koskevia erityisvaatimuksia.

niiden, jotka tarjoavat editointipalveluita, jotka tuottavat puhetta, kuten syntetisoituja ihmisääniä tai jäljiteltyjä ääniä tai muuttavat merkittävästi henkilökohtaisia identiteettiominaisuuksia, tulee lisätä äänikehotteita tai äänirytmikehotteita ja muita merkkejä äänen alkuun, loppuun tai keskelle sopiviin kohtiin tai lisätä ne. vuorovaikutteiseen kohtauskäyttöliittymään näkyvät varoitusmerkit.

epäselvän ja vaikeasti määriteltävän tekijänoikeuskysymyksen lisäksi toinen kiista syntyy realistisista eettisistä ja moraalisista konflikteista.

esimerkiksi tekoälyn käyttäminen kuolleiden julkkisten äänien ja hymyjen "herättämiseen henkiin" lämmön ja muiston varjolla, katsotaan myös epäkunnioittavaksi ja vainajan liialliseksi kulutukseksi.

olipa kyseessä sisältöalustan toisen sukupolven tekoälyäänityöt tai three sheepin tekoälyn jälkiäänitys rikollinen tapaus, tekoälyn äänen kloonaustekniikkaan liittyy edelleen monia tekijänoikeuksiin, etiikkaan, tietosuojaan, laittomiin ja rikollisiin kysymyksiin liittyviä kysymyksiä, joita on vielä käsiteltävä. keskusteltu.

kirjoittaja |. tsukiyama tachibana ishize

toimittaja |. zhang jie

uutiset

tekoälyn äänikloonausyritys käytti three sheep'sin tallennustekniikkaa harjoittaakseen "itsemurhamarkkinointia"?

johdanto

yhteystietoni