tekoälykuva-arvostelu aiheuttaa kiistaa: mikki hiiri polttaa, trump suutelee, paavo pukeutuu natsien univormuun

ai-valokuva-arvostelu aiheuttaa kiistaa: mikki hiiri polttaa, trump suutelee, paavo pukeutuu natsi-univormuun

2024-09-04

zhidixi (julkinen tili: zhidxcom)

käännetty |

toimittaja |. mo ying

wall street journalin 2. syyskuuta julkaiseman raportin mukaan joitakin leikkiä ja poliittisesti harhaanjohtavia tekoälykuvia on viime aikoina levitetty sosiaalisen median alustalle "mickey holding a gun" jne., kuvan sisältö saa käyttäjät tuntemaan olonsa hämmentyneeksi ja epämukavaksi.

nämä tekoälykuvat ovat luoneet suuret tekoälymallit, kuten grok-2 ja gemini. grok-2:n kehitti xai, muskin perustama amerikkalainen tekoälyn iso malli yksisarvinen, ja gemini tuli amerikkalaiselta teknologiajättiläiseltä googlelta.

google on äskettäin parantanut tekoälykuvan tuottaman sisällön tarkistusmekanismiaan yrittääkseen välttää puolueellista, moniselitteistä, väärää, rasistista ja historiallisten tosiasioiden vastaista tekoälytulostusta.

vastauksena vastaaviin ongelmiin openai, suuri amerikkalainen tekoälymalli yksisarvinen, on kieltänyt tekoälyn käytön selkeästi suuntaavien hahmojen tuottamiseen tehostaakseen tekoälykuvan luomisen sisällön arviointia.

1. xai:n uuden sukupolven suuri malli grok-2, sallii hiljaisesti poliittisten hahmojen pilaamisen

avaa sosiaalisen median alusta kamala harris kisses.

nämä hämmentävät, epämukavat kuvat luotiin käyttämällä xai:ta ja googlen uusia generatiivisia tekoälymalleja tai -ohjelmistoja.

▲tekoälytekniikalla luodussa kuvassa trump "prinsessa halaa" harrisia selkeällä muotokuvalla (lähde: "wall street journal")

14. elokuuta xai lanseerasi seuraavan sukupolven suuren kielimallin grok-2. muutaman päivän sisällä mallin julkaisusta x-alusta oli täynnä kuvia, joiden kerrottiin luodun grok-2:lla. näissä kohtauksissa "kilpailijat" trump ja harris ovat intiimejä, kun taas mikki satumaailmassa pitelee asetta ja tupakoi. nämä generatiivisella tekoälytekniikalla tuotetut kuvat eivät ainoastaan vahingoita poliittisten hahmojen imagoa, vaan saavat myös tekijänoikeudella suojatut hahmot tekemään loukkaavia toimia. "jos disney näkisi sen, he eivät todennäköisesti nauraisi."

grok-2:n suuren kielimallin tarjoaa black forest labs, saksalainen tekoälykuvan ja -videon luontiyritys, ja se on tällä hetkellä saatavilla vain x-alustan maksullisille tilaajille.

x-alustan käytännön mukaan käyttäjiä ei saa jakaa sisältöä, joka saattaa hämmentää tai johtaa harhaan tosiasioita, olla tarkoituksellisesti väärennetty ja lopulta johtaa henkilö- tai omaisuusvahinkoon. myöhemmin samana päivänä, jona grok-2 julkaistiin, vaikka joitain laittomia tekoälykuvia ei enää voitu hakea x-alustalta, käyttäjät voivat silti käyttää grok-2:ta luodakseen uusia teoksia täynnä "pahaa makua".

musk, x-alustan varsinainen ohjain, ei kuitenkaan näytä välittävän tällaisesta poliittisesta huijauksesta. heinäkuussa hän uudelleentwiittasi väärennetyn deepfake-videon, jossa harris kutsui itseään "perimmäiseksi monimuotoisuuden palkaksi".

sisällön moderoinnin asiantuntijat sanoivat, että samanlaiset generatiiviset tekoälytyökalut voivat tuottaa vääriä tietoja yhdysvaltain vaalisyklin aikana ja jopa levitä yhteiskuntaan.

elokuun 19. päivänä, päivää ennen vuoden 2024 demokraattien kansalliskokouksen avajaisia, trump julkaisi kuvan, jonka epäiltiin olevan tekoälyn luoma. tuolloin, koska yhdysvaltain nykyinen presidentti biden oli luopunut uudelleenvalinnasta, puolueen sisäisen äänestyksen jälkeen harris, tämän tekoälykuvan päähenkilö, oli lukinnut demokraattien presidenttiehdokkuuden etukäteen.

kuvassa on kohtaus "harris pitämässä puhetta chicagossa", taustalla punainen lippu sirppi ja vasara, mikä näyttää viittaavan siihen, että harris on kommunisti, mikä laukaisee poliittista kiistaa.

2. googlen gemini-suurmalli on toistuvasti kaatunut, eikä se erottele mustaa ja valkoista herkissä elementeissä.

googlen gemini-chatbot, jonka voimanlähteenä on samanniminen suuri kielimalli gemini.

ennen kuin google julkaisi gemini-chatbotin uuden version tämän vuoden helmikuussa, google teki virheenkorjauksen gemini-mallissa, jotta se pystyi reagoimaan monimuotoisempiin hahmoihin moniselitteisemmillä ominaisuuksilla, kun se kohtaa ohjeita, jotka liittyvät merkkien luomiseen.

esimerkiksi luotaessa kuvia lääkäreistä tekoäly yleensä antaa kuvia valkoisista miehistä. google toivoo vähentävänsä tekoälykuvan luontimallien "harhaa" "diversifioinnin" avulla.

mutta kuukaudessa gemini-malli teki suuren virheen. kun tämä malli loi "rodullisesti erilaisia" kuvia, se ei vastannut uskontoa, rotua, sukupuolta jne., mikä johti useisiin ihmiskuviin, jotka eivät vastanneet historiallisia tosiasioita. saatuaan kritiikkiä suurelta joukolta nettimiehiä google päätti keskeyttää gemini-mallin kuvanluontitoiminnon, mikä jarrutti tekoälykuvan luomisen mahdollisia riskejä.

sissie hsiao, googlen varapresidentti ja gemini-chatbotin johtaja, sanoi äskettäisessä haastattelussa, että sen varmistaminen, että tekoälymalli noudattaa käyttäjän ohjeita, on periaate, jota google noudattaa. "tämä on käyttäjän gemini, ja me palvelemme käyttäjää."

siitä huolimatta jotkut gemini chatbotin avulla luoduista kuvista ovat edelleen ristiriidassa historiallisten tosiasioiden kanssa. monet x-alustan käyttäjät ottivat kuvakaappauksia kyseenalaistaen googlen mallin sisällönvalvontaominaisuudet.

mitä tulee gemini-malliin, joka tuottaa loukkaavaa ja rodullisesti puolueellista sisältöä, googlen toimitusjohtaja sundar pichai vastasi, että "tätä ei voida hyväksyä" ja yritys "käsittelee tämän ongelman kokonaisvaltaisesti".

google on kuitenkin viime aikoina jälleen suututtanut käyttäjiä tekoälytekniikalla luotujen kuvien löyheän sisällön vuoksi.

elokuun puolivälissä lanseerattiin googlen uusimman sukupolven älypuhelimet, pixel 9 -sarja. pixel 9 -sarja esittelee ai-valokuvien muokkaustyökalun nimeltä "reimagine", joten käyttäjät voivat soittaa tekoälylle muokatakseen kuvien sisältöä kirjoittamalla tekstikehotteita.

jotkut käyttäjät kuitenkin huomasivat, että reimaginen avulla käyttäjät voivat lisätä joitain laittomia elementtejä, kuten "käyttää" natsisymboleja paavolle. tämä sisällön suojausvirhe aiheutti käyttäjissä inhoa.

googlen tiedottaja sanoi, että yritys "vahvistaa ja parantaa jatkuvasti olemassa olevia tekoälymallien suojauksia".

google paljasti tämän vuoden elokuun lopussa, että sen ai-chatbot gemini käynnistää uudelleen hahmokuvan luontitoiminnon. tämä toiminto on aluksi vain englanninkielisten käyttäjien käytettävissä, joilla on maksullinen tilaus. samaan aikaan google on saavuttanut "merkittävää edistystä" tekoälykuvan luomisessa ja tarkistamisessa, mutta on "mahdotonta, että jokainen geminin luoma kuva on tarkka".

3. tekoälyn luomien kuvien eettiset ja oikeudelliset rajat on määritettävä alan vertailuarvoina

tällä hetkellä tekoälykuvan luontiohjelmisto jatkaa sosiaalisen median alustakäytäntöjen alimman rivin testaamista. tämä ilmiö on herättänyt keskustelua ja pohdintaa, kuten siitä, pitäisikö teknologiayritysten valvoa ja miten tarkastaa sisällön tuotto huippuluokan ai-kuvantuotantoohjelmistolla?

ennen kuin generatiivinen tekoälyteknologia avataan nettilaisten käyttöön ilmaista luomista varten, tekoälykuvan luontiohjelmisto on varustettu tehokkailla turvatoimilla varmistaakseen, että tekoälyn tuottamat teokset eivät riko sääntöjä tai eettisiä periaatteita. tämä on paine, jota teknologiayritykset kohtaavat valvoessaan tekoälysisältöä.

eettisten dilemmojen lisäksi tekoälymallien ja -ohjelmistojen kehittäjät kohtaavat myös monia mahdollisia juridisia vastuita. tämä johtuu siitä, että heidän tekoälymallien ja -ohjelmistojen harjoittamiseen käyttämä koulutustieto rikkoo immateriaalioikeuksia ja muita oikeuksia.

väitetyn loukkauksen vuoksi taiteilijat käynnistivät ryhmäkanteen tekoälykuvastartuppeja stability ai ja midjourney vastaan vuonna 2023. ryhmäkanne kohdistuu myös joukkoon yrityksiä, joilla on tekoälykuvan luontimalleja, kuten deviantart ja runway.

lisäksi taiteilijoiden ryhmäkanteen lisäksi stability ai:tä vastaan on nostettu myös amerikkalainen visuaalisen median yritys getty images. jälkimmäinen syytti stability ai:tä sen oikeuksien loukkaamisesta kouluttaa malleja. vastauksena getty imagesin tiedottaja sanoi, että yritys on nyt julkaissut oman tekoälykuvan generointimallin.

openai julkaisi tekoälykuvan sukupolven mallin dall-e vuonna 2022. saatuaan taiteilijoiden ryhmäkanneoikeuden viime vuonna openai lisäsi dall-e-mallin käyttöliittymään uuden vaihtoehdon, jonka avulla tekijät voivat tarkistaa vaihtoehdon ladata kuvia henkilökohtaisesti, jotta niitä ei käytetä seuraavan sukupolven dall-e-mallin koulutukseen.

news corp, the wall street journalin emoyhtiö, on allekirjoittanut sisällön lisenssisopimuksen openai:n kanssa. tämän ansiosta openai voi vapaasti käyttää ja kerätä news corpin olemassa olevia mediaresursseja tietyissä rajoissa.

"me selvitämme tämän lopulta." immateriaalioikeuslakimies geoffrey lottenberg sanoi, että tämäntyyppiset tekoälyn tekijänoikeuksiin liittyvät oikeudelliset kiistat voivat muodostaa ennakkotapauksen tekoälyn oikeudellisille rajoituksille. sitten muilla tekoälyyrityksillä on viitestandardi sille, mitä kuvia, videoita ja muuta dataa he voivat käyttää mallejaan ja chatbottejaan harjoittaessaan.

johtopäätös: google ja openai korjaavat aktiivisesti virheitä, kun taas xai tekee päinvastoin.

tekoälykuvan luontiohjelmiston kyky luoda kuvia tietyistä, tunnetuista hahmoista on yksi tärkeimmistä ristiriitakohdista tällä ai-sisällönarviointikiistalla.

monet teknologiayritykset, kuten google ja openai, ovat kieltäneet tekoälykuvan luontiohjelmiston käytön sellaisten tekoälyteosten luomiseen, jotka sisältävät tiettyjä merkkejä ja joiden hahmot ovat helposti tunnistettavissa.

koska xai:n perustaja musk vaati sananvapautta, xai:n grok-2 suuri malli päätti säilyttää tiettyjen ihmisten ja roolien kuvanmuodostustoiminnon. muutos johti kuitenkin siihen, että teknologia-alan vahtikoirat kritisoivat xai:ta.

professori sarah t. roberts kalifornian yliopistosta los angelesista on sitoutunut sisällön moderointitutkimukseen. hän uskoo, että käyttäjät käyttävät huippuluokan tekoälyteknologiaa videoiden, äänien, valokuvien jne. syväväärennösten levittämiseen väärän tiedon levittämiseksi.

roberts lisäsi, että kaikki perinteisen sosiaalisen median ongelmat on edelleen kohdattava generatiivisen tekoälyn avulla, ja se on vaikeampi havaita. erityisesti visuaalinen sisältö, kuten tekoälytekniikalla luodut kuvat, on toisinaan vakuuttavampi.

pennsylvanian yliopiston professori pinar yildirim sanoi, että alustat yrittävät asettaa joitain sääntöjä, kuten kieltää avainsanat, estääkseen tekoälytekniikan väärinkäytön. mutta samaan aikaan käyttäjät voivat myös löytää tietoturva-aukkoja ja ohittaa nämä säännöt saadakseen haluamansa sisällön. "käyttäjistä tulee älykkäämpiä ja he voivat lopulta hyödyntää porsaanreikiä luodakseen laitonta sisältöä", yildirim sanoi.

lähde: "wall street journal"

uutiset

ai-valokuva-arvostelu aiheuttaa kiistaa: mikki hiiri polttaa, trump suutelee, paavo pukeutuu natsi-univormuun

1. xai:n uuden sukupolven suuri malli grok-2, sallii hiljaisesti poliittisten hahmojen pilaamisen

2. googlen gemini-suurmalli on toistuvasti kaatunut, eikä se erottele mustaa ja valkoista herkissä elementeissä.

3. tekoälyn luomien kuvien eettiset ja oikeudelliset rajat on määritettävä alan vertailuarvoina

johtopäätös: google ja openai korjaavat aktiivisesti virheitä, kun taas xai tekee päinvastoin.

johdanto

yhteystietoni