tutkimus: tekoälyn luoman sisällön toistuva käyttö tekoälyn harjoittamiseen voi aiheuttaa "mallin romahtamisen"

2024-09-05

it house news 5. syyskuuta. syyskuun 4. päivänä paikallista aikaa forbesin mukaan tohtori ilja shumelov oxfordin yliopistosta ja hänen tiiminsä havaitsivat, että kun generatiivinen tekoälyohjelmisto luottaa vain sisältöön, vastausten laatu alkaa heikentyä. tutkimus on julkaistu nature-lehdessä.

kahden ensimmäisen kyselyn jälkeen vastaukset poikkesivat vähitellen tarkkuudesta, viidennellä kyselyllä laatu heikkeni merkittävästi ja yhdeksännellä peräkkäisellä kyselyllä vastaukset olivat muuttuneet täysin merkityksettömäksi hölynpölyksi. tutkijat kutsuvat tätä generatiivisen tekoälysisällön syklistä liikakäyttöä "mallin romahtamiseksi", jossa tekoälyn tulos poikkeaa vähitellen todellisuudesta ja muuttuu lopulta arvottomaksi, kun se on jatkuvasti saastuttanut oman harjoitussarjansa.

"on yllättävää, kuinka nopeasti ja huomaamattomasti mallin romahtaminen tapahtuu", shumelov sanoi. "aluksi se vaikuttaa pieneen määrään dataa - niihin, jotka ovat aliedustettuina. sitten se vaikuttaa tulosten monimuotoisuuteen, mikä vähentää vaihtelua. joskus huomaat. pieniä parannuksia suurimmassa osassa dataa, mutta tämä parannus peittää mallin suorituskyvyn heikkenemisen pienessä osassa dataa."

tutkijat tunnistivat "mallin romahtamisen" käyttämällä esikoulutettua tekoälyllä toimivaa wikipediaa ja antamalla tekoälymallin päivittää sen luoman sisällön perusteella. saastuneen datan vaikutus aiheuttaa vähitellen alkuperäisen harjoitussarjan kulumisen, ja tulosinformaatiosta tulee vaikea ymmärtää. esimerkiksi yhdeksännen hakukierroksen jälkeen tutkittava wikipedia-artikkeli muuttui koomisesti jostain 1300-luvun englantilaisesta kirkontornista paperiksi erivärisiä bobtail-kaneja.

raporttien mukaan amazon web services -tiimin kesäkuussa julkaiseman toisen tutkimuksen mukaan noin 57 % verkkotekstistä on käännetty tekoälyalgoritmeilla. jos ihmisen luoma tieto internetissä korvautuu nopeasti tekoälysuodatetulla sisällöllä ja jos shumeilovin tutkimustulokset pitävät paikkansa, tekoäly voi olla "itsetuhoista" - ja samalla tuhota internetiä.

tutkimuksessa todettiin, että ainoa tapa saavuttaa tekoälyn pitkän aikavälin kestävä kehitys on varmistaa, että sillä on pääsy olemassa olevaan ei-ai-tuottuun sisältöön ja että se jatkaa uuden ihmisen luoman sisällön käyttöönottoa.

uutiset

tutkimus: tekoälyn luoman sisällön toistuva käyttö tekoälyn harjoittamiseen voi aiheuttaa "mallin romahtamisen"

johdanto

yhteystietoni