uutiset

Jos tekoälytiedot eivät riitä, voimmeko käyttää papereita "korjaamaan"?

2024-08-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

elokuun 14
Naturen virallinen verkkosivusto julkaisi artikkelin siitä
Useat akateemiset kustantajat investoivat teknologiayrityksiin
Tutkimuskirjojen käyttöoikeuksien myynti
Käytetään AI-mallien kouluttamiseen
Monissa tapauksissa nämä liiketoimet
Kirjoittajaa ei kuultu
Tämä aiheutti joissakin tutkijoissa voimakasta tyytymättömyyttä.
Paperit, jotka "petettiin"
Luonnon mittakaava
brittiläiset akateemiset kustantajat
Taylor Francis
Hän on jo allekirjoittanut sopimuksen Microsoftin kanssa
Sopimus arvoltaan 10 miljoonaa dollaria
Anna Microsoftin käyttää tietojaan
parantaa tekoälyjärjestelmiä
Kesäkuussa oli uutinen, että
Amerikkalainen kustantaja Wiley
Anna yrityksen käyttää sisältöä mallien kouluttamiseen
ansaitsi siten 23 miljoonaa dollaria
Luonnon mittakaava
Nämä paperit kattavat
Luonnontieteet, yhteiskuntatieteet ja muut alat
Siitä on tullut tärkeä korpus tekoälymallikoulutukselle.
Maalausrobotti esitteli maalausta 2024 "Artificial Intelligence for Humanity Global Summit" -tapahtumassa Genevessä, Sveitsissä.
Lähde: Xinhua News Agency
Luontoartikkeli ajattelee
Nykyiset akateemisten julkaisujen kirjoittajat
Kun kohtaat kustantajia, jotka myyvät tekijänoikeudella suojattuja teoksiaan
ei juuri mitään oikeutta puuttua
Julkaistuille artikkeleille
Ei ole olemassa mekanismia näiden sisällön vahvistamiseksi
Käytetäänkö sitä tekoälyn harjoitustietona
Suurten kielimallien käytössä
Kuinka luoda oikeudenmukaisempi mekanismi
Suojella tekijöiden oikeuksia
Laajan keskustelun arvoinen korkeakouluissa ja tekijänoikeuspiireissä
Ei tarpeeksi AI-dataa
Paperit "meikkaamiseen"
Kolme pääelementtiä tekoälyn suurten mallien kehittämiseen
Se on dataa, algoritmeja ja laskentatehoa
Tekoälytekniikan nopean kehityksen myötä
Harjoittelutietojen kasvava kysyntä
Jotkut tiedotusvälineet sanoivat
vuoden 2021 lopussa
OpenAI koulutus GPT-4
kohtasi vaikean ongelman
Sen koulutus on loppunut Internetiin
Luotettava englanninkielinen tekstilähde
sitten
Tämän ongelman ratkaisemiseksi
OpenAI käyttää videota ja ääntä Youtube-alustalta
Literoi suuria määriä keskustelutekstiä
Treenit sen jälkeen
Heinäkuun 2. päivänä henkilöstö kommunikoi digitaalisten ihmisten kanssa digitaalitalouden mukaansatempaavan kokemuksen alueella 2024 Global Digital Economy -konferenssissa.
Kuva: Xinhua News Agency -toimittaja Ren Chao
nyt
Tekniikan jättiläiset siirtävät huomionsa
akateeminen kustantaja
akateemiset paperit as
Viisauden kiteytyminen tieteellisen tutkimuksen alalla
Ryhdy "kuumaksi kakuksi", jota ihmiset kiirehtivät ostamaan.
Otetaan esimerkiksi luonnollisen kielen käsittely
Useiden papereiden koulutuksen kautta
AI-mallit voivat ymmärtää paremmin
akateemisen alan tietämys
parantaa sen tarkkuutta
Teknologiajätit, kuten Google ja Microsoft
Olemme investoineet voimakkaasti korpujen hankintaan
Kilpailuedun saamiseksi tekoälyn alalla
Financial Times on laittanut oman sisällönsä
kohtuulliseen hintaan
Myydään OpenAI:lle
Sosiaalinen uutissivusto Reddit
Myös Googlen kanssa tehtiin vastaava sopimus
Nämä liiketoimet heijastavat
Julkaisijat yrittävät valtuuttaa laillisesti
Vältä sitä, että tekoälymallit indeksoivat sisältöäsi ilmaiseksi
Harjoitteludatan dilemma
Kuinka katkaista peli
Työskentele julkaisijoiden kanssa
Vain teknologiayritykset ratkaisevat sen
Riittämättömien harjoitustietojen ongelman ruumiillistuma
Äskettäin
The Economist -lehti julkaisee artikkelin
"Tekoälyyritykset käyttävät pian suurimman osan Internet-tiedoista"
Ennusta, mitä Internetistä on saatavilla
Ihmistekstidata loppuu neljässä vuodessa
Huhtikuun 23. päivänä Hannoverin teollisuusmessuilla Saksassa kävijät pelasivat "kivi, paperi, sakset" -peliä älykkäällä robotilla.
Kuva: Xinhua News Agency -toimittaja Ren Pengfei
Tällaisen ongelman edessä
OpenAI:n perustaja ja toimitusjohtaja Sam Altman
Kiertotapaa on ehdotettu:
Yritykset, kuten OpenAI
Lopulta siirrytään tekoälyn tuottaman tiedon käyttöön
(tunnetaan myös synteettisenä datana) tekoälyn kouluttamiseen
Kehittäjät luovat yhä tehokkaampia teknologioita samalla
Se vähentäisi myös riippuvuutta tekijänoikeudella suojattuun tietoon
varmasti
Onko tämä tekninen tie toteutettavissa?
Kiistaa on edelleen
Nature-lehden kansiartikkeli väitti tämän
Jos suuri malli on sallittu
Harjoittele itseäsi automaattisesti luotujen tietojen avulla
AI voi heikentää itseään
Alkuperäinen sisältö muutamassa sukupolvessa
Iteroitu korvaamattomaksi hölynpölyksi
Synteettisten datamenetelmien lisäksi
Julkisten tietojen avoin jakaminen edelleen
pidetään myös tehokkaana tienä
Industrial Securities -raportti huomautti tämän
Julkisen tiedon avoimen kehittämisen vahvistaminen
on nykyinen ratkaisu tiedon hajauttamiseen
Tärkeitä toimenpiteitä harjoitustietojen laadun parantamiseksi
Kirjoittaja:Li Fei, Ma Jingyuan ladonta:Li Wenjian Koordinaattori:Li Zhengwei
Viite 丨Nature, The Paper, Financial Associated Press, 21st Century Business Herald
Tuottaja: Guangming.com
Lähde: World Internet Conference
Raportti/palaute