uutiset

mitä tehdä, jos ihmisiltä loppuvat tiedot? fudanin yliopiston professori xiao yanghua ehdotti kahta ratkaisua:

2024-09-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

red star capital bureau raportoi 7. syyskuuta, että big datan aikakaudella datan arvoa ei ole vielä täysin tutkittu. kun tekoälyn aikakausi saapuu, data joutuu kuluttamaan liian nopeasti, mikä tekee synteettisestä tietotekniikka kuuma kenttä. tutkimusorganisaation epoch ai:n kesäkuussa julkaiseman raportin mukaan ihmisten tuottaman uuden datan määrä on vuodesta 2026 alkaen pienempi kuin mallien oppiman uuden tiedon määrä. on arvioitu, että suurista kielimalleista loppuu ihmisestä tiedot vuoteen 2028 mennessä.
data määrää älykkyyden ylärajan jossain määrin, mikä tekee mitä enemmän läpimurtoja suurissa mallitekniikoissa, sitä enemmän tietotekniikkaa on "linjattava" sen kanssa.
vuoden 2024 bund-konferenssin aikana xiao yanghua, fudanin yliopiston professori ja shanghai key laboratory of data science -laboratorion johtaja, sanoi haastattelussa red star capital bureaulle ja muille tiedotusvälineille, että tietojen ehtymisen ongelman ratkaisemiseksi voi olla kaksi tietä. tulevaisuudessa. ensimmäinen on synteettistä dataa, ja toinen menee yksityiseen verkkotunnukseen.
xiao yanghua
"monet ihmiset ovat kommentoineet neljää kirjaa ja viittä klassikkoa. annotointiprosessi on kuin tietojen synteesiprosessi. voimme jatkuvasti ajatella, korreloida ja integroida alkuperäisiä tietoja tuottaaksemme lisää tietoa. tämä on synteettistä dataa." , synteettinen data on erittäin tärkeä idea. tietojen ehtymisen ongelman lievittämisen lisäksi sillä on myös erittäin tärkeä merkitys.
”suurin osa syntetisoidusta datasta on ajatteluprosessimme dataa. synteettisten tietojen avulla ilmaistaan ​​suuri määrä implisiittistä, kirjaamatonta ja ajatteluun keskittyvää dataa suurten mallien kyky.
xiao yanghua mainitsi, että nykyisessä suuressa mallissamme on "vain älykkyyttä eikä rationaalisuutta". se vain muistaa enemmän faktoja, mutta se ei tarkoita, että se olisi "älykkäämpi" eikä sen rationaalinen kyky ole lisääntynyt. synteettinen data on erittäin tärkeä idea rationaalisen kyvyn parantamiseksi.
"käytä ajatteluprosessia simuloivaa synteettistä dataa suuren mallin kouluttamiseen niin, että se osaa ajatella ongelmia. siksi synteettisellä datalla ei ole tarkoitus pelkästään lievittää datan "nälänhätää", vaan myös parantaa suuren mallin rationaalista kykyä. ."
toinen xiao yanghuan mainitsema erittäin tärkeä idea on siirtyä yksityiseen verkkotunnukseen. "enemmän korkealaatuista, arvokasta dataa on yksityisellä alalla, vertikaalisilla toimialoilla, tuhansilla toimialoilla, ja vielä jäljempänä on henkilötietoja. yksityisellä verkkotunnuksella ja yksilöillä on siis edelleen paljon arvokasta, erittäin alkuperäistä ja mutta emme ole aktivoineet tätä tietoa emmekä ole vielä lisänneet sitä suureen malliin asia tulevaisuudessa."
xiao yanghua sanoi, että kaikki yksityisen verkkotunnuksen tiedot ovat tietokantajärjestelmissä. nämä tietokannat sisältävät suuren määrän korkealaatuista yksityistä verkkotunnusta ja teollisuuden tietoja eri muodoissa. jos voit käyttää yksityisen verkkotunnuksen dataa suurten mallien kouluttamiseen, on mahdollista tehdä suurista malleista alan asiantuntijoita.
"nykypäivän suurilla malleilla on vain yleistietoa, eivätkä ne ole päteviä ammattitehtäviin. tämän saavuttamiseksi yksityisen verkkotunnuksen datan hyvä hyödyntäminen voi olla avainasemassa, joten hyödynnettävän tiedon potentiaali on edelleen erittäin suuri."
xiao yanghua odotti myös "henkilötietoja" hän huomautti, että henkilötietojen käyttö suurten mallien kouluttamiseen on juuri alkanut. hän uskoo, että seuraava askel on yhdistää henkilötiedot suuriin malleihin. tulevaisuudessa on kuitenkin vielä paljon potentiaalia yhdistää henkilötiedot suuriin malleihin ja muuttaa niistä "personoituja suuria malleja" palvelemaan yksilöitä on vielä paljon potentiaalia.
red star news -toimittaja wang tian
toimittaja deng lingyao
(lataa red star news ja lähetä raportit voittaaksesi palkintoja!)
raportti/palaute