uutiset

Vierailu Pekingin New Productivity·Out of the Laboratory|Näkymätön suuri malli, näkyvä tuottavuus

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Vuonna 2017 tekoäly sisällytettiin Kiinan hallituksen työraporttiin ensimmäistä kertaa ja siitä tuli kansallinen strategia. Vuonna 2018 Beijing Zhiyuan Artificial Intelligence Research Institute (jäljempänä "Zhiyuan") syntyi pienessä toimistossa johtavassa asemassa. innovaatiotila. OpenAI:n lanseeraama ensimmäisen sukupolven GPT-malli ei ollut tuolloin vielä saanut mediaotsikoita.

Vuonna 2023 Zhiyuan päivitti maani ensimmäisen erittäin suuren mittakaavan älykkään mallin "Wudao" versioon 3.0, ja siitä tuli Microsoftin presidentin Brad Smithin mielestä yksi maailman kolmesta huippuluokan tekoälylaitoksesta. Suurten mallien alalla Zhiyuan on ainoa ei-yritystutkimuslaitos maailmassa, jolla ei ole suurta valmistajaa. Se on myös ensimmäinen uusi tutkimuslaitos Kiinassa, joka suunnittelee järjestelmällisesti laajan malliteknologian tutkimus- ja kehitystyötä ekologinen rakentaminen, lahjakkuuksien koulutus ja yritysviljely.

"Tieteessä ja teknologiassa yhtäläiset oikeudet ovat aina synnyttäneet suuria teollisia mahdollisuuksia menneisyydessä." . Maan tekoälyn määritelmä on myös tarkempi: tekoäly on tärkeä moottori uusien tuotantovoimien kehittämisessä.


Työskentele lujasti pysyäksesi myrskyn edellä

Kerran tai kahdesti Kuun Dark Side of the Moonin toimitusjohtaja Yang Zhilin oli osallistujien ympäröimä vähintään kolme kertaa vuoden 2024 Pekingin Zhiyuan-konferenssissa. Kun OpenAI:n perustaja Sam Altman piti videopuheen Zhiyuanin konferenssissa vuosi sitten, levottomuus oli yhtä ilmeinen. .

Vuodesta 2023 vuoteen 2024 tekoälytutkijat, suurten teknologiayritysten toimitusjohtajat ja start-up-yritysten perustajat kokoontuvat eri paikkoihin saarnaamaan suurista malleista, olivatpa he teknisiä asiantuntijoita tai eivät, kaikki näyttämöllä olevat ovat enemmän tai vähemmän kuulleet nimi Zhiyuan Monet heistä olivat suoraan mukana Zhiyuanin laajamittaisissa mallitutkimusprojekteissa. Baidu CTO Wang Haifeng toimi aikoinaan Zhiyuanin johtajana, Tang Jie, Zhipu AI:n perustaja, toimi Zhiyuanin varapuheenjohtajana ja Yang Zhilin osallistui Wu Daon tutkimukseen ja kehittämiseen.

Nämä tekoälyn suunnannäyttäjät eivät olleet tekemisissä Zhiyuanin kanssa juuri nyt, eivätkä Zhiyuan ryhtynyt suuriin malleihin vasta sen jälkeen, kun niistä tuli suosittuja.

Vuonna 2019 Zhiyuan aloitti suurten mallien suunnittelun Vuonna 2020 se perusti Wudao-tutkimusryhmän ja aloitti laajan mallitutkimuksen ja -kehityksen. Maaliskuussa 2021 lanseerattiin ensimmäisen kerran Wu Dao 1.0 -malli, ja kesäkuussa Wisdom käytti 1,75 biljoonaa parametria luodakseen ennätyksen "maailman suurimmalle" suurelle mallille. Se oli OpenAI:n edistynein suuri malli GPT-3 tuolloin 10 kertaa parametrien lukumäärä.

Tieteellinen tutkimus kiinnittää huomiota somatosensoriseen, kysymysten ja arvioiden tekemiseen. Tuomio, jonka mukaan "suurten tekoälymallien aikakausi on tulossa", antoi Zhiyuanille varauksetonta rohkeutta. Zhiyuan ehdotti ensimmäisenä myös kiinalaista termiä "iso malli".

Mikä on iso malli? Zhiyuanin tutkimusinstituutin puheenjohtaja Huang Tiejun uskoo, että kolmen edellytyksen on täytyttävä: suuren mittakaavan, yli kymmeniä miljardeja nousevia parametreja, jotka pystyvät tuottamaan odottamattomia uusia ominaisuuksia, jotka eivät rajoitu erityisongelmiin tai -aloihin; Paljon erilaisia ​​tehtäviä.

Vuonna 2023 suuret mallit tulevat julkisuuteen. Wudao-sarjan mallit on päivitetty versioon 3.0, ja ne kattavat suuret perusmallit, kuten kieli-, visio- ja multimodaalisuus, ja ovat täysin avoimen lähdekoodin. Tuolloin Stanfordin yliopiston perusmalleista käydyssä keskustelussa Intelligent Source sijoittui teknologiajättiläisten, kuten Googlen, Microsoftin ja Facebookin (nykyisin Meta) rinnalle ja nousi suuren mallitutkimuksen edustajaksi maailmassa.

"Useimpien tutkimustulosten syntyminen historiassa oli sattumaa, eikä sitä kukaan osannut suunnitella. Kaikki pyrkimykset on parantaa todennäköisyyttä - tuoda yhteen huippututkijat ja tarjota heille yhteisöllinen ympäristö, jossa he voivat törmätä ideoita, löytää ongelmia ja löytää yhteistyökumppaneita "Zhang Hongjiangin, Zhiyuan Research Instituten perustajan puheenjohtajan, esipuhe Turing-palkinnon voittajan Yann LeCunin omaelämäkerralle on enemmän kuin syy, miksi Zhiyuan tuli ensimmäiseksi.

Tee järjestelmäsuunnittelua

Vuoden 2018 alussa Peking julkaisi "Pekingin täytäntöönpanotoimenpiteet uusien maailmanluokan tutkimus- ja kehitysinstituutioiden rakentamisen tukemiseksi" toteuttaakseen edistyksellisen tiede- ja teknologiajärjestelmän uudistuksen. Joulukuussa Zhiyuan perustettiin virallisesti tiede- ja teknologiaministeriön sekä Pekingin kaupunginpuolueen komitean ja hallituksen ohjauksella ja tuella.

Aiemmin tieteellisen tutkimuksen johtamisprosessi oli monimutkainen ja pitkiä jaksoja hanke-ehdotuksesta oppaan julkistamisesta rahoitushakemukseen ja tarkastukseen, mikä vaikeutti sopeutumista jatkuvasti muuttuviin tieteellisen tutkimuksen tarpeisiin kovassa kilpailussa. Tämän järjestelmän mukaan tutkimuslaitos teki hanke-ehdotukset lokakuussa 2020, ja laajamittaista mallitutkimusta voidaan aloittaa virallisesti aikaisintaan vuonna 2022. Zhiyuan-mallilla kesti alle 5 kuukautta projektin perustamisesta suurten mallien lanseeraukseen.

Tämä on uudenlainen tutkimus- ja kehitysinstituutio yliopistojen ja yritysten välillä. Xin Zai ei käytä papereita lopullisena arviointiindeksinä, eikä se käytä tuotteita arviointiindeksinä, vaan innovatiivisten järjestelmien rakentamiseen Xin Zai kokoaa yhteen tutkijoita eri instituutioista ja yrityksistä, kuten Tsinghuan yliopistosta, Pekingin yliopistosta, Facebookin tekoälylaboratoriosta, Baidu jne. Suuria asioita on tavoitella suuria ongelmia, pitää silmällä suuria tieteellisiä kysymyksiä ja tehdä tulevaisuuteen suuntautuvia suunnitelmia.

"Yliopistomalli on toiminut vuosikymmeniä, ja systemaattista T&K-toimintaa on vaikea tehdä organisoidusti, laajamittaisesti ja tiimien välisenä. Yrityksetkin panostavat t&k-toimintaan, mutta ne ovat enemmän taipuvaisia ​​tiiviiseen t&k-toimintaan. Liiketoimintaan liittyvä Zhiyuan tekee tutkimusprojektin, joka kestää viisi vuotta tai enemmän, ennen kuin tulokset näkyvät", Wang Zhongyuan sanoi eksklusiivisessa haastattelussa Beijing Business Daily -lehden toimittajalle.

Tällä hetkellä Zhiyuanin luottamus perustuu edelleen maan päättäväisyyteen tekoälyn suhteen. Maaliskuussa 2024 Li Qiang, CPC:n keskuskomitean poliittisen toimiston pysyvän komitean jäsen ja valtioneuvoston pääministeri, teki selväksi Pekingissä tehdyn tutkimuksen aikana: tekoäly on tärkeä moottori uusien tuotantovoimien kehittämisessä. .

Uusi laadukas tuottavuus on edistynyt tuottavuuslaatu, joka on johtavassa roolissa innovaatioissa, irtaantuu perinteisestä talouskasvusta ja tuottavuuden kehityspolusta, jolla on korkean teknologian, korkean tehokkuuden ja korkean laadun ominaisuuksia ja joka vastaa uutta kehityskonseptia. Se syntyi vallankumouksellisista teknologisista läpimurroista, innovatiivisesta tuotantotekijöiden allokoinnista sekä syvällisestä teollisesta muutoksesta ja parantamisesta. "Tieteessä ja teknologiassa yhtäläiset oikeudet ovat luoneet suuria teollisia mahdollisuuksia joka kerta menneisyydessä, ja suuret mallit voivat tuoda uutta tasa-arvoa tieteeseen ja teknologiaan", Wang Zhongyuan uskoo vakaasti.

Esimerkiksi suuret mallit ovat "älyn kantajia", tekoälyyn keskittyvä aalto on tiedustelutoimintaa, alin kerros on tekniset ohjelmistot ja laitteistojärjestelmät, ylin kerros on tekoälysovellukset ja suuret mallit ovat näiden kahden keskellä, "rungon" roolissa. Suuren mallin merkitys on muuttaa "älykkyys" julkisiksi palveluiksi, kuten vesi, sähkö ja Internet, ja tarjota tekoälypalveluita suurelle joukolle yrityksiä tai yksityishenkilöitä pilvipalvelun kautta.

Tämä on systemaattinen projekti "Se vaatii keskitettyä resurssien ja työvoiman investointeja. Sitä ei voi tehdä moni, mutta jokainen tekee sen erikseen, mutta Huang Tiejun antoi esimerkin: "Tekoälyn kehittäminen on Kuten teräksen valmistus ja sähköntuotanto, tarvitaan täydellinen sarja teknisiä järjestelmiä, jotta voidaan varmistaa korkealaatuisen teräksen tuotanto ja vakaa sähköntuotanto suhteellisen alhaisin kustannuksin", Huang Tiejun sanoi.

Mene alaa pidemmälle

Zhiyuanin rakentama tekninen järjestelmä sisältää: suuren malliperheen kauhan, suuren mallin käyttöjärjestelmän, tietojoukon, koulutuskehyksen, operaattorikirjaston jne. Nämä saavutukset ja Chi Yuanin visio ja tavoitteet on ripustettu seinälle Chi Yuan Buildingin ensimmäisessä kerroksessa.

Visio ja tavoitteet on jaettu viiteen pääsektoriin, mukaan lukien mekanismit ja teollinen kehitys, jotka voidaan tiivistää innovaatioksi. "Zhiyuan haluaa kehittää huippuluokan tekoälyteknologiaa, johtaa ja ennustaa tekoälyn kehitystä ja mennä alaa pidemmälle, Wang Zhongyuan selittää yksityiskohtaisesti: "Zhiyuan tekee asioita, joita yliopistot eivät voi tehdä ja joita yritykset eivät halua." tehdä tutkimusta ja kehitystä, tutkimusprojekteja, jotka kestävät 3–5 vuotta tai jopa kauemmin.

Hänen mukaansa suurten mallien tekniset ominaisuudet saavuttavat tietyn tason. "Yksi suunta on integroituminen tuotteisiin, sovellusten edistäminen ja kaupallisen arvon tuottaminen. Toisaalta niitä on vähän. instituutioista, jotka jatkavat suurten mallien iterointia ja optimointia, olivatpa yritykset tai tutkimuslaitokset, niiden tulisi jatkaa keskeisten teknologioiden käyttöä."

Esimerkiksi multimodaalisissa yrityksissä useimmat kotimaiset yritykset valitsevat tutkimukseen ja kehitykseen DiT-arkkitehtuurin. "Tämä johtuu siitä, että DiT on todistettu reitti. Zhiyuan toivoo voivansa yhdistää erilaisia ​​​​informaatiomuotoja, kuten tekstiä, kuvia, videoita ja ääniä, yhdeksi harjoitusmalliksi alusta alkaen. "Tämä Tämä multimodaalinen suuri malli voi nähdä, ymmärtää ja järkeillä maailmaa. Tulevaisuudessa suuret mallit yhdistettynä laitteistoon eli ruumiillistuneeseen älykkyyteen voivat tulla fyysiseen maailmaan palvelemaan ihmisiä."

Yritykset pysyvät lähellä markkinoita ja etsivät skenaarioita ylöspäin, kun taas T&K-laitokset keskittyvät ydinteknologian läpimurtoihin ja tarjoavat alaspäin suuntautuvaa tukea. Wisdom Source kuuluu toiseen tyyppiin, joka on kaukana sovelluksista ja skenaarioista, mutta käyttää avointa lähdekoodia tukena. teollisuus.

"Tekoäly ei ole sama asia kuin suuret mallit, se on vain tekoälyn genre", Wang Zhongyuan selitti Beijing Business Daily -toimittajalle. Nykypäivän älykäs lähde käyttää myös muita tekoälytekniikoita, kuten aivojen kaltaista tutkimusta ja digitaalista sydäntä, mikä tarkoittaa, että tekoälyn mielikuvitukselle ei ole ylärajaa muilla aloilla.

Beijing Business Daily -toimittaja Wei Wei