robin lin sisäinen puhe paljastui: kun keskustellaan kolmesta suuresta kognitiivisesta väärinkäsityksestä suurissa malleissa, mallien välinen kuilu kasvaa tulevaisuudessa

2024-09-16

"ulkomaailmalla on melko paljon väärinkäsityksiä suurista malleista", viimeaikaisten tiedotusvälineiden mukaan robin li paljastettiin sisäinen puhe. äskettäisessä viestinnässä työntekijöiden kanssa robin li puhui kolmesta väärinkäsityksestä suurissa malleissa, jotka kattavat suuren mallikilpailun, avoimen lähdekoodin mallien tehokkuuden ja älykkään agentinsuuntausodota kuumia aiheita.

robin li sanoi, että kuilu suurten mallien välillä voi kasvaa ja kasvaa tulevaisuudessa. hän sanoi, että suurten mallien katto on erittäin korkea, ja se on vielä kaukana ihanteellisesta tilanteesta. siksi mallin on jatkettava nopeaa iterointia, päivitystä ja päivitystä, jotta se pystyisi investoimaan jatkuvasti useita vuosia tai yli kymmenen vuotta täyttämään jatkuvasti käyttäjien tarpeita ja vähentämään kustannuksia.

seuraavassa on sisäisen puheen sisältö

kysymys: jotkut ihmiset ajattelevat, että suurten mallien ominaisuuksien välillä ei ole esteitä?

robin li:en ole samaa mieltä tästä lausunnosta. uskon, että ulkomaailmalla on aika paljon väärinkäsityksiä suurista malleista joka kerta kun uusi malli julkaistaan, he haluavat ehdottomasti sanoa, kuinka hyvä se on, ja seurata sitä joka kerta.vertailun vuoksi gpt-4o:han otan testisarjoja tai teen joitain listoja ja sanon, että pistemääräni on melkein sama kuin se tai jopa ylittää sen joissakin yksittäisissä kohteissa, mutta tämä ei todista, että nämä äskettäin julkaistut mallit olisivat edistyneimmät. openal:lla verrattuna malliin ei ole niin suurta eroa.

mallien välinen kuilu on moniulotteinen. yksi ulottuvuus on kyky, olipa se sitten ero peruskyvyissä, kuten ymmärryskyky, sukupolvikyky, looginen päättelykyky tai muistikyky.，jos haluat saada tämän kyvyn tai vastata näihin kysymyksiin, kuinka paljon se sinulle maksaa? joillakin malleilla voi olla erittäin hidas päättelynopeus. vaikka niillä saavutetaan sama vaikutus, niiden käyttökokemus ei itse asiassa ole yhtä hyvä kuin edistyneimmillä malleilla. ja testisarjalleylisovitus, jokainen malli, joka haluaa todistaa kykynsä, menee rankingin luokittelua tehdessään, hänen on arvattava, mitä muut testaavat ja mitä kysymyksiä voin käyttää ja mitä tekniikoita saan oikein, joten rankingista. tai testisarjat ulkonäön perusteella uskot, että ominaisuudet ovat hyvin lähellä, mutta varsinaisessa sovelluksessa on vielä selkeä aukko.

osa itsemediahypestä yhdessä julkisuuden motivaation kanssa jokaisen uuden mallin julkaisun yhteydessä antaa kaikille vaikutelman, että mallien välinen ero on suhteellisen pieni. itse asiassa näin ei ole. varsinaisessa käyttöprosessissa en anna teknisen henkilöstömme tehdä sijoituksia wenxinin suuren mallin ominaisuuksien mittaamiseen on se, pystytkö vastaamaan käyttäjien tarpeisiin tietyissä sovelluksissa ja voitko tuottaa lisäarvoa mistä todella välitämme.

meidän on nähtävä, että toisaalta mallien ominaisuuksien välillä on suhteellisen selvä kuilu, ja toisaalta katto on erittäin korkea. se, mitä teet tänään, on edelleen kaukana siitä, mitä todella haluat tehdä ihanteellinen tila, joten malli se on myös iteroitava, päivitettävä ja päivitettävä jatkuvasti ja nopeasti.vaikka näet, että ero ei ole niin suuri tänään, näetkö, onko ero kasvanut seuraavan vuoden kuluttua? kuka voi jatkaa investointeja tähän suuntaan useita vuosia tai jopa yli kymmenen vuotta, jotta se vastaisi yhä paremmin käyttäjien tarpeita, skenaarioita ja tehokkuuden parantamisen tai kustannusten vähentämisen tarpeita?kuilu eri mallien välillä ei pienene, vaan kasvaa ja kasvaa. kuitenkin, kun he eivät tiedä todellisia tarpeita, he saattavat tuntea, että melkein riittää vain testisarjan kysymysten tekeminen.

niin sanottu johtaminenkaksitoista tai 18 kuukautta jäljessä, en usko, että sillä on niin suurta merkitystä. jokainen yrityksemme on täysin kilpaillussa markkinaympäristössä. kilpailijoita on aina 12–18 kuukautta edellä ajattele, että 12-18 ihmistä on edessäsi. kuukausi on hyvin lyhyt aika.vaikka voit taata, että olet aina kilpailijoitasi edellä6 kuukautta, sitten voita, markkinaosuutesi saattaa olla70 %, kun taas vastustajalla voi olla vain 20 % tai jopa 10 %.

k: jotkut sanovat, että avoimen lähdekoodin malli umpeutuu suljetun lähdekoodin malliin, tuhoaako tämä suurten suljetun lähdekoodin malliyritysten liiketoimintamallin?

robin li:tämä kysymys liittyy vahvasti edelliseen kysymykseen. sanoin juuri, että ominaisuuksien tai tehosteiden lisäksi mallin on oltava myös tehokas tehokkuuden kannalta avoimen lähdekoodin mallit eivät ole hyviä. tarkemmin sanottuna suljetun lähdekoodin mallia pitäisi kutsua liiketoimintamalliksi. kaupallinen malli on sellainen, jossa lukemattomat käyttäjät tai asiakkaat jakavat samat resurssit ja jakavat t&k-kustannukset, koneresurssit ja päättelyresurssit.gpu, ja avoimen lähdekoodin malli edellyttää, että otat käyttöön joukon asioita itse. mikä on gpu:n käyttöaste käyttöönoton jälkeen? meidänwenxin iso malli3.5、4ei väliä .0, käyttöaste on yli 90 %. kuinka monta ihmistä käyttää käyttämääsi avoimen lähdekoodin mallia? kerromme yleisölle, että wenxin-malliin soitetaan yli 600 miljoonaa kertaa päivässä ja joka päivä syntyvien merkkien määrä ylittää biljoonan. mikä avoimen lähdekoodin malli voi kertoa, kuinka monta puhelua se tekee päivässä ja kuinka monta merkkiä se tuottaa? miten kustannukset jaetaan, jos kukaan ei käytä sitä? miten päättelyn kustannuksia voidaan verrata kaupallisiin malleihin?

ennen suurta malliaikakautta kaikki olivat tottuneet avoimeen lähdekoodiin, mikä tarkoitti ilmaista ja edullista. tuolloin markkinoilla olevista kaupallisista tuotteista piti maksaa jokaisesta versiosta, kuten tietokoneasennuksen ostamisestawindows, microsoft saattaa joutua veloittamaan siitä paljon rahaa, mutta sinun ei tarvitse käyttää tätä rahaa, jos käytät linuxia. koska linux on avoimen lähdekoodin, kaikki ohjelmoijat näkevät koodin, jos jotain ei ole tehty hyvin, voin päivittää sen. jättiläisistä. mutta nämä asiat eivät pidä paikkaansa suurten mallien aikakaudella. suurien mallien aikakaudella ihmiset puhuvat usein siitä, kuinka kalliita gpu:t ovat, ja laskentateho on avaintekijä, joka määrää suurten mallien onnistumisen tai epäonnistumisen.antaako avoimen lähdekoodin malli sinulle laskentatehoa? jos se ei anna sinulle laskentatehoa, miten sitä voidaan käyttää tehokkaasti? avoimen lähdekoodin malli ei ratkaise tätä ongelmaa.

aiemmin olit jo maksanut laskentatehosta, kun ostit tietokoneen, mutta tämä ei päde suurten mallipäätelmien tapauksessa. tämä johtopäätös on itse asiassa erittäin kallis. siksi avoimen lähdekoodin suurten mallien arvo on opetuksen ja tutkimuksen aloilla alalla, kun pyrit tehokkuutta, vaikutusta, kun harjoittamisesta on alhaisin kustannuksin, avoimen lähdekoodin mallilla ei ole etua.

kysyä:miten tekoälysovellukset kehittyvät? miksi älykkyys painotetaan?

robin li: suurten mallien kehitysprosessin täytyy käydä läpi nämä vaiheet. alussa ihmisiä autetaan, ja lopulta kun jotain tulee ulos, sen vaikutus on läpäistäväok, se päästetään ulos vain, jos se on kaikilta osin hyvä. tämä on agentin älykkyys itsenäisyys, kyky itsenäisesti käyttää työkaluja, reflektoida, kehittää itseään jne. ihminen, ja kaikki työn osat voidaan tehdä itsenäisesti. sellaisen prosessin täytyy olla.

tuomio, jonka mukaan "älykkäät agentit ovat suurten mallien tärkein kehityssuunta", on itse asiassa yksimielisyys. baidu create -konferenssissa julkaisimme kolme tuotetta, agentbuilder, appbuilder ja modelbuilder ovat molemmat edustajia, ja toisessa on tehokkaammat toiminnot. selitettyämme sen, jotkut ihmiset alkoivat vihdoin ymmärtää, että tämä asia on todellakin mielenkiintoinen, voi tuottaa arvoa ja se voidaan tehdä suhteellisen alhaisella kynnyksellä, joka kaikkien mielestä on käyttökelpoista. sen jälkeen älykkäiden agenttien suosio on vähitellen kasvanut ja monet ihmiset ovat alkaneet suhtautua optimistisesti älykkäiden agenttien kehityssuuntaan.mutta tänä päivänä älykkyydestä ei ole päästy yksimielisyyteen ei ole paljon baidun kaltaisia yrityksiä, jotka pitävät älykkyyttä suurten mallien tärkeimpänä strategiana ja tärkeimpänä kehityssuuntana.

miksi painotamme niin paljon agentteja? koska älykkäiden agenttien kynnys on todella matala, sanoimme viime vuonna, että meidän pitäisi ottaa sovelluksia käyttöön ja kaikkien pitäisi tehdä sovelluksia. itse asiassa monet ihmiset eivät vieläkään tiedä, miten se tehdään tähän suuntaan, ja mitä kykyjä minun täytyy käyttää tässä skenaariossa on lukemattomia epävarmuustekijöitä arvon tuottamisessa, eivätkä kaikki tiedä, kuinka siirtyä mallista toiseen?mutta agentti tarjoaa erittäin suoran, erittäin tehokkaan ja hyvin yksinkertaisen tavan. on varsin kätevää rakentaa agentti mallin päälle., minkä vuoksi wenxin-alustalle luodaan joka viikko kymmeniä tuhansia uusia agentteja.

agenttien suhteen olemme jo nähneet trendin ja meillä on suhteellisen hyvät edellytykset itse mallin vahvojen ominaisuuksien lisäksi meillä on myös hyvät jakelukanavat. baidunapp, erityisesti baidu-hakumiljardeja ihmisiäkäytössä käyttäjät ilmaisevat meille aktiivisesti tarpeitaan, mikä älykäs agentti voi vastata paremmin hänen kysymyksiinsä. tämä on luonnollinen sovitusprosessi, joten voimme parhaiten auttaa näitä kehittäjiä jakamaan niitä.

raportti/palaute

uutiset

robin lin sisäinen puhe paljastui: kun keskustellaan kolmesta suuresta kognitiivisesta väärinkäsityksestä suurissa malleissa, mallien välinen kuilu kasvaa tulevaisuudessa

johdanto

yhteystietoni