uutiset

Mitä keskustelua suurten mallien avoimesta ja suljetusta lähteestä käydään?

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina




Erimielisyydet eivät voi kiistää toistensa markkina-arvoa. Nämä kaksi markkinatarvetta ovat olemassa pitkään.



Teksti |. Wu Junyu Xu Wenpu

Toimittaja Xie Lilong

Tästä vuodesta lähtien yrittäjät, sijoittajat ja tekoäly-alan yrittäjät Kiinassa ja Yhdysvalloissa ovat samanaikaisesti aloittaneet keskustelun siitä, pitäisikö suurten mallien olla avoimen lähdekoodin vai suljettua lähdekoodia.
Kiinassa kiistan keskiössä on Baidun perustaja Robin Li. Tämän vuoden huhtikuussa hän totesi julkisesti: "Kaikki käyttivät avointa lähdekoodia ja ajattelivat avoimen lähdekoodin olevan halpa. Itse asiassa suurissa malliskenaarioissa avoin lähdekoodi on kallein. Avoimen lähdekoodin malli tulee yhä taaksepäin taaksepäin "Tälle näkemykselle ei ole vastustusta. Vastustajia ovat muun muassa Alibaba Cloud CTO (teknologiajohtaja) Zhou Jingren,Baichuanin älykkyysToimitusjohtaja Wang Xiaochuan ja Cheetah Mobilen toimitusjohtaja Fu Sheng. Tämän vuoden toukokuussa Zhou Jingren sanoi suoraan mediahaastattelussa: "Ei ole epäilystäkään siitä, että avoin lähdekoodi edistää globaalia teknologiaa ja ekologiaa. Tämä on todistettu monta kertaa ympäri maailmaa, eikä siitä ole enää tarvetta keskustella."
Yhdysvalloissa keskustelu on vielä kiivaampaa. Teslan perustaja Musk haastoi kerran tekoälyn startupit oikeuteenOpenAI. Musk oli yksi OpenAI:n tärkeimmistä perustajista ja sijoittajista vuonna 2015. Hän uskoo, että nykyisen toimitusjohtajan Altmanin johtama OpenAI on rikkonut sitoumustaan ​​"toimia voittoa tavoittelemattomana organisaationa ja tehdä tekoälystä avoimen lähdekoodin ja avoimen lähdekoodin". Kaksi kuuluisaa Piilaakson sijoittajaa, Andreessen, a16z:n perustaja, ja Kosla, Kleiner Perkins Caufield & Byersin perustaja, ovat kokeneet monia yhteenottoja sosiaalisessa mediassa. Edellinen uskoo, että suljetun lähdekoodin malli johtaa jättiläisten monopoliin ja heikentää akateemista tutkimusta. Jälkimmäinen uskoo, että suuret mallit ovat taloudellisia aseita, eikä niiden pitäisi olla avoimen lähdekoodin.


Avoin lähdekoodi on ohjelmistokehitysmalli – lähdekoodi julkaistaan ​​ilmaiseksi ja selviää yhteisön lahjoituksista. Kehittäjät voivat vapaasti ladata, muokata, jakaa, ilmoittaa ohjelmistovirheistä (ohjelmistovioista tai -virheistä) ja tehdä optimointiehdotuksia. Tämä kollektiivinen innovaatio nopeuttaa ohjelmistojen iteraatiota.Avoimen lähdekoodin malleilla tarkoitetaan malleja, jotka ovat ilmaisia ​​ja joissa on julkaistu teknisiä tietoja, kuten malliparametreja, jotka vaativat maksua ja eivät julkaise teknisiä tietoja.Ymmärrä yksinkertaisesti, avoin lähdekoodi on ilmaista, mutta sinun täytyy ostaa ja valmistaa omaa ruokaa.
Pitäisikö suurten mallien olla avoimen lähdekoodin vai suljetun lähdekoodin? Kaupalliset intressit, tekniset mielipiteet ja muut tekijät on sekoitettu niin, että monet tosiasiat ovat menneet sekaisin - mutta tämän keskustelun taustalla on muutama tietty tosiasia.
Ensinnäkin erilaiset liiketoimintastrategiat antavat yrityksille mahdollisuuden valita erilaisia ​​teknisiä reittejä.Yritykset, kuten Baidu ja OpenAI, jotka toivovat kaupallistavansa nopeasti suuret malliyritykset, ovat valinneet suljetun lähdekoodin Alibaba Cloudin, Metan ja muut yrityksetpilvilaskentaaTai kannattavaa mainostoimintaa harjoittavat yritykset valitsevat avoimen lähdekoodin tehdäksesi piirakasta isomman.
Toiseksi avoimen ja suljetun lähdekoodin markkinoiden vaatimukset elävät rinnakkain pitkään, ja on mahdotonta arvioida, kumpi on parempi.Avoimen lähdekoodin ja suljetun lähdekoodin malleilla on omat soveltuvat skenaariot, ja se, mikä malli valitaan, liittyy markkinoiden kysyntään. Tämä ei muutu mallinvalmistajan tahdosta.
Kolmanneksi avoimen lähdekoodin mallien ja avoimen lähdekoodin ohjelmistojen välillä on olennaisia ​​eroja.Avoimen lähdekoodin ohjelmisto julkaisee lähdekoodin ja useimmat tekniset tiedot. Avoimen lähdekoodin malli on enemmän kuin ilmainen tekninen musta laatikko - mallin parametrit ovat auki, mutta lähdekoodi, harjoitustiedot, harjoitusprosessi ja muut tekniset yksityiskohdat ovat harvoin auki.

Lisäksi avoimien ja suljettujen lähteiden välinen taistelu Kiinan tekoälyteollisuudessa on enemmän kaupallista kilpailua.Avoimella lähdekoodilla ei ole rajoja, tämä käsite on yleisesti tunnustettu. Kiinan ja Yhdysvaltojen välisen kiristyneen kilpailun yhteydessä tekoälyteollisuudessa Yhdysvaltain teollisuuden vastustus avoimeen lähdekoodiin kuitenkin kovenee ja kovenee.

Kuka on avoin lähdekoodi ja kuka on suljettu lähdekoodi?
Suurten mallien kehitys on vielä alkuvaiheessa ja vaatii vielä yritystä ja erehdystä.Avoin lähdekoodi ja suljettu lähdekoodi eivät eroa toisistaan. Kun yritykset kohtaavat monivalintakysymyksen avoimesta lähdekoodista ja suljetusta lähdekoodista, ne valitsevat kolme eri polkua.

Äärimmäisin asia on tehdä vain avoimen lähdekoodin malleja. Tällä tiellä on suhteellisen vähän yrityksiä, ja Meta on yksi harvoista. Etuna on, että se houkuttelee lisää käyttäjiä Ongelmana on, että voittomallia ei ole ja vain suurilla yrityksillä on siihen varaa.
Metan omistama Llama 3 on avoimen lähdekoodin malli, jolla on eniten käyttäjiä maailmassa. Metan päätoimiala on sosiaalinen media (kuten Facebook, Instagram), jonka nettotulos vuonna 2023 oli 39 miljardia dollaria. Metalla on halu tutustua uusiin yrityksiin, mutta painetta ansaita rahaa mallien avulla ei ole. Siksi se voi tehdä vain avoimen lähdekoodin mallin eikä toistaiseksi ota huomioon kannattavuuskysymyksiä.
Keskipolku on avoimen lähdekoodin ja suljettu lähdekoodi rinnakkain, mikä on erittäin joustavaa. Yritykset eivät vain saa käyttäjiä avoimen lähdekoodin kautta, vaan myös tuloja suljetun lähdekoodin kautta. Tämä ei ainoastaan ​​anna kehittäjille valinnanvaraa, vaan myös yrityksille itselleen tilaa virheille.
Tämän tien valitsevia yrityksiä ovat Microsoft, Google, Alibaba Cloud, Tencent Cloud sekä tekoälyn startup-yritykset, kuten Mistral Al, Zhipu AI ja Baichuan Intelligence. Yleinen käytäntö avoimen lähdekoodin ja suljetun lähdekoodin rinnakkaistamisessa on käyttää ilmaisia ​​avoimen lähdekoodin malleja houkuttelemaan käyttäjiä ja ohjaamaan käyttäjiä käyttämään kooltaan suurempia ja tehokkaampia suljetun lähdekoodin malleja. Esimerkiksi Microsoftin tärkein kaupallinen malli on OpenAI:n GPT-4-sarja, mutta se tarjosi myös avoimen lähdekoodin pienen mallin Phi-3 Mini. lähdepohjaiset mallit, teollisuuden mallit, Google on hankkinut avoimen lähdekoodin pienten mallien, ja se tarjoaa myös suljetun lähdekoodin suuria perusmalleja, kuten Mistral Al, on avoimen lähdekoodin mallit, joiden suorituskyky on edellisessä sukupolvessa ja opasti käyttäjiä maksamaan tämän sukupolven tehokkaampien mallien käytöstä.
Avoimen ja suljetun lähdekoodin ongelmana on, että kaupallistamiseen liittyy joskus kilpailevia ponnisteluja. Jotkut asiakkaat ovat käyttäneet ilmaisia ​​avoimen lähdekoodin malleja eivätkä enää käytä maksullisia suljetun lähdekoodin malleja. Tämän seurauksena mallivalmistajat menettävät osan tuloistaan.
Kiinalaisen tekoälyohjelmiston palveluntarjoajan teknikko kertoi Caijingille tämän vuoden heinäkuussa, että he käyttivät äskettäin Alibaba Cloudin avoimen lähdekoodin Tongyi Qianwen -mallia (Qwen2) keskiasteen koulutukseen ja hienosäätöön palvellakseen paikallista kaupunkimatkailutoimistoa. Tämä tilaus ylittää 10 miljoonaa yuania, ja he ovat edunsaajia, mutta Alibaba Cloudilla ei ole tuloja. "Caijing" tiedusteli Qwen2:n lisenssisopimuksesta Githubissa (maailman suurin koodin hosting-alusta). Sopimuksessa sanotaan, että kaupallista käyttöä ei vaadita. Toisin sanoen kaupallisesta käytöstä ei tarvitse maksaa, kun Qwen2 on koulutettu ja hienosäädetty.
Avoimen lähdekoodin pitkän aikavälin arvo on tehdä mallimarkkinoiden kakusta isompi. Alibaba Cloud -henkilö kertoi Caijingille, että on normaalia, että käyttäjät muokkaavat avoimen lähdekoodin malleja kaupalliseen käyttöön, ja sinun on varauduttava tähän, kun teet avoimen lähdekoodin. Vaikka Alibaba Cloud ei ole vielä syönyt kaikkea kakkua, se on tehnyt alan kakusta isomman. Pitkällä aikavälillä siitä on lopulta hyötyä. Kemiallisia reaktioita tapahtuu vain, kun eri asiakkaat, kuten hallitukset, suuret ja keskisuuret yritykset ja kehittäjät, käyttävät laajalti suuria malleja. Suurten mallitoimialojen on luotava ekologia ja muodostettava kasvun vauhtipyörä. Tämä suuntaus näkyy ModelScopessa, avoimen lähdekoodin tekoälyyhteisössä, jonka omistaa Alibaba Cloud. Tämän vuoden heinäkuusta lähtien Moda-yhteisöllä on yli 5,6 miljoonaa kehittäjää, yli 5 500 korkealaatuista mallia ja tuhansia tietojoukkoja, mikä tekee siitä Kiinan suurimman avoimen lähdekoodin malliyhteisön.
Optimistisempi näkemys on, että avoin lähdekoodi ja suljettu lähdekoodi voivat jopa muodostaa alku- ja loppupään suhteen. Avoin lähdekoodi on teknologian alkupäässä, ja se on vastuussa yhteisön osallistumisesta, teknologian iteraatiosta, asiakkaiden houkuttelemisesta ja sen varmistamisesta, että teknologia johtaa vertaisiaan. Suljettu lähde on loppupäässä ja vastaa kaupallisesta toteutuksesta.
Lanzhou Technology on suuri malli startup-yritys Kiinassa. Li Jingmei, Lanzhou Technologyn kumppani ja toimitusjohtaja, kertoi Caijingille, että avoin lähdekoodi on sekä tekninen strategia että liiketoimintastrategia. Se voi vaikuttaa kehittäjäyhteisöön sekä potentiaalisten asiakkaiden teknisen tiimin psyykeen. Avoin lähdekoodi ja suljettu lähdekoodi eivät ole ristiriidassa keskenään. Suljetun lähdekoodin mallien asiakaspalautesykli on suhteellisen pitkä, mutta avoimen lähdekoodin mallien yhteisökehittäjät antavat palautetta nopeasti. Tämä voi auttaa yrityksiä iteroimaan tuotteita nopeasti.
Johtavan kiinalaisen teknologiayrityksen tekoälyn strateginen suunnittelija uskoo, että johtaville pilvitoimittajille, kuten Alibaba Cloudille, on parempi olla avoimen lähdekoodin ja suljettu lähdekoodi rinnakkain kuin vain suljettu lähdekoodi. Alibaba Cloudin tulot tulevat pääasiassa julkisen pilven neljästä pääkomponentista (tietokone, tallennus, verkko, tietokanta). Ilmainen avoimen lähdekoodin malli edistää asiakkaiden liiketiedon kulutusta ja edistää siten edellä mainittujen pilvipohjaisten perustuotteiden myyntiä.
Vain suljetun lähdekoodin mallien tekeminen on yksinkertainen, suora ja looginen lähestymistapa. Tätä reittiä käyttävät suuret yritykset uskovat, että jos suuria malleja halutaan kaupallistaa, niiden on oltava suljettuja, muuten kaupallista silmukkaa ei voida sulkea.
Tekoäly startupit OpenAI (sen GPT-4-sarjan mallit), Amazon (sijoitti tekoälyn startup Anthropic, joka sisältää Claude 3.5 -sarjan mallit), Huawei (Pangu iso malli), Baidu (Wenxin iso malli) ja muut yritykset ovat valinneet tämän. tie. Suuria malleja käyttävät yritykset maksavat usein API (Application Programming Interface) -puhelukohtaisesti, mikä on kuin maksaisi vedestä, sähköstä ja kaasusta käytön perusteella. Suljetun lähdekoodin mallin liiketoimintamalli on teoriassa terveellisin. Microsoft Azuren, Amazon AWS:n ja Google Cloudin liikevaihdon kasvuvauhti on noussut noin 5 prosenttiyksikköä viimeisen vuoden aikana, ja myös niiden tulostasot ovat nousseet hieman. Tämän uskotaan johtuvan suuresta mallivedosta.
Mutta Kiinassa suljetun lähdekoodin mallin on vaikea olla todella kannattavaa lyhyellä aikavälillä. Tämän vuoden toukokuussa Kiinan mallimarkkinat aloittivat hintasodan. Hintojen alentamisen tarkoituksena on piristää asiakkaiden kysyntää ja laajentaa markkinoiden kokoa. ByteDancen pilvipalvelut Volcano Engine, Alibaba Cloud, Tencent Cloud ja Baidu Smart Cloud ovat peräkkäin alentaneet suurten mallipuheluiden hintoja yli 90 %. Suurten mallipuheluiden bruttokate putosi yli 60 %:sta alle 0 %:iin.
Kiinalaisen pilvitoimittajan suuresta malliliiketoiminnasta vastaava henkilö uskoo, että suuret mallipuhelut ovat tulleet "negatiivisen bruttovoiton aikakauteen". Mitä enemmän käytät sitä, sitä suurempia menetyksiäsi tulee. Erona on, että suurilla yrityksillä, kuten Alibaba, ByteDance ja Baidu, on varaa menettää rahaa, mutta pienillä ja keskisuurilla yrityksillä ja startupilla ei.

Hän ja iso mallistartup-johtaja ilmaisivat samanlaisen näkemyksen - eri yrityksillä on erilaiset geenit ja erilaiset malliliiketoiminnan strategiat. Pilvi on Alibaba Cloudin ydinliiketoiminta, ja avoimen lähdekoodin mallien perimmäinen tavoite on myydä enemmän pilviä. Volcano Engineä tukee ByteDance, ja emoyhtiön mainontatoimintaa voidaan siirtää. Volcano Enginen pilvitekniikan markkinaosuus on paljon pienempi kuin Alibaba Cloudin "Se on paljain jaloin eikä pelkää käyttää kenkiä", ja se toivoo saavansa lisää markkinaosuutta hintasodan kautta. Tekoäly on Baidun ydinliiketoimintaa Baidu toivoo ansaitsevansa rahaa suurilla malleilla, joten se korostaa suljetun lähdekoodin mallien arvoa.

Mikä on argumentti? Mikä on konsensus?
Kiinan avoimen lähdekoodin ja suljetun lähdekoodin keskustelussa suurista malleista on useita painopisteitä – ensinnäkin, onko avoimen lähdekoodin mallien ja avoimen lähdekoodin ohjelmistojen välillä eroa? Toiseksi, kumpi on vahvempi, avoimen lähdekoodin malli vai suljetun lähdekoodin malli? Kolmanneksi, kumpi on kalliimpi, avoimen lähdekoodin malli vai suljetun lähdekoodin malli?
Ensimmäinen keskustelu on, onko avoimen lähdekoodin mallien ja avoimen lähdekoodin ohjelmistojen välillä eroa? Vastaus on, että ero on suuri. Suurin osa avoimen lähdekoodin malleista ei ole täysin avoimen lähdekoodin. Ne ovat enemmän mustia laatikoita, joita voi käyttää ilmaiseksi, eikä läpinäkyviä laatikoita, kuten avoimen lähdekoodin ohjelmistoja.
Avoimen lähdekoodin ohjelmisto julkaisee lähdekoodin, ja kehittäjät voivat hallita suurimman osan ohjelmiston teknisistä yksityiskohdista lähdekoodin kautta. Ilmaisten avoimen lähdekoodin ohjelmistojen ydinlogiikka on, että kehittäjät kaikkialta yhteiskunnasta voivat auttaa ohjelmistovalmistajia löytämään tuotevirheet ja antamaan optimointiehdotuksia. Yhteiskunnallinen kehitys ei voi ainoastaan ​​vähentää ohjelmistojen tutkimus- ja kehityskuluja, vaan myös nopeuttaa ohjelmistojen iteraatiota. Mobiilikäyttöjärjestelmä Android ja tietokantaohjelmisto MySQL ovat molemmat saavuttaneet menestystä tällä tavalla.
Avoimen lähdekoodin mallit ovat monimutkaisempia kuin avoimen lähdekoodin ohjelmistot, kuten lähdekoodi, parametrien painot, mallin rakenne, koulutustiedot, koulutusprosessi jne. Kaksi tutkijaa Radboudin yliopistosta Alankomaista, Lisenfeld ja Dingemans, julkaisivat tämän vuoden maaliskuussa tutkimuksen, jossa vertailivat avoimen lähdekoodin astetta avoimen lähdekoodin malleissa. Paperi osoittaa, että tehokkaimmat avoimen lähdekoodin mallit yleensä vain painottavat avoimen lähdekoodin parametreja. Yksi selitys on, että mallien valmistajat eivät voi paljastaa kaikkia "reseptejä" varmistaakseen parhaan mallin suorituskyvyn. Otetaan esimerkkinä maailman tehokkain avoimen lähdekoodin malli Llama3. Sen parametrien painot ja mallirakenne ovat vain osittain avoimen lähdekoodin lähteitä.


Ei ole epäilystäkään avoimen lähdekoodin konseptin arvosta teollisen ekologian kannalta.Baidu Smart Cloud AI:n ja suuren mallialustan johtaja Xin Zhou kertoi Caijingille tämän vuoden heinäkuussa, että avoimen lähdekoodin mallit tekevät mallisovelluksista ja teollisuuden malleista rikkaampia. Mutta hän vastustaa avoimen lähdekoodin mallin sekoittamista avoimen lähdekoodin ohjelmistoihin.Koska näiden kahden välillä on olennainen ero - avoimen lähdekoodin malli ei voi luottaa sosiaalisten kehittäjien osallistumiseen tuotteen suorituskyvyn parantamiseen ja tutkimus- ja kehityskulujen alentamiseen, kuten avoimen lähdekoodin ohjelmistoihin. Perusmallia voi parantaa vain mallin valmistajan omalla koulutuksella. Avoimen lähdekoodin mallin hienosäätö ja päättelyn optimointi eivät ole yhtä hyviä kuin kaupallisella mallilla, eikä todelliset käyttökustannukset ole matala.
Toinen keskustelu on, kumpi on vahvempi, avoimen lähdekoodin malli vai suljetun lähdekoodin malli? Tosiasia on, että suljetun lähdekoodin mallit toimivat yleensä paremmin kuin avoimen lähdekoodin mallit, mutta suorituskyvyn ero avoimen lähdekoodin ja suljetun lähdekoodin mallien välillä pienenee.


Stanfordin yliopiston perusmallien tutkimuskeskus (CRFM) on jo pitkään tehnyt maailmanlaajuisia suuria mallitestausrankingeja. 24. heinäkuuta julkaistut laajamittaiset MMLU-testien sijoitukset osoittavat, että kymmenen parhaan suorituskykymallin joukossa vain Llama3.1 on avoimen lähdekoodin malli, mukaan lukien Claude3.5 (Investoi Amazon), GPT -4o (investoi Microsoft) ja Gemini 5 Pro (itsekehittämä Google) ja muut ovat suljetun lähdekoodin malleja.
Li Jingmei uskoo, että saman yrityksen suljetun lähdekoodin mallilla on oltava parempi suorituskyky kuin avoimen lähdekoodin mallilla. Alan horisontaalisessa vertailussa suljetun lähdekoodin mallit eivät kuitenkaan välttämättä ole avoimen lähdekoodin malleja parempia. Koska suuret mallit toistetaan 6–12 kuukauden välein, jotkin avoimen lähdekoodin mallit voivat kehittyä nopeammin.


Arvosteluorganisaatioiden sijoitukset kuvaavat tätä suuntausta. LMSYS-organisaation (Large Model System Research Organisation) aloitti Kalifornian yliopisto, Berkeley. Organisaatio arvioi ja luokittelee myös maailmanlaajuisen mallin suorituskykyä pitkään. Metan Llama3.1 ja Alibaba Cloudin Qwen2 paranevat nopeasti tässä arvioinnissa. Llama3.1 ylittää jopa useimmat suljetun lähdekoodin mallit.
Kiinalaisen pilvitoimittajan suuresta malliliiketoiminnasta vastaava henkilö analysoi, että avoimen lähdekoodin mallien ja suljetun lähdekoodin mallien suorituskyvyn eroon on kaventunut kaksi syytä suorituskyvyn parantaminen. Avoimen lähdekoodin malli houkuttelee suuren määrän kehittäjiä. Vaikka ne eivät voi suoraan parantaa mallien suorituskykyä koodipalautteen avulla, ne parantavat mallitutkimuksen yleistä tasoa, mikä epäsuorasti auttaa avoimen lähdekoodin malleja parantamaan mallien suorituskykyä.
Kolmas keskustelu on avoimen lähdekoodin malli vai suljetun lähdekoodin malli, kumpi on kalliimpi? Johtopäätös on, että suorituskyky on ratkaiseva tekijä. Mallin käyttökustannukset liittyvät suoraan mallin suorituskykyyn. Mitä korkeampi suorituskyky, sitä pienemmät pitkän aikavälin käyttökustannukset, koska tehtävän suorittamiseen tarvitaan vähemmän puheluita.
Avoimen lähdekoodin mallit ovat ilmaisia ​​ja antavat usein vaikutelman halvemmista ja halvemmista. Xin Zhou selitti, että suuri mallisovellus on kattava ratkaisu, joka sisältää "teknologia + palvelu", ja yrityksen on laskettava "pääkirja". Täydellisten mallien ja työkaluketjujen lisäksi suljetun lähdekoodin mallien valmistajat tarjoavat myös koulutusta ja teknisiä palveluita, jotka auttavat yrityksiä pääsemään alkuun nopeasti. Avoimen lähdekoodin malli näyttää olevan ilmainen, mutta saavuttaakseen saman vaikutuksen kuin suljetun lähdekoodin, se vaatii paljon myöhempiä investointeja työvoimaan, rahaan ja aikaan, ja kokonaiskustannukset ovat vielä korkeammat.

Pitkällä aikavälillä ratkaiseva tekijä avoimen lähdekoodin ja suljetun lähdekoodin mallien sovelluskustannuksissa on päättelyn hinta. Suljetun lähdekoodin mallit, joilla on sama parametrin suuruus, toimivat yleensä paremmin kuin avoimen lähdekoodin mallit ja niillä on alhaisemmat kokonaiskustannukset. Xin Zhou laski, että jos yritys ottaa käyttöön avoimen lähdekoodin mallin ilmaiseksi, suljetun lähdekoodin mallin käyttöönotto maksaa 500 000 yuania. Alkusijoitusvaiheessa avoimen lähdekoodin malli on halvempi. Jos suljetun lähdekoodin mallin kokonaissuorituskyky on myöhemmässä käyttövaiheessa 20 % parempi kuin avoimen lähdekoodin mallin, suljetun lähdekoodin malli voi säästää kymmeniä tuhansia juaneja päivässä joissakin suuryrityksissä. . Loppujen lopuksi pitkän aikavälin käyttökustannusten on oltava paljon alhaisemmat kuin avoimen lähdekoodin mallissa.

Kuka käyttää avoimen lähdekoodin mallia? Kuka käyttää suljetun lähdekoodin mallia?
Onko avoimen lähdekoodin malli parempi vai suljetun lähdekoodin malli? Tätä kysymystä eivät päätä tarjontapuolen mallien valmistajat, vaan kysyntäpuolen yritysasiakkaat.
Julkisuudessa yritysten sanasodat jatkuvat. Monet pilvitoimittajien tekniset henkilöt kertoivat kuitenkin Caijingille, että nämä väitteet eivät voi kiistää toistensa markkina-arvoa. Nämä kaksi tarvetta elävät rinnakkain pitkään. Toisesta näkökulmasta katsottuna sanasota helpottaa markkinoiden näkyvyyden lisäämistä yhdessä.
Itse asiassa useimmat yritysasiakkaat eivät välitä siitä, onko mallin oltava avoimen lähdekoodin. Xin Zhou päätteli, että keskusteltuaan monien suurten yritysasiakkaiden kanssa hän huomasi, että se, pitäisikö IT-osaston päällikön käyttää mallia, riippuu monista tekijöistä. Avoin tai suljettu lähdekoodi ei ole ratkaiseva tekijä.
Useimpien yritysten "työkalupakkauksessa" avoimen lähdekoodin mallit ja suljetun lähdekoodin mallit täydentävät toisiaan. Suuryritysten suurten mallien käyttöönotto on yleensä jaettu eri vaiheisiin.
Alkuvaiheessa IT-osasto selvittää markkinoilla olevien avoimen lähdekoodin ja suljetun lähdekoodin mallien suorituskyvyn ja ominaisuudet. Eri malleilla on erilaisia ​​etuja. Joillakin on vahvat kielen ääntämisominaisuudet ja joissakin vahvat datatilastot. Ilmainen varhaisen vaiheen avoimen lähdekoodin mallin POC (proof of concept) testaus liiketoimintavaikutusten todentamiseksi.
Keskipitkällä aikavälillä aloitamme projektien ensimmäisellä vaiheella liiketoimintaskenaarioissa, joissa on vähän vaikeutta ja nopeita tuloksia, kuten markkinointia, asiakaspalvelua ja tietopohjaa. Sinun ei tarvitse vain ostaa suljetun lähdekoodin mallia, vaan sinun on myös koulutettava ja hienosäädettävä oma avoimen lähdekoodin mallisi. Anna sisäisten ja ulkoisten mallien "kilpahevoset", vertailla eri mallien vaikutuksia ja kustannuksia ja vaihtaa käyttöä milloin tahansa.
Myöhemmässä vaiheessa toteutustulosten perusteella suunnitellaan vaiheittain toisen ja kolmannen vaiheen hankkeita vaikeissa ja hitaita tuloksia tuottavissa liiketoimintaskenaarioissa. Tänä aikana on usein jopa tarpeen käyttää kymmeniä miljoonia yuaneja itsenäisten ja hallittavissa olevien suurten perusmallien tai teollisuuden suurten mallien muodostamiseen.
Avoimen lähdekoodin malli on ilmainen, mutta sitä ei voi käyttää suoraan paketista, se vaatii aikaa ja vaivaa, eikä kukaan ole vastuussa yksityiskohdista. Suljetun lähdekoodin mallilla voidaan suoraan hankkia kypsiä tuotteita ja tarjota täydet palvelut ennen myyntiä, sen aikana ja sen jälkeen. Ymmärtääkseni avoimen lähdekoodin malli on kuin ruoan ostamista ja ruoanlaittoa itsellesi, kun taas suljetun lähdekoodin malli on kuin rahan käyttämistä ravintolassa syömiseen.
Xin Zhoun näkemys on, että avoimen lähdekoodin malli sopii akateemiseen tutkimukseen, joillekin pienille ja keskisuurille yrityksille, joilla on erittäin rajallinen IT-budjetti, ja joillekin suurille yrityksille itsenäisiin ja hallittaviin sisäisiin itsetutkimusprojekteihin, mutta se ei sovellu. soveltuu suuriin ulkoisiin kaupallisiin projekteihin. Joissakin vakavissa kaupallisissa projekteissa, jotka maksavat miljoonia tai kymmeniä miljoonia dollareita, suljetun lähdekoodin malli on edelleen paras valinta.
Avoimen lähdekoodin malli ei ole ilmainen lounas. Avoimen lähdekoodin mallia käyttävillä suurilla yrityksillä on monia piilokustannuksia. Esimerkiksi laskentatehon osto, ohjelmistosovitus jne. Eräs kiinalaisen älykkään markkinointipalveluntarjoajan tekninen johtaja kertoi Caijingille tämän vuoden heinäkuussa, että hänen yrityksensä on vahvasti riippuvainen pilvipalveluista ja käyttää vuosittain yli 80 miljoonaa yuania tutkimukseen ja kehitykseen. Viimeisen kahden vuoden aikana yhtiö on käyttänyt yli kymmentä suljetun lähdekoodin mallia samanaikaisesti, mutta avoimen lähdekoodin malleja niiden joukossa ei ole. Hänen mielestään avoimen lähdekoodin malli vaatii aikaa ja työvoimaa. Useimpia avoimen lähdekoodin malleja ei voi käyttää heti, kukaan ei tiedä yksityiskohtia, ja niitä voidaan pitää vain "leluina". Hänellä on tapana hallita yli tusinaa suljetun lähdekoodin mallia ja vaihtaa niiden välillä milloin tahansa hinnan ja suorituskyvyn perusteella. Tämä on kustannustehokkain.
Suuren osakeyhtiön liikepankin IT-johtajan mielestä ei ole suuri ongelma, että avoimen lähdekoodin mallia ei voida ottaa käyttöön heti. Hän kertoi Caijingille joulukuussa 2023, että hänen tiiminsä käytti myös Alibabaa (Tongyi avoimen lähdekoodin malli), Metaa (Llama avoimen lähdekoodin malli), Baidua (Wenxin-sarja) ja Zhipua (GLM-sarja) itsepalvelututkimuksen vaatimustenmukaisuusraportointisovelluksiin. Avoimen lähdekoodin malli sopii pieniin projekteihin, koska se mahdollistaa ilmaisen POC-testauksen ja sitä voidaan muokata tarpeen mukaan. Hänen IT-tiimissään on kymmeniä ihmisiä sekä ulkoistettu IT-palveluyritys, jolla on riittävästi työvoimaa näiden ongelmien ratkaisemiseen. Mutta hän uskoo myös, että suurissa, miljoonan tai kymmenen miljoonan yuanin arvoisissa projekteissa suljetun lähdekoodin malli sopii paremmin. Koska suljetun lähdekoodin malli on vakaa ja luotettava, voit löytää myös malliyrityksen, joka on vastuussa siitä huolehtimisesta.

Teollisuuden mallisarjan täydellinen kouluttaminen avoimen lähdekoodin malleilla maksaa kymmeniä miljoonia yuaneja, ja se vaatii myös tekoälysirujen ostamista itse rakennetun tietokonehuoneen rakentamiseksi. Edellä mainitut tekoälyohjelmiston palveluntarjoajien teknikot totesivat, että avoimen lähdekoodin malli sopii joihinkin valtion omistamiin keskusyrityksiin, joilla on korkeat vaatimukset tietoturvalle, autonomialle ja hallitukselle ja jotka eivät ole niin herkkiä kustannuksille. He käyttävät avoimen lähdekoodin malleja omien toimialamalliensa kouluttamiseen. Koska "avoimen lähdekoodin malli + yksityinen pilvi" täyttää monien keskus- ja valtion omistamien yritysten tietoturva- ja itsenäisen ohjattavuuden vaatimukset.

Mikä on tulevaisuus?
Keskustelu suurten mallien avoimien ja suljettujen lähteiden välillä Kiinan markkinoilla on puhtaasti kaupallinen kysymys. Kansainvälisillä markkinoilla kiista suurten mallien avointen ja suljettujen lähteiden välillä sisältää kuitenkin enemmän tekijöitä, kuten kilpailunrajoituksia ja kansallisia etuja.
Tämän vuoden toukokuussa käydyn hintasodan jälkeen Kiinan suuret mallipuhelut ovat tulleet "negatiivisen bruttovoiton aikakauteen". Sekä avoimen lähdekoodin että suljetun lähdekoodin malleissa on ongelma - suuret mallit eivät voi tuottaa suoraa voittoa.
"Isojen mallimarkkinoiden tyrmäyskilpailu on alkanut Kiinalaisen pilvitoimittajan suuresta malliliiketoiminnasta vastaava henkilö analysoi, että suurten mallipuheluiden negatiivinen bruttotulos tarkoittaa sitä, että mitä enemmän puheluita soitetaan lyhyellä aikavälillä." pilvitoimittajille suuremmat tappiot. Kiinalaiset pilvitoimittajat lyövät vetoa siitä, että kun suurten mallipuheluiden hintaa on laskettu 90 %, suurten mallipuheluiden määrä kasvaa eksponentiaalisesti seuraavan 1-2 vuoden aikana. Pitkällä aikavälillä pilvitoimittajien laskentatehokustannukset laimenevat asiakkaiden kysynnän kasvaessa, ja ne voivat silti saavuttaa lopulta positiivisia voittoja. Vaikka tämä veto ei pidä paikkaansa, joukko mallinvalmistajia kuolee hintasodassa, ja elossa olevat valmistajat poimivat palaset.
Monet alan sisäpiiriläiset ilmaisivat saman näkemyksen Caijingille. Tämä eliminointikierros kestää 1-2 vuotta, ja vain 3-5 perusmalliyritystä voi jatkaa hengissä.
Xiaopeng, China Informatization Baihuin toimeenpanevan komitean jäsen ja Alibaba Cloud Intelligent Technology Research Centerin johtaja, kertoi Caijingille tämän vuoden heinäkuussa, että Kiinassa ei ole satojen mallien sotaa tai edes kymmenen mallin sotaa. Suuret mallit vaativat jatkuvaa investointia, ovat 10 000 tai jopa 100 000 kortin kapasiteettia ja vaativat kaupallista tuottoa. Monilla yrityksillä ei ole tällaisia ​​mahdollisuuksia. Jatkossa Kiinan markkinoilla on vain kolme tai viisi perusmallin valmistajaa.
Kuka hyötyy hintasodasta? Kuka nauraa viimeisenä? Edellä mainitut Kiinan johtavien teknologiayritysten tekoälyn strategiset suunnittelijat uskovat, että tässä hintasodassa Alibaba Cloudin ja ByteDancen Volcano Enginessä on eniten verta. Alibaba Cloud voi ansaita rahaa pilvestä, ja Volcano Enginellä on ByteDancen mainostoiminta verensiirtona. Hintasodassa Baidu ei ole yhtä hyvä kuin Alibaba ja ByteDance. Kuitenkin Baidu n Wenxin suuri malli on vahva tekniikka ja on joukko asiakkaita, jotka ovat valmiita maksamaan tekniikkaa. Tämä auttaa Baidua selviytymään hintasodasta. Hän selitti edelleen, että nämä suuret mallistoyritykset Kiinan markkinoilla kohtaavat ankarat testit seuraavan 1-2 vuoden aikana. Suuret mallistartupit voivat joko ryhtyä projektipohjaisiin mallikehitysyrityksiin tai siirtyä vertikaalisiin toimialamalleihin.
Kokonaiskilpailu Kiinan suurilla mallimarkkinoilla on paljon tärkeämpää kuin paikallinen kilpailu avoimen lähdekoodin ja suljetun lähdekoodin mallien välillä. Globaalin kilpailun suunta määrää suoraan paikallisen kilpailun lopputuloksen.
Alibaba Cloud -henkilö sanoi suoraan, että sekä avoimen lähdekoodin että suljetun lähdekoodin malleilla on omat etunsa, ja Alibaba Cloud toivoo tekevänsä tekoälyn osallistavammaksi. Riippumatta avoimesta tai suljetusta lähdekoodista, ydintarkoituksena on antaa kehittäjille enemmän valinnanvaraa. Alibaba Cloud on päättänyt kulkea kahdella jalalla: avoimen lähdekoodin ja suljetun lähdekoodin mallit. Toinen kiinalaisen pilvitoimittajan suuresta malliliiketoiminnasta vastaava henkilö uskoo, että avoimella lähdekoodilla ei ole liiketoimintamallia. Kiinan mallimarkkinoilla vain johtavat yritykset tai hyvin pieni joukko startuppeja, jotka voivat kerätä varoja kestävästi, voivat vaatia avointa lähdekoodia. Lopulta Kiinan markkinoille voi jäädä vain 1-2 avoimen lähdekoodin mallia.
Mallivalmistajat kouluttavat uuden sukupolven malleja lähes 6-12 kuukauden välein. Kiinan mallimarkkinoilla voittopaineiden kasvaessa avoimen lähdekoodin mallit voivat muuttua yhä "strategisemmiksi" - yritykset pyrkivät käyttämään avoimen lähdekoodin malleja, joissa on taaksepäin tekniikka ja pienemmät parametrit edellisessä sukupolvessa, ja ohjaavat käyttäjiä maksamaan Käytä teknologiapäivityksiä ja -parametreja.
Kilpailu avoimen lähdekoodin ja suljetun lähdekoodin mallien välillä ei lopu lähiaikoina. Jotkut yritykset voivat jopa käyttää sekä avoimen lähdekoodin että suljettua lähdekoodia samanaikaisesti.IT-alalla tämä ei ole ennenkuulumatonta. Tietokanta syntyi yli 60 vuotta sitten, ja ensimmäinen avoimen lähdekoodin tietokanta syntyi yli 50 vuotta sitten. Tietokantamarkkinat ovat tällä hetkellä aktiiviset erilaisilla suljetun lähdekoodin ja avoimen lähdekoodin tietokannoilla, ja uusia tietokantabrändejä ilmaantuu edelleen loputtomasti. Tietokantajätti Oraclella on jopa sekä suljetun lähdekoodin RDBMS-tietokanta että avoimen lähdekoodin MySQL-tietokanta.
Monet pilvitoimittajien teknikot uskovat, että avoimen lähdekoodin mallit ja suljetun lähdekoodin mallit elävät rinnakkain pitkään. Suuret mallimarkkinat kasvavat vähitellen erilaisten teknisten reittien kilpailussa.

Toimittaja Zhang Yufei