2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"byten suuren mallin kehityspolku on mennä ensin c:hen kiillottamaan tuotetta ja sitten laajentamaan markkinoita, kun mallin ominaisuuksilla on kilpailuetu 25. syyskuuta volcano enginen presidentti tan daizai, hyväksyi haastattelun "daily economic news" saidille mediaryhmähaastattelussa, johon kuului toimittajia.
tämän kehityspolun perusteella sen jälkeen, kun editointiryhmän tämän vuoden toukokuussa kehittämään tekoälyn luomisalustaan "ji meng" sovellettiin varhaista versiota, papupussin videosukupolvimalli paljastettiin virallisesti vuoden 2024 volcano engine ai innovation tour -tapahtumassa. 24. syyskuuta ja on suunnattu yritysmarkkinat ovat avoinna betatestaukselle.
siitä lähtien, kun sora aloitti "chatgpt-videon aikakauden", kotimaiset suuret mallisoittimet, kuten kuaishou, zhipu ai, minimax ja alibaba, ovat peräkkäin tuoneet markkinoille samankaltaisia tuotteita. nyt kun bytedance on tullut peliin, voiko se muuttaa nykyistä suurten videomallien kilpailumaisemaa ?
esittämällä lehdistötilaisuudessa kahden videosukupolven mallin vaikutuksia, tan dai uskoo, että olipa kyseessä semanttinen ymmärtämiskyky, monimutkaiset interaktiiviset kuvat useista aiheiden liikkeistä tai sisällön johdonmukaisuus moniobjektiivisen vaihdon yhteydessä, suuri doubao-videosukupolvi. malli on saavuttanut alan johtavan tason.
samaan aikaan "music generation model" ja "simultaneous interpretation model" julkaistiin konferenssissa, mikä laajentaa entisestään byte ai -aluetta.
alan ensimmäisenä toimijana, joka laski suurten mallien hintoja, volcano engine on merkittävästi nopeuttanut kaupallistamistaan. tan dai kertoi "daily economic news" -toimittajalle, että b:hen soitettujen puheluiden määrä kasvaa nopeasti. "en ole niin selvä c-liiketoiminnan suhteen, mutta mielestäni se sujuu erittäin sujuvasti. uskon, että tekoäly voi ratkaista ongelmia päästä päähän, eivätkä rajat b- ja c-liiketoiminnan välillä ole niin ilmeisiä."
"daily economic news" -lehden toimittaja sai tiedon lehdistötilaisuudesta, että tämän vuoden syyskuusta lähtien doubao-mallin tokenien keskimääräinen päivittäinen käyttö on ylittänyt 1,3 biljoonaa, keskimäärin 50 miljoonaa kuvaa luodaan päivittäin ja keskimääräinen päivittäinen äänenkäsittely on 850 000 tuntia.
31. elokuuta, minimax, yksi "six little dragons of ai", julkaisi videosukupolven mallin video-1 19. syyskuuta, keling ai valmistui 9. iteraatiosta ja julkaisi "keling 1.5 -mallin". yunqi konferenssissa alibaba cloud lanseerasi uuden videosukupolven mallin alle kuukaudessa jo ennestään myrskyisä videosukupolven mallikenttä on toivottanut tervetulleeksi uuden pelaajan.
volcano engine ai innovation tourilla 24. syyskuuta julkaistiin kaksi suurta doubao video generation-pixeldance- ja doubao video generation-seaweed -mallia.
"daily economic news" -toimittaja huomasi, että näiden kahden suuren mallin tukeman videosisällön luomisen enimmäiskesto ei ole vielä ilmoitettu. sen sijaan keling lanseerasi 21. kesäkuuta videon jatkotoiminnon, jonka avulla videota voi jatkaa noin 5 sekuntia ja pisin video voidaan tuottaa noin 3 minuuttia.
kuvan lähde lehdistötilaisuudesta: kuva yang xinyi, daily newsin toimittaja
"eri skenaarioissa on erilaiset vaatimukset videon kestosta, ja kiinnitämme enemmän huomiota eri toimialojen ratkaisuihin." teollisuus piilee pääasiassa kyvyssä noudattaa ohjeita, moniobjektiivisen vaihdon johdonmukaisuutta ja videoiden generoinnin yleistyskykyä.
lehdistötilaisuudessa monet viralliset videot esittelivät yllä olevia kykyjä: esimerkiksi demonstraatiovideossa miehestä ja naisesta laukkaamassa hevosen selässä, 10 sekunnin näytöllä kahdella ihmisellä oli erilaiset ilmeet ja liikkeet, mutta he molemmat suoriutuivat hyvin luonnollinen ja sileä.
on syytä huomata, että doubao video sukupolven suuri malli tukee sukupolven mustavalkoinen, 3d-animaatio, 2d-animaatio, kiinalainen maalaus, paksu maali ja muita tyylejä sisältöä.
"videoiden sukupolven malleille on vaikeaa luoda erilaisia tyylejä (sisällön tuottamiseen). tekniikan lisäksi se riippuu pääasiassa tietolähteen rikkaudesta. suuri malliteknikko kertoi "daily economic news" -toimittajalle. tan dai selitti tämän "täyden pinon ominaisuuksien, teknologisten läpimurtojen eduilla sekä douyinin ja jianyingin videon ymmärtämisellä".
pragmatismin periaatetta noudattaen tan dai sanoi, että uusi papuvideosukupolvimalli "on harkinnut kaupallistamista julkaisustaan lähtien", ja sen sovellusalueita ovat verkkokaupan markkinointi, animaatiokasvatus, kaupunkikulttuurimatkailu ja mikrokäsikirjoitukset.
myös kaupallistamisesta "ahdistunut" on keling. toisen vuosineljänneksen tuloskonferenssipuhelussa illalla 20. elokuuta cheng yixiao, kuaishoun toinen perustaja, puheenjohtaja ja toimitusjohtaja, piti kelingin kaupallistamista ensisijaisena tavoitteena ja "pyrkii saavuttamaan huomattavan kaupallisen realisoinnin mittakaavan mahdollisimman pian ."
hinnoittelustrategiasta puhuessaan tan dai paljasti, että doubao-videosukupolven mallin hintaa ei ole vielä määritetty. ”videomallien ja kielimallien sovellusskenaariot ovat erilaisia, ja myös hinnoittelulogiikka on erilainen. tuotteen arvoa on mitattava uuden kokemuksen, migraatiokustannusten jne. avulla. voiko (tuotetta) lopulta käyttää laajasti. riippuu myös siitä, onko sillä parempi tuottavuus roi (sijoitetun pääoman tuotto) on parantunut paljon.”
uuden videosukupolven mallin lisäksi tapahtumassa julkaistiin myös säkkimusiikkimalleja ja simultaanitulkkausmalleja. tähän mennessä doubao-täysmodaalinen suuri malliperhe on kattanut kolme luokkaa suuret kielimallit, suuret visuaaliset mallit ja suuret puhemallit, ja kaikkiaan 13 suurta mallia on julkaistu.
mutta mallit eivät yksin riitä. monet alan ihmiset sanovat, että suurten mallivalmistajien nykyinen toteutus on "naulojen etsiminen vasaralla". joten naulojen löytämisestä ja sopivan vasaran käyttämisestä naulojen lyömiseen pienemmällä vaivalla voi tulla uusia haasteita pilvitoimittajille tekoälyn aikakaudella.
ensimmäinen on suurten mallivalmistajien ja yritysten välinen kustannuskysymys.
toukokuussa pidetyssä lehdistötilaisuudessa tan dai ilmoitti, että doubaon päämallin päätelmäsyöttöhinta on vain 0,0008 yuania/tuhat tokenia, mikä on 99,3 % halvempi kuin toimiala, mikä käynnistää hintasodan suurten mallien alalla.
"kustannus on avain. jos hinta laskee kymmenesosan, määrä voi kymmenkertaistua." tan dai näkee mallipuheluiden määrän ja sovellusten kattavuuden. "keskitymme pääasiassa sovellusten kattamiseen, emme tuloihin usko uusien skenaarioiden avaaminen on arvokkaampaa, kuten skenaariopäivitykset chatissa, kumppanuus, tuottavuus ja yrityssovellusten skenaarioiden laajentaminen."
hän kuitenkin vaati myös, että b-pään markkinoiden liiketoimintaympäristön on oltava kestävä. "emme voi harkita rahan ansaitsemista mainonnasta, kuten c-liiketoiminnassa." itseluottamusta tehdä se."
kun suuri doubao-malli otti johtoaseman hinnan alentamisessa, alibaba tongyi qianwen, baidu wenxin yiyan ja muut mallit laskivat myös peräkkäin hintojaan. tämän vuoden yunqi-konferenssissa tongyi qianwenin kolmen päämallin hintoja alennettiin alibaba cloud bailian -alustalla, zhou jingren jopa sanoi, että "tulevaisuuden valtaviin sovelluksiin verrattuna ne ovat edelleen liian kalliita. ."
alan nykytilanteesta tan dai sanoi, että hinnanalennuksen jälkeen puheluiden määrästä päätellen hinta ei ole enää este innovaatioille tällä hinnalla laatuindeksi tarkoituksena on tehdä mallista tehokkaampi ja monipuolisempi.
"yleisten alennusten" jälkeen suuri malliteollisuus ei enää sokeasti "alenna" hintoja tässä vaiheessa kilpailu on mallien suorituskykyä, jota tukee myös asiakkaiden kysyntä.
tanin havainnon mukaan suurten mallien toteutuksessa kysyntä to b -markkinoilla muuttuu hitaasti, ja ydinkysymys on kustannusten alentaminen ja tehokkuuden lisääminen. "kun yritykset soveltavat tekoälyä, ne suunnittelivat ylhäältä alaspäin, mikä oli suuri epäonnistumisen todennäköisyys. nyt niiden on innovoitava alhaalta ylöspäin."
"daily economic news" -toimittaja huomasi, että auttaakseen yrityksiä digitaalisessa transformaatiossa volcano engine on yhdistänyt voimansa kaikkien osapuolten kanssa perustaakseen smart terminal large model alliancen, automobile large model ecological alliancen ja retail large model ecological alliancen. , ja ulkopuoliset asiakkaat ovat kattaa yli 30 alaa, kuten matkapuhelimia, autoja, rahoitusta, kulutusta ja interaktiivista viihdettä.
nyt bytella on käsissään muutama kätevämpi "vasara", kuinka löytää lisää "nauloja", jotka vastaavat niitä kaikilla elämänaloilla, on volcano enginen seuraava testi.
päivittäisiä talousuutisia