uutiset

Vanha mies, joka ei malta odottaa Soraa, ryntää Kuaishou Kelingiin

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Miksi Kuaishou on ensimmäinen suuri valmistaja, joka julkaisi tekoälyvideot? ‍‍‍‍‍‍‍‍‍-

Teksti |. Chen Meixi

Toimittaja |

Alkuaikoina, jolloin Open AI valloitti maailman suurilla malleilla, Kuaishou ei ollut häikäisevä hahmo. Tuolloin Baidu keksi Wenxinyiyanin, Alibaba Tongyi Qianwenin ja Tencent Hunyuanin ison mallin, joka otti kiinni toisiaan, ja tutkimuksen ja kehityksen sekä avaamisen nopeus oli erittäin nopea.

Kuaishou ei ollut alkuperäisessä haastajalistassa, ja vielä nykyäänkin harvat voivat nimetä Kuaishoun suuren kielimallin nimen: Ruyi.

Taistelutilanne muuttui 6. kesäkuuta tänä vuonna, kun Kuaishou-videolla luotu suuri malli Keling avasi sovellukset julkiseen betaversioon. Media vertaa Kelingiä usein Open AI:n Soraan, mutta helmikuussa tapahtuneen räjähdysmäisen debyyttinsä jälkeen Sora ei ole ollut avoin yleisölle. Tämän seurauksena uteliaita kiinalaisia ​​käyttäjiä alkoi parvella Kelingiin.

Kymmenen päivää myöhemmin Keling "on (saanut) kymmeniä tuhansia hakemuksia. Nämä tiedot ovat peräisin Wan Pengfeilta, joka osallistui Zhiyuanin konferenssiin sinä päivänä. Hänen arvonimensä oli puheen aikaan Kuaishou Visual Generation and Interaction Centerin johtaja, ja hän oli myös Kelingin varsinainen vastuuhenkilö. Heinäkuun 19. päivänä hakijoiden määrä ylitti miljoonan. Kelingillä kesti vain yli kuukausi kasvattaa hakemusten määrä kymmenistä tuhansista miljoonaan suurten mallien edistymisestä vuoden ensimmäisen puoliskon aikana.


Hengen luoma kuva, nopea sana: mehiläinen kukissa

Tarinat käänteistä ovat aina suosittuja yleisön keskuudessa. Kelingin ja sen takana olevan Kuaishoun suuren malliyrityksen huolellinen kartoitus paljastaa kuitenkin, että tämä ei ole siistiä draamaa, joka jää lepäämään ja sitten yhtäkkiä esiin tulee, eikä se ole sankarillinen kertomus, jossa lahjakas nuori mies johtaa pienen joukkueen iskemään. takaisin.

Kelingin luoman kuvan pohjalta generoidaan edelleen video, jossa on kehote: mehiläiset lentävät ympäriinsä

Miksi Kuaishou on ensimmäinen suuri valmistaja, joka julkaisi tekoälyvideot?Liiketoiminnan tarpeet tuovat vahvaa motivaatiota ja tärkeysjärjestystä, datan ja teknologian kertyminen tuotemuotoon tuo iteraationopeutta ja liiketoimintaskenaarioiden yhteensovittaminen todellisia asiakkaita.

Ke Lingin ilmestyminen ei ole sattumaa. Kotimaassa Kuaishoun suurin kilpailija tekoälyvideon alalla tulee todennäköisesti ByteDancesta.


Kun on kysyntää, on motivaatiota

Tekijät ovat yksi tärkeimmistä linkeistä Kuaishoun sisältöekosysteemissä. Kuaishoun julkaisemien virallisten tietojen mukaan vuonna 2023 138 miljoonaa sisällöntuottajaa julkaisi lyhyitä videoita Kuaishoussa ensimmäistä kertaa, ja vuoden aikana julkaistut videot saivat alustalla yli biljoonaa tykkäystä.

Sisällöntuottajien suuri määrä tarkoittaa, että Kuaishoun on otettava haltuunsa heidän sisältötyökalujensa tarpeet. Muuten nousevaa tuottavuutta jahtaavat tekijät ryntäävät pian muihin työkaluihin ja jopa muihin alustoihin. Tämä on myös Kuaiying to Kuaishou ja Cutting to Byte arvo.

Siksi Kuaishoun aiempi panostus suuriin kielimalleihin ei ollut radikaali, vaan sen on pyrittävä huipulle multimodaalisten suurten mallien kilpailussa.

Ennen Kelingiä Kuaishoun itse kehittämä Wenshengtu-suurmalliominaisuus oli integroitu Kuaishouhun. Sisäisen testauksen tulos oli, että käyttäjät loivat kommentointialueella keskimäärin 500 miljoonaa+ tekoälykuvaa joka kuukausi.


Kelingin luoma kuva, kehotussana: Alien seisoo Jangtse-joen rannalla

Kysynnän tuoma vahva motivaatio on varmasti välttämätön edellytys Kelingin syntymiselle, mutta Kuaishou ei ole ainoa, jolla on nämä edellytykset. Jos on olemassa jokin muu tärkeä tekijä, joka vaikutti Ke Lingin syntymiseen, se voi olla päättäväisyys.

Päättäväisyys tulee ensin Kuaishoun ylimmältä johdolta.

Aikaisemmin Kuaishoun liikkeet suurilla malleilla tuntuivat aina puoli askelta hitaammalta. Kun puhutaan kotimaisista suurista kielimalleista, kaikki tulevat ensimmäisenä mieleen Wen Xin Yi Yanin ja Tong Yi Qian Wenin suurista kielimallisovelluksista, Kimi ja Doubao ovat markkinoiden suosituimpia. Vincentian grafiikan alalla SenseTimen Ririxin 5.0 murtautui ensimmäisenä kotimarkkinoilta julkaisunsa jälkeisenä aamuna SenseTime Technologyn osakekurssi nousi yli 30 % ja kaupankäynti keskeytettiin.

Edellisessä tarinasarjassa Kuaishou oli näennäisesti marginaalisessa asemassa. Videosuuret mallit ja niiden sovellukset ovat kilpailun tärkein solmu ja tärkein osa kokonaisvaltaista suuren mallin ulkoasua.

Teknologiamedian Silicon Starin aiemmassa raportissa Keling-tiimin teknikko sanoi: "Gai Kun sanoo usein, että kaikki yrityksen kortit ovat sinun käytettävissäsi, ja yritys tukee sitä täysin Yu Yue, Kuaishoun vanhempi varapresidentti ja toimitusjohtaja, joka vastaa asemalinjaliiketoiminnasta ja myös yhteiskuntatieteiden linjasta. Kun entinen teknologiajohtaja Chen Dingjia erosi, Gai Kunista tuli yksi Kuaishoun teknologialinjan huippujohtajista.

Wan Pengfei ja hänen tiiminsä voivat olla vieläkin päättäväisempiä.Yksi yksityiskohta on se, että päätettyään ottaa Keling-projektin haltuunsa Wan Pengfei luovutti kaikkien osapuolten liiketoimintatarpeiden hoitamisen alkuperäisen työn muille Zhang Di:n tiimin saman tason vastuuhenkilöille.Vastaavasti myös muut Keling-tiimin jäsenet ovat luovuttaneet käsillä olevan alkuperäisen liiketoiminnan ja omistautuneet täysin Kelingin tutkimukseen ja kehittämiseen.

Kelingin luoman kuvan perusteella edelleen generoitu video, kehotussanat: Alien kävelemässä vedessä, kaksi avaruusoliota korkealla

"Itse asiassa, yli kuukausi ennen virallista julkaisua, Ke Lingin testitulokset eivät olleet kovin hyviä." todella "ihmeellisiä tuloksia suurella voimalla". Monet ihmiset eivät lopulta odottaneet tällaista vaikutusta.

Päättäväisyydestä tuli siis viimeinen muuttuja.


Kasautuminen johtaa nopeuteen

Kuaishoulla tai millä tahansa johtavalla lyhytvideoalustalla on kokemusta tekoälyvideoiden kehittämisestä kahdessa suhteessa, sisällössä ja tekniikassa.

Videot ovat käyttäjien tuottamia, ja sen jälkeen, kun alusta on kommentoinut ja ymmärtänyt, jaettava sisältö suodatetaan pois. Tämä on Kuaishoun liiketoimintalogiikkaan luontainen reitti. Käsitellystä sisällöstä tulee eräänlaista dataa Itse sisällön kuvauksesta levityksen jälkeiseen suosioon, Kuaishou on hallinnut valtavan määrän sisältödataa.Maallikon termein heillä molemmilla on sisältöä ja he tietävät, mitä "hyvää sisältöä" käyttäjät haluavat nähdä.

Suurten generatiivisten videomallien koulutuksessa tämä prosessi on kuin ruokien valmistaminen etukäteen.

Jopa "kokki" on valmis.

Suurin osa Keling-projektitiimin tutkimus- ja kehitystyön ydinjäsenistä on Wan Pengfein vanhoja Y-tech-kauden alaisia. Vuoden alussa tiimin jäsenet pääsivät vähitellen kosketuksiin olennaisten tietojen ja materiaalien kanssa ja alkoivat työskennellä Kelingin tutkimus- ja kehitystyössä.

Aiemmin Wan Pengfein tiimi vastasi pääasiassa UGC:n älykkäiden luomistarpeiden toteuttamisesta Kuaishoun luovan ekosysteemin puitteissa, ja työskenteli tiiviisti yritysten, kuten pääasematuotannon, Kuaiyingin ja Yitian Cameran, kanssa , suoran lähetyksen avatarit jne.

Vuonna 2021 Wan Pengfei piti julkisen puheen "Y-tech-osaston tekoälyteknologiaalustan johtajana" maailmanlaajuisessa tekoälyteknologiakonferenssissa.Tuolloin jaettujen tapausten joukossa oli "elävän valokuvan erikoistehoste" - Tusheng-videopeli ennen suurta mallia. Tuolloin Kuaishoun ja Kuaiyingin mallikirjastot lanseerasivat "liikkuvat vanhat valokuvat" -erikoistehosteen Kun käyttäjät ovat ladaneet kuvan, valokuvan hahmot voivat tehdä liikkeitä, kuten hymyilee, räpäyttää ja nyökkää luodakseen videotehosteen. Raporttien mukaan yli 3,44 miljoonaa ihmistä on käyttänyt tätä dynaamista erikoistehostetta Kuaiyingissa.


Kuaishou netizen @senyuhelu vuonna 2021 julkaisemat liikkuvat vanhat kuvat ja videot

Vuonna 2021 Wan Pengfei luotti generatiivisen teknologian kehitykseen ja ehdotti, että "generatiivisista malleista tulee entistä tehokkaampia, luotu sisältö on realistisempaa ja sukupolviprosessi on vakaampi ja hallittavampi".

Kolme vuotta myöhemmin Keling ilmestyi jälleen työllään "Reviving Old Photos". Jotkut käyttäjät, jotka hakivat lupaa sen käyttöön, käyttivät "Tusheng Video" -toimintoa muuttaakseen kuolleiden sukulaisten valokuvat videoiksi. Verrattuna kolmen vuoden takaisiin "elävien valokuvien erikoistehosteisiin" käyttäjät voivat saada kuvien hahmot suorittamaan monimutkaisempia toimintoja.

Sora julkaistiin tämän vuoden helmikuussa, ja Kuaishou Keling -tiimiä alettiin muodostaa lähiaikoina, mutta multimodaalivetoisen videontuotantoteknologian kehittäminen ja soveltaminen on aina kuulunut Wan Pengfein ja hänen tiiminsä työn alla. .

Yllä mainitut harjoittajat ilmaisivat samankaltaisia ​​näkemyksiä Hedgehog Communelle: "Itse asiassa Soran syntyminen vastaa sitä, että jokainen voi määrittää teknisen reitin tai suunnitelman kyseisessä solmussa, mutta visuaalisen teknologian sovelluksia on monia, mukaan lukien multimodaaliset asiat. Niin he ovat aina tehneet."

Ke Lingin tarvitsema tekninen kertymä tulee tästä. Kokki törmäsi valmiiseen annokseen, ja kun uusi resepti nähtiin ympäri maailmaa, Kuaishousta tuli yksi nopeimmin valmiin tuotteen valmistajista.

Mutta samalla edellä mainituilla toimijoilla on myös odottava asenne, voiko Keling olla teknologian ja tuotteiden johtavassa asemassa pitkään. "Kaikkien nykyään käyttämät algoritmit ovat samanlaisia." tuottaa tuotteita, joilla on samanlainen vaikutus.

Siksi nopeus on vain väliaikainen Kuaishoun etu. Heidän on todella muutettava etunsa vakaiksi asiakkaiksi johtavan ikkunan aikana.


Missä on kohtaus, siellä on asiakkaita

29. joulukuuta 2020 Kuaishou julkaisi virallisesti "Kuaishou-ryhmän" yrityksen arvona ensimmäistä kertaa sisäisessä kirjeessä kaikille työntekijöille, sanoen, että "kiinnittynyt asiakkaisiin" on Kuaishoun arvojen ydin.

Aiemmin, olipa kyseessä Kuaishou tai muut suuret Internet-yritykset, useammin mainittu käsite oli "käyttäjät". Tästä syystä Kuaishou selitti erityisesti syyt tähän sanaston muutokseen. "Yrityksen liiketoiminnan monimutkaisuus on kasvanut ja laajentunut "käyttäjistä" "asiakkaiksi". Asiakkaita ovat tuottajat ja kuluttajat, B-puolen asiakkaat ja C-puolen käyttäjät, ulkopuoliset asiakkaat ja sisäiset asiakkaat. Meidän on vahvistettava ymmärrystämme tuottajista ja asiakkaista. B-puolen asiakkaat Asiakkaiden ymmärryksen ja tietoisuuden parantamiseksi meidän on korostettava myös sisäisten asiakkaiden palvelutietoisuutta.

Vuodelle 2024 katsottuna se oli todellakin tärkeä vedenjakaja Kuaishoun liiketoimintarakenteen muutoksissa. Vuonna 2020 Kuaishoun vuosituloista suorien lähetysten osuus laski edellisvuoden 80,4 prosentista 56,5 prosenttiin, ja verkkomarkkinointipalveluiden osuus kasvoi 19 prosentista 37,2 prosenttiin, mukaan lukien verkkokauppa osuus palveluliikevaihdosta nousi nopeasti 6,3 prosenttiin edellisen vuoden 1 prosentista.

Kuten Kuaishou itse on selittänyt, tuottajat ja kuluttajat, B-puolen asiakkaat ja C-puolen käyttäjät, ulkoiset asiakkaat ja sisäiset asiakkaat ovat kaikki Kuaishoun tärkeitä asiakkaita, ja heistä tulee myös Kuaishoun suuren mallin kohdeasiakkaita.

Tuottajat ja kuluttajat rakentavat yhdessä Kuaishoun perusliiketoimintaketjun. Tuottajat tuottavat sisältöä ja kuluttajat kuluttavat sisältöä.Suurten mallituotteiden arvo on tuotantokynnyksen alentamisessa ja sisällön laadun parantamisessa.

Edellinen on helppo ymmärtää, kuten Keling voi tällä hetkellä saavuttaa, voit saada videon syöttämällä tekstiä tai kuvia.

Jälkimmäinen kuulostaa aluksi hieman ristiriitaiselta - kuinka se voi olla laadultaan parempi kuin todellinen ammunta ja ammattimainen tuotanto nykyisten AI-videotuotteiden simulointiominaisuuksilla ja lähtöpituudella? Johtavilla alustoilla, kuten Kuaishou ja Douyin, suurin osa kymmenistä miljoonista päivittäin valmistetuista lyhyistä videoista tulee kuitenkin tavallisilta käyttäjiltä Ammattimaisten sisällöntuottajien silmissä "ei tarpeeksi hienostunut" AI-tekniikka riittää tekemään tavallisia käyttäjiä ' Ota satunnaisia ​​kuvia lisätäksesi materiaalia ja rikkautta.

B-puolen kauppiaista voi myös tulla Kuaishoun suurten malliominaisuuksien asiakkaita. Kuaishoun World Artificial Intelligence Conferencessa tänä vuonna julkaisemien tietojen mukaan sen tekoälyn mainostulot ovat ylittäneet 20 miljoonaa päivässä. Tekoälyn luomat mainosmateriaalit voivat alentaa tuotekohtaisia ​​kustannuksia 0,47 juaniin samalla, kun klikkausprosentti pysyy lähtötasolla.


Keling tuottaa kuvia, kehotussanoja: omenamehumainosmateriaalia, valkoisella pöydällä on lasillinen omenamehua, sivulla kaksi punaista omenaa

Monille suurille tuotteille laskeutumisskenaarioiden löytäminen on vaikea ongelma tuotteen koko elinkaaren ajan, mutta Kuaishoulla ei tietenkään ole pulaa skenaarioista.Kuten Kuaishoun varatoimitusjohtaja ja suurten mallien johtaja Zhang Di sanoi, Kelingin menestys johtuu "todellisen arvon louhinnasta todellisista kohtauksista vastaamaan käyttäjien todellisiin tarpeisiin".

Heidän on kohdattava ongelmana se, kuinka saada käyttäjät nykyisessä skenaariossa Kuaishoun suurten mallien korkean taajuuden käyttäjiksi, olemaan valmiita maksamaan siitä jatkossakin ja ymmärtämään ensin suurten mallien kaupallistaminen omassa ekosysteemissään.

25. heinäkuuta Keling avasi rekisteröinnin kokonaan. Samana päivänä Keling käynnisti jäsenjärjestelmänsä ja siirtyi laskutusvaiheeseen.

Kelingin virallisilla verkkosivuilla olevien tietojen mukaan ei-jäsenet käyttäjät voivat saada joka päivä kirjautuessaan 66 inspiraatiopistettä Nykyisen "hinnan" mukaan noin 6 videota tai 330 kuvaa voidaan luoda ilmaiseksi.

Maksumalleja on kaksi. Käyttäjät voivat ostaa eri tasoja kuukausittain, puolivuosittain tai yhden vuoden välein latausmalli, jossa käyttäjät voivat Jos maksat suoraan lataamisesta, käyttäjän kunkin videon tuotantokustannukset ovat 1 yuan ja kunkin kuvan tuotantokustannukset ovat 2 senttiä.


Kelingin luoma kuva, pikasana: auringonnousu, horisontissa on kauniita pilviä ja aamun hehkua, aurinko on piilossa pilviin

Kelingin hinnoittelujärjestelmässä on kaksi huomion arvoista seikkaa.

Ensinnäkin Kuaishou ei tarjoa jäsenyysvaihtoehtoa, joka voi tuottaa rajattomasti töitä, mikä tarkoittaa, että riippumatta siitä, valitsevatko he lataustilan vai jäsenyystilan, käyttäjät itse asiassa "maksavat rahaa ostaakseen aikoja".Ainoa ero on kunkin sukupolven yksikköhinta sekä erilaiset toiminnot, kuten vesileiman poisto, videon laajennus ja pääpeilin liike.

Tekoälyvideoiden luomisen kustannukset ovat korkeat, eikä Kuaishou tarjoa jäseniä, jotka voivat luoda rajattomasti aikoja. Kuaishou haluaa luonnollisesti välttää mahdollisen kustannusten hallinnan ja hillitä harmaata tuotantoa.

Toiseksi, inspiraatioarvo Kelingin "maksuvaluuttana" vastaa hinnoittelultaan Kuai-kolikoita, joita käytetään Kuaishoun ekosysteemin ankkureiden palkitsemiseen. Yhdellä yuanilla RMB:tä voit ostaa 10 pikakolikkoa tai 10 inspiraatiopistettä. Tämä hinnoittelutapa saattaa säilyttää mahdollisuuden maksujärjestelmän avaamiseen Kuaishoun ekosysteemissä tulevaisuudessa.


Kuaishou ei suinkaan ole ainoa, jolla on tarpeita, skenaarioita, asiakkaita, laitteita, dataa, teknologiaa ja kykyjä samanaikaisesti.

Edellä mainitut alan sisäpiiriläiset ennustavat, että Byte pystyy lähitulevaisuudessa valmistamaan saman tason generatiivisia videotuotteita. Ennen sitä Kuaishoun on suoritettava käyttäjien kerääminen ja sisällön kerääminen ikkunajakson sisällä, jotta tekoälysisältö voi toimia tehokkaasti Kuaishoun ekosysteemissä. On parasta pystyä kulkemaan kaupallistamispolun läpi ja istumaan edelläkävijänä pidempään.

Perinteiset kasvun ja toiminnan keinot ovat asialistalla. Kelingin virallisilla verkkosivuilla käynnistettiin nopeasti jäsenille 50 % alennustapahtuma Samaan aikaan käyttäjät voivat saada 66 inspiraatiopistettä kirjautumalla sisään joka päivä vähentääkseen maksumallin vaikutusta käyttäjien kasvuun ja säilyttämiseen, jotta kaikki käyttäjät voivat vähintään. kokeile ilman kynnystä.

Lisäksi Keling ei painota Kuaishou-sivuston toiminnassa liikaa sellaisia ​​käsitteitä kuin generatiiviset videot, diffuusiomalliratkaisut ja hajautetut koulutusklusterit. Sen sijaan se käyttää "vanhoista kuvista videoita", "sylkeilee sinut läpi". aika ja tila" ja "ylösnousemus 40 vuotta sitten". "Edellinen valokuva" ja muut pelimenetelmät houkuttelevat käyttäjiä käyttämään sitä ensin, jotta käyttäjät ymmärtäisivät kustannuksia.

Tavallisille käyttäjille uuden pelin vaikeuspolku on sama kuin aiemmassa Kuaiyingin erikoistehostepelissä Heistä tulee suurten mallituotteiden todellisia käyttäjiä.

Tämä on äärimmäinen ensimmäinen askel Kuaishoulle ja Bytelle tekoälyvideoiden tekemisessä, jos käyttäjät ovat omiaan, se on myös heidän kohtaamaansa äärimmäinen kriisi tekoälyn aikakaudella, jos käyttäjät houkuttelevat pois uusia epäjatkuvia tuotteita.

Sen sijaan, että väittäisivät, että he kilpailevat pääsystä tekoälyvideon aikakauteen, on parempi sanoa, että he ovat kaikki puolustajia. Uusi tuottavuus luo uusia sisältömuotoja ja lopulta uusia alustoja Tämä tarina on tuttu sekä Cheng Yixiaolle että Zhang Yimingille.

Heidän on oltava ensimmäinen taso.

(Kansikuva Kelingin luoma.)


Mediayhteistyön yhteyshenkilö WeChat ID |ciweimeijejun

Jos haluat kommunikoida kanssamme, voit liittyä yhteisöön vastaamalla taustalla "liity ryhmään".