uutiset

Kuaishoun "Keling" nousi yllättäen suosituksi, Byte halusi päästä kiinni ja kilpailu AI ​​Wensheng -videoraidalla kiristyi

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Helmikuussa 2024 Soran ilmaantuminen esti monia suuria malliyrityksiä järjestämästä hyvää kevätjuhlaa.

"Kevätjuhlagaala toistetaan edelleen, joten järjestämme kiireesti ryhmäkeskusteluja", erään johtavan tekoälyyrityksen työntekijä sanoi innokkaasti "City Circlelle". Nähdessään Soran silkinpehmeän kokemuksen, jopa kursseja myyvät bloggaajat ryntäävät julkaisemaan verkko-opetusohjelmia ja tienaamaan paljon rahaa.

Kuka pystyy "kopioimaan" Soran kotimaisen version nopeimmin? Yhä useammat ihmiset keskittyvät Alibabaan, Baiduun ja Big Fiveiin? Mutta kukaan ei uskonut, että voittaja olisi nopea pelaaja, jolla on suhteellisen "buddhamainen" tekninen suorituskyky.

Kesäkuun 7. päivänä Kuaishou lanseerasi yhtäkkiä Wensheng-videomallin "Kling", joka voi tukea jopa 2 minuutin videotuotantoa. Lisäksi vielä "tulevaisuus"-vaiheessa olevaan Soraan verrattuna Keling avattiin testattavaksi heti julkistamisen jälkeen, ja myös syntyneet tulokset ovat merkittäviä.

"Keling on aihe, josta on keskusteltu alalla viime aikoina eniten", pääomasijoitusalan henkilö kertoi City Circlelle. Virallisten tietojen mukaan yli 500 000 ihmistä haki Kelingiä kuukauden sisällä sen julkaisusta. Se on avattu yli 300 000 käyttäjälle ja se on luonut yli 7 miljoonaa lyhyttä videota.

Ke Lingin odottamaton suosio sai Byten väistämättä hieman nolostumaan. Tämän vuoden toukokuussa Byte avasi myös Wensheng Video -mallin "Jimeng" -testin, mutta vaikutus ei ole vielä ilmeinen tällä hetkellä suositussa Wensheng Video -raidassa.

Yhtäkkiä "ohjaamaton" vastustaja heitti hänet pois, joten Byten piti saada kiinni. TMTPostin mukaan ByteDance on äskettäin asettanut AI-suuren mallin ryhmän "P0-korkeimman tason" suunnaksi. Monet tiimit, kuten Douyin ja Jianying, työskentelevät myös kovasti kehittääkseen tekoälyvideomallisovelluksia, joiden odotetaan julkaistavan lähitulevaisuudessa.

1. Se voidaan tehdä nopeasti, karkeasti ja kiivaasti.

Monet kehittäjät kertoivat "Citylle", että Kelingin lanseeraus ja erinomainen suorituskyky ovat yllätys alalla.

Äskettäin "City Boundary" käytti avainsanana kappaletta "musta kissa" ja syötti saman kehotteen Kelingissä, Jimengissä ja "Qingyingissä", jotka Zhipu AI oli juuri käynnistänyt: "Kaupungin kadut ovat sateisena päivänä tyhjiä. Yksi henkilö, söpö musta kissa juoksee ohi. Sen kaulassa on keltainen kaulus ja kello maa heijastaa sitä mustan kissan hahmosta.

Kolmen luodun videon joukossa, vaikka Keling-versio ei onnistunut saavuttamaan nopean juoksun vaikutusta, videot olivat yleisesti ottaen objektiivisten sääntöjen mukaisia.

Sitä vastoin "Jimeng"-versiossa ei ollut vettä maassa, eikä musta kissa liikkunut eteenpäin. Vaikka "Qingying"-versiossa on vettä kertynyt, mustalla kissalla on outo askel kävellessä, ja myös häntä menettää kehyksiä.

▲ (Videot ovat Ke Lingin, Ji Mengin ja Qing Yingin luomia järjestyksessä)

Mukaan "Silicon Star", Keling kesti Kuaishou kolme kuukautta rakentaa joukkue on vain yli 20 henkilöä Johtaja on Wan Pengfei, nykyinen johtaja Kuaishou's Visual Generation and Interaction Center, joista suurin osa Hänen tutkimustaan. Ohjeet sisältävät kuvan/videosignaalin käsittelyn, laskennallisen valokuvauksen ja tietokonenäön, menetystoiminnon vähentämisen, näön luomisen jne.

Kelingin edeltäjä on peräisin huomaamattomasta Puji-projektista, jonka Kuaishou käynnisti uudelleen lokakuussa 2023. Tämä on työkaluohjelmisto, joka käyttää tekoälyä luomaan 2s Gif-hymiöitä staattisista kuvista. Tämän vuoden maaliskuun alussa Kuaishou piti pienen sisäisen kokouksen Wan Pengfein idean vahvisti Kuaishoun varapresidentti Gai Kun (Yu Yue), ja Puchi päätettiin nopeasti esitutkinnan tuotteeksi.

"Silicon Star Peoplen" mukaan "Kun teet Kelingiä, toteutustasolla vallitsee yksimielisyys siitä, että se on nopeaa, karkeaa ja kovaa."

Alle kuukausi Keling-projektin alkamisen jälkeen se sai tukea Kuaishoun perustajalta Cheng Yixiaolta, joka piti sitä strategisena projektina yritykselle. Gai Kun sanoo myös usein: Yrityksen kortit ovat kaikki sinun käytössäsi, ja yritys tukee sitä täysin.

Digitaalisella ihmisradalla yrittäjä Ke Ran analysoi "Cityä": "Kelingin menestys johtuu suurelta osin Kuaishoun keräämästä videodatamateriaalista. Maata katsottuna ainoa, joka voi kilpailla sen kanssa tässä suhteessa, on Douishu-ääni. ."

Mutta vaikka maisemat ovat kauniita, Byte näyttää hieman yksinäiseltä.

Vaikka "Jimeng" julkistettiin virallisesti 9. toukokuuta 17. kesäkuuta, Jimeng esiintyi myös AIGC:n lyhytsarjassa "Sanxingdui: Future Apocalypse" AI teknisenä tukijana. Kuitenkin, olipa kyseessä sen suorituskyky C-puolella tai verrattuna Kuaishoun AIGC-lyhytdraamaan "Mountains and Seas", joka julkaistiin 13. heinäkuuta, Ji Mengin ääni ei ole kovin kova.

Heinäkuun 17. päivänä markkinoilla oli uutinen, että Byte ilmoittaa Soran kaltaisen Vincent-videotekniikan edistymisestä. Myös ulkomaailma tulkitsee tämän tarkoittavan, että Byte saa kiinni ja kilpailee suoraan Kelingin kanssa.

Byte kuitenkin ilmoitti myöhemmin "City Circlelle", että uutiset eivät olleet tarkkoja. 17. heinäkuuta "City Circle" huomasi, että tapahtuma oli enemmän kuin teknologian jakamisistunto. Kokouksen isännöi pääasiassa Doubao large modelin visuaalisen perustutkimusryhmän johtaja Feng Jiashi, ja koko istunnon jakoivat Byte-tutkijat, institutionaaliset tutkijat jne. englanniksi.

Näyttää siltä, ​​että Byten "iso liike" saattaa vielä odottaa jonkin aikaa.

2. Tavu ei ole vielä palautunut

Joten miksi Byte missasi viime aikoina täydessä vauhdissa olleen juhlan Vincent Video -kappaleessa.

Tietyssä määrin, ehkä siksi, että verrattuna Kuaishou-vedonlyöntiin "Ke Lingillä", se voi "päihittää kymmenen taitoa yhdellä ponnistelulla". Byten suuren mittakaavan mallin asettelu on monimutkaisempi - ja tämän vuoden ensimmäisellä puoliskolla Byten tärkeimpiä vastustajia ovat Tencent ja Alibaba.

Suurien mallien edessä Byten tahti ei ole enää "radikaali". Loppujen lopuksi se oli Byte, joka otti johdon laajan mallin hintasodan käynnistämisessä alalla yli 2 kuukautta sitten.

15. toukokuuta ByteDancen "FORCE Motive Power Conference" -konferenssissa Byte lanseerasi API-palvelun, joka perustuu sen itse kehittämään säkkipussimalliin. Samanaikaisesti Volcano Enginen presidentti Tan Dai otti askeleen ja paljasti Doubaon viimeisimmän hinnan: 0,0008 yuania/tuhat Tokenia, ja ilmoitti, että tämä oli "pohjahinta" alle 99,3 %:sta toimialasta.

Tuolloin Byten "hyökkäys" oli mennyt johtoon. Monien lähteiden "markkinapiirien" mukaan johtavat pelaajat eivät olleet valmistautuneita Byten hyökkäykseen, vaikka kaikki osapuolet tunsivat olevansa avuttomia, he saattoivat seurata vain passiivisesti.

Muutaman seuraavan päivän aikana Alibaba Cloud, Baidu Wenxin Model ja Tencent Cloud ilmoittivat peräkkäin, että ne alentavat merkittävästi suurten mallipäätelmien syöttötunnisteiden ja API:iden hintoja. Tämän vaikutuksen alaisena suurikokoisten päämallien C-puolen puhelut ovat nyt lähes ilmaisia, ja ala on alkanut siirtyä seuraavalle ekologiselle tasolle.

Laillisen AI-sovellusyrityksen perustajan mukaan API-palvelun avaamisen jälkeen ei ollut juurikaan viivettä, ja Volcano Enginen myyntihenkilöstö alkoi olla aktiivisesti yhteydessä asiakkaisiin ja mainostaa tuotteita. Tämä vahvistaa myös markkinoilla kiertävää spekulaatiota, että Byte on merkinnyt suuren mallin korkeimman tason strategiaksi.



▲(Tan Dai vuoden 2024 "FOECE-konferenssissa". Lähde/Vulcano Engine)

Viime aikoina Byten "johtavien tuotteiden" papupussit ovat kasvaneet merkittävästi.

Questmobilen tietojen mukaan kesäkuusta 2024 lähtien kotimaisista AIGC-sovelluksista Doubao, Tiangong, Kimi Smart Assistant ja Cat Box ovat saavuttaneet vaikuttavaa kasvua – Doubaon ollessa ensimmäinen liikenteessä.



▲ (Kuvan lähde/QuestMobile)

Kuaishouhun verrattuna Byte on nyt huolestuneempi, voi olla täysi ekologinen kilpailu perusmalleista tekoälysovelluskerrokseen. Lisäksi, kun otetaan huomioon, että Volcano Enginestä tulee virallisesti pilvi vasta vuonna 2021, se on jättimäisten pilvitoimittajien joukossa "nuorin". Huoshan Cloudia on pidetty pilvimarkkinoiden haastajana jo yli kolmen vuoden ajan. Se, miten Byte tekee yhteistyötä suuren perusmallin, sovelluskerroksen ja pilvimarkkinoiden kanssa, on kattava ehdotus.

Viime aikoina "Photon Planet" -raporttien mukaan suuri joukko Byten "Kouzi"-alustan käyttäjiä etsii tapoja yhdistää luomansa agentit ja botit WeChatin virallisille tileille tai miniohjelmiin, ja keskustelut ovat erittäin aktiivisia.

Viime vuoden joulukuussa Byte lanseerasi AI-sovelluskehitysalustan "coze" ulkomailla. Tämän vuoden helmikuussa ”Buttonin” kotimainen versio julkaistiin verkossa. Suuri joukko Douyin-kauppiaita toivoo myös voivansa tehdä siitä nopeasti kultapotin.

Ottaen huomioon, että Tencent julkaisi myöhässä tekoälyagentin luomis- ja jakelualusta "Tencent Yuanqi" tämän vuoden toukokuussa. Buttonin käyntien määrä oli tuolloin saavuttanut 2,33 miljoonaa kertaa. Toistaiseksi Tencent Yuanqi ei ole vielä avannut WeChat-sarjan miniohjelmien, virallisten tilien ja asiakaspalvelun tilaustilien ekosysteemiä.

Tekoälykehitys on loppujen lopuksi vielä alkuvaiheessa. Byte, kuten Tencent, tarvitsee edelleen paljon aikaa käyttäjien kouluttamiseen. Kilpaileminen jakeluoikeuksista tekoälyn aikakaudella ja etumatkan saaminen voi olla suurempi opetus, joka Byten on tehtävä Tencentin kohdistamiseksi.

3. Lako myöhemmin, vielä on aikaa

Teollisuuden tasolla nykypäivän Internetissä ei ole pulaa sisältöliikenteestä, verkkokaupan liikenteestä ja tavuista taloudellisista ammuksista, vaikka se on "askeleen jäljessä" lyhyellä, pitkällä aikavälillä. sillä on vielä potentiaalia kiinni.

Byten erikoisuus on myös aktiivisten markkinastrategioiden käyttäminen jäljessä olevien positioiden saavuttamiseksi ja tarmokkaasti ihmeiden saavuttamiseksi.

Viime aikoina Alibabaan kohdistettu Byte on myös työskennellyt suurten mallien integroimiseksi. Juuri 26. kesäkuuta kuluneessa DingTalk Ecosystem Conference -konferenssissa presidentti Ye Jun ilmoitti, että Alibaban oman Tongyin lisäksi DingTalkiin sisällytetään myös suuria kolmannen osapuolen malleja kuudesta muusta yrityksestä. Näitä ovat MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing ja Baichuan Intelligence, jotka kattavat lähes kaikki tunnetut suuret mallistartupit Kiinassa ".

Kuten DingTalkin pelattavuus, sen lisäksi, että se tukee omaa "Doubaoa", Byten Kouzi-alustalla on pääsy suuriin ulkoisiin malleihin, kuten Tongyi Qianwen, Dark Side of the Moon ja MiniMax. Kouzi lanseerasi 14. kesäkuuta myös "Model Square" -toiminnon, jonka avulla käyttäjät voivat valita kaksi nimetöntä mallia ja pisteyttää ne luodun sisällön suorituskyvyn perusteella.



Lisäksi Byte on äskettäin paljastettu, ja sen "AI + hardware" -tutkimus kiihtyy, eikä se epäröi rekrytoida kykyjä yritysostojen kautta.

"Tech Planetin" mukaan Byten tytäryhtiö PICO on kehittänyt useita puettavia laitteita viime vuoden toisesta puoliskosta lähtien, mukaan lukien kuulokkeet ja kaiuttimet, ja nämä laitteet varustetaan myös tekoälyllä. Byte Doubao -tiimi on myös tutkinut suuren mittakaavan malliohjelmiston ja laitteiston yhdistelmää. Suuren mittakaavan malliohjelmiston ja laitteiston yhdistelmää on vähitellen sovellettu laitteistoihin, kuten oppimiskoneisiin, robotikoiriin ja robotteihin.

Toisen 36Kr:n raportin mukaan Byte AI -laitteiston "D-linjasta" vastaa Li Haoqian. Jälkimmäinen on Oladancen, OWS (Open Wearable Stereo) -kuulokebrändin perustaja, jonka Byte osti tämän vuoden maaliskuussa. Toisesta tekoälylaitteistolinjasta "O Line" vastaava henkilö on myös Byten hankkiman yrityksen perustaja. Hän raportoi ByteDance Technologyn johtajalle Hong Dingkunille.

Vincent Videon suunnassa kappaleen viimeaikaisen suosion edessä takaa-ajoilla, mukaan lukien Byte, on vielä aikaa.

Äskettäin kehittäjä kertoi "City Worldille": "Tällä hetkellä käytän Kelingiä kuvien sommittamiseen ja työnkulun työmäärän vähentämiseen. En käytä sitä vielä täysin luomiseen, joten en ole vielä kovin riippuvainen siitä."

Toisen kehittäjän ja lyhyen videon AIGC-bloggaajan silmissä Kelingillä on vielä paljon tilaa optimointiin: "Keling Wensheng Videoon luottaminen ei voi taata virtuaalisen ihmisen IP:n johdonmukaisuutta. Käytän yleensä Kelingtua videoiden tuottamiseen. Toiminto on vastaava. antaa Ke Lingille kuvan, jonka avulla hän voi luoda dynaamisia videoita eri näkökulmista ja sitten yhdistää ne simuloimaan kameran siirtämisen vaikutusta.

Kotimaisen tekoälyn simulointitreffituotteen T&K-tiimin jäsen sanoi: "Nykyisellä laajamittaisella mallisovellusmarkkinoilla kaikki ylittävät joen kiviä tuntemalla. Kuinka se kaupallistetaan, on liian kaukana ja liian kaukana Varmaa on kuitenkin se, että mitä enemmän ihmiset käyttävät ja pelaavat sitä, sitä paremmin se voi varmistaa tuotteen optimoinnin ja iteroinnin.

(Ke Ran on salanimi)

Tekijä | Dong Wenshu

Muokkaa | Li Yuan

Toiminta | Liu Shan