notizia

"Keling" di Kuaishou è diventato inaspettatamente popolare, Byte era ansioso di recuperare il ritardo e la competizione sulla traccia video AI Wensheng si è intensificata

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Nel febbraio 2024, l’emergere di Sora ha impedito a molte grandi aziende di modellismo di organizzare un buon Festival di Primavera.

"Il Gala del Festival di Primavera è ancora in riproduzione, quindi stiamo organizzando urgentemente discussioni di gruppo", ha detto con entusiasmo a "City Circle" un dipendente di un'azienda leader nel settore dell'intelligenza artificiale. Vedendo l'esperienza fluida di Sora, anche i blogger che vendono corsi si stanno affrettando a lanciare tutorial online e guadagnare un sacco di soldi.

Chi riuscirà a "copiare" la versione domestica di Sora nel minor tempo possibile? Sempre più persone si concentrano su Alibaba, Baidu e i "Big Five"? Ma nessuno pensava che il vincitore sarebbe stato un giocatore veloce con prestazioni tecniche relativamente "da Buddha".

Il 7 giugno, Kuaishou ha lanciato improvvisamente il modello video Wensheng "Kling", che può supportare la generazione di video fino a 2 minuti. Inoltre, rispetto a Sora, che è ancora nella fase "futuro", Keling è stato aperto ai test non appena è stato annunciato, e anche i risultati ottenuti sono notevoli.

"Keling è l'argomento più discusso recentemente nel settore", ha detto a City Circle una persona del settore del capitale di rischio. Secondo i dati ufficiali, più di 500.000 persone hanno fatto domanda per Keling entro un mese dal suo lancio. È stato aperto a più di 300.000 utenti e ha generato più di 7 milioni di brevi video.

L'inaspettata popolarità di Ke Ling inevitabilmente mise Byte un po' in imbarazzo. Nel maggio di quest'anno, Byte ha anche aperto il test del modello video Wensheng "Jimeng", ma l'effetto non è ancora evidente nella traccia video Wensheng attualmente popolare.

Improvvisamente respinto da un avversario che era stato "ignorato", Byte aveva bisogno di recuperare terreno. Secondo TMTPost, ByteDance ha recentemente impostato il grande modello AI come direzione “P0 di livello più alto” del gruppo. Molti team come Douyin e Jianying stanno anche lavorando duramente per sviluppare applicazioni di modelli video AI, che dovrebbero essere annunciate nel prossimo futuro.

1. Può essere fatto velocemente, in modo violento e violento.

Molti sviluppatori hanno detto a "City" che il lancio di Keling e le prestazioni eccezionali sono una sorpresa nel settore.

Recentemente, "City Boundary" ha utilizzato un paragrafo di "gatto nero" come parola chiave e ha inserito lo stesso messaggio in Keling, Jimeng e "Qingying" appena lanciato da Zhipu AI: "Le strade della città in una giornata piovosa sono vuote Una persona, un simpatico gatto nero, corre davanti. Ha gli occhi verdi, un collare giallo e un campanello sul collo e lunghi capelli neri sul corpo. Il video è girato dalla prospettiva della telecamera, e l'acqua sul il terreno lo riflette.

Tra i tre video generati, sebbene la versione Keling non sia riuscita a ottenere l'effetto della corsa veloce, i video generalmente erano conformi alle regole oggettive.

Al contrario, nella versione "Jimeng" non c'era acqua sul terreno e il gatto nero non si muoveva avanti. Sebbene la versione "Qingying" abbia un accumulo di acqua, il gatto nero ha un'andatura strana quando cammina e anche la coda perde fotogrammi.

▲(I video sono generati da Ke Ling, Ji Meng e Qing Ying in ordine)

Secondo "Silicon Star", Keling ha impiegato tre mesi per costruire il team di Kuaishou; le direzioni includono l'elaborazione del segnale immagine/video, la fotografia computazionale e la visione artificiale, la riduzione della funzione di perdita, la generazione della visione, ecc.

Il predecessore di Keling proviene da un progetto poco appariscente "Puji" riavviato da Kuaishou nell'ottobre 2023. Si tratta di uno strumento software che utilizza l'intelligenza artificiale per generare emoticon Gif 2s da immagini statiche. All’inizio di marzo di quest’anno, Kuaishou ha tenuto un piccolo incontro interno. L’idea di Wan Pengfei è stata confermata da Gai Kun (Yu Yue), vicepresidente senior di Kuaishou, e Puchi è stato subito determinato a diventare un prodotto per le indagini preliminari.

Secondo "Silicon Star People", "Quando si fa Keling, c'è consenso a livello di esecuzione sul fatto che sia veloce, rude e feroce".

Meno di un mese dopo l'inizio, il progetto Keling ha ricevuto il sostegno del fondatore di Kuaishou, Cheng Yixiao, che lo considerava un progetto strategico per l'azienda. Gai Kun dice spesso anche: le carte dell'azienda sono tutte a tua disposizione e l'azienda lo supporta pienamente.

Ke Ran, imprenditore sulla traccia umana digitale, ha analizzato "City": "Il successo di Keling è in gran parte dovuto al materiale di dati video accumulato da Kuaishou. Guardando il Paese, l'unico che può competere con esso sotto questo aspetto è Douishu sound" ."

Ma nonostante lo scenario sia bellissimo, Byte sembra un po’ solo.

Sebbene "Jimeng" sia stato annunciato ufficialmente il 9 maggio, il 17 giugno, Jimeng è apparso anche come principale sostenitore tecnico dell'IA nella breve serie dell'AIGC "Sanxingdui: Future Apocalypse". Tuttavia, sia in termini di performance sul lato C che rispetto al breve dramma AIGC di Kuaishou “Mountains and Seas”, lanciato il 13 luglio, la voce di Ji Meng non è molto forte.

Il 17 luglio sul mercato è arrivata la notizia che Byte annuncerà i progressi della tecnologia video Vincent simile a Sora. Anche il mondo esterno interpreta questo nel senso che Byte raggiungerà e competerà frontalmente con Keling.

Tuttavia, Byte ha successivamente dichiarato a "City Circle" che la notizia non era accurata. Il 17 luglio, "City Circle" ha notato che l'evento era più simile a una sessione di condivisione tecnologica. L'incontro è stato ospitato principalmente da Feng Jiashi, il leader del team di ricerca visiva di base del modello grande Doubao, e l'intera sessione è stata condivisa da ricercatori Byte, studiosi istituzionali, ecc. in inglese.

Sembra che la "grande mossa" di Byte potrebbe dover attendere ancora per un po'.

2. Il byte non è stato ancora recuperato

Quindi, perché Byte si è perso la festa nel brano Vincent Video che è stato in pieno svolgimento di recente?

In una certa misura, forse perché rispetto a Kuaishou che scommette su "Ke Ling", può "sconfiggere dieci abilità con un solo sforzo". Il layout del modello su larga scala di Byte è più complicato e nella prima metà di quest'anno gli avversari più importanti di Byte sono Tencent e Alibaba.

A fronte dei modelli di grandi dimensioni, il passo di Byte non è più “radicale”. Dopotutto, è stato Byte a prendere l’iniziativa di lanciare una grande guerra dei prezzi nel settore più di 2 mesi fa.

Il 15 maggio, alla "FORCE Motive Power Conference" di ByteDance, Byte ha lanciato un servizio API basato sul modello di pouf autosviluppato. Allo stesso tempo, Tan Dai, presidente di Volcano Engine, ha fatto un passo avanti e ha rivelato l’ultimo prezzo di “Doubao”: 0,0008 yuan/migliaia di token, annunciando che questo era il “prezzo minimo” inferiore al 99,3% del settore.

A quel tempo, l'"attacco" di Byte aveva preso il sopravvento. Secondo "circoli di mercato" provenienti da molte fonti, i principali attori erano impreparati all'attacco di Byte, sebbene tutte le parti si sentissero impotenti, potevano seguirlo solo passivamente;

Nei giorni successivi, Alibaba Cloud, Baidu Wenxin Model e Tencent Cloud hanno annunciato successivamente che avrebbero ridotto significativamente i prezzi dei loro token di input e API per l'inferenza di modelli di grandi dimensioni. Sotto questa influenza, le richieste del lato C per modelli di teste su larga scala sono ora quasi gratuite e l’industria ha iniziato a muoversi verso il livello ecologico successivo.

Secondo il fondatore di una società di applicazioni legali di intelligenza artificiale, non c'è stato quasi alcun ritardo dopo l'apertura del servizio API e il personale di vendita di Volcano Engine ha iniziato a contattare attivamente i clienti e a promuovere i prodotti. Ciò conferma anche la speculazione che circola nel mercato secondo cui Byte avrebbe contrassegnato il modello grande come la strategia di massimo livello.



▲(Tan Dai al “Convegno FOECE” del 2024. Fonte/Volcano Engine)

Recentemente, i pouf a sacco “prodotto di punta” di Byte sono cresciuti in modo significativo.

Secondo i dati di Questmobile, a giugno 2024, tra le app AIGC nazionali, Doubao, Tiangong, Kimi Smart Assistant e Cat Box hanno raggiunto una crescita impressionante, con Doubao al primo posto nel traffico.



▲(Fonte foto/QuestMobile)

Rispetto a Kuaishou, ciò di cui Byte è più preoccupato ora potrebbe essere la piena concorrenza ecologica dai modelli di base di grandi dimensioni al livello di applicazione dell’intelligenza artificiale. Inoltre, considerando che Volcano Engine diventerà ufficialmente un cloud solo nel 2021, è il più “giovane” tra i giganti fornitori di cloud. Per più di tre anni, Huoshan Cloud è stato considerato uno sfidante nel mercato del cloud. Il modo in cui Byte collabora con il modello di base di grandi dimensioni, il livello applicativo e il mercato cloud è una proposta completa.

Recentemente, "Photon Planet" ha riferito che un gran numero di utenti della piattaforma "Kouzi" di Byte stanno cercando modi per connettere gli agenti e i bot creati agli account ufficiali o ai mini-programmi di WeChat, e le discussioni sono molto attive.

Nel dicembre dello scorso anno, Byte ha lanciato all'estero la piattaforma di sviluppo di applicazioni AI "coze". Nel febbraio di quest’anno è stata lanciata online la versione domestica di “Button”. Un gran numero di mercanti Douyin sperano anche di ricavarne rapidamente una pentola d'oro.

Considerando che Tencent ha rilasciato tardivamente la piattaforma di creazione e distribuzione di agenti AI "Tencent Yuanqi" nel maggio di quest'anno. A quel tempo il numero di visite a Button aveva raggiunto i 2,33 milioni di volte. Al momento, Tencent Yuanqi non ha ancora aperto l'ecosistema della serie WeChat di mini programmi, account ufficiali e account di abbonamento al servizio clienti.

Dopotutto, lo sviluppo dell’intelligenza artificiale è ancora nelle fasi iniziali. Byte, come Tencent, deve ancora dedicare molto tempo all'educazione degli utenti. Competere per i diritti di distribuzione nell’era dell’intelligenza artificiale e ottenere un vantaggio potrebbe essere una lezione più grande che Byte deve imparare per prendere di mira Tencent.

3. Colpisci più tardi, c'è ancora tempo

A livello di settore, nell'Internet di oggi, non mancano il traffico di contenuti, il traffico di e-commerce e i byte di munizioni finanziarie. Anche se è "un passo indietro" in Vincent Video a breve termine, a lungo termine, ha ancora il potenziale per recuperare terreno.

Anche l'utilizzo di strategie di mercato attive per recuperare posizioni in ritardo e realizzare vigorosamente miracoli è la specialità di Byte.

Recentemente, prendendo di mira Alibaba, Byte ha lavorato anche sull’integrazione di modelli di grandi dimensioni. Alla DingTalk Ecosystem Conference tenutasi il 26 giugno, il presidente Ye Jun ha annunciato che oltre al Tongyi di Alibaba, saranno inclusi in DingTalk anche grandi modelli di terze parti delle altre sei società. Questi includono MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing e Baichuan Intelligence, che coprono quasi tutte le più note startup modello su larga scala in Cina. È ovvio "costruire l'ecosistema AI più aperto della Cina". ".

Similmente al gameplay di DingTalk, oltre a supportare il proprio "Doubao", la piattaforma Kouzi di Byte ha anche accesso ai principali modelli esterni come Tongyi Qianwen, Dark Side of the Moon e MiniMax. Il 14 giugno Kouzi ha lanciato anche la funzione “Model Square”, che consente agli utenti di selezionare due modelli anonimi e assegnargli un punteggio in base alle prestazioni del contenuto generato.



Inoltre, Byte è stato recentemente smascherato e la sua esplorazione di "AI + hardware" sta accelerando e non esita a reclutare talenti attraverso acquisizioni.

Secondo "Tech Planet", PICO, una filiale di Byte, sta sviluppando numerosi dispositivi indossabili dalla seconda metà dello scorso anno, tra cui cuffie e altoparlanti, e anche questi dispositivi saranno dotati di intelligenza artificiale. Il team di Byte Doubao ha anche esplorato la combinazione di software e hardware di modelli su larga scala. La combinazione di software e hardware di modelli su larga scala è stata gradualmente applicata a dispositivi hardware come macchine per l'apprendimento, cani robot e robot.

Secondo un altro rapporto di 36Kr, il responsabile della “linea D” dell’hardware Byte AI è Li Haoqian. Quest'ultimo è il fondatore di Oladance, il marchio di cuffie OWS (Open Wearable Stereo) acquisito da Byte nel marzo di quest'anno. Il responsabile della "O Line", un'altra linea di hardware AI, è anche il fondatore dell'azienda acquisita da Byte. Fa capo a Hong Dingkun, vicepresidente di ByteDance Technology.

Nella direzione di Vincent Video, di fronte alla recente popolarità del brano, gli inseguitori, compreso Byte, hanno ancora tempo.

Recentemente uno sviluppatore ha dichiarato a "City World": "Attualmente utilizzo Keling per comporre immagini e ridurre il carico di lavoro del flusso di lavoro. Non lo utilizzo ancora completamente per creare, quindi non sono ancora molto dipendente da esso."

Secondo un altro sviluppatore e blogger AIGC di video brevi, Keling ha ancora molto margine di ottimizzazione: "Affidarsi a Keling Wensheng Video non può garantire la coerenza dell'IP umano virtuale. Di solito utilizzo Kelingtu per produrre video. La funzione è equivalente dare a Ke Ling un'immagine, permettendogli di generare video dinamici da diverse prospettive e poi unirli insieme per simulare l'effetto del movimento della telecamera. In effetti, la proporzione dell'operazione umana è maggiore.

Un membro del team di ricerca e sviluppo di un prodotto di simulazione di incontri con intelligenza artificiale domestica ha dichiarato: "Nell'attuale mercato delle applicazioni di modelli su larga scala, tutti attraversano il fiume sentendo le pietre. Come commercializzarlo è una questione troppo lontana e troppo vago. Ma quello che è certo è che più persone lo usano e ci giocano, più può garantire l’ottimizzazione e l’iterazione del prodotto.”

(Ke Ran è uno pseudonimo)

Autore | Dong Wenshu

Modifica | Li Yuan

Operazioni | Liu Shan