notizia

Il vecchio che non vede l'ora di Sora, si precipita a Kuaishou Keling

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Perché Kuaishou è il primo grande produttore a lanciare video AI? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Testo |. Chen Meixi

Redattore |. Direttore

Agli albori in cui Open AI prese d’assalto il mondo in termini di modelli di grandi dimensioni, Kuaishou non era una figura brillante. A quel tempo, Baidu ha inventato Wenxinyiyan, Alibaba ha inventato Tongyi Qianwen e Tencent ha inventato il grande modello Hunyuan, mettendosi al passo l'uno con l'altro e la velocità di ricerca, sviluppo e apertura è stata molto elevata.

Kuaishou non era nella lista iniziale dei contendenti, e anche adesso, poche persone sanno nominare il nome del grande modello linguistico di Kuaishou: Ruyi.

La situazione della battaglia è cambiata il 6 giugno di quest'anno. Il modello di grandi dimensioni generato dal video di Kuaishou, Keling, ha aperto le domande per la beta pubblica. Quel giorno era anche il 13° anniversario di Kuaishou. I media spesso paragonano Keling a Sora di Open AI, ma dal suo debutto esplosivo a febbraio, Sora non è stata aperta al pubblico. Di conseguenza, gli utenti cinesi curiosi hanno iniziato ad affluire a Keling.

Dieci giorni dopo, Keling "ha (ricevuto) decine di migliaia di domande". Questi dati provengono da Wan Pengfei, che quel giorno partecipò alla Conferenza di Zhiyuan. Al momento del discorso, il suo titolo era quello di capo del Kuaishou Visual Generation and Interaction Center, ed era anche la persona effettiva responsabile di Keling. Al 19 luglio il numero dei richiedenti ha superato il milione. A Keling è bastato più di un mese per aumentare il numero di richieste da decine di migliaia a un milione Tra i progressi dei modelli di grandi dimensioni nella prima metà dell'anno, questa è la prestazione più sorprendente.


L'immagine generata dallo spirito, la parola sollecita: l'ape tra i fiori

Le storie di inversioni di rotta sono sempre popolari tra il pubblico. Tuttavia, un attento inventario di Keling e del grande business di modellismo di Kuaishou che sta dietro ad esso rivelerà che questo non è un bel dramma che giace dormiente e poi emerge all'improvviso, né è una narrazione eroica in cui un giovane talentuoso guida una piccola squadra per colpire Indietro.

Viene inoltre generato un video basato sull'immagine generata da Keling, con la parola immediata: api che volano in giro

Perché Kuaishou è il primo grande produttore a lanciare video AI?Sono le esigenze aziendali a portare una forte motivazione e un’alta priorità, è l’accumulo di dati e tecnologia sotto forma di prodotto che porta velocità di iterazione ed è l’abbinamento degli scenari aziendali a portare clienti reali.

L'apparizione di Ke Ling non è un evento casuale. A livello nazionale, il più grande rivale di Kuaishou nel campo dei video AI verrà molto probabilmente da ByteDance.


Quando c’è domanda, c’è motivazione

I creatori sono uno degli anelli più importanti nell'ecosistema dei contenuti Kuaishou. Secondo i dati ufficiali rilasciati da Kuaishou, nel 2023, ci saranno 138 milioni di creatori che hanno pubblicato brevi video su Kuaishou per la prima volta e i video pubblicati durante l'anno hanno ricevuto più di 1 trilione di Mi piace sulla piattaforma.

Avere un gran numero di creatori di contenuti significa che Kuaishou deve farsi carico delle loro esigenze di strumenti di contenuto. Altrimenti, i creatori che inseguono la produttività emergente si precipiteranno presto verso altri strumenti e persino su altre piattaforme. Questo è anche il valore di Kuaiying to Kuaishou e Cutting to Byte.

Pertanto, il precedente investimento di Kuaishou in grandi modelli linguistici non è stato radicale, ma deve puntare ai massimi livelli nella competizione dei grandi modelli multimodali.

Prima di Keling, la capacità del modello di grandi dimensioni Wenshengtu autosviluppato da Kuaishou era stata integrata in Kuaishou. Il risultato dei test interni è stato che gli utenti hanno generato una media di oltre 500 milioni di immagini AI nell'area dei commenti ogni mese.


L'immagine generata da Keling, la parola immediata: Alieno in piedi vicino al fiume Yangtze

La forte motivazione portata dalla domanda è certamente una condizione necessaria per l’emergere del Keling, ma Kuaishou non è l’unico ad avere queste condizioni. Se c'è qualche altro fattore importante che ha influenzato l'emergere di Ke Ling, potrebbe essere la determinazione.

La determinazione viene innanzitutto dal top management di Kuaishou.

In precedenza, i movimenti di Kuaishou sui modelli di grandi dimensioni sembravano sempre mezzo passo più lenti. Quando si tratta di modelli linguistici domestici di grandi dimensioni, tutti penseranno prima a Wen Xin Yi Yan e Tong Yi Qian Wen; quando si tratta di applicazioni di modelli linguistici di grandi dimensioni, Kimi e Doubao sono i più popolari sul mercato; Nel campo della grafica vincenziana, Ririxin 5.0 di SenseTime è stato il primo a uscire dal mercato interno. La mattina dopo il suo rilascio, il prezzo delle azioni di SenseTime Technology è aumentato di oltre il 30% e le negoziazioni sono state temporaneamente sospese.

Nella precedente serie di storie, Kuaishou era in una posizione apparentemente marginale. I modelli video di grandi dimensioni e le loro applicazioni sono il nodo più importante della competizione e la parte più importante del layout complessivo del modello di grandi dimensioni.

In un precedente rapporto del media tecnologico Silicon Star, un tecnico del team Keling ha dichiarato: "Ciò che Gai Kun dice spesso è che tutte le carte dell'azienda sono a tua disposizione e la società Gai Kun lo supporta pienamente." il vicepresidente senior di Kuaishou e funge da amministratore delegato. Il responsabile degli affari della linea della stazione e anche il responsabile della linea delle scienze sociali. Dopo le dimissioni dell'ex CTO Chen Dingjia, Gai Kun è diventato uno dei massimi leader della linea tecnologica di Kuaishou.

Wan Pengfei e la sua squadra potrebbero avere una determinazione ancora maggiore.Un dettaglio è che, dopo aver deciso di rilevare il progetto Keling, Wan Pengfei ha affidato il lavoro originale di soddisfare le esigenze aziendali di tutte le parti ad altre persone responsabili dello stesso livello nel team di Zhang Di.Di conseguenza, anche altri membri del team Keling hanno ceduto l'attività originaria e si sono dedicati completamente alla ricerca e allo sviluppo di Keling. È normale fare gli straordinari nei fine settimana per stare al passo con i progressi.

Un video ulteriormente generato in base all'immagine generata da Keling, parole immediate: Alieno che cammina nell'acqua, due alieni si danno il cinque

"In realtà, più di un mese prima del rilascio ufficiale, i risultati dei test di Ke Ling non erano molto buoni." Un professionista nel settore dei modelli di grandi dimensioni ha detto a Hedgehog Commune: "Lao Wan e gli altri stanno lottando contro le probabilità. Ciò che segue è davvero 'risultati miracolosi con grande forza'. Molte persone non si aspettavano un simile effetto alla fine."

Quindi la determinazione è diventata l’ultima variabile.


L’accumulo porta alla velocità

Kuaishou, o qualsiasi piattaforma leader di video brevi, ha accumulato esperienza nello sviluppo di video AI in due aspetti, contenuti e tecnologia.

I video sono prodotti dagli utenti e, dopo essere stati annotati e compresi dalla piattaforma, il contenuto che può essere distribuito viene filtrato. Questo è il percorso intrinseco alla logica aziendale di Kuaishou. Il contenuto elaborato diventa una sorta di dati. Dalla descrizione del contenuto stesso alla popolarità dopo la distribuzione, Kuaishou ha padroneggiato un'enorme quantità di dati sui contenuti.In parole povere, entrambi hanno contenuti e sanno quali "buoni contenuti" piace vedere agli utenti.

Per l’addestramento di modelli video generativi di grandi dimensioni, questo processo è come preparare i piatti in anticipo.

Anche il "cuoco" è già pronto.

La maggior parte dei membri principali del team di ricerca e sviluppo del progetto Keling sono vecchi subordinati di Wan Pengfei del periodo Y-tech. All'inizio dell'anno, i membri del team sono entrati gradualmente in contatto con informazioni e materiali rilevanti e hanno iniziato a lavorare sulla ricerca e sullo sviluppo di Keling.

In precedenza, il team di Wan Pengfei era principalmente responsabile di soddisfare le esigenze di creazione intelligente degli UGC nell'ambito dell'ecosistema creativo Kuaishou e ha lavorato a stretto contatto con partner commerciali come la produzione della stazione principale, Kuaiying e Yitian Camera. Le forme del prodotto includono l'abbellimento dei ritratti, effetti speciali audio e video , avatar trasmessi in diretta, ecc.

Nel 2021, Wan Pengfei ha tenuto un discorso pubblico in qualità di "Capo della piattaforma tecnologica AI del dipartimento Y-tech" alla conferenza globale sulla tecnologia dell'intelligenza artificiale.Tra i casi condivisi a quel tempo c'era l '"effetto speciale della foto vivente" - un video gameplay di Tusheng nell'era pre-grande modello. A quel tempo, le librerie di modelli di Kuaishou e Kuaiying lanciarono l'effetto speciale "spostamento di vecchie foto". Dopo che gli utenti hanno caricato una foto, i personaggi nella foto possono eseguire movimenti come sorridere, sbattere le palpebre e annuire per formare un effetto video. Secondo i rapporti, questo effetto speciale dinamico è stato utilizzato da oltre 3,44 milioni di persone a Kuaiying.


Le vecchie foto e video commoventi pubblicati dal netizen Kuaishou @senyuhelu nel 2021

Nel 2021, Wan Pengfei era molto fiducioso nello sviluppo della tecnologia generativa e ha proposto che "i modelli generativi diventeranno sempre più potenti, il contenuto generato sarà più realistico e il processo di generazione sarà più stabile e controllabile".

Tre anni dopo, Keling è apparso di nuovo con il suo lavoro "Reviving Old Photos". Alcuni utenti che hanno richiesto il permesso di utilizzarlo hanno utilizzato la funzione "Tusheng Video" per trasformare le foto dei parenti defunti in video. Rispetto agli "effetti speciali delle foto viventi" di tre anni fa, attraverso istruzioni aperte, gli utenti possono far sì che i personaggi nelle foto completino azioni più complesse. Questo è esattamente il cambiamento apportato dalla nuova tecnologia dei modelli di grandi dimensioni.

Sora è stato rilasciato nel febbraio di quest'anno e il team Kuaishou Keling ha iniziato a formarsi in un periodo ravvicinato, ma lo sviluppo e l'applicazione della tecnologia di generazione video multimodale è sempre stato nell'ambito del lavoro di Wan Pengfei e del suo team .

I praticanti sopra menzionati hanno espresso opinioni simili a Hedgehog Commune: "In effetti, l'emergere di Sora equivale a lasciare che tutti determinino il percorso tecnico o il piano in quel nodo, ma ci sono molte applicazioni della tecnologia visiva, comprese le cose multimodali. Questo è quello che hanno sempre fatto.”

L'accumulo tecnico di cui Ke Ling ha bisogno deriva da questo. Il cuoco si è imbattuto nel piatto preparato e, dopo che una nuova ricetta è stata vista in tutto il mondo, Kuaishou è diventato una delle squadre che ha preparato il prodotto finito più velocemente.

Ma allo stesso tempo, i professionisti sopra menzionati hanno anche un atteggiamento di attesa e vedono se Keling potrà mantenere a lungo una posizione di leadership nella tecnologia e nei prodotti. "Gli algoritmi utilizzati da tutti ora sono simili. Ogni azienda può avere qualche messa a punto, ma la differenza è sempre la stessa, con carte, dati e algoritmi simili, è solo questione di tempo prima che ogni azienda produce prodotti con effetti simili.

Pertanto, la velocità è solo un vantaggio temporaneo di Kuaishou. Hanno bisogno di trasformare veramente il loro vantaggio in clienti stabili durante il periodo principale.


Dove c'è una scena, ci sono i clienti

Il 29 dicembre 2020, Kuaishou ha ufficialmente rilasciato per la prima volta la "fazione Kuaishou" come valore aziendale in una lettera interna a tutti i dipendenti, affermando che "l'ossessione per i clienti" è il nucleo dei valori di Kuaishou.

In precedenza, sia all'interno di Kuaishou che di altre importanti società Internet, il concetto più spesso menzionato era "utenti". Per questo motivo, Kuaishou ha spiegato specificamente le ragioni di questo cambiamento di vocabolario. "La complessità aziendale dell'azienda è diventata più elevata, espandendosi da 'utenti' a 'clienti'. I clienti includono produttori e consumatori, clienti del lato B e utenti del lato C, clienti esterni e clienti interni. Dobbiamo rafforzare la nostra comprensione dei produttori e Clienti del lato B Per migliorare la comprensione e la consapevolezza del cliente, dobbiamo anche enfatizzare la consapevolezza del servizio verso i clienti interni”.

Guardando indietro al 2024, è stato davvero un importante spartiacque nei cambiamenti nella struttura aziendale di Kuaishou. Nel 2020, tra le entrate annuali di Kuaishou, la percentuale delle entrate delle trasmissioni in diretta è scesa dall'80,4% dell'anno precedente al 56,5% e la percentuale delle entrate dei servizi di marketing online è aumentata dal 19% al 37,2%. la percentuale dei ricavi da servizi è rapidamente salita al 6,3% dall’1% dell’anno precedente.

Come ha spiegato lo stesso Kuaishou, produttori e consumatori, clienti del lato B e utenti del lato C, clienti esterni e clienti interni sono tutti clienti importanti di Kuaishou e diventeranno anche i clienti target del grande modello di Kuaishou.

Produttori e consumatori costruiscono congiuntamente la catena commerciale più elementare di Kuaishou. I produttori producono contenuti e i consumatori consumano contenuti.Il valore dei prodotti di modello di grandi dimensioni risiede nell'abbassare la soglia di produzione migliorando al tempo stesso la qualità dei contenuti.

Il primo è facile da capire: come può fare attualmente Keling, è possibile ottenere un video inserendo testo o immagini. Per le persone senza condizioni di ripresa e capacità di produzione, la soglia di produzione è stata notevolmente abbassata.

Quest'ultima affermazione all'inizio sembra un po' controintuitiva: con le capacità di simulazione e la durata di output degli attuali prodotti video AI, come può essere migliore delle riprese reali e della produzione professionale in termini di qualità? Tuttavia, su piattaforme leader come Kuaishou e Douyin, la maggior parte delle decine di milioni di brevi video prodotti ogni giorno provengono da utenti ordinari. Agli occhi dei produttori di contenuti professionali, la tecnologia AI "non abbastanza sofisticata" è sufficiente per creare utenti ordinari ' Effettua scatti casuali per aggiungere materiale e ricchezza.

I commercianti del lato B possono anche diventare clienti delle grandi capacità dei modelli di Kuaishou. Secondo i dati rilasciati da Kuaishou alla World Artificial Intelligence Conference di quest’anno, le sue entrate pubblicitarie legate all’intelligenza artificiale hanno superato i 20 milioni al giorno. I materiali pubblicitari generati dall'intelligenza artificiale possono ridurre il costo per articolo a 0,47 yuan mantenendo il CTR al livello di base.


Keling genera immagini, parole immediate: materiale pubblicitario del succo di mela, c'è un bicchiere di succo di mela sul tavolo bianco, con due mele rosse sul lato

Per molti prodotti di grandi dimensioni, trovare scenari di atterraggio è un problema difficile durante tutto il ciclo di vita del prodotto, ma a Kuaishou ovviamente non mancano gli scenari.Come ha affermato Zhang Di, vicepresidente di Kuaishou e responsabile dei modelli di grandi dimensioni, il successo di Keling deriva dall’”estrazione di valore reale in scene reali per soddisfare le reali esigenze degli utenti”.

Il problema che devono affrontare è come far sì che gli utenti diventino utenti ad alta frequenza dei grandi modelli di Kuaishou nello scenario attuale, e siano disposti a continuare a pagare per questo, e realizzare prima la commercializzazione di grandi modelli all'interno del proprio ecosistema.

Il 25 luglio, Keling ha aperto completamente la registrazione. Lo stesso giorno, Keling ha lanciato il suo sistema di abbonamento ed è entrata nella fase di ricarica.

Secondo le informazioni sul sito ufficiale di Keling, gli utenti non membri possono ricevere ogni giorno 66 punti ispirazione effettuando il login. Secondo il "prezzo" attuale si possono creare gratuitamente circa 6 video o 330 immagini.

Esistono due modelli di pagamento: uno è il modello di abbonamento: gli utenti possono acquistare diversi livelli di abbonamento su base mensile, trimestrale, semestrale o annuale il modello di ricarica, in cui gli utenti possono pagare direttamente per ricaricare, il costo di produzione dell'utente per ogni video è di 1 yuan e il costo di produzione per ogni immagine è di 2 centesimi.


L'immagine generata da Keling, la parola immediata: alba, ci sono bellissime nuvole e il chiarore mattutino all'orizzonte, il sole è nascosto tra le nuvole

Ci sono due punti degni di attenzione riguardo al sistema dei prezzi di Keling.

Innanzitutto, Kuaishou non fornisce un'opzione di abbonamento in grado di generare lavori illimitati, il che significa che, indipendentemente dal fatto che scelgano la modalità di ricarica o la modalità di abbonamento, gli utenti in realtà "pagano soldi per acquistare tempi".L'unica differenza è il prezzo unitario di ogni generazione, nonché funzioni differenziate come la rimozione della filigrana, l'estensione video e il movimento dello specchio principale.

Il costo per generare video AI è elevato e Kuaishou non fornisce membri che possono generare tempi illimitati. Kuaishou ovviamente vuole evitare un possibile controllo dei costi e frenare in una certa misura la produzione grigia.

In secondo luogo, il valore di ispirazione come "valuta di pagamento" di Keling è equivalente nel prezzo alle monete Kuai utilizzate per premiare le ancore nell'ecosistema Kuaishou. Con 1 yuan di RMB puoi acquistare 10 monete veloci o 10 punti ispirazione. Questo metodo di prezzo potrebbe preservare la possibilità di aprire in futuro il sistema di pagamento all’interno dell’ecosistema Kuaishou.


Kuaishou non è l’unico ad avere allo stesso tempo bisogni, scenari, clienti, attrezzature, dati, tecnologia e riserve di talento.

Gli esperti del settore sopra menzionati prevedono che nel prossimo futuro Byte sarà in grado di produrre prodotti video generativi dello stesso livello. Prima di ciò, Kuaishou deve completare l'accumulo di utenti e l'accumulo di contenuti entro il periodo finestra, in modo che i contenuti dell'intelligenza artificiale possano operare efficacemente all'interno dell'ecosistema Kuaishou. È meglio essere in grado di percorrere il percorso di commercializzazione e sedersi nella posizione di punta un tempo più lungo.

I mezzi convenzionali di crescita e di operazioni sono all’ordine del giorno. Il sito web ufficiale di Keling ha lanciato rapidamente un evento con uno sconto del 50% per i membri. Allo stesso tempo, gli utenti possono ottenere 66 punti ispirazione accedendo ogni giorno per ridurre l'impatto del modello di pagamento sulla crescita e sulla fidelizzazione degli utenti, in modo che tutti gli utenti possano almeno farlo. provalo senza alcuna soglia.

Inoltre, nella gestione del sito Kuaishou, Keling non pone troppa enfasi su concetti come video generativi, soluzioni di modelli di diffusione e cluster di formazione distribuiti, ma utilizza "vecchie foto per diventare video", "abbracciandoti tempo e spazio" e "resurrezione 40 anni fa". "Foto precedente" e altri metodi di gioco per attirare gli utenti a iniziare a usarlo per primi, in modo da ridurre i costi di comprensione dell'utente.

Per gli utenti ordinari, il nuovo gameplay ha lo stesso percorso di difficoltà del precedente gameplay con effetti speciali di Kuaiying. Lo considerano un effetto speciale più potente Che abbiano sentito parlare o meno delle tre parole "modello grande", questo non li ostacola Diventano veri e propri utilizzatori di prodotti di grande formato.

Questo è il primo passo definitivo per Kuaishou e Byte per realizzare video sull'intelligenza artificiale, se gli utenti sono i propri; è anche la crisi definitiva che devono affrontare nell'era dell'intelligenza artificiale, se gli utenti vengono attratti da nuovi prodotti discontinui.

Piuttosto che dire che competono per l’ingresso nell’era dei video AI, è meglio dire che sono tutti difensori. La nuova produttività creerà nuove forme di contenuto e, in definitiva, nuove piattaforme. Questa storia è familiare sia a Cheng Yixiao che a Zhang Yiming.

Devono essere di primo livello.

(Immagine di copertina generata da Keling.)


Contatto per la cooperazione con i media ID WeChat |ciweimeijiejun

Se vuoi comunicare con noi puoi rispondere in background "unisciti al gruppo" per unirti alla community.