notizia

yan junjie, fondatore di minimax: l'unica cosa che puoi fare è migliorare te stesso|ai frontier

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

nota dell'editore:

"ai daily", una filiale della china financial news agency e del science and technology innovation board daily, ha lanciato oggi ufficialmente l'intervista "insight·ai frontier". le interviste si concentrano su aziende, imprenditori, studiosi di spicco, investitori, ecc. eccezionali nel campo dell'intelligenza artificiale e dei grandi modelli in patria e all'estero, portando le ultime esplorazioni, pratiche e riflessioni sull'intelligenza artificiale che danno potere a migliaia di industrie. insight・l'intelligenza artificiale è in prima linea, intuito, pioniere, in prima linea!

"kechuangban daily" 20 settembre (reporter huang xinyi)essendo una delle sei tigri dell'intelligenza artificiale, minimax ha completato il round di finanziamento a+. l'ultimo round è stato guidato da alibaba, con un importo di 600 milioni di dollari. la valutazione della società ha superato i 2,5 miliardi di dollari e gli investitori dietro di essa includono tencent, sequoia china, hillhouse, idg, mihoyo, ecc.

all'interno di minimax i colleghi si chiamano solo con i loro soprannomi. per quanto riguarda il fondatore yan junjie, i dipendenti lo chiamano io (nome del fiore). yan junjie è stato in passato vicepresidente di sensetime, vicepresidente dell'istituto di ricerca e cto dello smart city business group. nel dicembre 2021, alla vigilia della quotazione di sensetime, yan junjie ha lasciato sensetime e ha fondato minimax.

recentemente, minimax ha rilasciato il primo modello di generazione video ai ad alta definizione abab-video-1. dopo la conferenza stampa, yan junjie ha rivelato in un'intervista al science and technology innovation board daily e ad altri media che il modello della serie abab7 che utilizza la tecnologia di nuova generazione sarà ufficialmente rilasciato nelle prossime settimane e l'effetto sarà paragonabile al gpt modello -4o. parlando delle difficoltà nella commercializzazione di modelli di grandi dimensioni, yan junjie ha risposto che si tratta effettivamente di un test industriale e che solo le aziende che lo superano possono avere successo.

"quando nessuno usa un prodotto, o quando un prodotto non genera profitti, non puoi assolutamente incolpare gli utenti. la maggior parte di loro può solo incolpare la propria tecnologia o i prodotti che non sono abbastanza buoni. questo può essere considerato un una critica a un settore. se riesci a superare il test, puoi uscire. se non puoi superarlo, dovresti chiudere.

yan junjie alla conferenza stampa

▌la concorrenza è inevitabile e dobbiamo ampliare infinitamente le aree in cui possiamo essere più forti.

con l’ascesa di una nuova ondata di intelligenza artificiale rappresentata da gpt, è stato creato più spazio di immaginazione per la realizzazione dell’intelligenza generale artificiale (agi).

yan junjie crede che,l’agi non è qualcosa di stravagante, ma qualcosa che può diventare parte della vita di tutti.

“ad esempio, quando le persone guardano douyin o account video, non si rendono conto che si tratta di una piattaforma di distribuzione di contenuti per brevi video basata su algoritmi di raccomandazione, sentono invece che douyin e wechat sono diventati parte della vita di tutti.lo stesso vale per l’agi quando l’intelligenza artificiale diventerà come un telefono cellulare e diventerà parte dell’uso quotidiano di tutti, l’agi sarà realizzata. naturalmente ci vorrà molto tempo, ma penso che possiamo lavorare duro passo dopo passo.

per quanto riguarda i cambiamenti che l'intelligenza artificiale può apportare nel breve periodo di cinque anni, yan junjie ritiene che in cinque anni, con l'aiuto dell'intelligenza artificiale, tutti aumenteranno notevolmente il limite superiore del proprio qi e saranno più alti della persona con il qi più alto in un locale con centinaia di persone. "naturalmente non è sicuro di quanto il limite superiore del qi umano possa essere migliorato con l'aiuto dell'intelligenza artificiale."

entro il 2024, la concorrenza per i modelli di grandi dimensioni diventerà sempre più agguerrita. di fronte al rapido attacco dei grandi produttori, lo spazio vitale delle start-up è stato compresso.

“la concorrenza è inevitabile”, ha lamentato yan junjie: “in alcune industrie ben sviluppate in cina, come quelle dei veicoli elettrici, dei telefoni cellulari e di internet mobile, diverse aziende si sono impegnate in una concorrenza molto feroce a lungo termine, che alla fine ha portato alla cina prodotti leader nel mondo.poiché la storia dello sviluppo di altri settori emergenti è simile, e i modelli di grandi dimensioni probabilmente produrranno un grande valore sociale, dovrebbe esserci davvero molta concorrenza. questa è la legge oggettiva dello sviluppo。”

yan junjie ritiene che se una startup non riesce a vincere nella feroce concorrenza, dovrebbe essere eliminata.

quando aziende molto più grandi di te inizieranno a competere con te, ti renderai conto che alcune cose sono inutili. perché quei grandi produttori sono centinaia di volte migliori di te. ciò che possiamo fare è amplificare infinitamente (rendere più forti) le cose che hanno il potenziale per diventare più forti.si riduce a due punti: uno è come migliorare la tecnologia e l’altro è come creare co-creazioni migliori con gli utenti. entrambi questi punti richiedono alcuni giudizi molto critici e richiedono un accumulo a lungo termine. "

▌i grandi modelli multimodali implicano che anche l'infrastruttura sottostante deve essere aggiornata

il campo dei modelli di grandi dimensioni generati da video è stato molto attivo negli ultimi mesi. è stato lanciato vidu, un modello video di grandi dimensioni creato da shengshu technology; zhipu ai ha rilasciato ufficialmente il modello di generazione video di grandi dimensioni "qingying" ha lanciato vimi, il primo modello di generazione video di personaggi controllabili di grandi dimensioni per gli utenti c-end; la piattaforma di creazione video ai basata sulla stazione "xunguang"; kuaishou keling ai è stata ufficialmente lanciata sulla pagina web e ha reso open source un framework di generazione di video di ritratti controllabile chiamato liveportrait...

recentemente, minimax ha anche rilasciato il suo primo modello di generazione di video ai ad alta definizione. yan junjie ritiene che i grandi modelli multimodali siano l'unica strada da percorrere, perché il contenuto multimodale è una parte importante della comunicazione umana.

“la maggior parte dei contenuti che leggiamo ogni giorno ora non sono testi, ma contenuti dinamici. quando apriamo xiaohongshu, mostrerà immagini e testi, quando apriamo douyin, mostrerà video e anche quando apriamo pinduoduo per comprare cose. , la maggior parte delle volte mostrerà le immagini.per la società umana, il significato principale dei modelli di grandi dimensioni è quello di migliorare l'elaborazione delle informazioni. la maggior parte delle informazioni si riflette nel contenuto multimodale, piuttosto che nel testo che spesso ne è la parte più essenziale. per avere una copertura utente molto elevata e una profondità di utilizzo molto elevata, l'unico modo per produrre contenuti dinamici (multimodali) non è solo produrre contenuti puramente testuali. questo è un giudizio fondamentale.

sebbene la multimodalità sia generalmente ottimista, durante l'esplorazione l'industria ha anche avvertito che, rispetto ai modelli testuali, lo sviluppo di modelli di generazione video è ovviamente più difficile da sviluppare.

a questo proposito, yan junjie ritiene che la maggior parte delle volte la complessità del lavoro del video sia effettivamente più difficile di quella del testo, perché il testo del video è naturalmente molto lungo. ad esempio, un video coinvolge decine di milioni di input e output, che saranno naturalmente difficili da elaborare. in secondo luogo, la quantità di video è enorme. un altro esempio è che un video di 5 secondi pesa diversi megabyte, ma una lettura di testo di 5 secondi può essere inferiore a 1k. si tratta di un gap di archiviazione di migliaia di volte.la sfida sta nel come elaborare i dati, come pulirli e come etichettare l’infrastruttura sottostante precedentemente costruita sulla base del testo. ciò significa che anche l’infrastruttura deve essere aggiornata.

"inoltre, è necessaria più pazienza. ci sono molte cose open source per scrivere testi. sarebbe più veloce se facessimo ricerca e sviluppo basati sull'open source. ma non ci sono così tante cose open source per i video. deve essere fatto di nuovo, e richiede più pazienza."

▌obiettivamente parlando, la guerra dei prezzi ha aumentato il numero di richiami al modello

da quest’anno, molte aziende di modelli di grandi dimensioni hanno iniziato una guerra dei prezzi in cambio della popolarità dei modelli di grandi dimensioni basati sull’intelligenza artificiale. yan junjie ritiene che, oggettivamente parlando, la guerra dei prezzi abbia effettivamente aumentato il numero di model call.

"quando è iniziata la guerra dei prezzi dei modelli domestici, la maggior parte delle aziende che inizialmente pensavano che i modelli di grandi dimensioni fossero costosi, hanno iniziato a scoprire che i modelli di grandi dimensioni sono economici e possono essere utilizzati con sicurezza. alla fine, è stata fatta una scoperta sorprendentedopo la guerra dei prezzi dei modelli di grandi dimensioni, molte aziende molto tradizionali iniziarono ad essere molto disposte a utilizzare modelli di grandi dimensioni. ritengono che il costo sia comunque basso e non importa se qualcosa va storto, possono semplicemente chiamarlo ancora una volta. obiettivamente parlando, ciò aumenta notevolmente il numero di model call. "

in mezzo alla forte concorrenza tra i modelli nazionali, minimax si sta espandendo nei mercati esteri. yan junjie ha dichiarato: "è proprio a causa della forte concorrenza tra i modelli nazionali che dobbiamo andare avanti. almeno ora possiamo raggiungere un livello paragonabile a gpt nelle lingue dei paesi non anglofoni. concorrenza e vari poiché tutti i tipi di cose non possono essere evitati, prova a fare del tuo meglio.vediamo il lato ottimistico l’uso di grandi modelli domestici sta infatti crescendo in modo significativo, e i modelli cinesi stanno effettivamente diventando sempre più competitivi all’estero. penso che questi siano due cambiamenti positivi. "

per quanto riguarda il modello di commercializzazione specifico, yan junjie ha introdotto che la commercializzazione dell'intera azienda può essere divisa in due forme. una è la piattaforma aperta minimax per il lato b e l'altra è il meccanismo pubblicitario all'interno del prodotto.

"la piattaforma aperta minimax conta ora più di 30.000 clienti e sviluppatori aziendali, tra cui rinomate società internet, imprese tradizionali, ecc. gli utenti utilizzeranno le nostre capacità vocali e visive, perché non tutte le aziende possono farlo da sole. siamo un buon partner in secondo luogo, i prodotti minimax dispongono anche di meccanismi pubblicitari che possono essere monetizzati. tuttavia, in questa fase, la cosa più importante non è commercializzarli, ma rendere la tecnologia realmente disponibile”.

attualmente,ci sono sei startup indipendenti di modelli su larga scala in cina, tra cui zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax e step star, che sono chiamate le "sei piccole tigri dell'intelligenza artificiale". zhu xiaohu, socio amministratore della jinshajiang venture capital, ha dichiarato senza mezzi termini in un'intervista ai media che i modelli di grandi dimensioni sono troppo costosi ed è impossibile mantenersi con la commercializzazione. il miglior risultato per queste startup è vendere ai grandi produttori.

parlando delle osservazioni dell’investitore zhu xiaohu e delle difficoltà nella commercializzazione di modelli di grandi dimensioni, yan junjie ha risposto che si tratta effettivamente di un test del settore e che solo le aziende che lo superano possono avere successo.

“quando nessuno usa il prodotto, o quando il prodotto non genera profitti, in questo momento non puoi assolutamente incolpare gli utenti. la maggior parte delle volte puoi solo incolpare la tua tecnologia o il prodotto che non è abbastanza buono. siamo ecco come la vediamo.

secondo yan junjie, qq non sapeva come fare soldi nel 2000. ha provato numerosi piani di monetizzazione commerciale ma ha fallito. tuttavia, alla fine ha trovato servizi e giochi mobili a valore aggiunto e tutto seguirà questo processo. "questo può essere considerato un test per un'industria. se riesce a superare il test, sarà in grado di scappare. se fallisce, (l'azienda) dovrebbe essere chiusa."

durante l'intervista, yan junjie è sempre sembrato relativamente calmo riguardo alla concorrenza del settore e alle prospettive aziendali."di certo non si può incolpare gli utenti, né si può incolpare l'ecosistema. (per molte cose) possiamo solo incolpare noi stessi per non aver fatto abbastanza bene. almeno abbiamo lavorato duro. speriamo di poter migliorare. questo è l'unica cosa che possiamo fare."

(huang xinyi, reporter del science and technology innovation board daily)
segnalazione/feedback