notizia

il discorso interno di robin li esposto: discutendo tre principali malintesi cognitivi sui modelli di grandi dimensioni, il divario tra i modelli diventerà più ampio in futuro

2024-09-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"il mondo esterno ha molti malintesi sui modelli di grandi dimensioni", secondo recenti resoconti dei media, è stato rivelato un discorso interno di robin li. in una recente comunicazione con i dipendenti, robin li ha parlato di tre malintesi sui modelli di grandi dimensioni, riguardanti la concorrenza dei modelli di grandi dimensioni, l'efficienza del modello open source e l'agente intelligentetendenzaaspetta argomenti caldi.



robin li ha affermato che il divario tra i modelli di grandi dimensioni potrebbe diventare sempre più ampio in futuro. ha affermato che il limite dei modelli di grandi dimensioni è molto alto ed è ancora lontano dalla situazione ideale. pertanto, il modello deve continuare a iterare, aggiornarsi e aggiornarsi rapidamente e deve essere in grado di investire continuamente per diversi anni o più dieci anni per soddisfare continuamente le esigenze degli utenti e ridurre i costi.



quello che segue è il contenuto del discorso interno

domanda: alcune persone pensano che non ci siano barriere tra le capacità dei modelli di grandi dimensioni?

robin li:non sono d'accordo con questa affermazione. penso che ci siano molti malintesi sui grandi modelli nel mondo esterno. ogni volta che esce un nuovo modello, vogliono sicuramente dire quanto sono bravi e seguirli ogni volta.per fare un confronto con gpt-4o, prendo dei set di test o faccio degli elenchi e dico che il mio punteggio è quasi lo stesso o addirittura lo supera in alcuni singoli elementi, ma ciò non dimostra che questi modelli appena rilasciati siano i più avanzati con openal rispetto al modello non c'è un divario così grande.



il divario tra i modelli è multidimensionale. una dimensione è l'abilità, che si tratti del divario nelle abilità di base come capacità di comprensione, capacità di generazione, capacità di ragionamento logico o capacità di memoria, l'altra dimensione è il costo;se vuoi avere questa capacità o rispondere a queste domande, quanto ti costerà? alcuni modelli possono avere velocità di inferenza molto lente sebbene ottengano lo stesso effetto, la loro esperienza in realtà non è buona come quella dei modelli più avanzati. e per il set di provain caso di adattamento eccessivo, ogni modello che vuole dimostrare le sue capacità andrà in classifica. quando fa le classifiche, deve indovinare cosa stanno testando gli altri e quali domande posso usare e quali tecniche posso ottenere correttamente, quindi dalle classifiche. o set di test a quanto pare, pensi che le capacità siano molto simili, ma nell'applicazione reale c'è ancora un chiaro divario.



parte del clamore automediale, unito alla motivazione della pubblicità quando viene rilasciato ogni nuovo modello, dà a tutti l'impressione che la differenza nelle capacità tra i modelli sia relativamente piccola. in realtà, non è così. nel processo di utilizzo effettivo, non permetto al nostro staff tecnico di fare classifiche ciò che misura veramente le capacità del modello wenxin di grandi dimensioni è se è possibile soddisfare le esigenze degli utenti in scenari applicativi specifici e se è possibile generare guadagni di valore ciò che ci interessa veramente.



dobbiamo vedere che, da un lato, esiste un divario relativamente evidente tra le capacità del modello e, dall'altro, il limite è molto alto. ciò che fai oggi è ancora lontano da ciò che vuoi effettivamente fare stato ideale, quindi il modello deve anche essere ripetuto, aggiornato e aggiornato continuamente e rapidamente.anche se vedi che il divario non è così grande oggi, vedrai se il divario si sarà ampliato tra un altro anno? chi può continuare a investire in questa direzione per diversi anni o anche più di dieci anni, perché possa soddisfare sempre più le esigenze degli utenti, soddisfare gli scenari e soddisfare le esigenze di miglioramento dell’efficienza o di riduzione dei costi?il divario tra i diversi modelli non sta diventando sempre più piccolo, ma diventerà sempre più grande. è solo che quando non conoscono le reali esigenze, potrebbero pensare che sia quasi sufficiente fare solo le domande del test.

cosiddetto leaderdodici o 18 mesi indietro, non credo che importi molto. ognuna delle nostre aziende si trova in un ambiente di mercato completamente competitivo. non importa quale direzione prendi, ci saranno molti concorrenti. se puoi sempre assicurarti di essere 12-18 mesi avanti rispetto ai tuoi concorrenti, sarai invincibile pensa che da 12 a 18 persone sono più avanti di te un mese è un tempo molto breve,anche se puoi garantire che sarai sempre in vantaggio rispetto ai tuoi concorrenti6 mesi e poi vinci, la tua quota di mercato potrebbe essere70%, mentre l’avversario può avere solo una quota del 20% o addirittura del 10%.



d: alcune persone dicono che il modello open source sta colmando il divario con il modello closed source. ciò distruggerà il modello di business delle grandi aziende modello closed source?

robin li:questa domanda è fortemente correlata alla domanda precedente. ho appena detto che oltre alle capacità o agli effetti, un modello deve anche essere efficiente. in termini di efficienza, i modelli open source non sono buoni. per essere precisi, il modello closed-source dovrebbe essere chiamato modello di business. un modello commerciale è quello in cui innumerevoli utenti o clienti condividono le stesse risorse e condividono i costi di ricerca e sviluppo, le risorse dei macchinari e le risorse di ragionamento.gpu e il modello open source richiede la distribuzione di una serie di elementi da parte tua. qual è il tasso di utilizzo della gpu dopo la distribuzione? nostromodello grande wenxin3.54non importa .0, il tasso di utilizzo è superiore al 90%. quante persone utilizzano un modello open source distribuito? diciamo al pubblico che il modello wenxin viene chiamato più di 600 milioni di volte al giorno e il numero di token generati ogni giorno supera i trilioni. quale modello open source può dire quante chiamate effettua in un giorno e quanti token genera? come verrà ripartito il costo se nessuno lo utilizza? come si può confrontare il costo dell’inferenza con i modelli commerciali?



prima dell’era dei grandi modelli, tutti erano abituati all’open source, ovvero gratuito e a basso costo. a quel tempo, per i prodotti commerciali sul mercato, dovevi pagare per ogni versione, come l'acquisto di un'installazione su computerwindows, microsoft potrebbe dover addebitare un sacco di soldi, ma non devi spendere questi soldi se usi linux. poiché linux è open source, tutti i programmatori possono vedere il codice. se qualcosa non viene fatto bene, posso aggiornarlo. dopo l'aggiornamento, posso effettuare il check-in. tutti aggiungono benzina sul fuoco e puoi continuare a fare progressi sulle spalle dei giganti. ma queste cose non sono vere nell’era dei modelli di grandi dimensioni. nell’era dei modelli di grandi dimensioni, si parla spesso di quanto siano costose le gpu e della potenza di calcolo come fattore chiave che determina il successo o il fallimento dei modelli di grandi dimensioni.il modello open source ti dà potenza di calcolo? se non ti fornisce potenza di calcolo, come può fare un uso efficiente della potenza di calcolo? il modello open source non può risolvere questo problema.



in passato si pagava già per la potenza di calcolo quando si acquistava un computer, ma questo non è il caso dell'inferenza di modelli di grandi dimensioni. questa inferenza è in realtà molto costosa. pertanto, il valore dei modelli di grandi dimensioni open source è nel campo dell'insegnamento e della ricerca scientifica. se vuoi capire come funzionano i modelli di grandi dimensioni, se non conosci il codice sorgente, ci sarà sicuramente uno svantaggio nel campo degli affari, quando si persegue l'efficienza, l'effetto, quando il perseguimento è il costo più basso, il modello open source non ha alcun vantaggio.



chiedere:come si evolveranno le applicazioni ia? perché l’enfasi sull’intelligenza?

robin li: il processo di sviluppo di modelli di grandi dimensioni deve passare attraverso queste fasi. all'inizio, le persone vengono assistite e, infine, quando esce qualcosa, le persone devono superare il controllo finale. siamo sicuri che il suo effetto lo siaok, verrà rilasciato solo se è buono sotto tutti gli aspetti. questa è la fase del copilota; più in basso c'è l'intelligenza dell'agente. il mondo esterno ha varie definizioni diverse di agente. la cosa più importante è che abbia un certo grado di autonomia, con la capacità di utilizzare gli strumenti in modo indipendente, riflettere, autoevolversi, ecc., se questo grado di automazione va oltre, diventerà un cosiddetto al worker, in grado di svolgere una varietà di lavori mentali e fisici; un essere umano e tutti gli aspetti del lavoro possono essere completati in modo indipendente. deve esserci un tale processo.



il giudizio secondo cui "gli agenti intelligenti rappresentano la direzione di sviluppo più importante di grandi modelli" è in realtà un non consenso. alla conferenza baidu create, abbiamo rilasciato tre prodotti, agentbuilder, appbuilder e modelbuilder. agentbuilder e appbuilder riguardano entrambi gli agenti, uno ha una soglia inferiore e l'altro ha funzioni più potenti. dopo averlo spiegato, alcune persone hanno finalmente iniziato a capire che questa cosa è davvero interessante, può produrre valore e può essere realizzata con una soglia relativamente bassa che tutti ritengono utilizzabile. da allora, la popolarità degli agenti intelligenti è gradualmente aumentata e molte persone hanno iniziato a essere ottimiste riguardo alla direzione dello sviluppo degli agenti intelligenti.ma finora l’intelligence non è un consenso. non sono molte le aziende come baidu che considerano l’intelligence la strategia più importante e la direzione di sviluppo più importante di grandi modelli.



perché diamo così tanta importanza agli agenti? perché la soglia per gli agenti intelligenti è davvero molto bassa l'anno scorso abbiamo detto che dovremmo lanciare applicazioni e che tutti dovrebbero farlo. in effetti, molte persone dicono ancora di non sapere come farlo, se possono farlo in questa direzione, e quali competenze devo utilizzare? ci sono innumerevoli incertezze nel riuscire a generare valore in questo scenario e non tutti sanno come passare dal modello all'applicazione.ma l'agente fornisce un modo molto diretto, molto efficiente e molto semplice. è abbastanza conveniente costruire un agente sopra il modello., motivo per cui ogni settimana vengono creati decine di migliaia di nuovi agenti sulla piattaforma wenxin.



per quanto riguarda gli agenti, abbiamo già visto la tendenza e disponiamo di presupposti relativamente buoni. oltre alle forti capacità del modello stesso, disponiamo anche di buoni canali di distribuzione. quello di baiduapp, in particolare la ricerca baidu hamiliardi di personedurante l'uso, gli utenti ci esprimono attivamente le loro esigenze, quale agente intelligente può rispondere meglio alle sue domande e soddisfare le sue esigenze. questo è un processo di abbinamento naturale, quindi siamo in grado di aiutare questi sviluppatori a distribuirli al meglio.

segnalazione/feedback