competizione, efficienza, intelligenza, il grande modello a cui robin li sta a cuore

2024-09-15

"il limite dei modelli di grandi dimensioni è molto alto ed è ancora lontano dalla situazione ideale". l'11 settembre è stato esposto un discorso interno del ceo di baidu, robin li. ha affermato senza mezzi termini che il mondo esterno ha tre malintesi sui modelli di grandi dimensioni: "il divario tra i diversi modelli non sta diventando sempre più piccolo, ma diventerà sempre più grande." "la potenza di calcolo è un fattore chiave che determina il successo o il fallimento dei grandi modelli open source non possono risolvere questo problema." questa domanda "non c'è consenso sul fatto che gli agenti intelligenti siano la direzione di sviluppo più importante di modelli di grandi dimensioni."

si parla spesso del tema dei modelli di grandi dimensioni, il dibattito tra open source e closed source, il valore della lista, ecc. si basa su questo, robin li, che ha individuato nella fase iniziale la traccia dei modelli di grandi dimensioni per condividere le sue opinioni.

"ogni volta che viene rilasciato un nuovo modello, voglio assolutamente dire quanto è buono. ogni volta che lo confronto con gpt-4o, faccio un test o faccio degli elenchi e dico che il mio punteggio è quasi lo stesso, e anche alcuni il punteggio nelle singole voci lo ha superato, ma ciò non dimostra che questi modelli appena rilasciati non siano più così indietro rispetto ai modelli più avanzati di openal." robin li ritiene che il mondo esterno abbia malintesi sui modelli di grandi dimensioni.

a suo avviso, il divario si riflette nelle capacità e nei costi. "dall'elenco o dal set di test, si sente che le capacità sono molto vicine, ma nelle applicazioni reali c'è ancora un divario chiaro. non permetto al nostro staff tecnico di quando. per quanto riguarda le classifiche, ciò che misura veramente le capacità del modello wenxin è se è possibile soddisfare le esigenze degli utenti in scenari applicativi specifici e se è possibile generare guadagni di valore. questo è ciò che ci interessa davvero."

valori e scenari sono spesso menzionati anche dai colleghi. "l'adozione dell'intelligenza artificiale da parte del settore aziendale non consiste nel perseguire tecnologie interessanti, né nel 'cercare chiodi con il martello'. l'obiettivo è risolvere i punti critici del business. dall'anno scorso (2023), tutti sono stati un po' eccessivamente ottimisti riguardo modelli di grandi dimensioni, pensando che possano cambiare rapidamente il mondo recentemente, ci sono alcuni pessimisti che pensano che i modelli di grandi dimensioni siano belli ma non facili da usare in realtà, non è consigliabile sopravvalutare i progressi a breve termine e sottovalutare l'effetto a lungo termine.'" tang daosheng, vicepresidente esecutivo senior del gruppo tencent e amministratore delegato del cloud e dell'intelligence industry group. dal punto di vista del cliente, gli scenari sono la chiave per sbloccare l'intelligenza artificiale. è meglio per le aziende combinare dati professionali unici per trovare opportunità per ridurre i costi e aumentare l’efficienza nei flussi di lavoro e negli scenari aziendali esistenti, per poi continuare a migliorare e investire a lungo termine.

open source e closed source sono un argomento dibattuto da molto tempo. in qualità di rappresentante del closed source, robin li ha fatto ancora una volta un confronto: "oltre alle capacità o agli effetti, un modello dipende anche dall'efficienza. in termini. di efficienza, i modelli open source non sono buoni."

"il modello closed-source dovrebbe essere accuratamente definito modello di business. il modello commerciale è che innumerevoli utenti o clienti condividono le stesse risorse, condividono i costi di ricerca e sviluppo e condividono le risorse della macchina e la gpu (unità di elaborazione grafica) utilizzate per il ragionamento, mentre il modello open source il modello richiede che tu distribuisca una serie di cose da solo e tutti lo usano spesso nell'era dei grandi modelli. riguarda quanto sono costose le gpu è un fattore chiave nel determinare il successo o il fallimento dei modelli di grandi dimensioni. t darvi potenza di calcolo, come si può utilizzare in modo efficiente il modello open source? questo problema non può essere risolto.”

due mesi fa, robin li ha dichiarato alla conferenza mondiale sull’intelligenza artificiale del 2024: è molto ottimista riguardo agli agenti intelligenti. all’inizio di settembre, molti imprenditori ed esperti hanno creduto alla conferenza dell’inclusion bund del 2024 che gli corpi intelligenti fossero una nuova forma terminale e genereranno una nuova generazione di super piattaforme.

riguardo a questo argomento sempre più acceso, robin li è intervenuto ancora una volta: "perché diamo così tanta importanza agli agenti? perché la soglia per gli agenti è davvero molto bassa. gli agenti forniscono un modo molto diretto, molto efficiente e molto semplice per costruire intelligence su parte superiore del modello. la carrozzeria è abbastanza comoda", ha chiesto e si è risposto.

secondo lui "il giudizio secondo cui 'gli agenti sono la direzione di sviluppo più importante di grandi modelli' è in realtà un non consenso. finora non c'è consenso sugli agenti. baidu, ad esempio, considera gli agenti come la strategia più importante e il aspetto più importante dei modelli di grandi dimensioni." non sono molte le aziende che si stanno sviluppando in questa direzione."

wei wei, giornalista del beijing business daily

segnalazione/feedback

notizia

competizione, efficienza, intelligenza, il grande modello a cui robin li sta a cuore

introduzione

le mie informazioni di contatto