notizia

Accerchiamento e soppressione di NVIDIA |. Deep Krypton

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Testo|Qiu Xiaofen

Intervista|Qiu Xiaofen e Yang Xiao

Redattore|Su Jianxun Yang Xuan

resistere

Un gruppo WeChat segreto si diffonde tramite il passaparola tra le persone delle società di chip AI a Zhangjiang, Shanghai. Il nome del gruppo è "Domestic Chip Group Warming Group". anche i concorrenti si scambieranno informazioni e scambieranno risorse aziendali.

Il "gruppo di chip domestico per il calore" ha delineato una zona di tregua, dove i colleghi possono temporaneamente tregua e aiutarsi a vicenda, solo perché tutti hanno un nemico comune: NVIDIA.

A causa dell'esistenza di Nvidia, le vendite delle aziende nazionali di chip hanno subito un po' di umiliazione.

Li Ming (pseudonimo) è un venditore presso un'azienda nazionale di GPU. Quando è iniziato il boom dell'intelligenza artificiale, è andato incontro ai clienti con fiducia, ma non ha avuto il tempo di salutarli. Il cliente ha iniziato a fare domande:

"Rispetto al chip A100 di NVIDIA, qual è la differenza tra le tue cose? NVIDIA ha NVLink, cosa hai?" (Nota dell'autore: NVLink collega più chip GPU per impedire che i dati della GPU vengano spostati nella CPU per i calcoli per migliorare l'efficienza di calcolo)

Vedendo che non potevano impressionare i clienti con i loro prodotti e le loro tecnologie, il team di Li Ming iniziò a pensare a come fare affidamento sulle connessioni e trovare "persone più potenti" per fare lobby, ma i clienti continuavano ad agitare la mano e a dire: "Vogliamo ancora usare Nvidia."

NVIDIA A100, con 54 miliardi di transistor racchiusi in un'area di 826 millimetri quadrati, è la chiave per aprire la scatola magica dei grandi modelli IA.

L'addestramento di modelli di grandi dimensioni è come "raffinare gli elisir" in enormi quantità di dati, con lo scopo di scoprire i modelli di cambiamento dei dati;Usare i chip NVIDIA per addestrare modelli di grandi dimensioni è come chiedere a centinaia di milioni di persone con un QI pari a 200 di fare calcoli, mentre l'effetto di altri chip equivale solo a chiedere a migliaia di persone con un QI pari a 100 di fare calcoli.


Immagini NVIDIA A100 dal sito Web ufficiale NVIDIA

Le principali aziende tecnologiche si stanno affrettando ad acquistare Nvidia. Chi possiede il maggior numero di GPU NVIDIA di fascia alta avrà l'opportunità di addestrare modelli di grandi dimensioni più intelligenti.

Le informazioni pubbliche mostrano che OpenAI controlla attualmente il maggior numero di GPU NVIDIA di fascia alta al mondo, almeno 50.000 pezzi. Google e Meta sono anche proprietari di cluster Wanka (circa 26.000 ed è raro che esista Internet); rete con cluster Wanka GPU di fascia alta Nvidia Il più grande è ByteDance (13.000).

NVIDIA monopolizza le migliori risorse nella catena industriale globale: possiede la più abbondante capacità di produzione di chip avanzati di TSMC, ha il più grande gruppo di utenti di ingegneri al mondo e controlla la linfa vitale informatica di molte aziende di intelligenza artificiale.

Il monopolio assoluto spesso genera insoddisfazione, rabbia e fuga.

"Tutti coloro che oggi producono modelli di grandi dimensioni stanno sostanzialmente perdendo soldi sul serio! Solo uno sta guadagnando soldi! NVIDIA", ha detto con rabbia un insider del settore——"Il margine di profitto di NVIDIA mette a disagio tutti i clienti e danneggia il settore dell'intelligenza artificiale!".

Il rapporto finanziario mostra che il margine di profitto lordo di Nvidia ha raggiunto il 71%, tra cui i popolari prodotti delle serie A100 e H100 hanno margini di profitto lordo fino al 90%. In quanto azienda di hardware, Nvidia gode effettivamente di margini di profitto lordi più elevati rispetto alle aziende di software Internet.

I prezzi elevati e gli enormi profitti hanno costretto i grandi clienti di Nvidia a fuggire. Il 30 luglio, Apple ha annunciato che il suo modello di intelligenza artificiale era stato addestrato con 8.000 TPU di Google, mentre il contenuto di NVIDIA era pari a 0. Non appena è uscita la notizia, il prezzo delle azioni di NVIDIA è sceso di oltre il 7% il 31 luglio, il calo più grande del passato. tre mesi e il suo valore di mercato è evaporato di 193 miliardi di dollari.Ho quasi perso un Pinduoduo.


Grafico del calo del prezzo delle azioni NVIDIA nell'ultimo anno

Per tutte le aziende nazionali di GPU che vogliono strappare un pezzo di carne a Nvidia, il 2022 è un anno di svolta Negli Stati Uniti sono stati emessi diversi cicli di divieti. Nvidia, costretta a guadagnarsi da vivere, continua a lanciare versioni castrate di chip in Cina, ma vengono rapidamente nuovamente vietati:

  • Nel settembre 2022, è stata vietata l'esportazione in Cina dell'A100/H00 e nell'ottobre 2023 NVIDIA ha lanciato la versione castrata dell'A800/H800, mentre nel giugno 2024 è stata vietata l'esportazione in Cina dell'A800/H800/L40/L40S/RTX4090; Il fondatore di NVIDIA, Huang Jenxun, ha affermato che spingerà le versioni castrate dei chip L20 e H20 in Cina.

Tuttavia, la versione castrata ha scatenato una condanna più intensa da parte dell’industria. L'imminente H20 di Nvidia costa la metà dell'H100 di Nvidia, ma le sue prestazioni sono solo 1/3 del primo. Una persona del settore dell'intelligenza artificiale ha denunciato con rabbia - " Non è semplicemente rubare soldi? Pura tassa sul QI! "

Quando i clienti di Nvidia divennero insoddisfatti e arrabbiati, le aziende produttrici di chip nazionali che volevano sostituire Nvidia furono "nutrite" da questa emozione.

In passato potevano solo seguire il sedere di Nvidia e mangiare un po' della torta. Secondo i dati della società di analisi di semiconduttori TechInsights, la quota di mercato di Nvidia nelle spedizioni di GPU per data center raggiungerà il 98% nel 2023. I chip nazionali e tutti i giganti dei chip messi insieme,Solo un magro 2%.

Ora che è arrivato il divieto, la Nvidia perfetta è stata fatta a pezzi nel mercato cinese. Chi può sostituire Nvidia? I produttori nazionali di chip IA vedono speranza.

“Quest’anno è stato liberato il 90% del mercato di NVIDIA in Cina.Che tu possa afferrarlo o meno dipende dalle tue capacità.", ha affermato il fondatore di un'azienda nazionale di GPU.

36 Krypton ha pubblicato una volta "Deep Krypton | CATL: Cracks in the Trillion Battery Empire" nel 2021. Nel settore delle batterie di potenza, CATL non ha eguali ed è tenuto d'occhio dai concorrenti.

Oggi Nvidia, che è l'attore dominante nel campo dei chip AI, è considerata anche una spina nel fianco da molti colleghi. Tuttavia, la differenza tra Nvidia e Nvidia è che le sue barriere sono più alte e il divario con i suoi avversari lo è ancora più ampio.

Cerchiamo di trovare le "crepe in NVIDIA" attraverso la resistenza degli avversari di NVIDIA. Guardando al settore delle GPU, sebbene i produttori nazionali di GPU e chip AI siano deboli, comprendono meglio il mercato cinese e i loro metodi di gioco sono più localizzati e simili Intel, AMD, ecc. I giganti dei chip affermati hanno munizioni più sufficienti per affrontare Nvidia frontalmente.

Nel breve termine Nvidia non verrà sconfitta, ma non resterà indenne. Questa è destinata ad essere una guerra sanguinosa.

Scoppiare

Se vuoi sfondare, devi trovare i punti deboli del tuo avversario.Uno dei punti deboli di Nvidia: l'arroganza.

L’industria dei chip è essenzialmente un’industria del software di tipo B. I clienti hanno bisogno di servizi di "accompagnamento" da parte dei produttori di chip, come il debug dell'hardware e la compatibilità di software e hardware. Solo quando la compagnia è in atto i clienti possono essere appiccicosi e i prodotti a base di chip non saranno facilmente sostituibili.

Tuttavia, molti esperti di chip nazionali hanno dichiarato a 36Kr che nel mercato cinese, ad eccezione dei grandi acquirenti con dimensioni miliardarie come BAT e Byte, è quasi difficile per la maggior parte delle altre società ottenere investimenti da Nvidia anche se il volume delle loro transazioni raggiunge decine di milioni. . Assistenza post-vendita.

In altre parole, quando gli ingegneri cinesi che utilizzano i chip NVIDIA hanno dei dubbi, possono solo fare affidamento su se stessi per cercare documenti sul sito ufficiale di NVIDIA o rivolgersi alla comunità per imparare da soli.

Quando si collabora con NVIDIA, spesso le diverse esigenze dei clienti cinesi non vengono soddisfatte.Una persona del settore dei chip ha detto a 36Kr che Nvidia generalmente promuove le soluzioni complete di fascia alta e più costose in Cina. Quando i clienti fanno richieste personalizzate per scenari specifici, di solito vengono respinti Dopo aver acquistato la carta, i clienti devono "pensare parlane tu stesso o trova una potente società di algoritmi per farlo."

Questo approccio di Nvidia ha accumulato molte lamentele da parte dei clienti di piccole e medie dimensioni. "Nvidia, in quanto grande produttore oggi, non presta più la stessa attenzione ai piccoli clienti come in passato. I loro prodotti non hanno concorrenti e non hanno bisogno di lavorare sodo per accontentare i clienti," ha detto la persona menzionata sopra.

Ma in passato, l'ascesa dell'ecosistema NVIDIA ha effettivamente confermato l'importanza dei servizi per l'industria dei chip: nel 2006, quando l'ecosistema CUDA era appena iniziato, i prodotti NVIDIA non erano buoni quanto i chip domestici di oggi. Ma il team NVIDIA ha iniziato prima con i gruppi di ricerca scientifica delle università, per poi penetrare nelle start-up di ogni sottosettore per adattare software e hardware, e solo allora è diventato un grande paese oggi.


NVIDIA H100 Fonte: sito Web ufficiale NVIDIA

Anche i produttori cinesi di chip se ne sono accorti e stanno cercando di iniziare con il servizio clienti.

Una certa azienda nazionale di chip di intelligenza artificiale che desidera rimanere anonima sta cercando dal 2023 di portare il personale di ricerca e sviluppo di back-end in prima linea per fornire servizi personali, non solo per essere sul posto per la formazione congiunta, ma anche per fornire ai clienti un team dedicato di personale di ricerca e sviluppo dopo l'inserimento dell'ordine di vendita in un piccolo gruppo. I prezzi unitari per i clienti vanno da pochi milioni a centinaia di migliaia e puoi usufruire di una consulenza 24 ore su 24, 7 giorni su 7.

Fornire semplicemente servizi localizzati e premurosi non è sufficiente. Dopo il ritiro di NVIDIA dalla Cina,L’industria dei chip non è più semplicemente una battaglia tra gli stessi prodotti chip. , ma verifica anche la rispettiva comprensione della finestra temporale. I produttori cinesi di chip si sono avventati su di loro come un branco di lupi e sono iniziate le vigorose offerte.

Huawei sta arrivando più ferocemente. Huawei ha già collaborato con iFlytek per rilasciare il dispositivo "Spark All-in-One", equipaggiato con l'"Ascend 910B".

Una volta si diceva che questo chip fosse "paragonabile a NVIDIA A100" in termini di capacità di una singola scheda. Ciò che non è noto è il lato difficile dietro questo glorioso caso: 36 Krypton ha appreso che Huawei non ha esitato a pagare i costi della manodopera e ha inviato centinaia di ingegneri per aiutare iFlytek a regolare i parametri.


Huawei e iFlytek rilasciano la macchina Spark all-in-one, fonte: iFlytek

Anche se questo viene definito "fatto a mano" dall'industria, non appena è uscito il caso di riferimento, molte grandi aziende di modellismo e società Internet hanno offerto un ramoscello d'ulivo a Huawei per i test.

Una società nazionale di vendita di chip è stata sorpresa di scoprire che dal luglio dello scorso anno, il management di alto livello di Huawei può essere visto di stanza lì in qualsiasi progetto di centro di calcolo intelligente che è stato bandito pubblicamente “Huawei può ora inviare centinaia di persone a un progetto We andare a servire e persino perdere soldi su alcuni progetti chiave per guadagnare entrate da altri progetti."

La suddetta società di chip senza nome ha anche 200 venditori irriducibili, una configurazione molto rara nel settore dei chip nazionale. Il loro team di vendita ha iniziato dai tre settori più caldi per l'implementazione di modelli di grandi dimensioni, finanza, diritto e industria, ed è apparso in quasi tutte le mostre relative alla potenza di calcolo. "Nel settore dei chip, le risorse vengono prima di tutto. Se corri lentamente, morirai ." Perduto".

È iniziata anche una guerra nascosta dei prezzi per i chip nazionali.

Una persona del settore dei chip ha detto a 36Kr che il loro obiettivo è quello di ottenere più ordini per centri di calcolo intelligenti di riferimento, indipendentemente dal prezzo unitario. 36 Krypton ha osservato che per ridurre i costi, alcune aziende nazionali non esitano a rimuovere la costosa HBM (memoria ad alta larghezza di banda) dalle loro schede di inferenza, e addiritturaSpedito ad un prezzo inferiore del 50% rispetto al prezzo di costo.

"Non importa cosa, tutti sperano ancora di sfondare da vari punti di ingresso e ognuno di prendere una piccola fetta della torta da NVIDIA, in modo che NVIDIA non sia più l'unica."

Ma la realtà è crudele. Quando si tratta di prodotti, i chip IA domestici avranno inevitabilmente diversi problemi.

Un esperto di chip ha fornito un esempio a 36Kr: potrebbero essere necessari solo dieci giorni per elaborare lo stesso set di dati utilizzando il cluster A100 di NVIDIA, ma potrebbero essere necessari diversi mesi per utilizzare alcuni prodotti chip nazionali.Il tempo di accumulo dell'hardware dei chip domestici è troppo breve e mancano processi avanzati e lacune hardware, con conseguente bassa efficienza.

Anche le carenze del software sono evidenti. Un altro esperto del settore ha testato e scoperto che quando si utilizzano chip domestici per eseguire modelli di grandi dimensioni, se si desidera eseguire applicazioni più interessanti su di esso, una volta modificato il modello di base di grandi dimensioni, i chip domestici sono soggetti a arresti anomali "In molti casi, utilizziamo patatine fatte in casa." Fondamentalmente, ti chiudi il naso e lo usi."

Ora, ogni azienda ha veramente visto chiaramente la strategia di “accerchiamento e repressione” e si è gradualmente differenziata in percorsi più realistici:

Sebbene ci siano ancora alcune fazioni che continuano a spostarsi nel cluster Wanka, concentrandosi su scenari di addestramento e essendo duri con NVIDIA, rappresentate da Moore Threads e Huawei, la maggior parte delle fazioni sceglie di concentrarsi maggiormente sull'uso di modelli di grandi dimensioni; piccoli modelli in vari settori L'implementazione di vari settori inizia dal ragionamento su scenari che non richiedono hardware e software elevati, rappresentati da Suiyuan, Tianshu Zhixin, ecc.

(36Kr Nota: i modelli di grandi dimensioni hanno due collegamenti: addestramento e inferenza: l'addestramento è il processo di ricerca di modelli da miliardi di database."Fare"Modello di grandi dimensioni; l'inferenza è presente"utilizzo"Il processo di modelli di grandi dimensioni è meno difficile eRequisiti hardware e software inferiori, collegamento più stretto con l'industria)


Moore Thread rilascia l'ammasso Kua'e Wanka alla Conferenza sull'intelligenza artificiale del 2024 Colpo di 36 krypton

"Non stiamo inseguendo ciecamente Nvidia adesso. Non possiamo permetterci di recuperare il ritardo e non osiamo realizzare ciecamente chip con una potenza di calcolo estremamente elevata", ha detto senza mezzi termini un esperto dell'industria dei chip.

Una considerazione realistica per i produttori di chip nazionali è quella di NvidiaL'obiettivo principale non è qui e i produttori nazionali hanno evitato la guerra frontale di Nvidia.

In precedenza, la maggior parte delle aziende utilizzava le schede grafiche per videogiochi NVIDIA 4090 di livello consumer per eseguire inferenze basate su considerazioni sui costi. Queste schede presentavano molti problemi: consumo energetico eccessivo, memoria insufficiente e disattivazione. I funzionari di Nvidia inoltre non consentono l'utilizzo di queste schede grafiche di livello consumer per l'inferenza di modelli di grandi dimensioni.

Le società di chip nazionali sono entrate nel divario di NVIDIA. Tianshu Zhixin e Suiyuan stanno entrambi spingendo quest'anno schede di inferenza che competono con la 4090, con i punti di forza di ampia memoria, basso consumo energetico e fornitura stabile.

Anche i produttori nazionali di chip hanno chiarito l'importanza di identificare i segmenti di mercato. Ad esempio, per alcuni scenari sensibili al consumo energetico, ci concentriamo su piccoli chip a basso consumo oppure possiamo immergerci in scenari di nicchia come l'ottimizzazione video per realizzare piccole ma belle attività;

Il campo di battaglia dei giganti è teso.

Quando le società nazionali di GPU scrivono "superando NVIDIA" in PPT, è più simile a una bella visione. Questo gruppo di società non è stato istituito da molto tempo e ha raggiunto la tendenza alla sostituzione domestica, anche se supera solo di poco , è considerata un'impresa. Nvidia è sia un rivale che un punto di riferimento per loro.

Ma quando si tratta di Intel e AMD, paragonabili per anzianità a Nvidia, l'atmosfera è ancora più tesa.

Internamente consideriamo Nvidia il nostro nemico mortale", ha detto a 36Kr uno sviluppatore della linea di prodotti della serie MI di AMD.

Al Taipei Computer Show (Computex 2024) nel giugno di quest'anno, il fondatore di AMD Su Zifeng (è anche cugina del fondatore di Nvidia Huang Jen-Hsun) ha anche chiarito per la prima volta il futuro ritmo dei prodotti AMD sulla GPU, iterandone uno nuovo ogni anno i prodotti GPU sono coerenti con il ritmo di aggiornamento di Nvidia.

Quasi ogni volta che Nvidia lancia una GPU, AMD la acquisterà dal mercato e la smonterà immediatamente per confrontarla con prodotti non ancora lanciati.

"Dobbiamo aggiungere alcune funzionalità (indicatori) qui e aumentare i parametri lì." Quello che stanno perseguendo è che "l'hardware non possa restare indietro rispetto a NVIDIA e i parametri siano leggermente migliori", ha detto la persona di cui sopra a 36 Krypton.


Su Zifeng ha rilasciato Instinct MI325X al Taipei Computex di quest'anno

Dal 2023, i partner cinesi dell’ecosistema AMD riceveranno nuove richieste di ottimizzazione del software da AMD quasi ogni due giorni. Per promuovere le proprie GPU, i dirigenti AMD a volte richiedono al reparto CPU più vantaggioso di abbinare le GPU per effettuare ordini, rischiando che le CPU non vengano vendute.

Le persone AMD bruciano incenso e adorano Buddha ogni giorno, sperando che si possa migliorare l'ecologia", lo ha detto attualmente il dirigente di un'azienda ecologicaEsistono già più di 10 fornitori cloud e clienti To B in Cina, nell'adattamento e nella verifica degli effetti relativi ai chip AMD.

Rispetto agli ansiosi produttori di chip nazionali, il vantaggio dei giganti di chip stranieri a livello di hardware è che hanno processi avanzati e capacità di produzione HBM, quindi non c'è un grande divario tra i prodotti AMD e Intel rispetto ai prodotti Nvidia in una certa misura.

I dati ufficiali mostrano che il prodotto AMD (MI300X rilasciato nel dicembre 2023) affermava in precedenza che la potenza di calcolo è 1,2 volte quella di Nvidia H100;

Il prodotto Intel (Gaudi 3 rilasciato nell'aprile 2024) supera di gran lunga l'H100 in termini di efficienza energetica e prestazioni di inferenza. Naturalmente, è anche più economico. Il prezzo della GPU AMD è circa il 70-80% rispetto ai prodotti benchmark di Nvidia.

Ma tutti i produttori aggressivi con Nvidia affrontano un problema comune:Non importa quanto sia forte il nostro hardware, viene messo in ombra dal software debole, proprio come i difetti di un barile.

In un'epoca in cui le GPU potevano essere utilizzate solo per l'elaborazione grafica, la piattaforma software CUDA lanciata da NVIDIA equivaleva a fornire agli sviluppatori una serie di interfacce di programmazione, consentendo loro di scrivere liberamente programmi di elaborazione sulla GPU utilizzando il linguaggio di programmazione a loro più familiare. con.

"Lascia che ti faccia un'analogia. Perché CUDA non può superarlo? È come se imparassi una lingua e lavorassi in questa lingua per così tanti anni. Se ti chiedessi di cambiare lingua, ti sentirai a disagio? Non è vero? non sei disposto?" Un impiegato di un'azienda di chip ha fatto un esempio.

CUDA è la barriera più profonda per l’ecosistema software di Nvidia.Anche Intel e AMD, che sono grandi aziende, non riescono a superare le altre in un breve periodo di tempo.

Un ex dipendente del team Intel GPU ha detto a 36Kr di aver schierato più di 3.000 ingegneri in tutto il mondo e di aver investito tre o quattro anni, ma di aver migliorato solo la precisione dallo 0% al 4%: hanno utilizzato i chip Intel per convertire un ritratto e hanno aspettato Dopo molto tempo l'informazione andò perduta al punto che "non era più un volto umano".


Il CEO di Intel Kissinger rilascia la serie di chip Gaudi

Riappare l’errore dell’uovo e della gallina. È proprio perché non molte persone utilizzano GPU AMD e Intel, e ancora meno persone utilizzano le piattaforme software corrispondenti (ROCm, oneAPI), quindi è difficile per chiunque sfruttare appieno le proprie reali capacità hardware.

"CUDA di NVIDIA ha sempre avuto così tanti sviluppatori che iterano sugli algoritmi, aiutando NVIDIA a rendere l'inferenza e l'addestramento molto efficienti. Di conseguenza, NVIDIA ha sempre avuto potere contrattuale e sa sempre cosa dovrebbe fare il suo prossimo chip, ma questa è AMD. È un mal di testa sia per Intel che per Intel", ha detto senza mezzi termini il CEO di una società dell'ecosistema AMD.Lo strumento software ROCm di AMD è "proprio come CUDA di NVIDIA 20 anni fa".

Ma per i clienti a valle è qui che sorge il rischio.

Verificare un modello di grandi dimensioni è intrinsecamente un esperimento con incertezza. Se vuoi ancora eseguirlo su un chip che non è stato verificato, equivale a mettere insieme due variabili incontrollabili: abbandonare Nvidia significa dover pagare una cifra enorme incertezza.

Nonostante ciò, l’accerchiamento e la soppressione di Nvidia è ancora una battaglia che deve essere combattuta per AMD e Intel.

L’architettura globale dei chip è divisa in tre parti: l’architettura X86 guida il settore dei PC ed è dominata da Intel e AMD; il mercato mobile è dominato da Arm e NVIDIA domina il mercato dell’intelligenza artificiale;

In quasi un anno e mezzo da quando la nuova rivoluzione dell’intelligenza artificiale ha inaugurato l’era, Nvidia ha superato la soglia dei 3 trilioni di dollari del valore di mercato, che ora equivale al valore di mercato combinato di 7 Intel + AMD.

Dopo 20 anni, “l’accerchiamento e la soppressione” di Nvidia da parte dei giganti dei chip,Fu un'altra battaglia ansiosa, e fu anche un contrattacco tardivo.

vera crepa

Quando le aziende nazionali di chip IA formano un esercito di formiche, AMD e Intel fanno di tutto. Nvidia è davvero scossa di fronte a un simile assedio?

Le crepe nell'impero NVIDIA si stanno diffondendo silenziosamente.

Un segnale su cui Nvidia deve prestare attenzione è che OpenAI, Google, Microsoft... questi importanti clienti che hanno ricaricato Nvidia per la loro fiducia nell'intelligenza artificiale stanno facendo il primo passo verso "anti-Nvidia".

I chip sviluppati internamente sono un gioco di scacchi pianificato da tempo da diverse aziende. Un ex dipendente principale del team TPU di Google ha detto a 36Kr che Google, che utilizza 1/4 della potenza di calcolo mondiale,"Potremmo non acquistare chip esterni entro la fine dell'anno."

In passato, il TPU sviluppato internamente da Google si basava maggiormente su considerazioni sui costi. Ad esempio, si temeva che Nvidia aumentasse i prezzi a piacimento o che l’offerta non fosse sufficientemente stabile. Ora la strategia di creazione dei core di Google è più radicale."Quasi indipendentemente dal costo e dal costo."

OpenAI ha innumerevoli preparativi. Prevedono di raccogliere fino a 7 trilioni di dollari USA per costruire un nuovo impero di chip AI.

Anche a livello nazionale, 36Kr hanno imparato da molte fonti:Al momento, i maggiori acquirenti nazionali di Nvidia, Alibaba, Byte e Baidu, stanno fondamentalmente ricercando segretamente chip per l'addestramento di modelli di grandi dimensioni.

Progresso del prodotto di produttori di cloud esteri, produttori di modelli di grandi dimensioni e produttori di chip stellari, raccolta e mappatura completa di informazioni da 36 Kr

Tuttavia, i chip sviluppati internamente sono una soluzione a lungo termine. Un altro piano a breve termine per questi grandi clienti è provare i prodotti dei concorrenti di Nvidia e ridurre la loro dipendenza da Nvidia.

AMD è questo piano B. Un membro di AMD ha detto a 36Kr,I prodotti GPU di AMD hanno già aperto grandi mercati ai clienti in Europa, Stati Uniti, Corea del Sud e altri luoghi——Microsoft ha acquistato decine di migliaia di prodotti AMD e anche Tesla, Midjourney, U.S. National Laboratory e Korea Telecom hanno preso in consegna i prodotti in lotti.

In Cina, Chen Wen, un dipendente di AMD Ecosystem, ha affermato che centinaia di schede acceleratrici AMD di un determinato modello saranno spedite nel 2023. Anche se non sono molte, "ma questo prodotto AMD non è quasi mai stato trovato prima in Cina".

Secondo le precedenti stime ottimistiche di AMD, le GPU dei data center porteranno ad AMD fino a 2 miliardi di dollari di entrate entro la fine del 2024.

Sebbene il formicaio dei produttori di chip cinesi non abbia ancora rappresentato una minaccia sostanziale per Nvidia, le sue scintille stanno gradualmente guadagnando slancio.

36Kr ha appreso che ora le vendite nazionali di chip per formazione e inferenza sono balzate a un nuovo livello: un segnale gratificante e positivo è che le società Internet e le grandi aziende modello, riconosciute come le più difficili da acquisire in Cina, hanno iniziato a investire in chip nazionali Il produttore ha aperto la bocca.

Secondo 36Kr, attualmente,Ascend Chip ha lottato per entrare nel sistema delle società Internet, inclusa Baidu.

Inoltre, le società nazionali di intelligenza artificiale come Zhipu AI, MiniMax e Step Star stanno tutte addestrando modelli di grandi dimensioni con trilioni di parametri. Tuttavia, quando i chip di fascia alta di NVIDIA sono limitati, le aziende di modelli di grandi dimensioni generalmente scelgono la “formazione mista” (ovvero NVIDIA +. altri chip), come,Il cluster di Zhipu AI riserva quasi la metà dei chip Shengteng.

Inoltre, i prodotti di chip di inferenza di Tianshu Zhixin e Suiyuan hanno spedito decine di migliaia di pezzi dallo scorso anno. I canali di spedizione includono i principali centri di calcolo intelligenti nazionali. Il primo è entrato nella catena di fornitura di Baichuan, un grande produttore di modelli Chip Kunlun Qui, le spedizioni cumulative delle ultime due generazioni di chip di inferenza ammontano a 30.000-50.000 pezzi, con spedizioni da Baidu e canali esterni che rappresentano la metà ciascuna.

"Gli attuali livelli di prezzo e offerta di Nvidia sono al limite per verificare se e come tutti possano farlo.", ha detto senza mezzi termini un insider del settore.


Il fondatore di NVIDIA Huang Jenxun Picture Source Visual China

Se si guarda oltre nei prossimi tre-cinque anni, emergeranno gradualmente nuove minacce per Nvidia.

Nel settore sono apparse anche nuove architetture di chip AI diverse dalle GPU: ad esempio, la società di chip Groq della Silicon Valley, che in precedenza aveva lanciato l'architettura LPU, afferma di eseguire modelli linguistici di grandi dimensioni "dieci volte più veloci" delle GPU di Nvidia;

C'è anche il chip Etched della Silicon Valley, che ha rilasciato un chip ASIC di grande modello, sostenendo di essere "un ordine di grandezza più veloce" delle GPU Nvidia. Queste startup di chip sono supportate da formazioni di investimenti stellari come OpenAI.

36Kr ha appreso che quest'anno in Cina sono emerse nuove startup di chip AI. Ad esempio, Shanghai ha recentemente sostenuto segretamente due nuove società di chip AI.

Yang Gongyifan, CEO di Zhonghao Xinying, un'azienda nazionale di TPU, ha affermato che il tasso di utilizzo complessivo dei transistor della GPU è solo del 20%. In realtà, le carenze sono evidenti, sebbene le nuove architetture come TPU e ASIC non siano molto versatili , i loro transistor Il tasso di utilizzo può raggiungere il 60%-100%. "Nei prossimi tre-cinque anni ci sarà sicuramente un gran numero di chip AI al di fuori dell'architettura GPU in patria e all'estero."

Basta poco per scuotere il colosso NVIDIA.

"Pensi che NVIDIA sembri non avere rivali all'esterno? In realtà non è così", ha detto a 36Kr un dipendente NVIDIA. Come dice spesso Huang Renxun: "Abbiamo solo 30 giorni prima del fallimento".

NVIDIA si è preparata per più di dieci anni, poi si è imbattuta in un'azienda geniale come OpenAI e insieme hanno catalizzato il miracolo di NVIDIA. In passato, nell’industria dei semiconduttori non mancavano le storie sui sorpassi dei giganti in curva.

Il fumo della battaglia per accerchiare e sopprimere Nvidia è già stato acceso.

FINE

FINE