notizia

la "fonte del declino" di nvidia: chip all'avanguardia, più potenti sono le prestazioni, più difficile è produrli

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autore |. gao zhimo

redattore |. intelligenza artificiale dura

se la "fonte del declino" di nvidia potesse essere riassunta in una frase, sarebbero i chip all'avanguardia. più forti sono le prestazioni, più difficile è la produzione.

mercoledì, pur riportando forti vendite e profitti trimestrali, nvidia ha anche notato che le difficoltà di produzione con i nuovi chip avevano portato a margini di profitto più bassi e che la società aveva accantonato 908 milioni di dollari di riserve nell'ultimo trimestre. colpito da ciò, giovedì il prezzo delle sue azioni è sceso del 6,4%.

l'azienda ha ammesso in un comunicato che le gpu con architettura blackwell hanno problemi di rendimento e necessitano di riprogettare parte del design del processore b200 per migliorare i rendimenti. pertanto, la produzione di massa della gpu con architettura blackwell di prossima generazione sarà rinviata al quarto trimestre del 2024:

"abbiamo adattato il design delle gpu blackwell per migliorare i rendimenti di produzione. il piano di produzione di blackwell inizierà nel quarto trimestre e continuerà fino all'anno fiscale 2026.

prevediamo che i prodotti blackwell genereranno entrate per miliardi di dollari nel quarto trimestre. "

nvidia non ha approfondito la causa specifica del problema. ma analisti e dirigenti del settore ritengono che le sfide ingegneristiche derivino principalmente dai complessi problemi del processo di produzione posti dalla progettazione del chip blackwell.

l'analisi ha evidenziato che le enormi dimensioni e il design complesso del blackwell hanno comportato una complessità produttiva senza precedenti. i difetti in qualsiasi componente potrebbero causare la rottamazione del chip, influenzando così la resa e i profitti. inoltre, le differenze nei coefficienti di espansione termica delle varie parti del chip possono anche causare la deformazione del package, influenzando prestazioni e affidabilità.

per migliorare il rendimento, nvidia ha modificato il design blackwell e prevede di aumentare la produzione come previsto. tuttavia, gli analisti ritengono che la complessità dell'adozione della nuova tecnologia di connessione dei chip di tsmc e le sfide intrinseche legate alle dimensioni dei chip costituiranno ancora i principali ostacoli alla produzione di massa di blackwell.

g. dan hutcheson, vicepresidente della società di analisi del settore techinsights, ha dichiarato:

"il problema è come far lavorare insieme i chip e migliorare la resa. quando la resa di ciascuna parte del chip non è sufficientemente elevata, tutto può andare a male rapidamente."

01

la complessità dei chip blackwell

per mantenere la propria posizione leader nel campo dei chip di intelligenza artificiale, nvidia (nvda) punta sul concetto "più grande è meglio". tuttavia, se da un lato le dimensioni maggiori comportano prestazioni più elevate, dall’altro comportano anche maggiori difficoltà di produzione.

l'ultimo chip ai di nvidia, blackwell, è descritto da huang jen-hsun come una "gpu molto, molto grande". in senso fisico, è effettivamente la gpu più grande attualmente. è composta da due die blackwell e utilizza il processo a 4 nm di tsmc ha 2080 miliardi di transistor, 2,6 volte quelli della generazione precedente.

gli analisti di ubs hanno affermato in un rapporto all'inizio di questo mese che il problema principale riscontrato da nvidia con blackwell è stata la complessità dell'adozione del nuovo metodo di packaging cowos-l di tsmc.

semianalysis, un media professionale nel settore dei semiconduttori, ha riferito che questa tecnologia di packaging utilizza un interposer rdl con ponti di interconnessione locale in silicio (lsi) per collegare le particelle centrali e la velocità di trasmissione può raggiungere circa 10 tb/s. la precisione di posizionamento di questi bridges richiede costi estremamente elevati. un difetto in un qualsiasi componente può causare la rottamazione dell'intero chip del valore di 40.000 dollari, influenzando così la resa e i profitti.

inoltre, si verificano deformazioni del chip e guasti del sistema a causa della mancata corrispondenza del coefficiente di espansione termica (cte) tra il die della gpu, i bridge lsi, l'interpositore rdl e il substrato della scheda madre. secondo quanto riportato, per migliorare la resa, nvidia ha dovuto riprogettare lo strato metallico superiore e le protuberanze del chip gpu.

huang jenxun ha sottolineato in una teleconferenza con gli analisti che il chip blackwell non richiede alcun "cambiamento funzionale" e che tutti gli aggiustamenti mirano a migliorare la resa.

il direttore finanziario colette kress ha affermato che nvidia sta aumentando la produzione di blackwell come previsto e si aspetta che blackwell porterà all'azienda miliardi di dollari di entrate nel quarto trimestre.

02

micron aggiunge un nuovo piano di espansione della produzione di dram

secondo quanto riportato dai media giapponesi, micron prevede di costruire un nuovo impianto di produzione di chip dram nella prefettura di hiroshima, in giappone, con l'obiettivo di metterlo in funzione entro la fine del 2027.

questo tipo di problema non è esclusivo di nvidia. gli esperti del settore affermano che tali problemi aumenteranno poiché i produttori di chip cercheranno di aumentare la potenza di elaborazione aumentando le dimensioni dei chip. anche le modifiche alla progettazione dei chip volte a eliminare difetti o migliorare la resa sono comuni nel settore.

su zifeng, ceo del gigante dei chip amd, ha inoltre sottolineato che man mano che le dimensioni dei chip continuano ad aumentare, anche la complessità della produzione aumenterà inevitabilmente.i chip di prossima generazione devono raggiungere progressi in termini di efficienza energetica e consumo energetico per soddisfare l’enorme domanda di potenza di calcolo nei data center di intelligenza artificiale.

"ci vogliono molti investimenti tecnici per far funzionare queste tecnologie", ha detto. "diventeranno più complessi e più grandi? non c'è dubbio. questa è la nostra realtà."

naturalmente, per superare il limite di dimensione di un singolo chip, la strategia radicale di nvidia di combinare due chip più grandi per creare blackwell ha suscitato dubbi anche da parte dei concorrenti.

andrew feldman, fondatore della rivale cerebras systems, ritiene che la difficoltà di sviluppare una tecnologia di combinazione multi-chip aumenterà in modo esponenziale. cerebras systems ha scelto di sviluppare un singolo chip gigante e ha lanciato un servizio di cloud computing di intelligenza artificiale basato su di esso nel tentativo di sfidare la posizione di mercato di nvidia.

andrew feldman ha detto:

"svolgere un lavoro significativo nel campo dell'intelligenza artificiale richiede molta potenza di calcolo, che richiede molti transistor, più di quanto un singolo chip possa contenere...

è già difficile sviluppare la tecnologia a due chip, è ancora più difficile sviluppare la tecnologia a quattro chip ed è ancora più difficile sviluppare la tecnologia a otto chip. "

se la strategia dei chip giganti di nvidia alla fine riuscirà a vincere resta da testare il mercato. ma quello che è certo è che la sfida finale della produzione di chip è appena iniziata.