notizia

Il rilascio del nuovo chip AI di Nvidia sarà ritardato di almeno 3 mesi e colossi come Microsoft, Google e Meta ne risentiranno.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Punti salienti:

Tencent Technology News, 3 agosto: Secondo quanto riportato dai media stranieri, l'ultimo progetto di chip di intelligenza artificiale di Nvidia ha riscontrato un difetto di progettazione. Secondo due fonti coinvolte nella produzione di chip e hardware del server, questo incidente causerà un ritardo di almeno tre volte nel rilascio mesi, mesi o anche di più.

Si prevede che il cambiamento avrà un impatto su una serie di importanti clienti tra cui Meta, Google e Microsoft, che hanno preordinato la serie di chip per un valore di decine di miliardi di dollari.

Questa settimana NVIDIA ha informato Microsoft, uno dei suoi maggiori clienti e un altro importante fornitore di servizi cloud, che la consegna dei suoi chip di intelligenza artificiale più all'avanguardia della serie Blackwell subirà ritardi, secondo i dipendenti interni di Microsoft e un'altra persona a conoscenza della questione. .

NVIDIA ha lanciato ufficialmente la serie Blackwell nel marzo di quest'anno. Il CEO Huang Jenxun ha annunciato ottimisticamente a maggio di voler realizzare spedizioni su larga scala di questa serie di chip entro l'anno. Tuttavia, il processo ha subito una battuta d’arresto dopo aver incontrato difficoltà di progettazione. Secondo le persone direttamente coinvolte nella produzione dei chip Blackwell, Nvidia sta lavorando con il produttore di chip TSMC per condurre un nuovo ciclo di test intensivi per superare gli attuali ostacoli tecnici.

Per questo motivo si prevede che le spedizioni su larga scala di chip Blackwell verranno posticipate al primo trimestre del prossimo anno. Vale la pena notare che una volta che i fornitori di servizi cloud ricevono i chip, sono necessari circa tre mesi aggiuntivi per implementare e attivare cluster di chip di grandi dimensioni.

Le sfide di progettazione e produzione hanno accresciuto le preoccupazioni sulla situazione di Nvidia, soprattutto mentre il Dipartimento di Giustizia degli Stati Uniti indaga sulle denunce di presunti comportamenti anticoncorrenziali. Nonostante ciò, Nvidia mantiene ancora la sua posizione di leader nel settore grazie ai significativi vantaggi prestazionali dei suoi chip.

Gli azionisti nutrono grandi speranze per la serie Blackwell e gli analisti di Keybanc Capital Markets prevedono che la serie di chip dovrebbe portare le entrate dei data center di Nvidia a passare da 47,5 miliardi di dollari nel 2024 a oltre 200 miliardi di dollari nel 2025. Huang Jen-Hsun ha dichiarato durante la conferenza sugli utili di maggio: "Quest'anno assisteremo a Blackwell che porterà entrate sostanziali!"

Il chip del server di intelligenza artificiale di Nvidia, l'unità di elaborazione grafica (GPU), è da tempo la forza trainante principale per sviluppatori come OpenAI nel campo dell'intelligenza artificiale conversazionale e video. Allo stesso tempo, queste GPU aiutano i giganti dei servizi cloud come Microsoft a ottenere una crescita significativa delle vendite affittando le risorse dei chip ad altri sviluppatori.

Se i prossimi chip di intelligenza artificiale B100, B200 e GB200 subissero ritardi di almeno tre mesi, ciò potrebbe interrompere i piani di implementazione di alcuni clienti, impedendo loro di eseguire cluster di chip di grandi dimensioni nei data center come previsto nel primo trimestre del 2025 .

Clienti importanti come Microsoft, OpenAI e Meta attendono con impazienza i nuovi chip di Nvidia, con l'obiettivo di utilizzare queste tecnologie per aggiornare e sviluppare la prossima generazione di modelli linguistici di grandi dimensioni, che è il software principale dietro ChatGPT, l'assistente Meta AI e una serie di soluzioni di automazione innovative. funzioni.

Queste aziende sottolineano la necessità di maggiore potenza di calcolo per ottenere progressi quantici nelle prestazioni del software per rispondere in modo più accurato a query complesse, automatizzare attività in più fasi o generare contenuti video altamente realistici. Hanno grandi speranze nei chip di intelligenza artificiale di prossima generazione di Nvidia, in particolare nei miglioramenti prestazionali che possono apportare se integrati nei cluster di supercomputer.

Un portavoce di Nvidia è stato cauto riguardo alle dichiarazioni relative ai ritardi nelle spedizioni, dicendo solo che "il progresso della produzione sarà accelerato come previsto" entro la fine dell'anno.

I rappresentanti ufficiali di Microsoft, Google, Amazon e Meta hanno scelto di non commentare. Un portavoce di TSMC non ha risposto a una richiesta di commento.

Vale la pena notare che i principali clienti di Nvidia nutrono grandi speranze per il chip GB200 e hanno piani ambiziosi. Recentemente, Google, Meta e Microsoft hanno rivelato la loro enorme crescita degli investimenti in data center e chip di intelligenza artificiale. Questa mossa rara non solo ha fatto temporaneamente salire il prezzo delle azioni di Nvidia, ma ha anche innescato preoccupazioni del mercato sul ciclo di rendimento degli investimenti e sulle prospettive di profitto di queste società. Discusso ampiamente.

Grande ordine di Blackwell

Secondo due fonti nel campo della produzione di chip, Google ha ordinato più di 400.000 chip GB200 insieme al relativo hardware del server, il prezzo totale dell'ordine potrebbe superare i 10 miliardi di dollari USA, ma i tempi di consegna specifici non sono ancora chiari. Al contrario, gli investimenti di Google in chip, attrezzature e risorse quest'anno sono saliti a circa 50 miliardi di dollari, con un aumento su base annua di oltre il 50%.

Allo stesso tempo, anche Meta sta facendo grandi passi, con un totale di ordini previsti non inferiore a 10 miliardi di dollari. Microsoft, sebbene non abbia rivelato la dimensione totale degli ordini, ha apportato modifiche incrementali del 20% agli ordini nelle ultime settimane. Secondo persone che ne hanno conoscenza diretta, Microsoft si prepara a configurare da 55.000 a 65.000 chip GB200 per OpenAI entro il primo trimestre del 2025.

Una persona a conoscenza della questione ha affermato che Microsoft originariamente aveva pianificato di consegnare i server basati su Blackwell a OpenAI entro gennaio del prossimo anno, ma ora potrebbe essere necessario spostarlo a marzo o all'inizio della primavera.

Due addetti ai lavori coinvolti nel processo di produzione del chip Blackwell hanno affermato che nelle ultime settimane sono emerse difficoltà di progettazione del chip e che gli ingegneri di TSMC hanno scoperto difetti chiave nella fase di preparazione per la produzione di massa. Nello specifico, il problema è incentrato sul chip del processore che collega le due GPU Blackwell. Il guasto di questo componente in silicio influisce direttamente sulla resa complessiva, il che significa che il numero di chip che TSMC può fornire a Nvidia è limitato. Tali problemi spesso spingono le aziende a sospendere le attività produttive.

Alla luce di ciò, NVIDIA sta modificando urgentemente il piano di progettazione e deve eseguire nuovamente i test di produzione presso TSMC per garantire che il problema venga risolto prima di avviare il processo di produzione di massa.

Secondo persone a conoscenza della questione, Nvidia ha rivelato ad almeno un fornitore di servizi cloud che, per far fronte alle attuali difficoltà e accelerare la consegna del prodotto, l'azienda sta valutando di lanciare in alternativa una versione dotata di un solo chip Blackwell .

ritardo insolito

TSMC originariamente prevedeva di lanciare la produzione di massa dei chip Blackwell nel terzo trimestre e prevedeva di iniziare le spedizioni di massa ai clienti Nvidia nel quarto trimestre. Si prevede tuttavia che la produzione di massa dei chip Blackwell verrà ritardata fino al quarto trimestre, se in futuro non si verificheranno nuovi problemi, i server verranno spediti in grandi quantità nei trimestri successivi.

I ritardi nella produzione dei chip non sono rari. Secondo persone a conoscenza della questione, anche Nvidia ha riscontrato ritardi nelle prime versioni della sua GPU di punta nel 2020, ma la sua influenza sul mercato in quel momento era ancora bassa e le aspettative dei clienti per gli ordini non erano elevate, quindi l'impatto immediato sul data center e il reddito da investimenti in chip era limitato.

Tuttavia, è insolito che un grave difetto di progettazione venga scoperto subito prima della produzione in serie. In circostanze normali, il team di progettazione del chip lavorerà a stretto contatto con produttori come TSMC ed effettuerà più cicli di test e simulazioni di produzione per garantire che il prodotto sia maturo e affidabile prima di accettare ordini di grandi volumi.

Secondo i dipendenti interni di TSMC, in quanto produttore leader di chip al mondo, TSMC ha raramente sospeso la propria linea di produzione per riprogettare questo prodotto che sta per essere prodotto in serie. In vista del piano di produzione di massa dei chip GB200, TSMC ha preassegnato le risorse di produzione, ma tali risorse rimarranno inattive finché il problema non sarà risolto.

Inoltre, il difetto di progettazione ha influenzato anche il programma di produzione e consegna dei rack per server NVLink di Nvidia, perché le aziende interessate devono attendere nuovi campioni di chip per completare la progettazione del rack. (Compilato/Cervo d'oro)