notizia

cos'è successo a nvidia, il "produttore di pale per la vendita di intelligenza artificiale", diminuito di 200 miliardi di dollari?

2024-08-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autore |.wan chen

redattore |. zheng xuan

che la domanda di intelligenza artificiale sia forte o meno, i “venditori di pale” sono i primi a sentire la temperatura del mercato. mentre la "teoria della bolla dell'intelligenza artificiale" causata dalle crescenti spese in conto capitale dei fornitori di servizi cloud è diventata dilagante, nvidia ha inaugurato la stagione dei rendiconti finanziari più seguita.

dopo la chiusura del mercato mercoledì ora locale, nvidia ha annunciato la performance finanziaria del secondo trimestre per l'anno fiscale 2025. in questo trimestre, le entrate di nvidia hanno raggiunto il livello record di 30 miliardi di dollari, con un aumento su base annua del 122%. tra questi, anche il business dei data center ha raggiunto la cifra record di 26,3 miliardi di dollari.

nonostante ciò, il prezzo delle azioni di nvidia ha continuato a scendere quel giorno e, dopo la richiesta degli utili, il prezzo delle azioni della società è sceso al 6,6%.

il motivo è che la crescita dei data center di nvidia è rallentata in modo significativo, con solo il 16% su base trimestrale. ciò dimostra che non è chiaro se le successive spese in conto capitale dei principali clienti come i fornitori di cloud possano supportare l’elevata crescita dei data center nvidia.

durante la teleconferenza, quando gli è stato chiesto come considerava il roi (ritorno sull'investimento) delle spese in conto capitale per l'intelligenza artificiale, huang ha dichiarato: "le persone che investono nell'infrastruttura nvidia possono ottenere rendimenti immediati. l'investimento nell'infrastruttura informatica è il miglior investimento oggi. progetti con un alto tasso di rendimento.” l’implicazione è che quasi due anni dopo i cambiamenti del modello su larga scala innescati da chatgpt, le opportunità deterministiche dell’intelligenza artificiale sono ancora solo a livello infrastrutturale, il che mette davvero alla prova la pazienza degli investitori.

il rapporto finanziario di nvidia ha causato uno shock considerevole nel circolo dei semiconduttori dell'intelligenza artificiale.insieme al prezzo delle azioni di nvidia, sono diminuiti anche i prezzi delle azioni del settore dei semiconduttori ai a monte e a valle. allo stesso tempo, il prezzo delle azioni dell è sceso del 3% e quello delle azioni super micro è sceso del 4%. le azioni di broadcom e amd sono scese di circa il 2%. le azioni di micron technology sono scese del 2,6%. le azioni della società di progettazione di chip arm holdings sono scese di quasi il 3%.

01

blackwell ritarda le spedizioni

nel secondo trimestre, al 28 luglio 2024, il fatturato totale di nvidia è stato di 30 miliardi di dollari, con un aumento del 15% rispetto al primo trimestre e del 122% rispetto allo stesso periodo dell'anno scorso.

entrate del rapporto finanziario nvidia 2025q2 per azienda | fonte immagine: sito web ufficiale nvidia

tra questi, il business dei data center, che è il più redditizio, è cresciuto del 154% su base annua raggiungendo i 26,3 miliardi di dollari. il cfo di nvidia colette kress ha spiegato che la forte crescita dei data center è guidata dalla domanda per la piattaforma di elaborazione gpu hopper, che viene utilizzata per addestrare e dedurre modelli linguistici di grandi dimensioni, motori di algoritmi di raccomandazione e generare applicazioni di intelligenza artificiale. la piattaforma nvidia h200 inizierà la produzione di massa questo trimestre e verrà fornita ai grandi fornitori di cloud (csp), internet consumer e aziende aziendali. rispetto all'h100, la larghezza di banda della memoria h200 è aumentata di oltre il 40%.

oltre agli scenari di utilizzo relativi a modelli di grandi dimensioni, i principali scenari di utilizzo dei data center nvidia includono anche: pre e post-elaborazione di dati video, immagini e testo utilizzando carichi di lavoro cuda e ai con elaborazione di database sql e vettoriali;

per quanto riguarda le entrate generate da questi scenari informatici, nvidia ha affermato che la domanda per l'architettura hopper è ancora forte e si prevede che le spedizioni continueranno ad aumentare nella seconda metà dell'anno fiscale 2025. allo stesso tempo, la domanda dei clienti per le unità informatiche di prossima generazione con architettura blackwell supera di gran lunga l’offerta.

in effetti, i chip con questa nuova architettura avrebbero dovuto essere spediti in lotti durante questo trimestre fiscale. lo scorso trimestre, lao huang ha affermato che blackwell inizierà a spedire nel secondo trimestre fiscale, aumenterà le spedizioni nel terzo trimestre e vedrà "una grande quantità di entrate apportate dall'architettura blackwell" quest'anno fiscale. ma all'inizio di questo mese, the information ha dato la notizia che le spedizioni della piattaforma informatica di prossima generazione di nvidia, blackwell gpu, saranno ritardate.

a questo proposito, colette kress, chief financial officer di nvidia, ha dichiarato: "abbiamo apportato modifiche alla maschera gpu blackwell per aumentare la produzione. l'inizio della produzione di blackwell è previsto nel quarto trimestre e si prevede che le entrate di blackwell nel quarto trimestre fiscale raggiungeranno diversi livelli. cifre. un miliardo di dollari."

le maschere nei semiconduttori rappresentano una parte fondamentale del processo di progettazione e produzione e sono considerate il modello per la progettazione di circuiti integrati. la sostituzione è un processo costoso e dispendioso in termini di tempo. questo sembra essere il motivo per cui nvidia ritarda leggermente le spedizioni di grandi volumi di blackwell.

vale la pena notare che la piattaforma informatica di nvidia integra processori, interconnessioni, software, algoritmi, sistemi e servizi.pertanto, la crescita anno su anno del business dei data center è composta principalmente dai ricavi derivanti dall'informatica e dalla rete. in termini di ricavi di rete, i ricavi della rete di data center di nvidia sono stati di 3,7 miliardi di dollari in questo trimestre, con un aumento su base annua del 114%, guidato da infiniband ed ethernet (inclusa la piattaforma ethernet end-to-end spectrum-x).

kress ha affermato: “i ricavi dell’ai ethernet sono raddoppiati continuamente e centinaia di clienti hanno adottato prodotti ethernet, incluso x.ai di musk. questo è un prodotto completamente nuovo per noi e sta diventando una tecnologia che porta affari multimiliardari ."

in termini di prestazioni del data center, nvidia ha anche menzionato specificamente la potenza del mercato cinese. kress ha affermato che i ricavi dei data center di nvidia in cina sono aumentati in modo sequenziale nel secondo trimestre fiscale e hanno contribuito in modo importante ai ricavi dei data center, ma la sua quota di ricavi era ancora inferiore rispetto a prima dell'implementazione dei controlli sulle esportazioni.

oltre al business dei data center, anche le altre tre business unit di nvidia: giochi, visualizzazione professionale e ricavi automobilistici hanno registrato diversi gradi di crescita.

tra questi, le entrate derivanti dai giochi sono aumentate del 16% su base annua e del 9% su base mensile. questi aumenti sono stati guidati dall’aumento delle vendite di gpu geforce rtx serie 40 e soc per console di gioco. nvidia ha affermato che "la domanda di gpu da gioco è stata forte nel secondo trimestre come parte della stagione del rientro a scuola".

i ricavi derivanti dalla visualizzazione professionale sono aumentati del 20% su base annua, mentre i ricavi del settore automobilistico sono aumentati del 37% su base annua. quest’ultimo è guidato da soluzioni di cabina di pilotaggio con intelligenza artificiale e piattaforme di guida autonome.

02

le applicazioni software di intelligenza artificiale terminale non sono ancora redditizie;

trazione del data center

quanto può durare?

con il recente "sguardo mortale" sui titoli tecnologici - ritorno sull'investimento, il mondo esterno spera di vedere dal rapporto finanziario di nvidia che i fornitori di cloud e altri clienti siano stati in grado di ottenere rendimenti sufficienti sulle loro spese, anche se riescono a vedere rendimenti tali offre ai clienti la sicurezza di continuare a investire nell'hardware ai di nvidia.

ma ovviamente, non solo questo rapporto finanziario non è stato rispecchiato, ma anche il conforto offerto da huang e dal suo direttore finanziario kress durante la teleconferenza non è riuscito a confortare tutti.

nell'ultimo anno, con l'impennata del business dei data center, le entrate di nvidia sono aumentate più volte. tuttavia, il tasso di crescita trimestre su trimestre dei data center è rallentato per quattro trimestri consecutivi e i ricavi nel secondo trimestre dell’anno fiscale 2025 sono aumentati solo del 16,3% rispetto al primo trimestre. un anno fa (secondo trimestre dell'anno fiscale 2024), i ricavi dei data center di nvidia sono aumentati del 140% su base mensile. questa è la preoccupazione nascosta dietro questo rapporto finanziario.

nvidia ha affermato che i fornitori di cloud e le società internet consumer (toc) e internet industriale (tob) hanno guidato la crescita dei data center. tra questi, i fornitori di servizi cloud (csp) rappresentano circa il 45% dei ricavi dei data center, mentre le società internet consumer e industriali contribuiscono per oltre il 50% dei ricavi.

durante la conferenza sugli utili, lao huang ha analizzato la distribuzione dell'utilizzo dietro questi dati. oltre agli scenari in cui i fornitori di cloud e altre aziende affittano la potenza di calcolo, le applicazioni di intelligenza artificiale sull’internet consumer vengono attualmente utilizzate principalmente nei sistemi di algoritmi di raccomandazione, nei sistemi pubblicitari e negli scenari di ricerca. l'internet industriale, che "inizia a navigare da questo trimestre", elenca solo gli scenari di assistente ai di alcuni importanti clienti saas come servicenow e sap.

non esistono applicazioni ia estremamente redditizie o scalabili sul lato b o sul lato c. in questo caso, lao huang non può che continuare a educare tutti sul motivo per cui il business dei data center di nvidia ha aperto un vasto mercato da mille miliardi di dollari usa.

huang, che non indossa una giacca di pelle, sta lanciando una partita di baseball. non sembra che miri a un business di trilioni di data center? |fonte immagine: visual china

innanzitutto, per i grandi produttori di modelli, la legge di scaling è ancora l’unica regola efficace. in questo caso, ogni volta che la dimensione del modello viene raddoppiata, anche la dimensione del set di dati deve essere più che raddoppiata per addestrarlo. pertanto, il numero di guasti richiesti per creare il modello aumenta quadraticamente. quindi i modelli di prossima generazione richiedono 10, 20, 40 volte più calcoli rispetto alla generazione precedente. la tendenza all’aumento dell’indice di potenza di calcolo continua.

allo stesso tempo, l'"intelligenza artificiale sovrana" spacciata da lao huang, che distribuisce le proprie esigenze di intelligenza artificiale all'interno dei confini nazionali, porterà quest'anno a nvidia entrate per miliardi di dollari.

infine, il “calcolo accelerato” e l’“intelligenza artificiale generativa” sono le forze trainanti assolute del business dei data center. questo è il “primo principio” del mercato dei data center da mille miliardi di dollari. in passato, i data center non disponevano di gpu, ma solo di cpu. in futuro ogni data center sarà dotato di gpu perché occorre accelerare i carichi di lavoro per "ridurre i costi e aumentare l'efficienza". d’altro canto, abbiamo bisogno di gpu per abilitare la nuova era dell’intelligenza artificiale generativa.

vedendo questo, potresti persino sentire che queste parole ti sono molto familiari. sì, sono la "visione" che huang renderà popolare in qualsiasi forum pubblico. avendo sperimentato così tante tendenze, huang conosce molto bene il futuro dell'informatica e sa anche come raccontarlo a tutti. tuttavia, questo rapporto trimestrale non ha aspettato il "capitale paziente".