nouvelles

La sortie de la nouvelle puce IA de Nvidia sera retardée d’au moins 3 mois et des géants tels que Microsoft, Google et Meta seront affectés.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Points forts:

Tencent Technology News, 3 août : Selon les médias étrangers, le dernier projet de puce d'intelligence artificielle de Nvidia a rencontré un défaut de conception. Selon deux sources impliquées dans la production de puces et de matériel de serveur, cet accident entraînera un retard d'au moins trois fois le délai de sortie. des mois, voire plus.

Ce changement devrait avoir un impact sur un certain nombre de grands clients, notamment Meta, Google et Microsoft, qui ont précommandé cette série de puces pour des dizaines de milliards de dollars.

NVIDIA a informé cette semaine Microsoft, l'un de ses plus gros clients, et un autre fournisseur de services cloud majeur, que la livraison de ses puces d'intelligence artificielle les plus avancées de la série Blackwell serait retardée, selon des employés internes de Microsoft et une autre personne proche du dossier. .

NVIDIA a officiellement lancé la série Blackwell en mars de cette année. Le PDG, Huang Jenxun, a annoncé avec optimisme en mai qu'il prévoyait de réaliser des livraisons à grande échelle de cette série de puces au cours de l'année. Cependant, le processus a subi un revers après avoir rencontré des difficultés de conception. Selon des personnes directement impliquées dans la production de puces Blackwell, Nvidia travaille avec son fabricant de puces TSMC pour mener une nouvelle série de tests de production intensifs afin de surmonter les obstacles techniques actuels.

Compte tenu de cela, les expéditions à grande échelle de puces Blackwell devraient être reportées au premier trimestre de l'année prochaine. Il convient de noter qu'une fois que les fournisseurs de services cloud auront reçu les puces, il faudra environ trois mois supplémentaires pour déployer et activer de grands clusters de puces.

Les défis de conception et de production ont accru les inquiétudes concernant la situation de Nvidia, d'autant plus que le ministère américain de la Justice enquête sur des plaintes pour comportement anticoncurrentiel présumé. Malgré cela, Nvidia conserve toujours sa position de leader dans l’industrie grâce aux avantages significatifs en termes de performances de ses puces.

Les actionnaires fondent de grands espoirs sur la série Blackwell, et les analystes de Keybanc Capital Markets prédisent que cette série de puces devrait faire passer les revenus des centres de données de Nvidia de 47,5 milliards de dollars en 2024 à plus de 200 milliards de dollars en 2025. Huang Jen-Hsun a déclaré lors de la conférence téléphonique sur les résultats en mai : « Nous verrons Blackwell générer des revenus substantiels cette année !

La puce de serveur d'intelligence artificielle de Nvidia, l'unité de traitement graphique (GPU), est depuis longtemps la principale force motrice des développeurs tels qu'OpenAI dans le domaine de l'intelligence artificielle conversationnelle et vidéo. Dans le même temps, ces GPU aident les géants des services cloud tels que Microsoft à réaliser une croissance significative de leurs ventes en louant des ressources de puces à d'autres développeurs.

Si les prochaines puces d'intelligence artificielle B100, B200 et GB200 subissent des retards d'au moins trois mois, cela pourrait perturber les plans de déploiement de certains clients, les empêchant d'exécuter de grands clusters de puces dans les centres de données comme prévu au premier trimestre 2025. .

Des clients de poids tels que Microsoft, OpenAI et Meta attendent avec impatience les nouvelles puces de Nvidia, dans le but d'utiliser ces technologies pour mettre à niveau et développer la prochaine génération de grands modèles de langage, qui est le logiciel de base derrière ChatGPT, l'assistant Meta AI et une série d'automatisations innovantes. les fonctions.

Ces entreprises soulignent la nécessité de disposer de plus de puissance de calcul pour réaliser des progrès quantiques en termes de performances logicielles afin de répondre avec plus de précision à des requêtes complexes, d'automatiser des tâches en plusieurs étapes ou de générer du contenu vidéo très réaliste. Ils placent de grands espoirs dans les puces d'intelligence artificielle de nouvelle génération de Nvidia, en particulier dans les gains de performances qu'elles peuvent apporter lorsqu'elles sont intégrées dans des clusters de supercalculateurs.

Un porte-parole de Nvidia s'est montré prudent quant aux déclarations relatives aux retards de livraison, affirmant seulement que "les progrès de la production seront accélérés comme prévu" plus tard cette année.

Les représentants officiels de Microsoft, Google, Amazon et Meta ont choisi de ne pas commenter. Un porte-parole de TSMC n'a pas répondu à une demande de commentaire.

Il convient de noter que les principaux clients de Nvidia fondent de grands espoirs sur la puce GB200 et ont des projets ambitieux. Récemment, Google, Meta et Microsoft ont révélé l'énorme croissance de leurs investissements dans les centres de données et les puces d'intelligence artificielle. Cette décision rare a non seulement fait grimper temporairement le cours de l'action de Nvidia, mais a également déclenché des inquiétudes sur le marché concernant le cycle de retour sur investissement et les perspectives de bénéfices de ces sociétés. Abondamment discuté.

Blackwell grosse commande

Selon deux sources dans le domaine de la production de puces, Google a commandé plus de 400 000 puces GB200. Avec le matériel serveur associé, le prix total de la commande pourrait dépasser largement les 10 milliards de dollars américains, mais le délai de livraison précis n'est toujours pas clair. En revanche, les investissements de Google dans les puces, les équipements et les actifs ont atteint cette année environ 50 milliards de dollars, soit une augmentation de plus de 50 % sur un an.

Dans le même temps, Meta fait également de grands progrès, avec des commandes totales qui devraient atteindre au moins 10 milliards de dollars. Microsoft, bien qu'il n'ait pas divulgué le montant total des commandes, a procédé à des ajustements progressifs de 20 % des commandes au cours des dernières semaines. Selon des personnes ayant une connaissance directe, Microsoft se prépare à configurer 55 000 à 65 000 puces GB200 pour OpenAI d'ici le premier trimestre 2025.

Une personne proche du dossier a déclaré que Microsoft avait initialement prévu de livrer des serveurs basés sur Blackwell à OpenAI d'ici janvier de l'année prochaine, mais qu'il faudra peut-être maintenant l'ajuster à mars ou au début du printemps.

Deux initiés impliqués dans le processus de fabrication de la puce Blackwell ont déclaré que des difficultés de conception avec la puce sont apparues ces dernières semaines et que les ingénieurs de TSMC ont découvert des défauts clés dans la phase de préparation à la production de masse. Plus précisément, le problème est centré sur la puce du processeur qui connecte les deux GPU Blackwell. La défaillance de ce composant en silicium affecte directement la production globale, ce qui signifie que le nombre de puces que TSMC peut fournir à Nvidia est limité. De tels problèmes poussent souvent les entreprises à suspendre leurs activités de production.

Compte tenu de cela, NVIDIA ajuste de toute urgence le plan de conception et doit réexécuter les tests de production chez TSMC pour s'assurer que le problème est résolu avant de démarrer le processus de production de masse.

Selon des personnes proches du dossier, Nvidia a révélé à au moins un fournisseur de services cloud que, pour faire face aux difficultés actuelles et accélérer la livraison des produits, la société envisageait de lancer une version équipée d'une seule puce Blackwell comme alternative. .

retard inhabituel

TSMC avait initialement prévu de lancer la production en série de puces Blackwell au troisième trimestre et prévoyait de commencer les expéditions en masse aux clients de Nvidia au quatrième trimestre. Cependant, on s'attend désormais à ce que la production de masse des puces Blackwell soit retardée jusqu'au quatrième trimestre. S'il n'y a pas de nouveaux problèmes à l'avenir, les serveurs seront expédiés en grande quantité au cours des trimestres suivants.

Les retards dans la production de puces ne sont pas rares. Selon des personnes proches du dossier, les premières versions de son GPU phare de Nvidia en 2020 ont également connu des retards, mais à cette époque, son influence sur le marché était encore faible et les attentes des clients en matière de commandes n'étaient pas élevées. les revenus des investissements en puces étaient limités.

Il est cependant rare qu’un défaut de conception majeur soit découvert juste avant la production en série. Dans des circonstances normales, l'équipe de conception de puces travaillera en étroite collaboration avec des fabricants tels que TSMC et procédera à plusieurs séries de tests de production et de simulation pour garantir que le produit est mature et fiable avant d'accepter des commandes de gros volumes.

Selon les employés internes de TSMC, en tant que premier fabricant mondial de puces, TSMC a rarement suspendu sa chaîne de production pour repenser ce produit qui est sur le point d'être produit en série. Compte tenu du plan de production de masse des puces GB200, TSMC a pré-alloué des ressources de production, mais ces ressources resteront inutilisées jusqu'à ce que le problème soit résolu.

En outre, le défaut de conception a également affecté le calendrier de production et de livraison des racks de serveurs NVLink de Nvidia, car les entreprises concernées doivent attendre de nouveaux échantillons de puces pour terminer la conception du rack. (Compilé/Cerf d'or)