nouvelles

la « source du déclin de nvidia » : puces de pointe, plus les performances sont puissantes, plus elles sont difficiles à fabriquer

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

auteur | gao zhimo

éditeur | ia dure

si la « source du déclin » de nvidia pouvait être résumée en une phrase, ce seraient les puces de pointe. plus les performances sont fortes, plus elles sont difficiles à fabriquer.

mercredi, tout en faisant état de ventes et de bénéfices trimestriels solides, nvidia a également noté que les difficultés de fabrication des nouvelles puces avaient entraîné une baisse des marges bénéficiaires et que la société avait mis de côté 908 millions de dollars de réserves au cours du dernier trimestre. affecté par cela, son cours de bourse a chuté de 6,4% jeudi.

la société a admis dans un communiqué que les gpu à architecture blackwell ont des problèmes de rendement et doivent repenser une partie de la conception du processeur b200 pour améliorer les rendements. par conséquent, la production en série de la prochaine génération de gpu à architecture blackwell sera reportée au quatrième trimestre 2024 :

« nous avons ajusté la conception des gpu blackwell pour améliorer les rendements de production. le plan de production de blackwell débutera au quatrième trimestre et se poursuivra jusqu'à l'exercice 2026.

nous nous attendons à ce que les produits blackwell génèrent des milliards de dollars de revenus au quatrième trimestre. "

nvidia n'a pas précisé la cause spécifique du problème. mais les analystes et les dirigeants de l'industrie estiment que les défis techniques proviennent principalement de problèmes de processus de fabrication complexes posés par la conception de la puce blackwell.

l'analyse a souligné que la taille énorme et la conception complexe de blackwell ont entraîné une complexité de fabrication sans précédent. des défauts dans n'importe quel composant peuvent entraîner la mise au rebut de la puce, affectant ainsi le rendement et les bénéfices. de plus, les différences dans les coefficients de dilatation thermique des différentes parties de la puce peuvent également provoquer une déformation du boîtier, affectant les performances et la fiabilité.

afin d'améliorer le taux de rendement, nvidia a ajusté la conception blackwell et prévoit d'augmenter la production comme prévu. cependant, les analystes estiment que la complexité de l'adoption de la nouvelle technologie de connexion des puces de tsmc et les défis inhérents à la taille des puces resteront les principaux obstacles à la production de masse de blackwell.

g. dan hutcheson, vice-président de la société d'analyse industrielle techinsights, a déclaré :

"le problème est de savoir comment faire fonctionner les puces ensemble et améliorer le rendement. lorsque le rendement de chaque partie de la puce n'est pas suffisamment élevé, tout peut vite se détériorer."

01

la complexité des puces blackwell

afin de maintenir sa position de leader dans le domaine des puces d'intelligence artificielle, nvidia (nvda) mise sur le concept du « plus gros, c'est mieux ». cependant, si une taille plus grande apporte de meilleures performances, elle entraîne également de plus grandes difficultés de fabrication.

la dernière puce ia de nvidia, blackwell, est décrite par huang jen-hsun comme un « très, très gros gpu ». au sens physique, il s'agit en effet du plus grand gpu actuellement. il est composé de deux puces blackwell et utilise le processus 4 nm de tsmc. il possède 2 080 milliards de transistors, soit 2,6 fois celui de la génération précédente.

les analystes d'ubs ont déclaré dans un rapport publié plus tôt ce mois-ci que le principal problème rencontré par nvidia avec blackwell était la complexité de l'adoption de la nouvelle méthode de packaging cowos-l de tsmc.

semianalysis, un média professionnel de l'industrie des semi-conducteurs, a rapporté que cette technologie d'emballage utilise un interposeur rdl avec des ponts d'interconnexion locaux en silicium (lsi) pour connecter les particules centrales, et que le taux de transmission peut atteindre environ 10 to/s. la précision de placement de celles-ci. les ponts nécessitent des exigences extrêmement élevées. un défaut dans l'un des composants peut entraîner la mise au rebut de la puce entière d'une valeur de 40 000 $, affectant ainsi le rendement et les bénéfices.

de plus, une déformation des puces et une défaillance du système se produisent en raison d'une inadéquation du coefficient de dilatation thermique (cte) entre la puce gpu, les ponts lsi, l'interposeur rdl et le substrat de la carte mère. selon certaines informations, afin d'améliorer le rendement, nvidia a dû repenser la couche métallique supérieure et les bosses de la puce gpu.

huang jenxun a souligné lors d'une conférence téléphonique avec des analystes que la puce blackwell ne nécessite aucun « changement fonctionnel » et que tous les ajustements visent à améliorer le rendement.

la directrice financière, colette kress, a déclaré que nvidia augmentait la production de blackwell comme prévu et s'attend à ce que blackwell rapporte des milliards de dollars de revenus à l'entreprise au quatrième trimestre.

02

micron ajoute un nouveau plan d'expansion de la production de dram

selon les médias japonais, micron prévoit de construire une nouvelle usine de production de puces dram dans la préfecture d'hiroshima, au japon, dans le but de la mettre en service dès la fin de 2027.

ce type de problème n'est pas propre à nvidia. les experts du secteur affirment que ces problèmes vont s’aggraver à mesure que les fabricants de puces chercheront à augmenter la puissance de traitement en augmentant la taille des puces. les modifications de conception des puces visant à éliminer les défauts ou à améliorer le rendement sont également courantes dans l'industrie.

su zifeng, pdg du géant des puces amd, a également souligné qu'à mesure que la taille des puces continue d'augmenter, la complexité de fabrication augmentera inévitablement.les puces de nouvelle génération doivent réaliser des percées en matière d’efficacité énergétique et de consommation d’énergie pour répondre à l’énorme demande de puissance de calcul dans les centres de données d’intelligence artificielle.

"il faut beaucoup d'investissements techniques pour faire fonctionner ces technologies", a-t-elle déclaré. "vont-ils devenir plus complexes et plus grands ? cela ne fait aucun doute. c'est notre réalité."

bien entendu, afin de dépasser la limite de taille d'une seule puce, la stratégie radicale de nvidia consistant à combiner deux plus grandes puces pour créer blackwell a également suscité les doutes de la part des concurrents.

andrew feldman, fondateur de son rival cerebras systems, estime que la difficulté de développer une technologie de combinaison multi-puces va augmenter de façon exponentielle. cerebras systems a choisi de développer une puce unique géante et a lancé un service de cloud computing d'intelligence artificielle basé sur celle-ci dans le but de contester la position de nvidia sur le marché.

andrew feldman a dit :

« réaliser un travail significatif dans le domaine de l'intelligence artificielle nécessite une grande puissance de calcul, ce qui nécessite beaucoup de transistors, plus qu'une seule puce ne peut en contenir...

il est déjà difficile de développer une technologie à deux puces, il est encore plus difficile de développer une technologie à quatre puces et il est encore plus difficile de développer une technologie à huit puces. "

reste à savoir si la stratégie des puces géantes de nvidia peut finalement l'emporter, reste à tester par le marché. mais ce qui est certain, c’est que le défi ultime de la fabrication de puces ne fait que commencer.