nouvelles

ming-chi kuo a déclaré que nvidia avait arrêté de développer la version à double armoire de l'armoire ia gb200 (nvl36*2).

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

selon les informations d'it house du 2 octobre, ming-chi kuo a publié hier (1er octobre) un briefing sur les investissements sur le marché. il a été rapporté qu'en l'absence d'exigences de personnalisation du client, nvidia ne fournissait plus la version à double armoire du gb200 (2 nvl36). ), et ne fournit que des versions à armoire unique. la version à armoire unique gb200 nvl72, tandis que la version à armoire unique nvl36 conserve le plan de développement et d'expédition d'origine.

it home joint les informations d'information de ming-chi kuo comme suit :

en conclusion:

cette question n'affectera pas la tendance positive à long terme d'ai et de nvidia, mais à court terme, elle pourrait amener certains acteurs du marché à remettre en question les capacités d'exécution de nvidia et de la chaîne d'approvisionnement.

nvidia a récemment révisé fréquemment son modèle de produit de serveur d'ia. je pense que cela est dû au fait que nvidia souhaite parvenir à un meilleur équilibre entre l'exécution de la chaîne d'approvisionnement, les avantages concurrentiels et les besoins des clients avec des ressources limitées (l'arrêt du développement de nvl36*2 n'est qu'un exemple). c'est une bonne chose et représente l'approche plus pragmatique de nvidia en matière de planification des produits, mais le processus de changement peut rendre certains acteurs du marché confus quant au chaos de la chaîne d'approvisionnement.

en raison de la faible visibilité actuelle sur le mix d'expéditions de produits des serveurs blackwell en 2025 (il y a quelques mois, le marché pensait généralement qu'il n'y aurait que des nvl36, nvl72 et nvl36*2), les perspectives 2025 de certains fournisseurs, comme l'assemblage et le refroidissement, seront grandement affectés.

comparaison de deux versions 72gpu : raisons du choix du nvl72 et de l'annulation du nvl36*2

les ressources de développement sont limitées.le plan initial était que trois boîtiers gb200 (nvl36, nvl72, nvl36*2) étaient en cours de développement en même temps. il est prévu que la version de développement (development drop : devdrop) à partir de la mi-novembre convergera vers nvl72 et nvl36*2 (car nvl36 est « théoriquement » prêt à entrer dans la phase de production de masse), et la version finale des deux sera être achevé d’ici la mi-mars 2025. assurance qualité (aq). cependant, des incertitudes subsistent quant au développement du nvl36, sans parler du développement simultané de deux versions 72 gpu (nvl72 et nvl36*2).

nvl72 économise de l'espace dans le centre de données.si le nvl72 peut résoudre correctement les problèmes de conception de dissipation thermique du sidecar, il nécessitera une armoire de moins que le nvl36*2, améliorant ainsi l'efficacité de l'espace du centre de données.

l'efficacité d'inférence de nvl72 est meilleure.bénéficiant de la conception parallélisable du logiciel, il y a peu de différence dans les résultats de la formation ai llm entre nvl72 et nvl36*2. cependant, dans le processus de raisonnement qui n'est pas ou n'est pas facile à paralléliser la conception (comme les modèles autorégressifs), les performances du nvl72 sont plus faciles à surpasser celles du nvl36*2.

préférences clés des clients.par exemple, microsoft préfère nvl72 plutôt que nvl36*2.

tenir les promesses publiques. l'accent publicitaire de nvidia a toujours été mis sur la version à armoire unique de nvl72. afin de remplir son engagement public et avec des ressources limitées, la priorité de développement de nvl72 est supérieure à celle de nvl36*2.

le développement du nvl72 est confronté à des défis techniques sans précédent et la visibilité actuelle du calendrier de production de masse est encore faible.

le plus grand défi dans le développement du nvl72 vient principalement de l'exigence de tdp (thermal design point) de 132 kw. il s'agit du serveur à consommation électrique la plus élevée de l'histoire et la chaîne d'approvisionnement a besoin de plus de temps pour résoudre des problèmes techniques sans précédent.

il convient de noter que le tdp fait référence à la consommation d'énergie moyenne d'un fonctionnement continu. si une mauvaise conception entraîne une consommation d'énergie maximale instantanée (appelée edp (electrical design point) par nvidia) supérieure au tdp, plus de deux sidecars peuvent être nécessaires. si tel est le cas, non seulement la complexité de la conception de la dissipation thermique et la difficulté de la production de masse sont augmentées, mais l'avantage du nvl72 en matière d'économie d'espace dans le centre de données est perdu.

un autre défi de conception de sidecar est de contrôler la température approche de manière stable entre 5 et 10°c. si la norme est assouplie, la stabilité du système peut être affectée.

il convient de noter que le défi de consommation d’énergie élevée mentionné ci-dessus implique non seulement sidecar, mais également tous les composants et la conception du système.

ma dernière enquête sur la chaîne d'approvisionnement souligne que le calendrier de production de masse du nvl72 pourrait ne pas intervenir avant 2s25 (contre 1s25 pour l'objectif optimiste de nvidia).