nouvelles

Le vieux Huang fait un autre geste surprenant !Le premier serveur GB20 « édition spéciale » est lancé, qui pourrait être lancé l'année prochaine

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Nouveau rapport de sagesse

Editeur : Service éditorial

[Introduction à la nouvelle sagesse]Les médias étrangers ont annoncé que Nvidia lancerait l'année prochaine une puce d'IA personnalisée pour le marché chinois et développerait même un serveur correspondant. C'est la première fois dans l'histoire de Nvidia.

La bataille entre Nvidia et le Département américain du Commerce s'est encore intensifiée !

Sous le contrôle américain des exportations, Lao Huang continue de proposer des stratégies alternatives et un jeu du chat et de la souris a lieu.


Après la mise en œuvre de nouvelles réglementations sur le contrôle des exportations, Lao Huang n'a pas pu gagner d'argent sur le marché chinois.

Depuis janvier de cette année, les nouvelles réglementations sur les exportations sont mises en œuvre depuis exactement un an et la part du marché chinois dans les revenus de Nvidia est tombée à 17 %. Il y a deux ans, ce chiffre était encore de plus de 25 %.

Face à la réglementation, Nvidia a continuellement lancé des puces « édition spéciale » personnalisées pour la Chine. Cependant, ces puces aux performances affaiblies ne se vendent souvent pas bien.

Les ventes du H20, qui avaient connu un mauvais départ auparavant, venaient tout juste de commencer à augmenter, mais Nvidia a été choqué d'apprendre la mauvaise nouvelle...

Les analystes de Jefferies ont révélé dans un rapport de recherche la semaine dernière que le département américain du Commerce procéderait à son examen annuel des restrictions à l'exportation de semi-conducteurs en octobre et pourrait interdire l'exportation de puces H20.

La surveillance continue de s'intensifier, et cette fois, Lao Huang a fait de son mieux.

Non seulement il a lancé la nouvelle puce IA phare B20, mais craignant qu'elle ne soit pas facile à utiliser, il a également lancé le serveur de support GB20.


Il n'est pas difficile de deviner d'après le nom que le B20 est une variante du Blackwell B200 lancé par Nvidia en mars de cette année.

En tant que GPU le plus rapide à ce jour, le B200 peut traiter certaines tâches jusqu'à 30 fois plus rapidement que son prédécesseur. (par exemple, laissez le chatbot générer des réponses)

Malheureusement, cela n'a rien à voir avec la puce B20 "édition spéciale"...

Le B20, né sous les restrictions de la politique américaine de contrôle des exportations, est destiné à être un produit d’entrée de gamme, contrastant fortement avec le B200 doté de performances d’IA de pointe.

Cependant, selon la source, même si le B20 sera plus lent que le B200 dans le traitement des calculs d'IA, l'installation d'un grand nombre de puces ensemble dans le serveur GB20 peut compenser en partie cette lacune.

Cela garantira que Nvidia maintiendra un certain degré de compétitivité face à la concurrence des produits chinois, tout en respectant la limite supérieure de puissance de calcul des puces requise par les contrôles américains à l'exportation.

Sous contrôle, un « jeu du chat et de la souris » se joue

Depuis fin 2022, Nvidia a reconfiguré à plusieurs reprises ses puces pour le marché chinois, en ciblant les besoins des clients chinois qui ont besoin de puces pour développer LLM, en essayant de rester attractif pour les clients chinois tout en se conformant à la réglementation américaine.

En octobre 2022, le gouvernement américain a interdit la vente des A100 et H100 de Nvidia, ses puces d'intelligence artificielle les plus avancées à l'époque.

Quelques mois plus tard, Nvidia lançait deux produits alternatifs, A800 et H800, pour le marché chinois.

Moins d'un an plus tard, le Département américain du Commerce a de nouveau mis à jour ses mesures de contrôle des exportations et imposé des restrictions sur ces deux puces.

Nvidia a répondu rapidement,


Parmi eux, la puce H20 a des performances limitées mais une vitesse de connexion plus élevée. Avec une mémoire à large bande passante et un support logiciel mature, elle offre de meilleures performances.

Bien que les ventes initiales aient été médiocres, de plus en plus de clients chinois choisissent d'acheter cette puce.

Selon quatre personnes directement impliquées dans les ventes de puces Nvidia en Chine, les entreprises chinoises ont commandé plus de 500 000 puces H20 pour une valeur totale de près de 5,8 milliards de dollars et seront livrées en 2024.

La société de recherche SemiAnalysis a également fait des estimations optimistes selon lesquelles Nvidia vendrait plus d'un million de puces H20 en Chine cette année, pour une valeur de plus de 12 milliards de dollars.

Mais comme mentionné précédemment, cette entreprise est confrontée à de nouvelles menaces de la part du ministère du Commerce. Lorsque la réglementation sera adaptée à la fin de l’année, le H20 pourrait être interdit de vente.

Cette interdiction pourrait prendre de nombreuses formes, notamment des interdictions spécifiques à des produits, une réduction de la puissance de calcul d'une puce ou une limitation de sa capacité de mémoire.

Après tout, le contexte macroéconomique est tel que l’on s’attend généralement à ce que les États-Unis continuent d’exercer des pressions sur les contrôles à l’exportation liés aux semi-conducteurs.

Les États-Unis souhaitent que les Pays-Bas et le Japon restreignent davantage la fourniture d'équipements de fabrication de puces à la Chine, ont indiqué des sources.


Sous le contrôle croissant, de plus en plus d'"éditions spéciales" pourraient apparaître.


La rumeur veut que Nvidia développe également une nouvelle carte graphique de jeu phare, la RTX 5090D.


La carte graphique sera conçue spécifiquement pour le marché chinois et fera suite à la RTX 4090D, la première carte graphique grand public répondant aux normes d'exportation.

Les performances de la puce ne suffisent pas, il faut le serveur pour compenser

Les spécifications spécifiques du B20 n'ont pas encore été déterminées, mais ce qui est sûr, c'est qu'il ne brisera certainement pas le « plafond » de la politique américaine d'exportation de GPU.

Tout comme ses anciens prédécesseurs - les H20, L20 et L2 précédemment lancés, les performances de ces trois puces peuvent être qualifiées de "épiques". Non seulement les performances sont médiocres, mais elles ne sont également équipées que d'une version résiduelle de NVLink. connecter.

TPP & PD deux indicateurs majeurs pour se serrer la gorge

Les États-Unis ont des réglementations de performance strictes sur les exportations chinoises de GPU et utilisent un indicateur appelé « puissance totale de traitement » (TPP).

Cette métrique prend en compte le TFLOPS et la précision de la puissance de calcul du GPU. Plus précisément, multiplier TFLOPS (sans parcimonie) par la précision (en bits) vous donne TPP.

La limite actuelle est fixée à 4800 TPP, qu'est-ce que cela signifie ?

En prenant comme référence les produits précédents de NVIDIA : les Hopper H100 et H200 ont largement dépassé cette norme. Le TPP des deux GPU a atteint 16 000, soit plus de trois fois la limite supérieure spécifiée.


Même le RTX 4090 dépasse la limite avec sa puissance de calcul FP8 de 660,6 TFLOPS.

Le GPU de bureau Nvidia le plus puissant pour rester dans la limite de 4 800 TPP est le RTX 4090D, spécialement conçu pour se conformer aux restrictions d'exportation.


Blackwell a établi une nouvelle référence en matière de performances informatiques, avec sa solution à double puce susceptible de produire environ 4 500 TFLOPS de puissance de calcul FP8, soit 7,5 fois la limite d'exportation.

Autrement dit, les performances du B20 seront inférieures à 1/7 des performances du Blackwell B200 !

De plus, le B20 est également confronté à des restrictions supplémentaires : les restrictions de « densité de performances » (PD).

Il s’agit d’une restriction spécifiquement imposée aux GPU des centres de données aux États-Unis, et les GPU grand public ne sont pas concernés par cette restriction.

L'indicateur PD peut être obtenu en divisant le score TPP par la taille de la puce. Le PD des GPU exportés vers la Chine ne doit pas être supérieur à 6,0.

Selon cet indicateur, les GPU de la série RTX 40 (architecture Ada Lovelace) ne peuvent plus être utilisés dans les centres de données.

Blackwell est évidemment meilleur qu'Ada Lovelace en termes de densité et de performances.

En d’autres termes, Nvidia doit limiter strictement les performances du B20 ou utiliser une plus grande proportion de puces pour se conformer aux réglementations en vigueur.

Selon Tom's Hardware, le B20 sera le successeur des GPU AI d'entrée de gamme A30 et H20 de Nvidia.

En prenant le H20 comme exemple, sa puissance de calcul FP16 n'est que de 296 TFLOPS, TPP est de 2368, PD n'est que de 2,90, tandis que H100/H200 est de 1979 TFLOPS.


Dans le même temps, l'A30 a un score TPP de 2640 et un score PD de 3,20, ce qui est légèrement supérieur à celui du H20.

On peut voir que le GPU AI construit par Nvidia pour le marché chinois a une certaine marge d'amélioration en termes de performances, mais l'espace est très limité.

Dans le meilleur des cas, Nvidia pourrait chercher à créer un GPU avec un TPP compris entre 4 000 et 4 500 et une taille de puce de 800 millimètres carrés.

GB20 : faites de notre mieux pour sauvegarder les performances du B20

Pour rendre le prochain B20 plus efficace, Nvidia utilise les stratégies utilisées avec le H20, telles que l'amélioration de la capacité de mémoire, car les puces mémoire ne sont pas soumises aux contrôles d'exportation actuels.

Selon deux personnes impliquées dans le développement du serveur, Nvidia s'efforce d'augmenter la vitesse de transfert des données entre la mémoire et les processeurs B20, afin que de grands ensembles de données énergétiques puissent être traités plus rapidement.

De plus, Nvidia utilisera également sa technologie NVLINK (qui permet une communication rapide entre différentes puces) et ses solutions de refroidissement dans la conception du rack GB20.

Cela devrait accroître l'utilisation des puces B20 et l'efficacité des clusters informatiques GB20 pour alimenter l'intelligence artificielle, ont ajouté le duo.

Le système GB20 permettra aux clients d’effectuer plus efficacement la formation et l’inférence de l’IA en exécutant plusieurs puces en parallèle.

Avant que le GB20 ne soit exposé, Tom's Hardware avait prédit avec audace que le B20 serait une puce difficile à vendre.

Mais aujourd’hui, avec la bénédiction du GB20, il semble y avoir un nouvel espoir.

Les références:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- règlements

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules