nouvelles

Nouveaux produits | Inspur Information lance le commutateur Ethernet X400 Super AI prenant en charge la plate-forme Spectrum-X

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nouvelles du 23 juilletInspirer des informationsSortie de "X400 Super AI" pour l'IA générativeEthernetchanger, la première solution domestique X400 Super AI Ethernet (X400 AI Fabric) qui prend en charge la technologie de plate-forme NVIDIA Spectrum-X et crée une collaboration terminal-réseau basée sur les SuperNIC X400 et BlueField-3, améliorant considérablement les performances de formation du GPU Wanka jusqu'à 1,6 fois.

On rapporte qu'à mesure que la concurrence à l'ère des grands modèles devient de plus en plus féroce, les capacités itératives des grands modèles sont devenues le cœur de la compétitivité du marché. Cependant, à mesure que la puissance de calcul continue d'augmenter, les performances d'une seule puce ne sont plus la clé décisive et l'efficacité du système d'IA est devenue la priorité des utilisateurs. Actuellement, dans le processus de formation des grands utilisateurs de modèles d'IA, la communication réseau représente jusqu'à 20 à 40 % du temps de formation. Par exemple, les méta-statistiques précédentes montrent que la communication réseau occupe en moyenne 35 % du temps de formation en IA (le plus élevé est de 57 %), ce qui équivaut à 35 % du temps passé sur un GPU acheté pour des millions ou des milliards de dollars. dollars est gratuit. Afin d'améliorer l'utilisation des ressources GPU, l'efficacité des communications réseau doit être améliorée de toute urgence. Cependant, le problème inégal de HASH d'ECMP dans les réseaux RoCE traditionnels entraîne une faible utilisation globale de la charge de liaison. Même si les solutions réseau dédiées peuvent répondre aux exigences de performances, elles ne peuvent pas prendre en compte l’écosystème Ethernet bien établi.

Récemment, le « X400 Super AI Ethernet » d'Inspur Information est basé sur la plate-forme Spectrum-X et utilise la technologie de collaboration terminal-réseau pour ouvrir une nouvelle voie pour la construction de réseaux de formation de grands modèles d'IA, sous les quatre aspects de performances, d'évolutivité, de stabilité et expérience utilisateur. Il répond aux défis rencontrés par les clients et leur évite le dilemme de savoir s'il faut adopter Ethernet ou des réseaux dédiés. Dans le même temps, le commutateur Ethernet Super AI X400 adopte une architecture ouverte et est conçu conformément à la spécification S3IP-UNP pour réaliser un découplage hiérarchique des logiciels et du matériel et accélérer l'innovation commerciale des clients en créant un écosystème de réseau ouvert. Lors du test réel de formation du modèle GPT3 à l'échelle de calcul des cartes GPU 16K, Super AI Ethernet a réalisé une percée en termes de performances, atteignant 1,6 fois celle du RoCE traditionnel.

En termes de performances réseau, la solution Ethernet X 400 Super AI adopte la planification collaborative des cartes réseau intelligentes X400 plus grâce à des technologies telles que le routage adaptatif, la préservation de l'ordre des paquets et le CC programmable, les commutateurs et les cartes réseau peuvent coopérer plus étroitement pour fournir. Solutions d'IA. Le modèle fournit un réseau de commutation à liaison complète sans perte de paquets et sans blocage, des performances d'interconnexion inter-machines de 400G, la bande passante effective est augmentée des 60 % traditionnels à 95 % et les performances sont 1,6 fois supérieures. du RoCE traditionnel.

En termes d'expansion flexible des ressources informatiques, X400 Super AI Ethernet a atteint des niveaux extrêmement élevésportGrâce à la densité et à l'évolutivité élastique, il offre des performances ultra élevées et peut répondre à l'échelle de puissance de calcul de centaines de milliers de cartes dans le réseau de deuxième couche, le GPU.serveurLe nombre peut atteindre 1 024 unités, prend en charge les cartes GPU 8K et peut être étendu de manière flexible à un réseau à trois couches en fonction de l'échelle de la puissance de calcul. L'échelle des serveurs GPU peut atteindre 64 000 unités et le nombre maximum de cartes GPU prises en charge peut atteindre. 512K, répondant aux besoins de groupes de différentes tailles. Conformément aux exigences du réseau, la mise en réseau flexible et élastique est devenue un puissant moteur d'innovation commerciale.

En termes d'efficacité opérationnelle, la solution Ethernet Inspur X400 Super AI maintient la compatibilité et la rentabilité de la solution Ethernet, garantissant un fonctionnement et une maintenance agiles et des performances ultra-élevées tout en réduisant considérablement le coût total de possession de la construction du réseau et en créant un déploiement automatisé en un clic pour les clients. modèle pour réaliser une configuration réseau adaptative des caractéristiques du modèle, raccourcir le cycle de déploiement de quelques semaines à quelques jours et accélérer les activités en ligne. Combiné à une plate-forme d'exploitation et de maintenance intelligente et entièrement visible, les risques et les défauts potentiels peuvent être découverts intuitivement pour assurer la continuité des activités. (Dingxi)