Nachricht

Neue Produkte |. Inspur-Informationen veröffentlicht den X400 Super AI Ethernet Switch, der die Spectrum-X-Plattform unterstützt

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Neuigkeiten vom 23. JuliInspur-Informationen„X400 Super AI“ für generative KI veröffentlichtEthernetschalten, die erste inländische X400-Super-AI-Ethernet-Lösung (X400 AI Fabric), die die NVIDIA Spectrum-X-Plattformtechnologie unterstützt und eine Terminal-Netzwerk-Zusammenarbeit auf Basis von X400- und BlueField-3-SuperNICs ermöglicht, wodurch die Wanka-GPU-Trainingsleistung deutlich auf das 1,6-fache verbessert wird.

Es wird berichtet, dass der Wettbewerb im Zeitalter großer Modelle immer härter wird und die iterativen Fähigkeiten großer Modelle zum Kern der Wettbewerbsfähigkeit des Marktes geworden sind. Da die Rechenleistung jedoch immer weiter zunimmt, ist die Leistung eines einzelnen Chips nicht mehr der entscheidende Schlüssel und die Effizienz des KI-Systems rückt in den Fokus der Benutzer. Derzeit macht die Netzwerkkommunikation im Trainingsprozess großer KI-Modellbenutzer bis zu 20 bis 40 % der Trainingszeit aus. Frühere Metastatistiken zeigen beispielsweise, dass die Netzwerkkommunikation im KI-Training durchschnittlich 35 % der Zeit einnimmt (der höchste Wert liegt bei 57 %), was 35 % der Zeit entspricht, die für eine Millionen oder Milliarden gekaufte GPU aufgewendet wird Dollar ist kostenlos. Um die GPU-Ressourcennutzung zu verbessern, muss die Effizienz der Netzwerkkommunikation dringend verbessert werden. Das ungleichmäßige HASH-Problem von ECMP in herkömmlichen RoCE-Netzwerken führt jedoch zu einer geringen Gesamtauslastung der Verbindungslast. Obwohl dedizierte Netzwerklösungen Leistungsanforderungen erfüllen können, können sie das etablierte Ethernet-Ökosystem nicht berücksichtigen.

Kürzlich basiert das „X400 Super AI Ethernet“ von Inspur Information auf der Spectrum-X-Plattform und nutzt Terminal-Netzwerk-Kollaborationstechnologie, um einen neuen Weg für den Aufbau von KI-Trainingsnetzwerken für große Modelle zu eröffnen, und zwar unter den vier Aspekten Leistung, Skalierbarkeit, Stabilität und Es geht auf die Herausforderungen ein, mit denen Kunden konfrontiert sind, und erspart ihnen das Dilemma, ob sie Ethernet oder dedizierte Netzwerke einsetzen sollen. Gleichzeitig verfügt der Super AI Ethernet Switch Im tatsächlichen Test des GPT3-Modelltrainings im Rechenmaßstab von 16K-GPU-Karten erzielte Super AI Ethernet einen Leistungsdurchbruch und erreichte das 1,6-fache des herkömmlichen RoCE.

In Bezug auf die Netzwerkleistung übernimmt die X 400 Super AI Ethernet-Lösung die kollaborative Planung von X400 plus intelligenten Netzwerkkarten. Durch Technologien wie adaptives Routing, Beibehaltung der Paketreihenfolge und programmierbares CC können die Switches und Netzwerkkarten enger zusammenarbeiten, um bereitzustellen KI-Lösungen bieten ein nicht blockierendes Full-Link-Switching-Netzwerk ohne Paketverlust, eine Inter-Machine-Verbindungsleistung von 400 G, die effektive Bandbreite wird von herkömmlichen 60 % auf 95 % erhöht und die Leistung beträgt das 1,6-fache des traditionellen RoCE.

Im Hinblick auf die flexible Erweiterung der Rechenressourcen hat X400 Super AI Ethernet extrem hohe Ergebnisse erzieltHafenDank der Unterstützung von Dichte und elastischer Skalierbarkeit verfügt es über eine extrem hohe Leistung und kann die Rechenleistungsskala von Hunderttausenden Karten im Second-Layer-Netzwerk (GPU) erfüllenServerDie Anzahl kann 1024 Einheiten erreichen, unterstützt 8K-GPU-Karten und kann je nach Umfang der Rechenleistung flexibel auf dreischichtige Netzwerke erweitert werden. Die Größe der GPU-Server kann 64.000 Einheiten erreichen und die maximale Anzahl unterstützter GPU-Karten erreichen 512K erfüllt die Anforderungen von Gruppen unterschiedlicher Größe. Im Einklang mit den Netzwerkanforderungen ist eine flexible und elastische Vernetzung zu einem starken Treiber für Geschäftsinnovationen geworden.

Im Hinblick auf die Betriebseffizienz setzt die Inspur X400 Super AI Ethernet-Lösung die Kompatibilität und Kosteneffizienz der Ethernet-Lösung fort und gewährleistet einen agilen Betrieb und Wartung sowie eine ultrahohe Leistung, während gleichzeitig die Gesamtbetriebskosten für den Netzwerkaufbau erheblich gesenkt werden und eine automatisierte Bereitstellung mit einem Klick für Kunden ermöglicht wird. Modell, um eine adaptive Netzwerkkonfiguration von Modelleigenschaften zu realisieren, den Bereitstellungszyklus von Wochen auf Tage zu verkürzen und das Geschäft online zu beschleunigen. In Kombination mit einer umfassend sichtbaren intelligenten Betriebs- und Wartungsplattform können potenzielle Risiken und Fehler intuitiv erkannt werden, um die Geschäftskontinuität sicherzustellen. (Dingxi)