notizia

Nuovi prodotti |. Comunicati stampa Inspur Lo switch Ethernet Super AI X400 supporta la piattaforma Spectrum-X

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Novità il 23 luglioFornire informazioniRilasciato "X400 Super AI" per l'intelligenza artificiale generativaEthernetinterruttore, la prima soluzione domestica X400 Super AI Ethernet (X400 AI Fabric) che supporta la tecnologia della piattaforma NVIDIA Spectrum-X e crea collaborazione terminale-rete basata su X400 e BlueField-3 SuperNIC, migliorando significativamente le prestazioni di training della GPU Wanka fino a 1,6 volte.

È stato riferito che, poiché la concorrenza nell’era dei modelli di grandi dimensioni diventa sempre più agguerrita, le capacità iterative dei modelli di grandi dimensioni sono diventate il fulcro della competitività del mercato. Tuttavia, poiché la portata della potenza di calcolo continua ad aumentare, la prestazione di un singolo chip non è più la chiave decisiva e l’efficienza del sistema AI è diventata l’attenzione degli utenti. Attualmente, nel processo di formazione di grandi utenti di modelli di intelligenza artificiale, la comunicazione di rete rappresenta fino al 20~40% del tempo di formazione. Ad esempio, le precedenti meta statistiche mostrano che la comunicazione di rete occupa in media il 35% del tempo nell'addestramento dell'IA (il valore più alto è il 57%), che equivale al 35% del tempo trascorso su una GPU acquistata per milioni o miliardi di dollari. dollari. Per migliorare l'utilizzo delle risorse GPU, è necessario migliorare urgentemente l'efficienza della comunicazione di rete. Tuttavia, il problema HASH irregolare di ECMP nelle reti RoCE tradizionali si traduce in un basso utilizzo complessivo del carico di collegamento. Sebbene le soluzioni di rete dedicate possano soddisfare i requisiti prestazionali, non possono tenere conto dell’ecosistema Ethernet ormai consolidato.

Recentemente, "X400 Super AI Ethernet" di Inspur Information si basa sulla piattaforma Spectrum-X e utilizza la tecnologia di collaborazione tra reti terminali per aprire un nuovo percorso per la costruzione di reti di addestramento di grandi modelli di intelligenza artificiale, dai quattro aspetti di prestazioni, scalabilità, stabilità e esperienza dell'utente. Affronta le sfide affrontate dai clienti e salva i clienti dal dilemma se adottare reti Ethernet o dedicate. Allo stesso tempo, il Super AI Ethernet Switch X400 adotta un'architettura aperta ed è progettato in conformità con la specifica S3IP-UNP per ottenere il disaccoppiamento gerarchico di software e hardware e accelerare l'innovazione aziendale dei clienti costruendo un ecosistema di rete aperto. Nel test effettivo dell'addestramento del modello GPT3 su scala di calcolo delle schede GPU da 16K, Super AI Ethernet ha ottenuto un progresso prestazionale, raggiungendo 1,6 volte quello del tradizionale RoCE.

In termini di prestazioni di rete, la soluzione X 400 Super AI Ethernet adotta la pianificazione collaborativa di X400 più schede di rete intelligenti. Attraverso tecnologie come routing adattivo, conservazione dell'ordine dei pacchetti e CC programmabile, gli switch e le schede di rete possono cooperare più strettamente per fornire Soluzioni AI Il modello fornisce una perdita di pacchetti pari a zero, una rete di commutazione full-link senza blocchi, prestazioni di interconnessione tra macchine di 400G, la larghezza di banda effettiva è aumentata dal tradizionale 60% al 95% e le prestazioni sono 1,6 volte superiori. del tradizionale RoCE.

In termini di espansione flessibile delle risorse di calcolo, X400 Super AI Ethernet ha raggiunto risultati estremamente elevatiportaCon il supporto della densità e della scalabilità elastica, ha prestazioni ultra elevate e può soddisfare la scala di potenza di calcolo di centinaia di migliaia di schede nella rete di secondo livello, GPUserverIl numero può raggiungere 1024 unità, supporta schede GPU 8K e può essere espanso in modo flessibile a reti a tre strati in base alla scala della potenza di calcolo. La scala dei server GPU può raggiungere le 64.000 unità e il numero massimo di schede GPU supportate 512K, che soddisfa le esigenze di gruppi di varie dimensioni In linea con i requisiti di rete, il networking flessibile ed elastico è diventato un potente motore per l'innovazione aziendale.

In termini di efficienza operativa, la soluzione Inspur X400 Super AI Ethernet mantiene la compatibilità e il rapporto costo-efficacia della soluzione Ethernet, garantendo funzionamento e manutenzione agili e prestazioni elevatissime, riducendo significativamente il TCO di costruzione della rete e creando una distribuzione automatizzata con un clic per i clienti. modello per realizzare una configurazione di rete adattiva delle caratteristiche del modello, abbreviare il ciclo di implementazione da settimane a giorni e accelerare il business online. In combinazione con una piattaforma operativa e di manutenzione intelligente e completamente visibile, è possibile scoprire in modo intuitivo potenziali rischi e guasti per garantire la continuità aziendale. (Dingxi)