notícias

Novos produtos | Inspur Information lança switch Ethernet X400 Super AI compatível com plataforma Spectrum-X

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Notícias em 23 de julho,Informações do InspurLançado "X400 Super AI" para IA generativaEthernettrocar, a primeira solução doméstica X400 Super AI Ethernet (X400 AI Fabric) que suporta a tecnologia da plataforma NVIDIA Spectrum-X e cria colaboração terminal-rede baseada em SuperNICs X400 e BlueField-3, melhorando significativamente o desempenho do treinamento da GPU Wanka em 1,6 vezes.

É relatado que à medida que a concorrência na era dos grandes modelos se torna cada vez mais acirrada, as capacidades iterativas dos grandes modelos tornaram-se o núcleo da competitividade do mercado. No entanto, à medida que a escala do poder computacional continua a aumentar, o desempenho de um único chip não é mais a chave decisiva, e a eficiência do sistema de IA tornou-se o foco dos usuários. Atualmente, no processo de treinamento de grandes usuários do modelo de IA, a comunicação em rede é responsável por até 20 a 40% do tempo de treinamento. Por exemplo, estatísticas Meta anteriores mostram que a comunicação em rede ocupa em média 35% do tempo no treinamento de IA (o mais alto é 57%), o que equivale a 35% do tempo gasto em uma GPU comprada por milhões ou bilhões de dólares. dólares é grátis. Para melhorar a utilização dos recursos da GPU, a eficiência da comunicação em rede precisa ser melhorada urgentemente. No entanto, o problema desigual de HASH do ECMP nas redes RoCE tradicionais resulta em baixa utilização geral da carga do link. Embora as soluções de rede dedicadas possam atender aos requisitos de desempenho, elas não podem levar em conta o ecossistema Ethernet bem estabelecido.

Recentemente, o "X400 Super AI Ethernet" da Inspur Information é baseado na plataforma Spectrum-X e usa tecnologia de colaboração terminal-rede para abrir um novo caminho para a construção de redes de treinamento de grandes modelos de IA, a partir dos quatro aspectos de desempenho, escalabilidade, estabilidade e experiência do usuário. Ele aborda os desafios enfrentados pelos clientes e os salva do dilema de adotar Ethernet ou redes dedicadas. Ao mesmo tempo, o Super AI Ethernet Switch X400 adota uma arquitetura aberta e é projetado em conformidade com a especificação S3IP-UNP para alcançar a dissociação hierárquica de software e hardware e acelerar a inovação nos negócios do cliente através da construção de um ecossistema de rede aberto. No teste real de treinamento do modelo GPT3 na escala de computação de placas GPU de 16K, o Super AI Ethernet alcançou um avanço no desempenho, atingindo 1,6 vezes o do RoCE tradicional.

Em termos de desempenho de rede, a solução X 400 Super AI Ethernet adota o agendamento colaborativo do X400 mais placas de rede inteligentes. Por meio de tecnologias como roteamento adaptativo, preservação de ordem de pacotes e CC programável, os switches e placas de rede podem cooperar mais estreitamente para fornecer. Soluções de IA O modelo fornece uma rede de comutação de link completo sem perda de pacotes e sem bloqueio, desempenho de interconexão entre máquinas de 400G, a largura de banda efetiva é aumentada dos tradicionais 60% para 95% e o desempenho é 1,6 vezes maior. do RoCE tradicional.

Em termos de expansão flexível dos recursos de computação, o X400 Super AI Ethernet alcançou níveis extremamente elevadosportaCom suporte de densidade e escalabilidade elástica, possui desempenho ultra-alto e pode atender à escala de poder de computação de centenas de milhares de placas na rede de segunda camada, GPU.servidorO número pode chegar a 1.024 unidades, suporta placas GPU de 8K e pode ser expandido de forma flexível para redes de três camadas de acordo com a escala de poder de computação. A escala de servidores GPU pode chegar a 64.000 unidades e o número máximo de placas GPU suportadas pode atingir. 512K, atendendo às necessidades de grupos de vários tamanhos Em linha com os requisitos de rede, a rede flexível e elástica tornou-se um poderoso impulsionador para a inovação empresarial.

Em termos de eficiência operacional, a solução Inspur X400 Super AI Ethernet dá continuidade à compatibilidade e economia da solução Ethernet, garantindo operação e manutenção ágeis e desempenho ultra-alto, ao mesmo tempo que reduz significativamente o TCO de construção de rede e cria implantação automatizada com um clique para os clientes. modelo para realizar a configuração de rede adaptativa das características do modelo, encurtar o ciclo de implantação de semanas para dias e acelerar os negócios on-line. Combinado com uma plataforma de operação e manutenção inteligente amplamente visível, riscos e falhas potenciais podem ser descobertos intuitivamente para garantir a continuidade dos negócios. (Dingxi)