noticias

Nuevos productos | Lanzamientos de información de Inspur El conmutador Ethernet X400 Super AI es compatible con la plataforma Spectrum-X

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Noticias del 23 de julioInformación sobre InspurLanzado "X400 Super AI" para IA generativaEthernetcambiar, la primera solución nacional X400 Super AI Ethernet (X400 AI Fabric) que admite la tecnología de plataforma NVIDIA Spectrum-X y crea colaboración terminal-red basada en X400 y BlueField-3 SuperNIC, mejorando significativamente el rendimiento del entrenamiento de GPU Wanka a 1,6 veces.

Se informa que a medida que la competencia en la era de los modelos grandes se vuelve cada vez más feroz, las capacidades iterativas de los modelos grandes se han convertido en el núcleo de la competitividad del mercado. Sin embargo, a medida que la escala de la potencia informática sigue aumentando, el rendimiento de un solo chip ya no es la clave decisiva y la eficiencia del sistema de inteligencia artificial se ha convertido en el centro de atención de los usuarios. Actualmente, en el proceso de formación de grandes usuarios de modelos de IA, la comunicación de red representa entre el 20 y el 40% del tiempo de formación. Por ejemplo, Metaestadísticas anteriores muestran que la comunicación en red ocupa en promedio el 35% del tiempo en el entrenamiento de IA (el más alto es el 57%), lo que equivale al 35% del tiempo dedicado a una GPU comprada por millones o miles de millones de dólares es gratis. Para mejorar la utilización de los recursos de la GPU, es necesario mejorar urgentemente la eficiencia de la comunicación de la red. Sin embargo, el problema HASH desigual de ECMP en las redes RoCE tradicionales da como resultado una baja utilización general de la carga del enlace. Aunque las soluciones de red dedicadas pueden cumplir con los requisitos de rendimiento, no pueden tener en cuenta el ecosistema Ethernet bien establecido.

Recientemente, "X400 Super AI Ethernet" de Inspur Information se basa en la plataforma Spectrum-X y utiliza tecnología de colaboración terminal-red para abrir un nuevo camino para la construcción de redes de entrenamiento de modelos grandes de IA, desde los cuatro aspectos de rendimiento, escalabilidad, estabilidad y experiencia del usuario. Aborda los desafíos que enfrentan los clientes y les ahorra el dilema de adoptar Ethernet o redes dedicadas. Al mismo tiempo, el Super AI Ethernet Switch X400 adopta una arquitectura abierta y está diseñado de acuerdo con la especificación S3IP-UNP para lograr un desacoplamiento jerárquico de software y hardware y acelerar la innovación empresarial de los clientes mediante la construcción de un ecosistema de red abierto. En la prueba real de entrenamiento del modelo GPT3 en la escala informática de tarjetas GPU de 16K, Super AI Ethernet logró un avance en el rendimiento, alcanzando 1,6 veces el del RoCE tradicional.

En términos de rendimiento de la red, la solución X 400 Super AI Ethernet adopta la programación colaborativa de las tarjetas de red inteligentes X400 plus. A través de tecnologías como enrutamiento adaptativo, preservación del orden de paquetes y CC programable, los conmutadores y las tarjetas de red pueden cooperar más estrechamente para proporcionar. Las soluciones de IA proporcionan una red de conmutación de enlace completo sin pérdida de paquetes y sin bloqueo, un rendimiento de interconexión entre máquinas de 400G, el ancho de banda efectivo aumenta del 60% tradicional al 95% y el rendimiento es 1,6 veces mayor. del tradicional RoCE.

En términos de expansión flexible de los recursos informáticos, X400 Super AI Ethernet ha logrado niveles extremadamente altos.puertoCon el apoyo de la densidad y la escalabilidad elástica, tiene un rendimiento ultraalto y puede alcanzar la escala de potencia informática de cientos de miles de tarjetas en la red de segunda capa, GPU.servidorEl número puede alcanzar 1024 unidades, admite tarjetas GPU de 8K y se puede expandir de manera flexible a redes de tres capas de acuerdo con la escala de potencia informática. La escala de servidores GPU puede alcanzar 64,000 unidades y la cantidad máxima de tarjetas GPU compatibles puede alcanzar. 512K, que satisface las necesidades de grupos de diversos tamaños. De acuerdo con los requisitos de la red, las redes flexibles y elásticas se han convertido en un poderoso impulsor de la innovación empresarial.

En términos de eficiencia operativa, la solución Inspur X400 Super AI Ethernet continúa la compatibilidad y rentabilidad de la solución Ethernet, garantizando una operación y mantenimiento ágiles y un rendimiento ultraalto al tiempo que reduce significativamente el TCO de la construcción de la red y crea una implementación automatizada con un solo clic para los clientes. modelo para realizar una configuración de red adaptable de las características del modelo, acortar el ciclo de implementación de semanas a días y acelerar el negocio en línea. Combinado con una plataforma de operación y mantenimiento inteligente completamente visible, los riesgos y fallas potenciales se pueden descubrir intuitivamente para garantizar la continuidad del negocio. (Dingxi)