berita

Produk Baru |. Informasi Inspur Merilis X400 Super AI Ethernet Switch Mendukung Platform Spectrum-X

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Berita pada tanggal 23 Juli,Informasi inspirasiMerilis "X400 Super AI" untuk AI generatifEthernetmengalihkan, solusi X400 Super AI Ethernet (X400 AI Fabric) domestik pertama yang mendukung teknologi platform NVIDIA Spectrum-X dan menciptakan kolaborasi terminal-jaringan berdasarkan SuperNIC X400 dan BlueField-3, secara signifikan meningkatkan kinerja pelatihan GPU Wanka hingga 1,6 kali lipat.

Dilaporkan bahwa persaingan di era model besar menjadi semakin ketat, kemampuan berulang model besar telah menjadi inti daya saing pasar. Namun, seiring dengan meningkatnya skala daya komputasi, kinerja sebuah chip tidak lagi menjadi kunci penentu, dan efisiensi sistem AI telah menjadi fokus pengguna. Saat ini, dalam proses pelatihan pengguna model AI besar, komunikasi jaringan menghabiskan hingga 20~40% dari waktu pelatihan. Misalnya, statistik Meta sebelumnya menunjukkan bahwa komunikasi jaringan menghabiskan rata-rata 35% waktu pelatihan AI (yang tertinggi adalah 57%), yang setara dengan 35% waktu yang dihabiskan untuk GPU yang dibeli jutaan atau miliaran dolar. dolar. gratis. Untuk meningkatkan pemanfaatan sumber daya GPU, efisiensi komunikasi jaringan perlu segera ditingkatkan. Namun, masalah HASH ECMP yang tidak merata di jaringan RoCE tradisional mengakibatkan rendahnya pemanfaatan beban tautan secara keseluruhan. Meskipun solusi jaringan khusus dapat memenuhi persyaratan kinerja, solusi tersebut tidak dapat memperhitungkan ekosistem Ethernet yang sudah mapan.

Baru-baru ini, "X400 Super AI Ethernet" dari Inspur Information didasarkan pada platform Spectrum-X dan menggunakan teknologi kolaborasi terminal-jaringan untuk membuka jalur baru bagi konstruksi jaringan pelatihan model besar AI, dari empat aspek kinerja, skalabilitas, stabilitas dan pengalaman pengguna. Ini mengatasi tantangan yang dihadapi pelanggan dan menyelamatkan pelanggan dari dilema apakah akan mengadopsi Ethernet atau jaringan khusus. Pada saat yang sama, Super AI Ethernet Switch X400 mengadopsi arsitektur terbuka dan dirancang sesuai dengan spesifikasi S3IP-UNP untuk mencapai pemisahan hierarki perangkat lunak dan perangkat keras serta mempercepat inovasi bisnis pelanggan dengan membangun ekosistem jaringan terbuka. Dalam pengujian sebenarnya pelatihan model GPT3 pada skala komputasi kartu GPU 16K, Super AI Ethernet mencapai terobosan kinerja, mencapai 1,6 kali lipat dari RoCE tradisional.

Dalam hal kinerja jaringan, solusi X 400 Super AI Ethernet mengadopsi penjadwalan kolaboratif X400 plus kartu jaringan cerdas. Melalui teknologi seperti perutean adaptif, pelestarian pesanan paket, dan CC yang dapat diprogram, switch dan kartu jaringan dapat bekerja sama lebih erat untuk menyediakan penyediaan. Solusi AI. Model ini menyediakan jaringan peralihan tautan penuh tanpa kehilangan paket, kinerja interkoneksi antar-mesin sebesar 400G, bandwidth efektif ditingkatkan dari biasanya 60% menjadi 95%, dan kinerjanya 1,6 kali lipat. dari RoCE tradisional.

Dalam hal perluasan sumber daya komputasi yang fleksibel, X400 Super AI Ethernet telah mencapai pencapaian yang sangat tinggipelabuhanDengan dukungan kepadatan dan skalabilitas elastis, ia memiliki kinerja sangat tinggi dan dapat memenuhi skala daya komputasi ratusan ribu kartu di jaringan lapisan kedua, GPUserverJumlahnya bisa mencapai 1024 unit, mendukung kartu GPU 8K, dan dapat diperluas secara fleksibel ke jaringan tiga lapis sesuai dengan skala daya komputasi. Skala server GPU bisa mencapai 64.000 unit, dan jumlah maksimal kartu GPU yang didukung bisa mencapai 512K, memenuhi kebutuhan kelompok dengan berbagai ukuran. Sejalan dengan kebutuhan jaringan, jaringan yang fleksibel dan elastis telah menjadi pendorong yang kuat bagi inovasi bisnis.

Dalam hal efisiensi operasional, solusi Inspur X400 Super AI Ethernet melanjutkan kompatibilitas dan efektivitas biaya dari solusi Ethernet, memastikan pengoperasian dan pemeliharaan yang tangkas serta kinerja ultra-tinggi sekaligus secara signifikan mengurangi TCO konstruksi jaringan dan menciptakan penerapan otomatis sekali klik bagi pelanggan. model untuk mewujudkan konfigurasi jaringan adaptif dari karakteristik model, memperpendek siklus penerapan dari minggu ke hari, dan mempercepat bisnis online. Dikombinasikan dengan platform operasi dan pemeliharaan cerdas yang terlihat secara komprehensif, potensi risiko dan kesalahan dapat ditemukan secara intuitif untuk memastikan kelangsungan bisnis. (Dingxi)