소식

Musk는 100,000개의 Nvidia H100 GPU를 통합하는 "세계에서 가장 강력한 AI 클러스터"를 출시합니다!

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

7월 23일 뉴스에 따르면, Tesla, X, xAI의 CEO인 Elon Musk는 최근 X 플랫폼에서 "세계에서 가장 강력한 AI 클러스터"를 만들기 위해 "세계에서 가장 강력한 AI 클러스터"를 출시했다고 발표했습니다. " 올해 12월까지 100,000개의 Nvidia H100 GPU를 단일 패브릭에 통합하는 시스템입니다.

머스크는 xAI 팀의 노력으로 현지 시간 오전 4시 20분경부터 액체 냉각식 H100이 세계에서 가장 강력한 인공 지능 훈련 클러스터가 되었다고 말했습니다!

올해 5월 머스크는 2025년 가을까지 슈퍼컴퓨팅 공장을 열겠다고 밝혔다. 당시 머스크는 서둘러 슈퍼클러스터 작업을 시작했고 엔비디아 '호퍼' H100 GPU를 구매해야 했다. 이는 당시 기술 거물이 곧 출시될 Blackwell 기반 B100 및 B200 GPU는 물론 H200 칩 출시를 기다릴 인내심이 없었음을 나타내는 것 같습니다. 최신 Nvidia Blackwell 데이터 센터 GPU는 2024년 말까지 출시되지 않을 것으로 예상됩니다.

최근 뉴스에 따르면, 당초 2025년 가을에 개장할 예정이었던 슈퍼컴퓨팅 공장이 예정보다 거의 1년 앞당겨 실현될 것으로 예상됩니다. 그러나 결론을 내리기에는 너무 이르다. 그러나 올해 초 로이터 통신이 The Information과 인터뷰한 소식통은 프로젝트 시기가 잘못되었을 가능성이 더 높은 것 같습니다. 또한 xAI Supercluster가 실행되면서 xAI가 더 강력하거나 차세대 Nvidia GPU를 기다리지 않은 이유에 대한 질문에 대한 답이 제공됩니다.

Supermicro는 xAI를 위한 대부분의 하드웨어를 제공하며, 이 회사의 CEO인 Charles Liang도 Musk의 게시물에 대해 다음과 같이 말했습니다. “Musk의 Memphis 팀과 협력하게 되어 매우 기쁩니다! 최대한 빨리, 최대한 효율적으로, 최대한 환경 친화적으로 작업하는 것은 정말 힘든 일입니다.”

후속 트윗에서 Musk는 새로운 Supercluster가 "모든 측면에서 세계에서 가장 강력한 인공 지능을 훈련할 것"이라고 설명했습니다. 이전 의도 진술로 판단하면 xAI의 100,000 H100 GPU 설치 기능은 이제 Grok 3 모델 훈련을 목표로 할 것입니다. 개선됐다고 말했다.법학 석사훈련 단계는 '올해 12월 이전'에 완료되어야 합니다.

규모 측면에서 새로운 xAI 슈퍼클러스터는 GPU 컴퓨팅 성능 측면에서 Frontier(37,888 AMD GPU), Aurora(60,000 Intel GPU) 및 Microsoft Eagle(14,400 Nvidia H100 GPU)과 같은 현재 가장 강력한 슈퍼컴퓨터를 능가할 것입니다.

편집자: Core Intelligence - 루로니 소드