전문가: 중국은 AI 개발을 위해 '스태킹 칩'에 의존할 수 없다

전문가: 중국의 AI 개발은 '스태킹 칩'에 의존할 수 없다

2024-07-29

출처: 글로벌타임스

[글로벌타임스 마준 기자] 미국은 소프트웨어와 하드웨어의 장점을 바탕으로 규모를 활용해 세계에서 가장 강력한 인공지능(AI)을 '쌓는다'. 미국의 억만장자 머스크는 최근 자신의 AI 스타트업 회사인 xAI가 AI 훈련을 위해 10만 개의 H100 GPU로 구성된 '멤피스 슈퍼 클러스터'를 사용하기 시작했다고 소셜 미디어를 통해 발표하며 '세계에서 가장 강력한 AI 훈련 클러스터'라고 주장했습니다. 중국은 미국이 주도하는 이러한 기술 경로를 따라야 할까요? 최근 중국 지능형 컴퓨팅 산업 연합과 국가 비컨 위원회 컴퓨팅 성능 표준 실무 그룹이 공동 주최한 2024년 중국 컴퓨팅 성능 개발 전문가 세미나에서 많은 학자와 전문가가 각자의 견해를 제시했습니다.

초지능 통합의 미래는 3단계로 나누어진다

중국과학원 원사 천룬성(陳興生)은 세미나에서 "인공지능의 대형 모델은 새로운 생산성의 대표자"라며 "대형 모델과 슈퍼컴퓨팅의 통합적인 발전은 매우 중요하다. 우리나라는 이를 진지하게 배치하고 고려해야 한다"고 말했다. 중국과학원 컴퓨팅기술연구소 장윤취안(張雲泉) 연구원은 대형 모델의 급속한 발전이 새로운 생산성의 특징을 보여주지만 현재 컴퓨팅 파워 병목현상도 겪고 있다고 언급했다. 슈퍼컴퓨팅 분야에서 중국의 심오한 기술 축적을 고려할 때, 슈퍼지능 융합(대형 모델로 대표되는 슈퍼컴퓨팅과 지능형 컴퓨팅의 융합)이 이러한 과제를 효과적으로 해결할 수 있을 것으로 기대됩니다. 산지광 국가정보센터 정보산업발전국장은 “현재 기본 컴퓨팅 파워, 지능 컴퓨팅 파워, 슈퍼 컴퓨팅 파워 등의 다각적인 발전이 슈퍼지능 융합을 탄생시켰다”고 설명했다. 동시에 여러 컴퓨팅 리소스의 애플리케이션 요구 사항을 충족하기 위해 하이브리드 컴퓨팅 리소스 또는 통합 컴퓨팅 시스템을 사용할 수 있는지 여부입니다.”

중국과학원 학자 첸더페이(Qian Depei)는 초지능 통합의 미래 과정을 예측하면서 AI에 의한, AI에 의한, AI 되기의 3단계를 거쳐 전면적으로 진화할 것이 분명하다고 믿고 있다. 하드웨어부터 소프트웨어까지 인공지능 기술 발전에 적응하고 촉진합니다. AI 1단계에서는 AI 업무를 효율적으로 지원하고 실행할 수 있도록 기존 컴퓨터 시스템의 전환과 업그레이드, 전용 하드웨어 개발에 중점을 두고 인공지능 연구를 위한 견고한 인프라를 제공할 예정이다. AI의 두 번째 단계에서는 AI가 기존 컴퓨팅을 변화시키는 데 사용될 것입니다. 한편으로는 AI 방법이 전통적인 슈퍼컴퓨팅 문제를 해결하는 데에도 사용됩니다. 명백해진다. AI가 되는 마지막 단계에서는 컴퓨터 시스템이 고유한 지능형 특성을 발휘하게 됩니다. 인공지능은 더 이상 외부 능력이 아니라 컴퓨터의 핵심 속성이자 기본 구성 요소가 될 수 있습니다. 지능은 오늘날 우리가 갖고 있는 슈퍼컴퓨팅이나 지능형 컴퓨팅을 능가합니다.

Chen Runsheng은 과학계와 업계가 슈퍼컴퓨팅과 지능형 컴퓨팅의 통합 문제를 해결하기 위해 노력해 왔다는 점에 주목했습니다. 예를 들어 엔비디아의 최신 GB200 아키텍처는 사실상 GPU 2개와 CPU 1개로, 어떤 의미에서는 머신러닝을 수행하는 2개의 GPU 레이아웃에 CPU를 추가해 고속 컴퓨팅을 제공한다고 볼 수 있다. 데이터 전송. 그러나 그는 이 아키텍처가 효율성 문제를 근본적으로 해결하지 못한다고 믿습니다. “슈퍼컴퓨팅과 지능컴퓨팅의 결합은 불가피하며, 단순히 합치는 것이 아닌 유기적으로 통합될 것입니다.”

중국 공정원 학자 정웨이민(Zheng Weimin)은 대형 모델의 개발, 교육, 미세 조정 및 추론의 모든 측면이 컴퓨팅 성능과 분리될 수 없으며 컴퓨팅 성능 비용이 전체 비용의 대부분을 차지한다고 말했습니다. 특히 훈련 단계에서는 최대 70%를 차지하며 추론 단계에서는 최대 95%에 달합니다. 이런 점에서 컴퓨팅 파워는 대형 모델 개발을 뒷받침하는 핵심 요소가 됐다.

지능형 컴퓨팅은 "인간 지능"을 의미해야 합니다.

중국 학자와 전문가들은 현재 중국의 대형 모델 열풍과 미국의 '원자로 규모'를 따르는 기술 경로에 대해 각자의 견해를 제시했습니다. Qian Depei는 중국이 현재 미국보다 수와 유형에 있어서 더 많은 대형 모델을 보유하고 있으며 일반 인공 지능에도 종사하고 있다고 말했습니다. 그러나 우리는 하드웨어 측면에서 미국에 의해 엄격하게 제한될 뿐만 아니라 품질도 제한됩니다. "이렇게 생산된 대형 모델이 미국보다 나을 수 있을까요? 아직은 중국의 국내 조건에 맞춰야 하고 완전히 할 수는 없다고 생각합니다." 미국인을 따라가라."

Chen Runsheng은 또한 현재 중국에서 등장하는 대형 모델은 기본적으로 미국이 제안한 대형 모델과 알고리즘을 개선한 것이지만 전체 대형 모델의 기본 이론에 대한 고려는 거의 없다고 믿습니다. 그는 세미나에서 전통적인 슈퍼컴퓨터가 사용하는 로컬 메모리 모델과 비교할 때 지능형 컴퓨팅은 정보의 분산 저장이라는 근본적인 차이점을 보여준다고 지적했습니다. 이 저장 방법은 인간 두뇌 신경망의 복잡한 구조를 모방하여, 조밀하게 상호 연결된 대규모 칩 네트워크를 통해 점점 더 큰 모델을 전달합니다. 그러나 인간의 지식을 이러한 복잡한 시스템에 효과적으로 내장하는 방법과 정보가 시스템에 어떻게 배포되고 저장되는지, 그 뒤에 있는 알고리즘과 기술 이론은 아직 완전히 탐구되지 않았습니다. "모델 규모가 통제되지 않게 확장되면서 극복할 수 없는 문제는 에너지 소비입니다. 따라서 대형 모델의 저장 문제를 해결하기 위해 맹목적으로 칩을 추가하고 증가하는 시스템 복잡성에 의존하는 것은 전적으로 바람직하지 않습니다."

따라서 Chen Runsheng은 미래의 지능형 컴퓨팅이 여전히 인간 두뇌의 작동 메커니즘을 시뮬레이션하는 "인간 지능"을 참조해야 한다고 믿습니다. 인간의 뇌는 매우 작아서 수십 와트의 에너지만 소비하지만, 그것이 생산하는 지능은 도시 전체의 에너지를 소비하는 현재의 첨단 AI를 능가한다. "대형 모델과 지능형 컴퓨팅의 개발에는 응용 수준의 모델 및 알고리즘 개선뿐만 아니라 기본 이론 관점의 획기적인 발전도 필요합니다. 현재 대형 모델은 초기 10%, 90%만 개발했습니다. 나는 또한 더 많은 칩을 쌓아서 대형 모델을 달성할 수 없다고 생각합니다. 인간의 두뇌처럼 학습하고 공간 복잡도와 시간 복잡도를 더 작게 압축하여 에너지 소비를 줄여야 합니다. 문제는 지능형 컴퓨팅의 기본 이론을 완성하기 위해 현재의 공간 복잡성을 연구하는 것입니다. 기본 이론에서 어느 정도 진전을 이룰 수 있다면 근본적이고 독창적인 혁신을 이룰 수 있습니다."

베이징 응용 물리학 및 계산 수학 연구소의 연구원인 위안 궈싱(Yuan Guoxing)은 일반적인 대형 모델이 모든 계층의 문제를 해결할 수 있을 것이라고 기대하는 것은 불가능하다고 믿습니다. 실제 상황에서 볼 때, 다양한 애플리케이션에는 서로 다른 기술이 있고, 서로 다른 알고리즘이 필요하며, 컴퓨팅 성능에 대한 요구 사항도 다릅니다. 예를 들어, 과학 컴퓨팅에서는 계산 정확도에 대한 요구 사항이 점점 더 높아지고 있으며, 컴퓨터 규모가 확장됨에 따라 데이터가 점점 더 많아지고 신뢰도는 지속적으로 감소하고 있습니다. NASA(미국항공우주국)도 비슷한 점을 지적했으며 계산 정확도에 대한 요구 사항이 매우 높습니다. 따라서 미래의 다양한 응용 프로그램은 다양한 문제를 해결하기 위해 다양한 대형 모델과 다양한 계산을 갖게 될 것입니다. 오늘날의 대형 모델은 계산 정확도와 알고리즘에 대한 요구 사항이 완전히 다릅니다.

중국 정보 통신 기술 아카데미의 클라우드 컴퓨팅 및 빅 데이터 연구소 소장인 He Baohong은 다음과 같이 덧붙였습니다. "컴퓨팅과 교육은 기본 인프라에 대한 요구 사항이 다르며 어떤 시나리오에서 차이점을 결정해야 하는지도 결정해야 합니다. 보호되어야 하며 어떤 시나리오에서 차이점이 반영되어야 하는지 설명합니다."

주권수준의 대형모델 개발 필요

장윤취안(Zhang Yunquan)은 미국이 최근 고급 GPU 판매 금지, 대형 모델의 소스 코드 공유 중단, 서비스 중단 등 일련의 조치를 통해 우리나라를 인공 지능 개발에 '고착'시키려 했다고 말했습니다. 생태 협력. 동시에 대형 모델의 컴퓨팅 규모가 이제 10,000 GPU, 심지어 100,000 GPU에 도달하면 에너지 소비 벽, 신뢰성 벽, 병렬 벽과 같은 기술적 병목 현상을 극복하기 위해 대형 모델용 특수 슈퍼컴퓨터를 개발해야 합니다. 이런 맥락에서 중국이 단기적으로 대형 모델의 컴퓨팅 성능 병목 현상을 극복하려면 갈 길이 멀다. 지난 20년 동안 축적한 고급 슈퍼컴퓨팅 기술을 활용해 대형 모델용 특수 슈퍼컴퓨터를 개발해 이러한 문제를 극복하는 것이다. 대형 모델의 컴퓨팅 성능 병목 문제를 해결하여 우리나라가 글로벌 대형 모델의 가장 앞선 수준을 확고히 파악하고 뒤처지지 않도록 합니다.

장윤취안(張雲泉)은 초지능 융합 시스템 하의 '주권 대형 모델(Sovereign Large Model)' 계획을 도입하면서 우리나라는 최근 몇 년 동안 지능형 컴퓨팅 개발에 막대한 자금을 투자해 슈퍼컴퓨팅 분야에서 엄청난 기술 축적을 이루었다고 말했다. 슈퍼 지능형 융합 컴퓨팅 파워 시스템을 중심으로 구축하는 데 중점을 두고 있습니다. 시스템 엔지니어링은 컴퓨팅 파워 문제를 해결하기 위해 슈퍼컴퓨팅 기술 이점의 사용을 극대화하기를 희망하면서 대형 모델의 컴퓨팅 파워 요구에 대응합니다. '주권급 대형 모델' 계획의 전개에 따르면, '주권급 대형 모델' 혁신 컨소시엄은 국가 슈퍼컴퓨터, 중국과학원 및 전국 핵심 대학의 유명 교수팀, 스마트 칩 기업, 대형 모델 솔루션 기업 등이 유사한 OpenAI의 개방형 조직을 공동으로 만들기 위해 비영리 부문에서 개발하여 "주권 수준 대형 모델"을 구성하고, 영리 부문을 구성하여 "주권 수준 대형 모델"을 구현합니다. ". 그는 슈퍼컴퓨터가 "국가의 가장 중요한 무기"이며 가장 크고 가장 어려운 도전을 극복하는 데 사용해야 한다고 제안했습니다. 주권수준의 대형모델은 일반적인 대형모델이 아닌 국가발전을 지원할 수 있는 뿌리모델이다. 이와 유사한 국가급 슈퍼모델은 다른 나라에서도 큰 주목을 받았다. 예를 들어 미국의 마이크로소프트(Microsoft)와 오픈AI(OpenAI)는 새로운 인공지능 슈퍼컴퓨터에 1000억 달러를 투자할 계획이라고 최근 발표했다. 국가수준의 모델을 개발하고 있습니다.

Chen Runsheng은 중국의 현재 기본 조건과 대형 모델의 피할 수 없는 발전 추세를 고려할 때 서구의 접근 방식을 완전히 따르는 것은 비현실적이며 단기적으로 따라잡기가 어려울 것이라고 믿습니다. 따라서 주권수준의 대규모 모델을 개발할 수 있는 방안을 찾는 것이 더욱 중요하다.

소식

전문가: 중국의 AI 개발은 '스태킹 칩'에 의존할 수 없다

소개

내 연락처 정보