Yizhu Technology 회장 Xiong Dapeng과의 대화: 스토리지와 컴퓨팅의 통합은 AI 시대 컴퓨팅 성능의 두 번째 성장 곡선을 시작할 수 있습니다
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
인공지능(AI)의 폭발로 인해 컴퓨팅 파워에 대한 막대한 수요가 발생했습니다. 포스트 무어 시대에는 첨단 칩 제조 공정이 물리적 한계에 가까워지고 있으며 스토리지와 컴퓨팅의 통합이 중요한 기술 경로 중 하나가 될 것으로 예상됩니다. 미래에.
스토리지와 컴퓨팅이 통합됩니다. 즉, 데이터 스토리지와 컴퓨팅이 동일한 칩의 동일한 영역에 통합됩니다. 통합 스토리지 및 컴퓨팅 아키텍처 칩의 성능 및 비용 이점은 어떤 측면에서 반영됩니까? 현재 대규모 상용화가 직면한 과제는 무엇입니까? 스토리지와 컴퓨팅의 통합이 국내 칩 산업이 차선을 바꾸고 이를 추월할 수 있는 가능성이 될까요?
China Business News는 최근 Yizhu Technology의 창립자이자 회장 겸 CEO인 Xiong Dapeng과 위 주제에 관해 대화를 나누었습니다. 그의 관점에서 스토리지와 컴퓨팅 통합 기술은 미래 컴퓨팅 분야에서 혁신적인 잠재력을 갖고 있으며 무어의 법칙을 깨고 컴퓨팅 성능의 두 번째 성장 곡선을 시작할 것입니다. 특히 AI 시대에는 이 기술이 컴퓨팅 파워 성장을 견인하는 핵심 요소가 될 수 있다”고 말했다.
폰 노이만 아키텍처를 깨고 세 가지 주요 문제를 제거합니다.
전통적인 폰 노이만 아키텍처에서 컴퓨팅 및 스토리지 기능은 각각 컴퓨팅 장치(CPU, GPU 등 XPU)와 스토리지 장치로 완성됩니다. 데이터는 메모리에서 얻어지고 처리 후 메모리로 반환됩니다. 처리 장치 외부의 메모리에서 데이터를 전송하고 읽는 데 필요한 시간은 컴퓨팅 시간의 몇 배에 달하므로 컴퓨팅 효율성이나 유효 컴퓨팅 성능이 저하되는 경우가 많습니다.
"오늘날 대형 모델이 널리 보급되면 계산을 완료하려면 모델 매개변수를 이동해야 합니다. 매개변수의 양이 매우 많고 소요 시간이 80% 이상으로 높은 비율을 차지합니다. 어떤 경우에는 이것이 따라서 데이터 대역폭은 실제 칩의 성능을 제한하지만 실제 성능은 이 수치보다 훨씬 낮을 수 있습니다."라고 Xiong Dapeng은 말합니다. 중국 비즈니스 뉴스에 말했다.
'저장벽 문제' 문제와 함께 전송 과정에서 많은 양의 에너지가 소모되어 칩의 에너지 효율비가 크게 감소하는 '에너지 벽 문제'가 발생한다.
또한 "컴파일 벽" 문제가 있습니다. 즉, 동적 데이터 흐름 스케줄링이 복잡하고 컴파일러는 정적 및 예측 가능한 조건에서 데이터 흐름 최적화를 달성하기 위해 연산자와 실행 프로그램을 자동으로 최적화할 수 없으며 수동에 의존해야 합니다. 이를 달성하기 위한 조정은 효과적인 컴퓨팅 성능이 높을수록 실제 배포 및 마이그레이션에 소요되는 시간과 인건비를 증가시킵니다. Xiong Dapeng은 "이 세 가지 점은 AI 산업의 발전을 크게 제한하여 자원이 점점 부족해지고 전력 소비가 크게 증가했습니다"라고 말했습니다.
통합 스토리지 및 컴퓨팅 기술은 폰 노이만 아키텍처를 깨고 스토리지 기능과 컴퓨팅 기능을 동일한 칩에 통합하며 "읽기" 회로의 메모리 내 컴퓨팅 아키텍처를 수정하여 데이터 처리를 위해 스토리지 장치를 직접 사용할 수 있습니다. "읽기" 회로에서 "연산 결과는 회로에서 얻어지며 결과는 메모리의 대상 주소에 직접 "기록"됩니다. 컴퓨팅 장치와 저장 장치 간의 빈번한 데이터 전송이 더 이상 필요하지 않으므로 제거됩니다. 데이터 이동으로 인한 소비를 줄이고 전력 소비를 크게 줄여 컴퓨팅 효율성을 크게 향상시킵니다.
"통합 스토리지와 컴퓨팅 기술은 포스트 무어 시대의 중요한 기술 경로 중 하나가 될 것으로 예상됩니다. 효과적인 컴퓨팅 성능의 첫 번째 원칙에서 스토리지와 컴퓨팅 통합을 위해 데이터 전송량이 크게 줄어들고 효과적인 컴퓨팅 파워는 선형적인 성장을 보여줍니다. 스토리지와 컴퓨팅 파워가 통합되어 있다고 할 수 있습니다. 컴퓨팅 통합은 무어의 법칙을 깨뜨리고 동시에 컴퓨팅 파워의 두 번째 성장 곡선을 열 것입니다. 미래 컴퓨팅 분야, 특히 AI 시대에 이 기술은 컴퓨팅 파워의 성장을 촉진하는 핵심 요소가 될 수 있다”고 말했다.
더 나은 에너지 효율성과 비용 대비 성능을 갖춘 솔루션
최근 인기를 끌고 있는 고대역폭 메모리 칩 HBM과 비교하여 스토리지 및 컴퓨팅 통합 아키텍처 칩은 시스템 에너지 효율성과 비용 대비 성능이 더 좋습니다.
HBM은 GPU와 고성능 컴퓨팅(HPC) 시스템의 데이터 처리 능력을 향상시키는 데 주로 사용되는 고성능 메모리 인터페이스 기술이다. 이 기술은 DRAM 칩을 수직으로 쌓고 고속 상호 연결을 사용하여 프로세서에 긴밀하게 연결함으로써 대역폭을 획기적으로 늘립니다.
"HBM은 '스토리지 벽' 문제를 해결하는 효과적인 기술 경로이지만 넓은 대역폭을 제공하려면 더 높은 전력 소비가 필요하고 가격도 기존 DRAM 가격을 훨씬 뛰어넘어 매우 비싸기 때문에 비용과 전력 소비가 필요합니다." Xiong Dapeng은 "본질적으로 HBM은 메모리 칩이고 컴퓨팅 기능이 없습니다. 컴퓨팅 기능을 달성하려면 GPGPU와 같은 컴퓨팅 칩과 쌍을 이루어야 합니다."라고 말했습니다.
시스템 비용의 관점에서 통합 스토리지 및 컴퓨팅 칩은 기존 GPGPU와 HBM의 조합보다 낮을 수 있습니다.
한편으로는 통합 스토리지 및 컴퓨팅 아키텍처의 컴퓨팅 전력 밀도 또는 PPA가 더 높기 때문입니다. "통합 스토리지 및 컴퓨팅 아키텍처의 등가 데이터 대역폭은 HBM의 데이터 대역폭보다 훨씬 크며 이는 몇 배 또는 심지어 10배 차이일 수 있습니다. 동시에 컴퓨팅 성능 밀도가 더 유리합니다. 실제 유효 컴퓨팅 성능 , 비용 성능 및 에너지 효율성 비율은 GPGPU+HBM 솔루션보다 훨씬 높을 것입니다."라고 Xiong Dapeng은 말했습니다.
반면 통합 스토리지 및 컴퓨팅 기술은 고급 프로세스에 상대적으로 덜 의존하는 반면 GPGPU와 HBM은 모두 고급 프로세스에 크게 의존합니다. "HBM은 고급 프로세스에 의존하고 있으며 공급망 위험이 큽니다. 그러나 통합 스토리지 및 컴퓨팅 기술 경로를 채택하면 12nm 및 22nm와 같은 고급 프로세스를 사용하지 않더라도 성능이 4nm 또는 2nm보다 나쁘지 않을 수 있습니다. 3nm라도 이건 추월의 개념이죠.”
비용 성능 측면에서 통합 스토리지와 컴퓨팅은 동일한 성능을 달성하기 위해 더 많은 칩이 필요할 수 있지만 높은 비용 성능과 높은 에너지 효율성 비율은 중요한 장점 중 하나입니다.
향후 2~3년 안에 대형 모델 분야에서 대규모로 구현될 수도 있다.
통합 스토리지 및 컴퓨팅 기술에 대한 연구와 적용이 전 세계적으로 가속화되고 있습니다.
현재 통합 스토리지 및 컴퓨팅 경로를 채택한 해외 대규모 컴퓨팅 칩 회사로는 AI 칩 스타트업 Groq이 있으며, 이는 28억 달러 이상의 가치로 Nvidia의 강력한 경쟁자로 간주됩니다. Microsoft, Temasek, Samsung, Marvell, Hainan 등을 인수했습니다. Lux, Ericsson 및 기타 여러 회사가 투자했습니다.
또한 삼성전자는 네이처(Nature)에 MRAM 기반 인메모리 컴퓨팅에 관한 연구 결과를 발표하며 AI 알고리즘의 높은 정확도를 입증하기도 했습니다. SK하이닉스가 GDDR 인터페이스를 기반으로 컴퓨팅 속도를 대폭 높이고 전력 소모를 줄일 수 있는 DRAM 인메모리 컴퓨팅 제품을 출시했습니다.
"내가 아는 한 대부분의 해외 기업은 SRAM을 기반으로 스토리지와 컴퓨팅을 구현하지만 용량이 낮고 비용이 많이 듭니다. 예를 들어 Groq의 전체 솔루션에는 570개 이상의 칩이 필요합니다. NVIDIA H100을 사용하면 숫자는 SRAM을 기반으로 합니다. 이는 주로 저장 밀도가 부족하기 때문에 발생합니다. "Xiong Dapeng은 많은 국내 신흥 기업이 통합 저장 및 컴퓨팅 기술에서 획기적인 발전을 이루어 중국 칩 산업이 차선을 바꾸고 추월할 가능성을 제공했다고 말했습니다.
그러나 통합 스토리지와 컴퓨팅 칩의 컴퓨팅 성능이 대규모로 확장되면 여전히 많은 과제에 직면하게 됩니다. 첫째, 신뢰할 수 없는 정확성 문제, 둘째, 아날로그 계산을 기반으로 하는 디지털-아날로그 변환은 에너지 병목 현상을 가져옵니다. 셋째, 대형 AI 모델에는 용량 요구 사항이 있습니다.
"완전한 디지털 경로는 이러한 문제를 잘 해결할 수 있으며 이는 Yizhu Technology가 AI 대형 컴퓨팅 성능 추론 칩을 개발하는 기초이기도 합니다."라고 Xiong Dapeng은 말했습니다.
일반적인 아날로그 저장 및 컴퓨팅 통합 시스템에서는 데이터가 저장부 내에서 서로 다른 전압 레벨로 표현되는 아날로그 신호 형태로 저장되며, MAC 등의 연산은 옴의 법칙, 키르히호프의 법칙에 따라 수행된다. 이 접근 방식의 가장 큰 문제점은 아날로그 회로 노이즈 및 다양한 변수로 인해 정확성과 정확성을 신뢰할 수 없다는 것입니다. 제조 공정이나 작업 환경에 관계없이 멤리스터가 나타내는 값에는 오류나 표류가 있을 수 있습니다. 디지털-아날로그 하이브리드 방법은 효율성과 정확성 문제의 균형을 맞추려고 노력하지만 여전히 높은 정확성과 정확성 신뢰성을 보장할 수는 없습니다.
Xiong Dapeng은 Yizhu Technology의 솔루션이 Memristor(ReRAM) 기반의 완전한 디지털 스토리지 및 컴퓨팅 통합이라고 소개했습니다. 완전 디지털이기 때문에 데이터는 바이너리 형태로 저장 장치에 들어갑니다. 멤리스터는 1비트만 표현하며, 높은 레벨과 낮은 레벨, 높은 저항과 낮은 전류의 차이만 있을 뿐입니다. 신뢰할 수 있습니다.
또한 통합 스토리지 및 컴퓨팅 개발은 프로젝트 구현 문제에도 직면해 있습니다. "새로운 기술 경로로서 기존 생태계를 활용하고 통합하는 방법은 큰 과제입니다. 기존 생태계와의 프로그래밍 가능성과 호환성이 중요합니다."라고 Xiong Dapeng은 China Business News에 말했습니다.
종합적으로 볼 때, 통합 스토리지 및 컴퓨팅 기술은 전 세계적으로 높은 컴퓨팅 성능 수요와 높은 에너지 소비 비용 사이의 모순을 해결하는 효과적인 수단으로 간주되며, 이는 또한 중국 칩 산업이 따라잡을 수 있는 중요한 기회를 제공합니다. 향후 몇 년 동안 기술이 계속 성숙해지고 시장 수요가 증가함에 따라 통합 스토리지 및 컴퓨팅 칩이 다양한 분야에서 널리 사용되고 전체 산업의 혁신적인 발전을 촉진할 것으로 예상됩니다. 현재 대형 모델 분야의 통합 저장 및 컴퓨팅 칩 적용은 아직 개발 단계에 있으며 Xiong Dapeng은 향후 2~3년 내에 대규모로 구현될 것이라고 예측합니다.
(이 기사는 중국경제신문에서 발췌한 것입니다)