소식

"세 번째 메인 칩" dpu: 향후 3년은 상용 구현을 위한 창구 기간입니다.

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

cpu와 gpu에 이어 데이터 센터의 세 번째 주요 칩인 dpu는 최근 몇 년 동안 계속해서 인기를 얻고 있습니다.
dpu, 즉 데이터 프로세서는 강력한 네트워크 처리 능력은 물론, 보안, 저장, 네트워크 오프로딩 기능을 갖추고 있어 cpu의 컴퓨팅 파워를 해방시켜 네트워크 프로토콜 처리, 데이터 암호화, 복호화 등의 데이터 처리 작업을 완료할 수 있으며, cpu가 잘 못하는 데이터 압축도 하고, 각종 자원을 별도로 관리, 확장, 스케줄링하는 것, 즉 'cpu가 잘 못하는 일, gpu가 못하는 일'을 처리해 데이터센터 비용 절감과 효율성을 달성한다. 개선.
ai 시대에는 지능형 컴퓨팅 센터가 처리해야 하는 데이터의 양이 폭발적으로 증가했습니다. dpu는 지능형 컴퓨팅 센터의 효과적인 컴퓨팅 성능을 발휘하고 인프라의 비용 절감 및 효율성 향상 문제를 해결할 수 있습니다. 점차 증가하고 있습니다.
three us in one, 지능형 컴퓨팅 시대에 더욱 적합한 솔루션
"dpu 개념은 4년 전 nvidia에서 과장되었습니다. nvidia는 이스라엘 회사 mellanox를 인수한 후 cpu, gpu 및 dpu를 포함하는 업계 최초의 완전한 데이터 센터 솔루션 제공업체가 되었습니다. china business news와의 독점 인터뷰에서요." , yuan 창립자 lu sheng은 xinqiyuan이 2018년부터 dpu 연구 개발에 참여한 최초의 국내 제조업체 중 하나라고 말했습니다. 당시에는 smartnic이라고도 불렸습니다.
"과거에는 기존 네트워크 카드가 네트워크 전송 기능을 수행했습니다. 이후 스마트 네트워크 카드가 탄생했으며 4년 전 점차적으로 dpu로 발전했습니다." zhongke yushu (beijing) technology co., ltd.의 수석 부사장, 지능형 컴퓨팅 칩의 연구 개발 및 설계에 중점을 두고 있다고 first finance에 말했습니다.
2020년 엔비디아가 발표한 dpu 제품 전략은 이를 cpu, gpu에 이어 데이터센터의 '세 번째 메인 칩'으로 포지셔닝해 dpu 개념을 폭발시켰다.
오늘날 dpu는 데이터 센터의 보안, 네트워크 및 스토리지 작업을 가속화하도록 특별히 설계된 데이터 센터의 신흥 전문 프로세서가 되어 고대역폭, 저지연 데이터 집약적 컴퓨팅 시나리오에 대한 성능을 제공합니다. dpu의 핵심 역할은 원래 cpu가 처리했던 네트워크, 스토리지, 보안 및 관리 작업을 대신하여 cpu 리소스를 해제하고 데이터 보안 및 개인 정보 보호를 강화하는 것입니다.
"nvidia의 지능형 컴퓨팅 센터 솔루션은 실제로 3-u 통합입니다. 3년 전 nvidia의 dgx a100 서버와 후속 dgx gh200 시리즈에는 모두 cpu, gpu 및 dpu가 포함됩니다. 물론 dpu에는 다른 구성 요소도 있습니다. 스마트 네트워크가 있습니다. 실제로 dpu로 분류될 수 있는 rdma와 같은 카드는 본질적으로 동일합니다. 따라서 이러한 관점에서 현재 업계 리더 또는 일반적으로 인정되는 방향은 gpu와 dpu가 함께 작동하는 것입니다. "zhang yu는 일반 데이터 센터 솔루션이 cpu, 스토리지, 네트워크에 더 가깝다고 말했습니다. 일부 클라우드 기반 시나리오에서는 대기 시간이 짧고 처리량이 높은 데이터 네트워크 처리도 필요하며 지능형 컴퓨팅 시나리오에는 네트워크가 필요합니다. 처리 성능 요구 사항은 다음과 같습니다. 더 높은.
“cpu를 전반적인 제어에 사용되는 두뇌에 비유한다면, gpu는 견고하고 풍부한 병렬 컴퓨팅 성능을 제공하는 데 사용되는 근육에 가깝고, dpu는 데이터를 전달하는 혈관 및 신경에 가깝습니다. gpu는 제어 명령 교환 및 프로토콜 변환을 완료하기 위해 dpu를 통해 서버로 전송되어야 합니다."라고 zhang yu는 말했습니다.
"여러 pu의 협력은 실제로 전체 컴퓨팅 아키텍처의 업그레이드입니다. 과거 범용 cpu 기반 아키텍처에서 가속기 기반 컴퓨팅 아키텍처로, 협력을 통해 전체 컴퓨팅 솔루션의 비용 효율성이 향상됩니다. zhang yu는 "현재 기술 측면에서 dpu는 점차 성숙해졌으며 네트워크 보안 암호화 및 암호 해독, 제로 트러스트 및 네트워크 경계도 상대적으로 성숙했습니다. 오프로딩은 기본적으로 dpu가 안정적으로 수행할 수 있는 기능이 되었습니다."
일정한 비용 성능으로 설비 투자 및 에너지 소비를 줄입니다.
cpu의 오프로드 엔진으로서 dpu의 가장 직접적인 역할은 네트워크 가상화 및 하드웨어 리소스 풀링과 같은 인프라 계층 서비스를 인수하고 cpu의 컴퓨팅 성능을 상위 계층 애플리케이션에 할당하는 것입니다. 지능형 컴퓨팅 센터의 컴퓨팅 성능을 해제하고 에너지 효율성을 향상시킵니다.
"nvidia는 이전 세대 제너레이티브 ai 서버의 컴퓨팅 파워 칩의 효율성이 설계 용량의 40%에 불과하다는 것을 이전에 인정했습니다. 우리는 이를 30% 이상만 측정했습니다. 이는 대부분의 컴퓨팅 파워가 유휴 상태라는 것을 의미합니다. 주요 그 이유는 클러스터에서는 계산에 의해 생성된 중간 변수가 데이터 동기화를 완료할 때까지 기다리는 데 시간이 걸리기 때문입니다. 네트워크 채널의 용량은 컴퓨팅 성능 기반의 상한을 제한하며, 이것이 바로 의 실제 값입니다. dpu가 거짓말을 하고 있습니다. 이로 인해 dpu가 다시 선두로 밀려났습니다.
데이터 양이 폭발적으로 증가하는 ai 시대에 dpu는 낮은 대기 시간, 넓은 대역폭, 고속 데이터 경로를 통해 새로운 컴퓨팅 기반을 구축하는 데 도움을 줄 수 있을 뿐만 아니라 안전하고 효율적으로 예약, 관리 및 작업을 수행할 수 있습니다. 이러한 분산된 cpu와 gpu 리소스를 연결하여 지능형 컴퓨팅 센터의 효과적인 컴퓨팅 성능을 발휘합니다. 따라서 dpu를 배치하면 데이터센터의 일회성 설비 투자(자본 지출)를 줄일 수 있습니다. cisco의 데이터에 따르면 기업은 가상화 기술을 통해 리소스 활용도를 높이면서 서버 수를 최대 40%까지 줄일 수 있습니다.
반면 dpu는 전용 하드웨어를 통해 네트워크, 보안 및 스토리지 작업을 가속화하여 데이터 센터 에너지 효율성을 향상시킵니다.
lu sheng은 절강성에 있는 china mobile의 sd-wan 적용 시나리오를 예로 들어 "xinqiyuan dpu 네트워크 카드로 만든 통합 소프트웨어 및 하드웨어 솔루션은 네트워크 보안 서비스의 오프로드를 실현합니다. 기존의 순수 소프트웨어 sd와 비교할 때 - wan 네트워크 솔루션으로 단일 시스템 효율성이 6~8배 향상되었으며 전체 프로젝트에서 서버 배포 투자 및 연간 소프트웨어 비용이 80% 절감되었습니다. 또한 시스템 배포 감소로 인해 데이터 센터 용량이 크게 절감되었습니다. 이는 에너지 소비를 줄이고 연간 300만kwh 이상의 전기를 절약하는 동시에 데이터 센터의 운영 비용도 크게 절감할 것으로 추정됩니다.”
비용 측면에서 china business news는 특히 고급 프로세스를 사용할 때 dpu의 r&d 및 생산 비용이 상대적으로 높기 때문에 가격이 더 높다는 사실을 알게 되었습니다. 그러나 dpu 솔루션 배포로 인해 숫자를 줄일 수는 없습니다. 에너지 소비는 계산 과정에서 절약되므로 전체 시스템 비용은 여전히 ​​비용 효율적이지만 특정 시나리오 및 응용 프로그램을 기반으로 논의해야 합니다.
향후 3년은 상용화에 있어서 중요한 시기이다.
그러나 현재 dpu 보급률 증가는 여전히 저항에 직면해 있습니다.
하드 기술 분야의 초기 투자에 주력하는 벤처 캐피탈 기관인 china science and technology star의 관계자는 china business news에 소프트웨어 및 하드웨어 협업을 위한 가상화 아키텍처인 dpu가 하드웨어와 효과적으로 연결되어야 한다고 말했습니다. 동시에, dpu의 하드웨어 설계는 기존 시스템과의 호환성 및 통합을 고려해야 합니다. 둘째, dpu의 아키텍처와 인터페이스는 아직 통일된 표준을 형성하지 않았으며 제품에는 차이가 있습니다. 사용자의 사용, 유지 관리 및 업그레이드에 어려움을 초래하는 다양한 제조업체, 소프트웨어 생태계가 아직 성숙하지 않았고 완전한 개발 도구, 드라이버 및 운영 체제 지원이 부족하지만 "이미 이를 수행하는 회사가 있습니다."
lu sheng은 dpu의 핵심 경쟁력이기도 한 전용적이고 효율적인 명령어 세트가 필요하다고 말했습니다. 나머지 2/3는 명령어 세트를 중심으로 생태계를 구축하는 것이 dpu 산업의 핵심 장벽입니다. 생태학적 건설의 성숙도는 제품의 상용화 속도를 결정합니다.
전반적으로 dpu 산업은 여전히 ​​외국 기업이 주도하고 있으며, nvidia, broadcom, intel 등 3대 거대 기업이 상대적으로 높은 점유율을 차지하고 있으며, amazon과 microsoft도 이에 뒤따르고 있습니다. 국내에서는 차이나모바일, 알리바바 등 대기업도 전용 dpu를 개발하고 있으며, xinqiyuan, zhongke yushu, dayu zhixin 등 스타트업도 이에 상응하는 성과나 진전을 이루었습니다.
"국내외 dpu 기술 개발은 같은 단계에 있지만 외국 기업의 축적은 더 깊습니다. 제 생각에는 dpu 산업은 실제로 점차 성숙하고 빠른 구현 단계로 나아갔습니다. 외국은 더 빨리, 더 빠르게 발전할 수 있습니다. 국내보다”라고 장위는 말했다.
dpu 상용화 측면에서는 현재 화웨이, 알리바바, zte 등 국내 대형 클라우드 제조업체와 xinqiyuan, zhongke yushu 등 소수의 새로운 dpu 세력만이 상업적 사용을 달성했습니다. 정보통신기술아카데미는 2025년 우리나라 데이터센터의 dpu 보급률이 12.7%에 이를 것으로 예측하고 있다.
zhang yu는 현재 dpu 단계에서 더 중요한 것은 iaas 계층에서 클라우드와의 긴밀한 통합이며, 특히 고객에게 포괄적이고 편리하며 투명한 순수 소프트웨어 iaas 솔루션을 제공하여 고객이 원활하게 마이그레이션할 수 있도록 하는 방법이라고 믿습니다. 에너지 효율성이 뛰어난 클라우드 솔루션을 지원하는 dpu입니다.
zhang yu는 "이 분야의 마이그레이션에는 업계의 공동 노력이 필요하며 오랜 시간, 심지어 수년 동안 지속될 것입니다."라고 zhang yu는 말했습니다. "amazon cloud는 더 빠르게 움직이고 있습니다. 그들은 강력한 r&d 역량을 갖추고 있으며 dpu에서 iaas를 완성했습니다. 대부분의 국내 기업의 경우 속도가 그리 크지 않을 것이며 ovs 제거, 네트워크 업그레이드 등 가장 고통스러운 지점부터 투명하게 사용될 수 있습니다."
"dpu의 상용화는 전통적인 데이터 센터의 iaas 분야에 의존할 뿐만 아니라 네트워크 보안, 고성능 스토리지, 클러스터 통신 및 기타 여러 산업과 분야도 포함합니다." lu sheng은 xinqiyuan이 "dpu에 깊이 관여해 왔습니다."라고 말했습니다. 방향으로 dpu는 방화벽, 보안 게이트웨이 등의 제품에 적용됩니다. 이제 sangfor 네트워크 보안 제품 라인에 진입하여 표준 확장 카드가 되어 intel cpu 부족과 같은 업계 문제를 해결합니다. 코끼리 스트림 처리 기능.
"현재 산업 발전 추세로 볼 때 기술 개발이 기대치를 충족한다면 2025년부터 2027년까지 폭발적인 성장이 있을 것입니다." 위에서 언급한 zhongke chuangxing 관계자는 그 이유는 디지털 경제의 발전과 함께 ai가 활성화되기 때문이라고 말했습니다. 클라우드 컴퓨팅 산업의 발전과 함께 서버 시장은 특히 금융, 정부, 고급 사용자 분야에서 성장을 이끌 것이며, 데이터 처리와 컴퓨팅 효율성 향상을 위해 많은 수의 dpu가 필요할 뿐만 아니라 dpu도 필요합니다. 보안을 활용합니다.
"dpu 칩은 실제로 대규모로 사용되었으며 현재 성장률은 연간 20~30%입니다. 그러나 dpu의 산업 특성은 안정성을 유지해야 하며 클러스터에서 안정적으로 실행되어야 한다는 것입니다. zhang yu는 "클러스터를 확장하기 전에 몇 달 동안"이라고 말했습니다. 그리고 더 중요한 것은 국내 정보 및 혁신 산업의 발전을 기반으로 이 2~3년이 매우 중요한 기간이 될 것이며 모든 dpu 제조업체가 파악해야합니다.
"dpu는 아직 표준화된 제품이 아닙니다. 상용화 및 수량 확장 과정에는 시장 수요와 다양한 응용 시나리오를 기반으로 한 심층적인 연마가 필요합니다. 수백 명의 소규모 파일럿 프로젝트부터 업스트림 및 다운스트림 제조업체의 협력이 필요합니다. lu sheng은 dpu의 상용화를 위해서는 상호 생태적 신뢰와 협력을 강화하고 나아가기 위한 모든 업계 파트너의 공동 노력이 필요하다고 말했습니다. 3u 통합 국산 cpu+gpu+dpu 상용화의 길에 함께 나아갑니다.
(이 기사는 중국경제신문에서 발췌한 것입니다)
보고/피드백