소식

황 노인이 또 한 번 놀라운 움직임을 보입니다!최초의 "스페셜 에디션" GB20 서버 출시(내년 출시 예정)

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


새로운 지혜 보고서

편집자: 편집부

[새로운 지혜 소개]외신들은 엔비디아가 내년에 중국 시장에 특화된 AI 칩을 출시하고, 이에 맞춰 서버까지 개발할 것이라는 소식을 전했습니다.

엔비디아와 미국 상무부의 전쟁이 다시 격화되었습니다!

미국의 수출통제 하에 라오황은 계속해서 대안 전략을 내놓으며 쫓고 쫓기는 게임이 벌어지고 있다.


새로운 수출 통제 규정이 시행된 후 Lao Huang은 중국 시장에서 돈을 벌 수 없었습니다.

올해 1월 기준으로 새로운 수출 규제가 시행된 지 딱 1년이 되었고, 엔비디아 매출에서 중국 시장이 차지하는 비중은 17%까지 떨어졌다. 2년 전에도 이 수치는 여전히 25% 이상이었습니다.

규제에 직면해 엔비디아는 중국 맞춤형 '스페셜 에디션' 칩을 꾸준히 출시했지만 성능이 저하된 칩은 잘 팔리지 않는 경우가 많다.

이전까지 좋지 못한 출발을 보였던 H20의 판매가 이제 막 오르기 시작했지만, 엔비디아는 그 나쁜 소식을 듣고 충격에 빠졌다——

Jefferies의 분석가들은 지난 주 연구 보고서에서 미국 상무부가 10월에 반도체 수출 제한에 대한 연례 검토를 실시하고 H20 칩 수출을 금지할 수도 있다고 밝혔습니다.

감독은 계속해서 확대되고 있으며 이번에는 Lao Huang이 최선을 다해 나아갔습니다.

새로운 플래그십 AI 칩 B20을 출시했을 뿐만 아니라 사용이 쉽지 않을 것을 우려해 지원 서버인 GB20도 출시했다.


B20은 엔비디아가 올해 3월 출시한 블랙웰 B200의 변형 제품이라는 것은 이름에서 짐작하기 어렵지 않다.

현재까지 가장 빠른 GPU인 B200은 이전 GPU보다 최대 30배 빠르게 특정 작업을 처리할 수 있습니다. (예: 챗봇이 답변을 생성하도록 허용)

안타깝게도 이는 "스페셜 에디션" B20 칩과는 아무런 관련이 없습니다.

미국 수출통제 정책의 제한 속에서 탄생한 B20은 업계 최고 수준의 AI 성능을 갖춘 B200과 극명한 대조를 이루는 보급형 제품이 될 운명이다.

하지만 소식통에 따르면 B20은 AI 계산 처리 속도가 B200보다 느리지만, GB20 서버에 대량의 칩을 함께 설치하면 이 단점을 부분적으로 보완할 수 있다고 한다.

이를 통해 Nvidia는 중국 제품과 경쟁할 때 어느 정도 경쟁력을 유지하는 동시에 미국 수출 통제에서 요구하는 칩 컴퓨팅 성능의 상한선을 준수할 수 있습니다.

통제하에 '고양이와 쥐 게임'이 진행됩니다.

Nvidia는 2022년 말부터 LLM을 개발하기 위해 칩이 필요한 중국 고객의 요구를 겨냥하여 중국 시장용 칩을 반복적으로 재구성하고 미국 규정을 준수하면서 중국 고객에게 매력을 유지하려고 노력했습니다.

2022년 10월, 미국 정부는 당시 가장 발전된 인공지능 칩이었던 엔비디아의 A100과 H100의 판매를 금지했습니다.

몇 달 후 Nvidia는 중국 시장을 위해 A800과 H800이라는 두 가지 대체 제품을 출시했습니다.

1년도 채 지나지 않아 미국 상무부는 다시 한번 수출 통제 조치를 업데이트하고 이 두 칩에 제한을 가했습니다.

엔비디아는 신속하게 대응했고,


그중 H20 칩은 성능이 제한되어 있지만 고대역폭 메모리와 성숙한 소프트웨어 지원을 통해 더 높은 연결 속도를 제공합니다.

초기 판매는 저조했지만 점점 더 많은 중국 고객들이 이 칩을 구매하고 있습니다.

중국 내 Nvidia 칩 판매에 직접 관여한 4명의 관계자에 따르면, 중국 기업은 총 가치가 약 58억 달러에 달하는 H20 칩을 50만 개 이상 주문했으며 2024년에 인도될 예정입니다.

조사 회사인 SemiAnalytics는 또한 Nvidia가 올해 중국에서 100만 개 이상의 H20 칩을 판매할 것이며 이는 미화 120억 달러 이상의 가치가 있을 것이라는 낙관적인 추정을 내놓았습니다.

그러나 앞서 언급했듯이 이 사업은 상무부의 새로운 위협에 직면해 있습니다. 연말에 규제가 조정되면 H20의 판매가 금지될 수도 있습니다.

이러한 금지는 제품별 금지, 칩의 컴퓨팅 성능 감소 또는 메모리 용량 제한 등 다양한 형태를 취할 수 있습니다.

결국 미국이 반도체 관련 수출통제에 대한 압박을 계속해서 가할 것으로 일반적으로 예상되는 거시적 배경이다.

미국은 네덜란드와 일본이 중국에 대한 칩 제조 장비 공급을 추가로 제한하기를 원한다고 소식통은 말했습니다.


통제가 강화되면서 점점 더 많은 "특별판"이 나타날 수 있습니다.


Nvidia가 새로운 플래그십 게이밍 그래픽 카드인 RTX 5090D도 개발하고 있다는 소문이 있습니다.


그래픽 카드는 중국 시장을 위해 특별히 설계되었으며 수출 표준을 충족하는 최초의 소비자 지향 그래픽 카드인 RTX 4090D의 후속 제품입니다.

칩 성능이 부족해 이를 보완하려면 서버가 필요하다.

B20의 구체적인 사양은 아직 결정되지 않았지만 확실한 것은 미국 GPU 수출 정책의 '한계'를 절대 깨지 않을 것이라는 점이다.

이전에 출시된 H20, L20 및 L2와 같은 이전 제품과 마찬가지로 이 세 가지 칩의 성능은 "대단하다"고 할 수 있습니다. 성능이 좋지 않을 뿐만 아니라 NVLink의 잔여 버전만 탑재되어 있습니다. 연결하다.

목을 잠그는 TPP & PD 두 가지 주요 지표

미국은 중국의 GPU 수출에 대해 엄격한 성능 규제를 하고 있으며 '총 처리 능력'(TPP)이라는 지표를 사용하고 있다.

이 지표는 TFLOPS와 GPU 컴퓨팅 성능의 정확성을 고려합니다. 특히 TFLOPS(희소성 제외)와 정밀도(비트 단위)를 곱하면 TPP가 됩니다.

현재 한도는 4800 TPP로 설정되어 있습니다. 이는 무엇을 의미합니까?

NVIDIA의 이전 제품을 참고하면 Hopper H100과 H200은 이 표준을 훨씬 초과했습니다. 두 GPU의 TPP는 지정된 상한의 3배가 넘는 16,000에 도달했습니다.


RTX 4090조차도 660.6 TFLOPS의 FP8 컴퓨팅 성능으로 한계를 초과합니다.

4800 TPP 제한 내에서 유지되는 가장 강력한 Nvidia 데스크탑 GPU는 수출 제한을 준수하도록 특별히 제작된 RTX 4090D입니다.


Blackwell은 듀얼 칩 솔루션으로 수출 한도의 7.5배에 해당하는 약 4,500 TFLOPS의 FP8 컴퓨팅 성능을 출력하는 등 컴퓨팅 성능의 새로운 기준을 세웠습니다.

즉, B20의 성능은 Blackwell B200의 성능의 1/7도 되지 않습니다!

뿐만 아니라 B20은 "성능 밀도"(PD) 제한이라는 추가 제한 사항에도 직면해 있습니다.

이는 미국의 데이터센터 GPU에 특별히 부과된 제한사항이며, 소비자 GPU는 이에 영향을 받지 않습니다.

PD 지표는 TPP 점수를 칩 크기로 나누어 구할 수 있으며, 중국으로 수출되는 GPU의 PD는 6.0을 넘지 않아야 합니다.

이 지표에 따르면 RTX 40 시리즈 GPU(Ada Lovelace 아키텍처)는 더 이상 데이터 센터에서 사용할 수 없습니다.

Blackwell은 밀도와 성능 측면에서 Ada Lovelace보다 분명히 낫습니다.

즉, 엔비디아는 관련 규정을 준수하기 위해 B20의 성능을 엄격하게 제한하거나 더 많은 칩을 사용해야 합니다.

Tom's Hardware에 따르면 B20은 Nvidia의 A30 및 H20 보급형 AI GPU의 후속 제품이 될 것입니다.

예를 들어 H20을 사용하면 FP16 컴퓨팅 성능은 296TFLOPS, TPP는 2368, PD는 2.90, H100/H200은 1979TFLOPS입니다.


동시에 A30은 TPP 점수가 2640점, PD 점수가 3.20점으로 H20보다 약간 높다.

엔비디아가 중국 시장을 겨냥해 구축한 AI GPU는 성능 개선의 여지가 어느 정도 있지만 그 공간이 매우 제한적이라는 것을 알 수 있다.

최상의 시나리오에서는 Nvidia가 4000~4500 사이의 TPP와 800제곱밀리미터의 다이 크기를 갖춘 GPU를 만들려고 할 수 있습니다.

GB20: B20의 성능을 유지하기 위해 최선을 다하십시오.

다가오는 B20을 더욱 효율적으로 만들기 위해 Nvidia는 메모리 칩이 현재 수출 통제 대상이 아니기 때문에 메모리 용량을 업그레이드하는 등 H20에서 사용한 전략을 채택하고 있습니다.

서버 개발에 참여한 두 사람에 따르면 엔비디아는 메모리와 B20 프로세서 간의 데이터 전송 속도를 높여 대용량 에너지 데이터 세트를 더 빠르게 처리할 수 있도록 노력하고 있습니다.

뿐만 아니라 Nvidia는 GB20 랙 설계에 NVLINK 기술(서로 다른 칩 간의 빠른 통신을 가능하게 함)과 냉각 솔루션도 사용할 예정입니다.

이는 B20 칩의 활용도를 높이고 인공 지능을 강화하는 GB20 컴퓨팅 클러스터의 효율성을 높일 것으로 예상된다고 두 사람은 덧붙였습니다.

GB20 시스템을 통해 고객은 여러 칩을 보다 효율적으로 병렬로 실행하여 AI 훈련 및 추론을 수행할 수 있습니다.

GB20이 공개되기 전, Tom's Hardware는 B20이 판매하기 어려운 칩이 될 것이라고 과감하게 예측했습니다.

하지만 이제 GB20의 축복으로 새로운 희망이 보이는 것 같습니다.

참고자료:

https://www.tomshardware.com/pc-comComponents/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- 규정

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-shirt-us-rules