소식

NVIDIA Deep Krypton의 포위 및 억제 |

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

글 | 추샤오펀(Qiu Xiaofen)

인터뷰|추샤오펀(Qiu Xiaofen)과 양샤오(Yang Xiao)

편집자 | Su Jianxun Yang Xuan

저항하다

비밀 위챗 그룹은 상하이 장장(張江)의 AI 칩 기업들 사이에서 입소문을 타고 퍼지고 있다. 그룹 이름은 '국내 칩 그룹 워밍 그룹(Domestic Chip Group Warming Group)'이다. 경쟁사라도 정보를 교환하고 비즈니스 자원을 교환할 것입니다.

"국내 따뜻함을 위한 칩 그룹"은 모두가 공통의 적, 바로 NVIDIA를 갖고 있기 때문에 동료들이 일시적으로 휴전하고 서로를 도울 수 있는 휴전 지대를 묘사했습니다.

엔비디아의 존재로 인해 국내 칩 업체들의 매출은 적잖은 굴욕을 겪었다.

국내 GPU업체 영업사원 리밍(가명)씨는 AI 붐이 불기 시작하자 자신감을 갖고 고객을 만나러 갔지만 인사할 시간이 없어 고객이 질문을 하기 시작했다.

"NVIDIA의 A100 칩과 비교했을 때, 당신 제품의 차이점은 무엇입니까? NVIDIA에는 NVLink가 있는데, 당신은 무엇을 가지고 있습니까?"(저자 주: NVLink는 여러 GPU 칩을 연결하여 컴퓨팅 효율성을 높이기 위해 GPU 데이터가 CPU로 이동되는 것을 방지합니다.)

자신의 제품과 기술로 고객에게 깊은 인상을 줄 수 없다는 것을 알고 Li Ming의 팀은 연결에 의존하여 "더 강력한 사람"을 찾아 로비할 수 있는 방법을 생각하기 시작했지만 고객은 여전히 ​​손을 흔들며 "우리는 여전히 사용하고 싶습니다"라고 말했습니다. 엔비디아."

826제곱밀리미터의 면적에 540억 개의 트랜지스터를 담은 엔비디아 A100은 대형 AI 모델의 마법 상자를 여는 열쇠다.

대규모 모델 훈련은 데이터 변경 패턴을 알아내는 목적으로 대규모 데이터의 "정제 비약"과 같습니다.NVIDIA 칩을 사용하여 대형 모델을 훈련시키는 것은 IQ 200인 수억 명의 사람들에게 수학을 하도록 요청하는 것과 같지만, 다른 칩의 효과는 IQ 100인 수천 명의 사람들에게 계산을 하도록 요청하는 것과 같습니다.


NVIDIA 공식 웹사이트의 NVIDIA A100 사진

최고의 기술 기업들은 모두 Nvidia 인수를 서두르고 있습니다. 가장 많은 NVIDIA 고급 GPU를 보유한 사람은 누구나 더 스마트한 대형 모델을 훈련할 수 있는 기회를 갖게 됩니다.

공개 정보에 따르면 OpenAI는 현재 세계에서 가장 많은 수의 NVIDIA 고급 GPU(최소 50,000개)를 제어하고 있으며 Google과 Meta도 Wanka 클러스터(약 26,000개)의 소유자이며 중국에서는 인터넷이 있는 경우가 거의 없습니다. Nvidia 고급 GPU Wanka 클러스터를 사용한 네트워크 가장 큰 것은 ByteDance(13,000)입니다.

NVIDIA는 글로벌 산업 체인에서 최고의 리소스를 독점합니다. TSMC에서 가장 풍부한 고급 칩 제조 능력을 보유하고 있으며, 세계에서 가장 큰 엔지니어 사용자 그룹을 보유하고 있으며 많은 AI 회사의 컴퓨팅 생명선을 제어합니다.

절대 독점은 종종 불만, 분노, 도피를 낳습니다.

"오늘날 대형 모델을 만드는 모든 사람은 기본적으로 심각한 손실을 입고 있습니다. 돈을 버는 사람은 단 한 명뿐입니다! NVIDIA"라고 업계 관계자는 화를 내며 말했습니다."NVIDIA의 이윤폭은 모든 고객을 불편하게 만들고 AI 산업에 해를 끼칩니다!"

재무 보고서에 따르면 Nvidia의 총 이익 마진은 71%에 달했으며 그 중 인기 제품인 A100 및 H100 시리즈의 총 이익 마진은 90%에 달했습니다. 하드웨어 회사로서 Nvidia는 실제로 인터넷 소프트웨어 회사보다 더 높은 총 이익 마진을 누리고 있습니다.

높은 가격과 막대한 이익으로 인해 Nvidia의 대규모 고객이 떠나기 시작했습니다. 지난 7월 30일, 애플은 자사의 AI 모델이 구글 TPU 8,000개로 훈련됐다고 발표했는데, 엔비디아의 콘텐츠는 0이었다. 이 소식이 나오자마자 엔비디아의 주가는 7월 31일 7% 이상 하락해 역대 최대 낙폭을 기록했다. 3개월 만에 시장 가치가 1,930억 달러 증발했습니다.나는 Pinduoduo를 거의 잃어버렸습니다.


지난 1년간 NVIDIA 주가 하락 차트

엔비디아의 살을 뜯어내고 싶어하는 모든 국내 GPU 회사들에게 2022년은 미국에서 여러 차례 금지령이 내려진 해다. 중국에서는 빠르게 다시 금지되었습니다.

  • 2022년 9월 A100/H00의 중국 수출이 금지되었고, NVIDIA는 2023년 10월에 거세 버전인 A800/H800을 출시했으며, 2024년 6월에는 A800/H800/L40/L40S/RTX4090의 중국 수출이 금지되었습니다. NVIDIA 창립자 Huang Jenxun L20 및 H20 칩의 거세 버전을 중국에 출시할 것이라고 밝혔습니다.

하지만 거세 버전은 업계의 더욱 거센 비난을 불러일으켰다. 엔비디아가 곧 출시할 H20은 가격은 엔비디아 H100의 절반 수준이지만 성능은 전작의 1/3에 불과하다. AI 업계 관계자는 분노하며 이렇게 비난했다. 이것은 단지 돈을 훔치는 것이 아닌가? 순수한 IQ 세금! "

엔비디아 고객들이 불만과 분노를 표출하자 엔비디아를 대체하려는 국내 칩 기업들은 이런 감정을 '자양분'으로 삼았다.

과거에는 Nvidia의 엉덩이를 따라가며 케이크를 조금만 먹을 수 밖에 없었습니다. 반도체 분석업체 테크인사이트(TechInsights)의 데이터에 따르면 엔비디아의 데이터센터 GPU 출하량 시장 점유율은 2023년 98%에 이를 것으로 예상된다. 국내 칩과 모든 칩 대기업을 합치면,2%에 불과합니다.

이제 금지령이 내려졌으니 중국 시장에서 완벽한 Nvidia가 무너졌습니다. 누가 Nvidia를 대체할 수 있을까요? 국내 AI칩 제조사들 희망 보인다.

“올해 엔비디아 중국 시장의 90%가 출시됐다.잡을 수 있는지 없는지는 당신의 능력에 달려있습니다."라고 국내 GPU업체 창업자는 말했다.

36 Krypton은 2021년에 "Deep Krypton | CATL: 수조 개의 배터리 제국의 균열"을 출판한 적이 있습니다. 전력 배터리 업계에서 CATL은 타의 추종을 불허하며 경쟁사들의 주목을 받고 있습니다.

오늘날 AI 칩 분야의 강자인 엔비디아는 많은 동료들에게 육체의 가시로 여겨지기도 합니다. 그러나 엔비디아와 엔비디아의 차이점은 장벽이 더 높고 상대와의 격차가 더 크다는 것입니다. 더욱 넓어졌습니다.

우리는 NVIDIA의 반대자들의 저항을 통해 "NVIDIA의 균열"을 찾으려고 노력합니다. GPU 산업을 살펴보면 국내 GPU 및 AI 칩 제조업체는 약하지만 중국 시장을 더 잘 이해하고 있으며 플레이 방식이 더 현지화되어 있습니다. Intel, AMD 등 기존 칩 거대 기업은 Nvidia와 정면으로 맞서기에 충분한 탄약을 보유하고 있습니다.

단기적으로 Nvidia는 패배하지 않을 것이지만, 무사히 남아 있지는 않을 것입니다. 이것은 피비린내 나는 전쟁이 될 것입니다.

브레이크아웃

돌파하고 싶다면 상대의 약점을 찾아내야 한다.Nvidia의 약점 중 하나는 오만함입니다.

칩 산업은 본질적으로 To B 소프트웨어 산업입니다. 고객은 하드웨어 디버깅, 소프트웨어와 하드웨어 호환 등 칩 제조업체의 "동반" 서비스가 필요합니다. 동반자 관계가 있어야만 고객이 끈적거릴 수 있고 칩 제품은 쉽게 교체되지 않습니다.

그러나 많은 국내 칩 전문가들은 중국 시장에서는 BAT, 바이트 등 수십억 규모의 대규모 구매자를 제외하면 대부분의 다른 기업들이 거래량이 수천만에 달하더라도 엔비디아로부터 투자를 받기가 거의 어렵다고 36Kr에 말했다. . 판매 후 서비스.

즉, NVIDIA 칩을 사용하는 중국 엔지니어가 의심스러울 때 NVIDIA 공식 웹사이트에서 문서를 검색하거나 커뮤니티에 가서 스스로 배울 수 밖에 없습니다.

NVIDIA와 협력할 때 중국 고객의 다양한 요구 사항이 충족되지 않는 경우가 많습니다.칩 업계의 한 관계자는 36Kr에 Nvidia가 일반적으로 중국에서 가장 고급스럽고 가장 비싼 완전한 솔루션을 홍보한다고 말했습니다. 고객이 특정 시나리오에 대해 맞춤형 요청을 하면 일반적으로 카드를 구매한 후 고객은 "생각해야 합니다." 스스로 그것에 대해 이야기하거나 이를 수행할 강력한 알고리즘 회사를 찾으십시오."

Nvidia의 이러한 접근 방식은 중소 규모 고객으로부터 많은 불만을 축적해 왔습니다. 위에서 언급한 관계자는 "이제 대규모 제조업체인 Nvidia는 더 이상 과거처럼 소규모 고객에게 많은 관심을 기울이지 않습니다. 그들의 제품에는 도전자가 없으며 고객을 만족시키기 위해 열심히 일할 필요가 없습니다"라고 말했습니다.

그러나 과거 NVIDIA 생태계의 부상은 실제로 칩 산업에 대한 서비스의 중요성을 확인시켜 주었습니다. CUDA 생태계가 막 시작된 ​​2006년에는 NVIDIA 제품이 오늘날의 국산 칩만큼 좋지 않았습니다. 하지만 NVIDIA 팀은 처음에는 대학의 과학 연구팀으로 시작하여 각 하위 분야의 스타트업 기업에 침투하여 소프트웨어와 하드웨어를 적용하고 나서야 오늘날 큰 나라가 되었습니다.


NVIDIA H100 출처: NVIDIA 공식 웹사이트

중국 칩 제조사들도 이를 깨닫고 고객 서비스부터 시작하려고 노력하고 있다.

익명을 요구한 국내의 한 AI 칩 회사는 2023년부터 백엔드 R&D 인력을 최전선에 배치해 개인 서비스를 제공하기 위해 노력해 왔다. 현장에서 공동 교육을 받을 뿐만 아니라 고객에게 판매 주문이 이루어진 후 R&D 인력으로 구성된 전담 팀. 고객단가는 수백만에서 수십만까지 다양하며, 연중무휴 24시간 상담이 가능합니다.

단순히 현지화되고 사려 깊은 서비스를 제공하는 것만으로는 충분하지 않습니다.칩 산업은 더 이상 단순히 칩 제품 간의 전쟁이 아닙니다. , 또한 시간 창에 대한 각자의 이해도 테스트합니다. 중국 칩 제조사들은 늑대 떼처럼 달려들었고, 치열한 입찰이 시작됐다.

화웨이가 가장 치열하게 다가오고 있다. Huawei는 이전에 iFlytek과 협력하여 "Ascend 910B"가 장착된 "Spark All-in-One" 장치를 출시했습니다.

이 칩은 단일 카드 기능 측면에서 "NVIDIA A100과 비교할 수 있다"고 한때 언급되었습니다. 알려지지 않은 것은 이 영광스러운 사건 뒤에 숨겨진 어려운 측면입니다. 36 Krypton은 Huawei가 인건비 지불을 주저하지 않고 iFlytek이 매개변수를 조정하는 데 도움을 주기 위해 수백 명의 엔지니어를 배치했다는 사실을 알게 되었습니다.


Huawei와 iFlytek, Spark 올인원 기기 출시, 출처: iFlytek

업계에서는 이를 '수작업'이라고 부르지만, 벤치마크 사례가 나오자마자 많은 대형 모델사와 인터넷 기업들이 화웨이에 올리브 가지를 뻗어 테스트를 진행했다.

국내 칩 판매 회사는 지난해 7월부터 공개 입찰된 모든 스마트 컴퓨팅 센터 프로젝트에 화웨이의 고위 경영진이 상주하는 것을 보고 놀랐다. “화웨이는 이제 프로젝트에 수백 명을 보낼 수 있습니다. 봉사하러 나가고, 다른 프로젝트에서 수입을 얻기 위해 일부 주요 프로젝트에서 돈을 잃기도 합니다."

앞서 언급한 이름 없는 칩 회사에도 하드코어 영업사원이 200명이나 있는데, 이는 국내 칩 업계에서 매우 드문 구성이다. 그들의 영업팀은 대형 모델 구현, 금융, 법률, 산업 등 가장 뜨거운 3개 분야에서 출발해 컴퓨팅 파워와 관련된 거의 모든 전시회에 출연했다. ." 잃어버린".

국산 칩의 숨겨진 가격 전쟁도 시작됐다.

칩 업계 관계자는 36Kr에게 단가에 관계없이 벤치마크 지능형 컴퓨팅 센터에 대한 더 많은 주문을 수주하는 것이 목표라고 말했습니다. 36 Krypton은 비용을 줄이기 위해 일부 국내 기업이 추론 카드에서 값비싼 HBM(고대역폭 메모리)을 제거하는 데 주저하지 않고 심지어는 심지어원가보다 50% 저렴한 가격으로 배송됩니다.

"무슨 일이 있어도 모든 사람들은 여전히 ​​다양한 진입점을 돌파하여 NVIDIA로부터 작은 조각을 가져가기를 희망합니다. 그러면 NVIDIA는 더 이상 유일한 존재가 아닙니다."

하지만 현실은 잔혹하다. 제품에 있어서 국산 AI칩은 다양한 문제를 안고 있을 수밖에 없다.

한 칩 전문가는 36Kr에 대한 예를 들었다. 엔비디아의 A100 클러스터를 사용하면 동일한 데이터 세트를 처리하는 데 열흘밖에 걸리지 않지만, 국산 일부 칩 제품을 사용하면 몇 달이 걸릴 수도 있다.국내 칩 하드웨어의 축적 시간이 너무 짧고, 첨단 프로세스와 하드웨어 격차가 부족해 효율성이 낮다.

소프트웨어 단점도 분명합니다. 또 다른 업계 관계자는 국산 칩을 사용하여 대형 모델을 실행할 때 더 멋진 응용 프로그램을 적용하려는 경우 기본 대형 모델이 변경되면 국산 칩이 충돌하는 경우가 많다는 사실을 테스트한 결과를 발견했습니다. 국산 칩." 기본적으로 코를 잡고 사용하는 거죠."

이제 각 회사는 현재 진행 중인 "포위 및 억제" 전략을 명확하게 확인했으며 점차 보다 현실적인 경로로 차별화되었습니다.

훈련 시나리오에 초점을 맞추고 Moore Threads 및 Huawei로 대표되는 NVIDIA를 사용하여 Wanka 클러스터로 계속 이동하는 파벌이 여전히 있지만 대부분의 파벌은 대형 모델 사용에 더 중점을 두는 것을 선택합니다. 다양한 산업의 소형 모델 구현은 Suiyuan, Tianshu Zhixin 등으로 대표되는 높은 하드웨어와 소프트웨어가 필요하지 않은 추론 시나리오에서 시작됩니다.

(36Kr 참고: 대규모 모델에는 훈련과 추론이라는 두 가지 링크가 있습니다. 훈련은 수십억 개의 데이터베이스에서 패턴을 찾는 프로세스입니다."만들다"대형 모델 추론"사용"대형 모델의 공정은 덜 어렵고하드웨어 및 소프트웨어 요구 사항 감소, 업계와의 긴밀한 연결)


Moore Thread, 2024 인공지능 컨퍼런스에서 Kua'e Wanka 클러스터 출시 36 크립톤 샷

한 칩 업계 관계자는 "우리는 지금 맹목적으로 엔비디아를 쫓는 것이 아니다. 따라잡을 여유도 없고, 엄청나게 큰 컴퓨팅 파워를 갖춘 칩을 맹목적으로 만들 수도 없다"고 직설적으로 말했다.

국내 칩 제조업체가 현실적인 고려 사항은 Nvidia의주요 초점은 여기에 있지 않으며 국내 제조업체는 엔비디아의 정면 전쟁을 피했습니다.

이전에는 대부분의 회사에서 NVIDIA 소비자급 게이밍 그래픽 카드 4090을 사용하여 비용 고려 사항을 기반으로 추론을 실행했습니다. 이러한 카드에는 과도한 전력 소비, 메모리 부족, 비활성화 등 많은 문제가 있었습니다. Nvidia 관계자는 또한 이러한 소비자급 그래픽 카드를 대규모 모델 추론에 사용하는 것을 허용하지 않습니다.

국내 칩 업체들이 엔비디아의 격차에 들어섰다. Tianshu Zhixin과 Suiyuan은 모두 대용량 메모리, 낮은 전력 소비 및 안정적인 공급이라는 판매 포인트를 바탕으로 올해 4090과 경쟁하는 추론 카드를 추진하고 있습니다.

국내 칩 제조업체들도 시장 부문 식별의 중요성을 분명히 했습니다. 예를 들어, 전력에 민감한 일부 시나리오의 경우 저전력 소형 칩에 중점을 두거나 작지만 아름다운 비즈니스를 수행하기 위해 비디오 최적화와 같은 틈새 시나리오에 뛰어들 수 있습니다.

거인의 전장은 긴장감이 넘친다.

국내 GPU 업체들이 PPT에 '엔비디아를 능가한다'라고 적으면 오히려 아름다운 비전에 가깝다. 이 그룹은 설립된 지 오래돼 조금이라도 뛰어넘더라도 국내 대체 추세를 따라잡았다. , 이는 Nvidia가 라이벌이자 벤치마크라는 점에서 위업으로 간주됩니다.

하지만 엔비디아에 뒤지지 않는 인텔과 AMD의 경우 분위기는 더욱 팽팽하다.

우리는 내부적으로 Nvidia를 치명적인 적으로 간주합니다."라고 AMD의 MI 시리즈 제품 라인 개발자가 36Kr에 말했습니다.

올해 6월 타이페이 컴퓨터 쇼(Computex 2024)에서 AMD 창립자 Su Zifeng(그녀는 Nvidia 창립자 Huang Jen-Hsun의 사촌이기도 함)도 처음으로 GPU 반복에 따른 새로운 AMD 제품 리듬을 밝혔습니다. 매년 GPU 제품은 Nvidia의 업데이트 리듬과 일치합니다.

엔비디아가 GPU를 출시할 때마다 거의 매번 AMD는 이를 시장에서 구입해 즉시 분해해 아직 출시되지 않은 제품과 비교해본다.

여기에는 몇 가지 기능(지표)을 추가하고 거기에는 매개변수를 높여야 한다”고 언급한 관계자는 36 크립톤에 대해 “하드웨어는 엔비디아에 뒤처지지 않고 매개변수는 조금 더 좋다”고 말했다.


Su Zifeng은 올해 타이페이 컴퓨텍스에서 Instinct MI325X를 출시했습니다.

2023년부터 AMD의 중국 생태계 파트너는 거의 이틀에 한 번씩 AMD로부터 소프트웨어 최적화에 대한 새로운 요구를 받게 됩니다. AMD 경영진은 GPU를 홍보하기 위해 때때로 더 유리한 CPU 부서에 GPU를 일치시켜 주문을 하도록 요구하여 CPU가 판매되지 않을 위험을 감수합니다.

AMD 사람들은 생태계를 개선할 수 있기를 바라며 매일 향을 피우고 부처님을 숭배합니다.”, 한 생태 회사의 임원은 그에 따르면 현재중국에는 이미 10개 이상의 클라우드 공급업체와 To B 고객이 있습니다., AMD 칩과 관련된 적응 및 효과 검증에서.

불안한 국내 칩 제조업체와 비교할 때 하드웨어 수준에서 외국 칩 거대 기업의 장점은 고급 프로세스와 HBM 생산 능력을 갖추고 있기 때문에 Nvidia 제품에 비해 AMD와 Intel 제품 사이에 큰 차이가 없다는 것입니다. 어느 정도.

공식 데이터에 따르면 AMD의 제품(2023년 12월 출시된 MI300X)은 이전에 컴퓨팅 성능이 Nvidia H100의 1.2배라고 주장했습니다.

인텔 제품(2024년 4월 출시된 가우디3) 역시 에너지 효율성과 추론 성능 면에서 H100을 훨씬 능가한다. 물론 AMD의 GPU 가격도 엔비디아 벤치마크 제품 대비 70~80% 정도 저렴하다.

그러나 Nvidia에 공격적인 모든 제조업체는 공통된 문제에 직면합니다.하드웨어가 아무리 강력해도 배럴의 단점과 마찬가지로 약한 소프트웨어로 인해 무색해집니다.

GPU가 그래픽 컴퓨팅에만 사용될 수 있었던 시대에 NVIDIA가 출시한 소프트웨어 플랫폼 CUDA는 개발자에게 프로그래밍 인터페이스 세트를 제공하여 개발자가 가장 익숙한 프로그래밍 언어를 사용하여 GPU에 컴퓨팅 프로그램을 자유롭게 작성할 수 있도록 하는 것과 같습니다. 와 함께.

"비유를 하나 드리죠. 왜 CUDA를 능가할 수 없나요? 마치 언어를 배우고 이 언어로 수년 동안 작업해 온 것과 같습니다. 언어를 바꿔 달라고 하면 불편하지 않을까요? 하시겠습니까?" 칩 회사 직원이 36Kr을 예로 들었습니다.

CUDA는 Nvidia 소프트웨어 생태계의 가장 깊은 장벽입니다.대기업인 인텔이나 AMD도 단기간에 따라잡을 수는 없다.

Intel GPU 팀의 전직 직원은 36Kr에게 전 세계에 3,000명 이상의 엔지니어를 배치하고 3~4년을 투자했지만 정확도가 0%에서 4%로 향상되었을 뿐이라고 말했습니다. 그들은 Intel 칩을 사용하여 초상화를 변환하고 기다렸습니다. 오랜 시간이 흐른 뒤 '더 이상 사람의 얼굴이 아니었다'는 정도로 정보가 사라졌다.


인텔 CEO 키신저, 가우디 칩 시리즈 출시

'닭고기와 달걀'의 오류가 다시 나타납니다. AMD와 Intel GPU를 사용하는 사람이 많지 않고, 해당 소프트웨어 플랫폼(ROCm, oneAPI)을 사용하는 사람은 더욱 적기 때문에 누구나 진정한 하드웨어 기능을 충분히 활용하기 어렵기 때문입니다.

"NVIDIA의 CUDA에는 항상 수많은 개발자가 알고리즘을 반복하여 NVIDIA가 추론과 훈련을 매우 효율적으로 수행할 수 있도록 도와주었습니다. 결과적으로 NVIDIA는 항상 협상력을 갖고 있으며 다음 칩이 무엇을 해야 하는지 항상 알고 있지만 이것이 바로 AMD입니다. Intel과 Intel 모두에게 골칫거리입니다.” AMD 생태계 회사의 CEO가 직설적으로 말했습니다.AMD의 소프트웨어 도구 ROCm은 "20년 전 NVIDIA의 CUDA와 같습니다."

그러나 다운스트림 고객의 경우 위험이 발생하는 곳이 바로 여기입니다.

대규모 모델을 검증하는 것은 본질적으로 불확실성이 있는 실험입니다. 검증되지 않은 칩에서 이를 실행하려는 경우 제어할 수 없는 두 가지 변수를 합치는 것과 같습니다. Nvidia를 포기한다는 것은 막대한 마이그레이션 비용을 지불해야 함을 의미합니다. 불확실성.

그럼에도 불구하고 엔비디아에 대한 포위와 탄압은 여전히 ​​AMD와 인텔을 위해 싸워야 할 싸움이다.

글로벌 칩 아키텍처는 세 부분으로 나뉩니다. X86 아키텍처는 PC 분야를 주도하고 Intel과 AMD가 지배하고 있으며, 모바일 시장은 Arm이 지배하고 있으며 NVIDIA는 인공 지능 시장을 지배하고 있습니다.

새로운 AI 혁명이 시대를 연 지 거의 1년 반 동안 Nvidia는 한때 3조 달러의 시장 가치를 넘어섰으며, 이는 현재 Intel + AMD의 시장 가치를 합친 것과 같습니다.

20년 후, 칩 거대 기업들의 엔비디아 '포위와 탄압',또다시 불안한 전투였고, 뒤늦은 반격이기도 했다.

진짜 균열

국내 AI 칩 기업들이 개미군단을 꾸리자 AMD와 인텔이 총력전을 벌이는데 과연 엔비디아는 이런 포위에 직면했을까?

NVIDIA 제국의 균열이 조용히 퍼지고 있습니다.

엔비디아가 경계해야 할 신호는 오픈AI, 구글, 마이크로소프트… AI에 대한 믿음 때문에 엔비디아를 재충전한 이들 주요 고객들이 '안티 엔비디아'를 향한 첫발을 내딛고 있다는 점이다.

자체 개발한 칩은 오랫동안 여러 회사에서 기획해 온 체스 게임입니다. Google TPU 팀의 전 핵심 직원은 36Kr에게 전 세계 컴퓨팅 성능의 1/4을 사용하는 Google이"연말까지 외부 칩을 구입하지 못할 수도 있습니다."

과거에는 구글이 자체 개발한 TPU가 비용을 더 고려했다. 예를 들어 엔비디아가 마음대로 가격을 올리거나 공급이 충분히 안정적이지 않을 것이라는 우려가 있었다. 이제 구글의 코어 제작 전략은 더욱 파격적이다."비용과 비용에 거의 관계가 없습니다."

OpenAI는 새로운 AI 칩 제국을 건설하기 위해 최대 7조 달러를 모금할 계획을 가지고 있습니다.

국내에서도 36Kr은 여러 곳에서 배웠습니다.현재 Nvidia의 국내 최대 구매자인 Alibaba, Byte, Baidu는 기본적으로 대규모 모델 훈련용 칩을 비밀리에 연구하고 있습니다.

해외 클라우드 제조업체, 대형 모델 제조업체, 스타칩 제조업체의 제품 진행 상황, 36Kr 종합 정보 수집 및 매핑

그러나 자체 개발한 칩은 결국 장기적인 솔루션입니다. 이러한 대규모 고객을 위한 또 다른 단기 계획은 Nvidia 경쟁사의 제품을 사용해 보고 Nvidia에 대한 의존도를 줄이는 것입니다.

AMD는 이것이 플랜 B입니다. AMD 내부자는 36Kr에게 다음과 같이 말했습니다.AMD의 GPU 제품은 이미 유럽, 미국, 한국 및 기타 지역에 대규모 고객 시장을 열었습니다.마이크로소프트는 수만 대의 AMD 제품을 구매했으며, 테슬라, 미드저니, 미국 국립연구소, 한국통신도 제품을 일괄 납품받았다.

중국에서는 AMD 에코시스템 직원인 Chen Wen은 특정 모델의 AMD 가속기 카드 수백 개가 2023년에 출시될 것이라고 말했습니다. 비록 많지는 않지만 "하지만 이 AMD 제품은 이전에 중국에서 거의 발견된 적이 없습니다."

AMD의 이전 낙관적 추정에 따르면, 데이터 센터 GPU는 2024년 말까지 AMD에 최대 20억 달러의 매출을 가져올 것입니다.

중국 칩 제조업체의 개미군은 아직 Nvidia에 실질적인 위협을 가하지는 않았지만 그 불꽃은 점차 추진력을 얻고 있습니다.

36Kr은 이제 국내 훈련 및 추론 칩의 판매가 새로운 수준으로 도약했다는 사실을 알게 되었습니다. 중국에서 수주하기 가장 어려운 것으로 인식되는 인터넷 회사와 대형 모델 회사가 중국에서 수주하기 시작한 것은 기쁘고 긍정적인 신호입니다. 국내 칩에 투자하라. 제조사가 입을 열었다.

36Kr에 따르면 현재Ascend Chip은 Baidu를 포함한 인터넷 회사의 시스템에 침입하기 위해 고군분투했습니다.

또한 Zhipu AI, MiniMax, Step Star 등 국내 AI 회사들은 모두 수조 개의 매개변수를 사용하여 대형 모델을 훈련하고 있습니다. 그러나 NVIDIA의 고급 칩이 제한적인 경우 대형 모델 회사는 일반적으로 "혼합 훈련"(예: NVIDIA + 다른 칩), 예를 들어,Zhipu AI의 클러스터는 Shengteng 칩의 거의 절반을 보유합니다.

또한 Tianshu Zhixin과 Suiyuan의 추론 칩 제품은 모두 작년부터 수만 개를 출하했습니다. 배송 채널에는 국내 주요 지능형 컴퓨팅 센터가 포함되며 전자는 대형 모델 제조업체인 Baidu의 공급망에 진입했습니다. Kunlun Chip 여기에서 지난 2세대 추론 칩의 누적 출하량은 30,000~50,000개이며, Baidu 및 외부 채널의 출하량이 각각 절반을 차지합니다.

"Nvidia의 현재 가격과 공급 수준은 모든 사람이 할 수 있는지 여부와 방법을 테스트하는 경계선에 있습니다.""라고 업계 관계자는 퉁명스럽게 말했다.


NVIDIA 창립자 Huang Jenxun 사진 출처 Visual China

향후 3~5년을 더 들여다보면 엔비디아에 대한 새로운 위협이 점차 등장할 것입니다.

GPU 이외의 새로운 AI 칩 아키텍처도 업계에 등장했습니다. 예를 들어 이전에 LPU 아키텍처를 출시한 실리콘 밸리 칩 회사 Groq는 Nvidia의 GPU보다 "10배 더 빠르게" 대규모 언어 모델을 실행한다고 주장합니다.

Nvidia GPU보다 "10배 더 빠르다"고 주장하는 대형 모델 ASIC 칩을 출시한 Silicon Valley 칩 Etched도 있습니다. 이러한 칩 스타트업은 OpenAI와 같은 스타 투자 라인업의 지원을 받습니다.

36Kr은 올해 중국에서 새로운 AI 칩 스타트업이 등장했다는 사실을 알게 되었습니다. 예를 들어, 상하이는 최근 두 개의 새로운 AI 칩 회사를 비밀리에 지원했습니다.

국내 TPU 회사인 Zhonghao Xinying의 CEO인 Yang Gongyifan은 GPU의 전체 트랜지스터 활용률이 20%에 불과하다고 말했습니다. 반면에 TPU 및 ASIC과 같은 새로운 아키텍처는 그다지 다재다능하지 않습니다. , 그들의 트랜지스터 활용률은 60%-100%에 도달할 수 있습니다. "향후 3~5년 내에 국내외 GPU 아키텍처 외부에 수많은 AI 칩이 있을 것입니다."

약간의 변화만으로도 거대한 NVIDIA를 흔들기에 충분합니다.

NVIDIA 직원은 36Kr에 "NVIDIA가 외부에 경쟁자가 없는 것처럼 보인다고 생각하시나요? 실제로는 그렇지 않습니다."라고 말했습니다. Huang Renxun이 자주 말했듯이 "파산까지 30일밖에 남지 않았습니다."

엔비디아는 10년 넘게 준비해오던 중, 오픈AI 같은 천재 기업을 만나 엔비디아의 기적을 공동으로 일으켰다. 과거 반도체 업계에서는 구석구석의 거대 기업을 추월한다는 이야기가 끊이지 않았다.

엔비디아를 포위하고 제압하려는 전쟁의 연기는 이미 점화됐다.