소식

실리콘 밸리의 거대 기업이 핵심을 만들고, "티켓"은 20억 달러입니다.

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"Chip Matters"는 Tencent Technology의 반도체 산업 연구 계획으로, 자체 개발한 AI 칩을 개발하는 기술 기업의 논리와 과제에 중점을 둡니다.

저자 Xinchao IC A Niu

편집자 양수

“우리 엔비디아 칩 보유량은 더 이상 따라잡을 수 없습니다.” 한 대형 AI 모델 회사의 CEO는 솔직하게 말했습니다.

수출 규제가 더욱 강화되면서 A800, H800 등 중국산 스페셜 에디션 칩을 구매하기가 어려워졌고, 대신 H20 호환 버전으로 교체되면서 성능이 크게 떨어졌습니다. 세계는 또한 그것을 거세 버전이라고 부릅니다. 그럼에도 불구하고 H20은 올해 10월 미국 상무부의 수출 통제 조항 업데이트로 인해 여전히 수출 통제에 직면할 수 있습니다.

Financial Times는 Nvidia와 가까운 두 명의 익명 소식통을 인용하여 여러 중국 기업이 Nvidia로부터 총 50억 달러에 달하는 칩을 주문했다고 말했습니다. 동시에 일부 국내 칩은 주요 기술 제조업체의 비전 분야에 진입했지만 프로세스, 상호 연결 및 기타 이유로 인해 여전히 성능 및 공급 문제에 격차가 있습니다.

이러한 배경에서 많은 대기업은 자체 연구를 시작했으며 자체 AI 칩 공급의 보안을 보장하기 위해 5nm 및 7nm와 같은 여러 프로세스 노드를 포괄하는 TSMC 현재 칩을 연속적으로 개발했습니다.

수출 통제는 양날의 검과 같아서 컴퓨팅 파워의 목을 막고 NVIDIA의 성장을 제한합니다. 특히 고객 자체 조사의 맥락에서 NVIDIA의 중국 본토 수익은 변동성을 보이기 시작했습니다. 2022회계연도에 중국 고객은 Nvidia 시장 수익의 25%를 기여했지만, 2024회계연도에는 이 비율이 한 자릿수로 떨어졌습니다.

엔비디아의 경우 중국 본토의 파이가 줄어들고 있고, 실리콘 밸리도 변화하고 있습니다. Google, Apple, Meta, Amazon, Tesla 등 주요 고객사는 모두 Nvidia의 칩을 사용하면서 자체 연구를 수행하면서 양방향을 시도하고 있습니다.

중국과 미국의 주요 제조사들이 자체 개발한 칩의 논리는 무엇일까? 홍해에 쏟아지는 기술 기업들은 자체 개발한 칩으로 성공적으로 안착할 수 있을까?

01 경화는 손에 쥐고 있을 때만 안전함을 느낀다

대형 모델과 생성 AI에 대한 현재 열풍 속에서 컴퓨팅 파워 칩은 기술 기업의 손에 있는 경화입니다. CoreChao IC는 "The Sky-high Price H100 Flows" 기사에서 이러한 "컴퓨팅 파워 잡기"의 광기와 긴장을 추적했습니다. 암시장으로".

주요 제조업체가 자체 칩을 개발하는 근본적인 이유는 카드를 손에 쥐는 것입니다.

Qianxin Technology의 Chen Wei 회장에 따르면 주요 제조업체는 공급 보장, 비용 절감, 입찰이라는 세 가지 트럼프 카드를 가지고 있습니다. 일반적으로 말하면 이는 일종의 칩 자율성입니다.

많은 중국의 주요 제조업체, 특히 인터넷 및 인공 지능 전공자에게는 첨단 칩 수출 통제를 배경으로 언제든지 컴퓨팅 파워 공급 감소 위험에 직면해 있습니다. 자체 연구는 컴퓨팅 파워 보안을 보장합니다. 그러나 각 회사에서 개발한 칩은 주로 내부용으로, 사양도 자사 제품에 맞게 맞춤화한 것이지 범용 제품은 아니다.

컴퓨팅 파워를 축적하기 위해 '돈을 태우는' 거대 기업들에게 있어 자기 연구는 비용을 줄이는 방법이다. "물량이 충분히 크고 수요도 충분히 크면 자체 조사를 고려하십시오. 그렇지 않으면 실제로 비용을 절감하지 못할 수도 있습니다."라고 전 TSMC 공장 건설 전문가인 Wu Zihao는 말했습니다.

2021년 머스크는 테슬라의 훈련을 위해 자체 개발한 AI 칩 D1을 탑재한 Dojo 슈퍼컴퓨터를 출시했다.자동 조종 장치 체계. Morgan Stanley의 최신 연구 보고서에 따르면 이 시스템은 Nvidia의 A100과 비교하여 총 65억 달러를 절약합니다.

AI 수요가 증가함에 따라 Cloud Factory의 GPU에 대한 의존도는 CPU의 의존도를 훨씬 초과합니다. 자체 조사는 Cloud Factory가 NVIDIA 주문을 확보하기 위한 입찰 칩이기도 합니다.

Amazon 관계자는 Xinchao IC에 NVIDIA 카드가 저렴하지 않다고 말했습니다. 주요 DSA 제조업체가 자체 개발한 특수 칩을 보유하면 칩 및 특허의 평균 비용을 완전히 줄일 수 있을 뿐만 아니라 NVIDIA와 더 잘 경쟁할 수 있습니다.

공개 정보에 따르면 Amazon은 자체 컴퓨팅 서버, 스토리지 서버 및 라우터를 설계할 뿐만 아니라 자체 서버 칩 Graviton도 개발하고 있습니다.

AWS, 범용 Graviton4 프로세서 출시

The Information에 따르면 Amazon은 Nvidia를 Graviton으로 교체하여 계속해서 가격을 낮추고 있습니다. Graviton 서버를 임대하는 고객은 컴퓨팅 비용을 직접 10%~40% 절감합니다. Nvidia의 관점에서 볼 때, 세계 최대의 클라우드 팩토리 고객인 Amazon을 유지하려면 포커 테이블에 앉아 더 나은 가격을 협상해야 합니다.

"이런 종류의 이익 양보는 때때로 할인에 완전히 반영되지 않을 수도 있지만 배분에는 반영될 수 있습니다."

위에서 언급한 내부자에 따르면, Nvidia가 세계 최고의 현물 제조업체로서 단가에 대해 매우 직관적인 할인을 직접 제공한다면 제품 가격 책정 시스템에 큰 부정적인 영향을 미칠 것이며 제품 가격 보호에 도움이 되지 않을 것입니다. , 상호 연결 장비 업그레이드, SSD 스토리지 업그레이드, 랙 구성 추가 등을 통해 위장한 대규모 고객에게 할인을 제공할 수 있습니다.

용량을 늘리고 최초 권한을 제공하는 보다 일반적인 우대 방법도 있습니다.

선점자 이점을 통해 Amazon은 단기적으로 전체 기계의 가격을 더 높게 설정할 수 있으며, 전체 기계의 프리미엄과 지원 소프트웨어 도구 체인의 유통으로 인한 비용을 "절약"(할인)할 수 있습니다.

일부 주요 제조업체는 공급 보장, 비용 절감 및 입찰 외에도 자체 칩을 개발하여 고유한 경쟁력을 확보하기를 원합니다.

Fengyun Society의 부사장 Chen Jing은 NVIDIA가 판매하는 칩이 일반 컴퓨팅에 적합하고 모든 기능을 갖추고 있지만 상대적으로 가격이 비싸다고 언급했습니다. 그러나 이 경우 일부 고객은 자신의 장점을 강화하기 위해 특정 기능만 필요하다고 말했습니다. , 그들은 자율 학습을 고려할 것입니다.

Chen Jing은 "대규모 모델 추론만 하면 되고 훈련 기능은 필요하지 않습니다. 이 경우 간단한 기능을 갖춘 전용 칩을 설계할 수 있지만 속도는 더 빠르고 가격도 저렴합니다."라고 Chen Jing은 말했습니다. "구글이나 마이크로소프트 같은 대기업은 각자의 소프트웨어와 하드웨어 시스템 사양이 있습니다. 소음을 어떻게 제어하고 어느 정도의 에너지 소비량을 달성해야 하는지. 엔비디아는 그 기준을 충족하지 못할 수도 있습니다. 직접 설계하는 것이 더 편리할 것입니다. "

실리콘 밸리의 거대 기업 중에서 Google은 자체 아키텍처, 비용 및 칩 기술의 차별화에 대해 매우 우려하고 있습니다. 대규모 및 중규모 교육에서 더 나은 비용 효율성을 달성하기 위해 2016년부터 자체 AI 텐서 처리 장치(TPU)를 개발해 왔습니다. 그리고 추론과 성능을 보장합니다.클라우드 컴퓨팅제품의 독창성과 인지도가 향상되었습니다.

구글, 6세대 TPU '트릴리움' 출시

구글이 공개한 4세대 TPU 관련 데이터에 따르면, TPU v4는 같은 크기의 시스템과 비교했을 때 엔비디아 A100보다 효율성은 1.7배, 에너지 절감 효과는 1.9배 더 높다.

위의 사항 외에도 생태학적 관점에서 볼 때 CUDA 독점을 깨야 하는 더 깊은 이유가 있습니다. NVIDIA가 개발한 프로그래밍 언어인 CUDA는 GPU 가격이 "하늘로 올라간" 주된 이유이며 고객은 이를 받아들여야 합니다.

클라우드 공장이 자체 조사를 하지 않으면 좋은 주문 가격을 얻을 수 있더라도 데이터 센터 프로세서의 95% 이상이 여전히 NVIDIA GPU를 사용하고 전체 클라우드 AI 수요는 여전히 CUDA에 의존할 것입니다. 생태계. 최종 분석에서 Nvidia의 운명은 Nvidia의 손에 달려 있습니다.

Cloud Factory는 데이터 센터에 자체 개발한 칩을 장착하고 고객이 자체 생태계로 마이그레이션할 수 있도록 다양한 기본 미들웨어 및 바이너리 번역 기능을 개발함에 따라 CUDA 프로그램과의 동등한 호환성을 더 높이게 되며 독점적 의존도는 점차 감소할 것입니다.

이 문제에 정통한 관계자는 "이것이 모든 클라우드 팩토리가 하고 있는 일이다. 프로세서가 전체 데이터센터의 4% 미만을 차지하더라도 여전히 이를 고집해야 한다"고 말했다.

02 사람 돈 있으면 끝내자

"사람, 돈, 사물이 있고 동시에 미래의 가능성도 있기 때문에 끝낼 수 있다."

 

Legend Holdings의 Yu Hao 부사장은 칩에 대한 자체 연구를 수행하는 대규모 제조업체의 논리가 상대적으로 원활하며 이는 분명한 이점이라고 믿습니다.

“'사람'은 칩의 전 생애주기에 걸쳐 실무 경험을 갖춘 '인재'가 되어야 하고, '돈'은 컴퓨팅 파워 사업을 기반으로 지속적으로 수익을 창출하는 '살아있는 돈'이어야 합니다. 제조업체는 AI 비즈니스 폐쇄 루프에 의존하여 미래 전망을 조사할 수 있으며, 예상되는 시장 성장에 따라 컴퓨팅 성능에 대한 수요가 정량화되었으며, 사람과 돈의 전략적 조정이 완료되었으며 자체 개발된 칩이 있습니다. 자연스럽게 왔다”고 Yu Hao는 Xinchao IC에 말했다.

그러나 자체 개발한 포커 테이블에 앉기 위한 입장료는 최소 20억 달러부터 시작됩니다. 올해 초에는오픈AI CEO인 샘 알트만(Sam Altman)은 칩 제조를 위해 7조 달러를 모금하겠다는 미친 계획이 있다는 소문까지 돌았지만, 관련자는 나중에 이 소문을 부인했습니다.

이 문제에 정통한 관계자에 따르면, "7나노미터 중간 노드를 기준으로 계산하면 각 회사가 1세대 제품을 반복하여 대량 생산을 늘리려면 최소 20억 달러의 비용이 듭니다."

또한, 자체 개발한 칩은 대부분 자체적으로 사용하기 위한 것이므로 생태계 구축의 어려움을 고려할 필요가 없습니다. Ran Ciyuan은 Sky Eagle Capital의 파트너의 말을 인용하여 다음과 같이 말했습니다. "특수 목적 칩의 아키텍처 설계는 일반적으로 특별히 복잡할 필요가 없으며 애플리케이션 특성도 매우 명확하며 개발이 상대적으로 빠릅니다. 따라서 많은 인터넷에서 회사의 특수 목적 칩 개발은 명확한 시나리오에 따라 이루어지기 때문에 소프트웨어 생태계를 개발하는 데 너무 많은 돈과 시간을 소비할 필요가 없으며 프로세스 IP도 성숙합니다.”

이론은 효과가 있지만 어떻게 자율 학습을 성공적으로 수행할 수 있습니까?

업계 지식에 따르면 칩 자체 연구는 프런트엔드 부분과 백엔드 부분으로 나눌 수 있습니다. 프런트엔드는 칩의 가장 기본적인 기능인 논리적 설계이며, 백엔드는 모든 기능을 회로에 구현하고 테이프로 묶는 개체입니다.

자체 개발 칩 공정 모식도

일반적으로 소규모 팀이 독립적으로 완료할 수 있는 유일한 설계는 로직 칩의 프런트엔드와 백엔드 및 소프트웨어 툴 체인 자체뿐이지만, 그럼에도 불구하고 자체 개발한 전용 회로는 5%에 불과한 설계가 많습니다.

앞서 언급한 이 문제에 정통한 관계자는 “시장의 1/5는 모두가 스스로 하고 나머지 4/5는 남에게 하라고 한다. 이는 꽤 성숙한 생태계다. 나쁜 채널이 있고 일부는 ARM과 같은 IP 설계 제조업체의 라이센스와 같은 규정 준수 채널을 통해 이루어집니다.”

실제로 많은 팀의 경우 일부 회로를 독립적으로 설계할 수 있는 능력을 갖추고 있지만 지적재산권 보호가 매우 엄격한 IP를 극복해야 하기 때문에 만들어도 컴퓨터 아키텍처를 위반할 가능성이 높아 사용할 수 없거나 다른 사람의 IP를 침해하더라도 이는 국내 제조업체가 자체 칩을 개발할 때 직면하는 첫 번째 장애물이기도 합니다.

NOC(Network on Chip)의 일부 매우 어려운 구조와 같이 자체 연구팀이 설계할 수 없는 것들도 있습니다.

디자인은 자체 개발한 칩의 일부일 뿐이며, 테이프아웃, 양산 등도 포함됩니다. 그 과정에서 테이프아웃 불량, 양산 능력 등 다양한 문제가 발생할 수 있지만 이는 자체 문제가 아닙니다. - 결국에는 산업 체인의 통합을 구현하는 방법을 포함하여 일련의 지원 문제를 해결해야 합니다.

외부 세계의 관점에서 볼 때 전용 로직 칩은 약 500mm²이고 범용 GPU는 800mm²가 될 수 있으며, 수백억 또는 수천억 개의 트랜지스터를 포함하며 그 기능 중 일부는 벡터 계산에 사용되며 벡터 프로세서로 간주되지만 애플리케이션 시나리오에서 구현하려면 스토리지, 에너지 소비 제어, 전원 공급 장치 및 전체 기계 작동 조건의 설계 및 구현도 필요하며 더 큰 클러스터를 형성해야 합니다.

또한 제품의 궁극적인 목표는 차별화를 만드는 것인데, 이는 주변 인터페이스와 전체 기계에서 이루어져야 하며, 업계에서는 일반적으로 저장 공간, 에너지 소비 및 면적 효율성을 관점에서 비교합니다. 전체 기계.

즉, 자체 개발 칩은 산업 체인 통합 및 IP 문제 외에도 제품 SKU도 고려해야 합니다. 로직 칩을 설계하는 것만으로는 충분하지 않습니다.

익명을 요구한 한 고위 관계자는 Xinchao IC에 "많은 국내 기업들이 제품 설계 능력이 없다. 칩을 만든 후 테스트를 위해 여러 곳으로 이동해야 한다. 그들의 엔지니어와 비즈니스 BD는 인스퍼(Inspur), 수곤(Sugon) 등에 주둔하고 있다"고 말했다. 주요 제조업체의 데이터 센터는 상대방이 자체적으로 새 서버 마더보드에 소켓을 남겨둘 수 있기를 바랍니다. 그러나 실제로는 성공 사례가 거의 없습니다.

대량 생산은 설계, 테이프아웃, 제품화 외에 또 다른 과제입니다. 소규모 팀은 생산 능력을 예약할 수 있는지 여부를 고려해야 합니까?

"생산량은 Fab 공장에 있어 항상 매우 중요한 수치입니다." 전 TSMC 공장 건설 전문가인 Wu Zihao는 제조업체가 어떤 링크에 들어가고 얼마나 많은 생산량을 약속하는지 파악해야 한다고 말했습니다.

일류 제조사들은 기본적으로 DTCO(Design Technology Collaborative Optimization) 단계에서 팹(Fab) 공장의 최신 생산능력을 예약해 왔다. 현재 ARM 등 세계 최고의 디자인팀들이 TSMC를 비롯해 매년 수많은 인력을 배치하고 있다. 많은 EDA 제조업체.

DTC는 3nm 노드에서 합리적인 레이아웃 설계를 통해 얼마나 비용을 절감할 수 있는지, 얼마나 성능을 향상시킬 수 있는지 등 특정 노드에서 차세대 프로세서의 성능 지표를 결정합니다.

"NVIDIA와 Apple은 항상 가장 진보된 제조 공정을 테스트할 의향이 있습니다. TSMC가 최첨단 제조 공정을 제시하는 한, 수율을 알 수 없고 성능 향상도 알 수 없는 경우, 즉 경제 모델이 성공하기 전에 계산해 보면 그들은 이미 생산 능력을 예약하고 있을 것입니다. Fab 공장과의 DTCO 공동 설계는 일류 제조업체가 생산 능력을 확보하는 근본적인 이유입니다."라고 Wu Zihao는 말했습니다.

처음부터 협업적인 설계가 없다면 Fab 공장과 Fabless 팀인 Party A와 Party B는 역할을 바꿔야 할 것입니다. 아무도 감히 사용하지 않기 때문에 Fab 공장은 조금씩 새로운 프로세스를 홍보할 수 있을 뿐입니다. , 가장 위험이 낮은 프로세스부터 시작합니다.

예를 들어, 채굴기 칩은 구조가 매우 간단하고 크기가 매우 작아 초기 테스트에 매우 적합합니다. 삼성의 3nm 칩의 첫 번째 고객은 중국의 채굴 장비 공장이었습니다.

Wu Zihao는 "Fab 공장이 이렇게 적은 고객 주문으로 물 테스트를 성공적으로 마친 후 PC CPU, 휴대폰 칩, 최종적으로 AI 칩을 단계별로 대량 생산할 수 있습니다."라고 말했습니다.

현재 국내 주요 제조업체들은 자체 개발 칩에 최소 수십억 달러를 투자했습니다. 스타트업 기업이 게임에 뛰어들려면 충분한 초기 고객을 확보하거나 칩 적응과 시행착오를 지원할 수 있는 애플리케이션 플랫폼을 갖추고 있거나, 충분한 자본금이나 탄탄한 자금 조달 능력을 갖춰야 한다. 만나다.

Chen Wei는 Xinchao IC에 저비용 인력 보유가 없는 상업 회사이고 학교나 연구 기관에 의존하지 않는 경우 대량 생산 전에 5억 위안에서 10억 위안 이상의 자금 조달이 필요하다고 말했습니다. 연구소나 연구기관인 경우, 기타 지원을 받으면 인건비를 많이 줄일 수 있고, 금전적 기준도 조금 낮출 수 있습니다.

"그렇게 많은 돈은 없지만 이 스타트업이 매우 강력한 비용 관리 능력을 갖추고 있다면 업스트림 및 다운스트림 협업을 최대한 활용하여 비용을 절감할 수 있습니다. 모든 것은 제품 연구 및 개발의 지속을 보장하는 것입니다."

팹 선택 우선 순위에 대해 정통한 소식통에 따르면 스타트업은 처음에는 TSMC의 생산 능력을 주문하고 그 다음으로 GlobalFoundries를 주문할 것이지만 GlobalFoundries는 고급 프로세스와 패키징을 갖추고 있지 않으며 SMIC로 전환할 것이지만 SMIC All 국제적으로 예약할 수 있는 생산 능력은 다음 해로 예정되어 있습니다.

이러한 상황에 대해 투자 기관은 장기적인 관점을 취합니다.

Yu Hao는 국내 자체 개발한 고급 칩만으로는 단기적으로 테이프아웃 병목 현상이 불가피하다고 말했습니다. 장기적으로는 SMIC로 대표되는 첨단 공정 라인 연마의 진화 속도와 생산 능력 확장에 달려 있습니다. 주로 내부 순환에 의존합니다. 그러나 고급 칩 설계 역량을 갖춘 제조업체는 해외 진출을 고려하고 외부 순환을 통해 내부 순환을 추진하는 것이 더 밝은 미래를 열어줄 것입니다.

03 엔비디아의 '무덤'이 되기는 쉽지 않다

오래된 고객은 자신의 사업을 시작하고 항상 상처를 받는 사람은 Nvidia입니다.

이러한 자기 연구의 세계적인 물결은 이전보다 더 많이 폭발하고 있습니다. Google TPU, Amazon Graviton 등 성숙한 자체 연구 결과 외에도 최근 "세계 최초의 트랜스포머 전용 AI 칩 소후(Sohu)"로 기술계 전체가 타격을 입었다.

미국 칩 스타트업 Etched, Transformer 전용 AI 칩 Sohu 출시

이 칩은 트랜스포머(Transformer) 아키텍처를 칩에 직접 내장해 GPU 등 일반 인공지능 칩보다 추론 성능이 10배 이상 강력하다고 한다. 올해 3월. 8개의 Sohu 칩을 탑재한 서버는 160개의 H100 GPU 클러스터와 비슷한 성능을 가지며 초당 최대 500,000개의 Llama 7B 토큰을 처리할 수 있다는 소문이 있습니다.

'인기 치킨'이 탄생했고, 팹팩토리와 파트너들은 기뻐했다.

이 회사는 Sohu 칩 생산을 위해 TSMC 4nm 공정과 직접 협력했으며 상위 공급업체로부터 충분한 HBM 및 서버 공급품을 확보한 것으로 알려졌습니다. 일부 초기 고객은 이미 회사로부터 수천만 달러의 하드웨어를 예약했습니다. 네티즌들은 Etched에게 "Nvidia's Gravedigger"라는 별명을 붙였습니다.

하지만 연기로 인해 엔비디아의 '자체 연구' 신화가 깨질까요? 실제로는 그렇지 않습니다.

반도체 업계에는 유명한 "미스터 벤 사이클(Mr. Ben Cycle)"이 있습니다. 칩 유형은 일반화와 맞춤화 사이에서 정기적으로 진화합니다. 특정 기간에는 일반 구조가 가장 잘 팔리고 사용자들 사이에서 인기를 얻습니다. 그러나 특정 단계에 도달한 후에는 환영합니다. , 범용 구조는 특정 요구에 대응하는 데 뒤쳐지고 특수 목적 구조가 대중화될 것입니다.

그리고 NVIDIA는 여전히 정점에 있는 유니버설 아키텍처 시대를 정당하게 대표합니다.

Wells Fargo의 통계에 따르면 NVIDIA는 현재 전 세계 데이터센터 AI 가속화 시장의 98%를 점유하며 절대적인 지배적 위치에 있습니다. 이는 전 세계 인구의 98%가 NVIDIA의 CUDA C를 사용하여 모든 GPU의 성능을 "압박"하고 있으며 나머지 2%-3%의 사람들만이 여전히 나쁜 "해머"를 사용하여 동일한 성능을 발휘한다고 주장한다는 의미입니다. "못".

"이제 Amazon이든 Intel이든, 스스로 만드는 프로세서는 클라우드 공급업체의 이익 극대화를 경제적으로 충족할 수 없으므로 언젠가 NVIDIA가 우위를 완전히 잃을 때까지 NVIDIA 칩을 계속해서 대량으로 사용할 것입니다. 이 문제에 정통한 사람은 축산 전문화에 대해 말했다.

그러나 누워있는 것은 엔비디아의 성격과 맞지 않습니다. 황런순은 1년 전 국립대만대학 연설에서 "슬픔 속에 태어나 행복 속에 죽는다"는 것을 아는 사람이다. , 아님 남들에게 먹이로 이용당할 때 자신이 어떤 상황에 처해 있는지도 모르고 무슨 일이 있어도 계속 달려가는 경우가 많다.”

이번에는 실리콘 밸리 전체에서 자체 연구에 도전하는 엔비디아도 카드를 사용하고 있습니다.

앞서 언급한 고위 관계자는 Xinchao IC에 "Nvidia는 더 이상 범용 GPU가 아닙니다. GPU 유닛에는 행렬 계산을 해결하기 위한 수많은 Tensor 코어를 볼 수 있습니다. 또한 Transformer 엔진, 희소화도 볼 수 있습니다. 엔진 등 하드웨어 구조나 하드웨어 운영자 업데이트 측면에서 NVIDIA는 매년 DSA 기반 디자인 트렌드를 향해 나아가고 있습니다.”

DSA(도메인 특정 아키텍처)는 특정 분야에 맞게 맞춤화된 프로그래밍 가능한 프로세서 아키텍처로, 특정 애플리케이션의 성능과 비용 효율성을 최적화할 수 있습니다. 현재 Google, Tesla, OpenAI 및 Cerebras는 모두 특정 애플리케이션을 위한 자체 DSA 칩을 출시했습니다.

이 문제에 정통한 소식통에 따르면 모든 DSA 제조업체는 Nvidia가 하드웨어를 수정하지 않고 범용 GPU가 한 명의 연산자만 업데이트하더라도 DSA 제조업체의 장점이 완전히 사라진다는 사실을 알게 될 것입니다. NVIDIA에 비하면 로직 칩 면적도 부족할 뿐만 아니라, 장치 용량과 속도도 부족하고, 컴퓨팅 성능도 NVIDIA만큼 좋지 않으며, 소프트웨어 적응성도 부족한 것 같습니다. 모든 DSA 제조업체가 직면한 문제 - Muben 사이클은 원래 DSA 도메인별 아키텍처 및 사용자 정의로 전환할 예정이었지만 이제는 범용 프로세서 시대로 돌아왔습니다.

Nvidia는 DSA 제조업체와 함께 '거울을 들여다보는 것' 외에도 자체 연구로 올리브 가지를 확장했습니다. 2024년 초에는 반도체 베테랑인 Dina McKinney가 이끄는 클라우드 컴퓨팅, 5G 통신을 위한 새로운 사업 부서를 설립했습니다. , 게임 등 다양한 분야의 고객을 위한 맞춤형 칩을 제작합니다.

로이터 통신은 엔비디아 경영진이 아마존, 메타, 마이크로소프트, 구글, 오픈AI 대표자들과 만나 맞춤형 칩에 대해 논의했다고 전했다. 및 비디오 게임 클라이언트.

앞서 Nintendo가 올해 출시한 Nintendo Switch 게임 콘솔의 새 버전에는 NVIDIA의 맞춤형 칩이 탑재될 가능성이 높다고 보도된 바 있습니다. NVIDIA도 휴대용 시장에서 확고한 입지를 확보하고 있으며 Tegra 시리즈 모바일 칩을 출시했습니다. 이 칩 시리즈는 결국 모바일 기기 시장에서 자리를 차지하지 못했습니다.

비용 효율성이 지배하는 시장에서 Nvidia의 무덤 파는 사람이 되기는 쉽지 않습니다. 이전의 무덤 파는 사람들은 대부분 실패했습니다. 결국 인수될 수 있습니다. 예를 들어 Intel과 Google은 많은 스타트업을 인수했지만 대부분의 다른 회사는 인수를 기다리지도 않고 직접 사망했습니다.

아마도 스타트업이 관점을 바꾸면 성공하기가 더 쉬울 것입니다.

"예를 들어 AI 프로세서 자체에 집착하지 마세요. DSA의 이상을 실현하기 위해 많은 시간을 들이는 대신 시스템 수준의 솔루션을 고려하는 것이 좋습니다. 예를 들어 주변 장치를 만들 수 있습니다. 이 문제에 정통한 관계자는 “AI 프로세서와 전문 스토리지에 대한 서비스를 제공하면 전문 센서도 같은 목적을 달성할 수 있다”고 말했다.

2019년에 Nvidia는 Mellanox를 69억 달러에 인수하겠다고 발표했습니다. 이 가치는 너무 높아서 Nvidia는 전체 현금 흐름을 거의 초과했습니다.

이 회사는 포트나 광전지 모듈을 개발하지 않으며 스위치 자체도 개발하지 않습니다. 스위치 하단 레이어와 통신 하단 레이어 사이의 고속 상호 연결을 위한 PHY "InfiniBand"라는 제품 하나만 만듭니다. 당시 서버 상호 연결의 한계를 극복하고자 했던 Nvidia에게 이는 매우 핵심적인 주변 장치 요구 사항이었습니다. 당시 NVLink가 아무리 훌륭하더라도 항상 단일 시스템 주위에 잠겨 있었습니다. 그러나 InfiniBand를 사용하면 스위치가 서버 간의 상호 연결 병목 현상을 극복하고 모든 GPU를 대규모 클러스터로 상호 연결할 수 있습니다.

현재 상황을 보면 국내 경기가 호황을 누리고 있어 당분간 자체 개발 칩의 총알이 날아가야 할 것으로 보인다. Chen Wei는 게임을 만드는 것이 나쁜 것은 아니지만, 산업 발전의 중요한 기간을 놓치지 않으려면 고급 게임을 만드는 것이 필요하다고 믿습니다.

Unfinished Research의 창립자인 Zhou Jiangong은 미래의 애플리케이션에는 최첨단 기본 대형 모델에 대한 수요를 초과하는 전문적이고 맞춤형이며 소형화된 AI 칩이 필요할 것이라고 믿습니다. 오픈 소스 교육, 더 저렴한 비용으로 더 작은 모델, 큰 모델을 미세 조정하고 정제하는 것, 추론 등 모두 자체 개발 칩을 위한 넓은 공간을 제공합니다. 더욱이, 신기술의 급속한 변화와 미성숙 단계에서는 위의 응용 분야를 중심으로 많은 자기 연구 기회가 있을 것입니다.

"Nvidia를 끝내는 일을 하지 말고, Nvidia 외에 더 많은 일을 하십시오."