소식

엔비디아의 새로운 AI 칩 출시가 최소 3개월 지연돼 마이크로소프트, 구글, 메타 등 거대 기업들이 영향을 받게 된다.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

하이라이트:

Tencent Technology News, 8월 3일: 외신 보도에 따르면 Nvidia의 최신 인공 지능 칩 프로젝트에 설계 결함이 발생했습니다. 칩 및 서버 하드웨어 생산에 관련된 두 소식통에 따르면 이 사고로 인해 출시 시간이 최소 3일 정도 지연될 것이라고 합니다. 몇 달, 몇 달 또는 그 이상.

이번 변화는 수백억 달러 상당의 칩 시리즈를 선주문한 메타, 구글, 마이크로소프트 등 다수의 주요 고객들에게 영향을 미칠 것으로 예상된다.

마이크로소프트 내부 직원과 이 문제에 정통한 또 다른 사람에 따르면, 엔비디아는 이번 주 최대 고객 중 하나이자 또 다른 주요 클라우드 서비스 제공업체인 마이크로소프트에 블랙웰 시리즈의 최첨단 인공 지능 칩 출시가 지연될 것이라고 통보했습니다. .

Nvidia는 올해 3월 Blackwell 시리즈를 공식 출시했으며 CEO Huang Jenxun은 지난 5월 이 시리즈 칩의 대규모 출하를 연내 달성할 계획이라고 낙관적으로 발표했습니다. 그러나 설계상의 어려움으로 인해 프로세스가 차질을 겪었습니다. Blackwell 칩 생산에 직접 관련된 사람들에 따르면 Nvidia는 칩 제조업체 TSMC와 협력하여 현재의 기술적 장애물을 극복하기 위해 새로운 테스트 생산을 집중적으로 수행하고 있습니다.

이에 따라 블랙웰 칩의 대규모 출하가 내년 1분기로 연기될 것으로 예상된다. 클라우드 서비스 제공업체가 칩을 받으면 대규모 칩 클러스터를 배포하고 활성화하는 데 약 3개월이 추가로 소요된다는 점은 주목할 가치가 있습니다.

설계 및 생산 문제로 인해 Nvidia의 상황에 대한 우려가 높아졌습니다. 특히 미국 법무부가 반경쟁 행위 혐의에 대한 불만 사항을 조사함에 따라 더욱 그렇습니다. 그럼에도 불구하고 Nvidia는 칩의 상당한 성능 이점으로 인해 여전히 업계 선두 위치를 유지하고 있습니다.

주주들은 Blackwell 시리즈에 대해 큰 기대를 갖고 있으며 Keybanc Capital Markets의 분석가들은 이 칩 시리즈가 Nvidia의 데이터 센터 수익을 2024년 475억 달러에서 2025년 2000억 달러 이상으로 끌어올릴 것으로 예상하고 있습니다. Huang Jen-Hsun은 5월 실적 발표에서 "올해 Blackwell이 상당한 수익을 창출하는 것을 목격할 것입니다!"라고 말했습니다.

엔비디아의 인공지능 서버 칩인 그래픽처리장치(GPU)는 오랫동안 대화형 인공지능과 영상 인공지능 분야에서 오픈AI 등 개발자들의 핵심 원동력이 되어왔다. 동시에 이러한 GPU는 Microsoft와 같은 클라우드 서비스 대기업이 다른 개발자에게 칩 리소스를 임대하여 상당한 매출 성장을 달성하는 데 도움이 됩니다.

곧 출시될 인공지능 칩 B100, B200 및 GB200이 최소 3개월 지연될 경우 일부 고객의 배포 계획이 중단되어 2025년 1분기 예정대로 데이터 센터에서 대규모 칩 클러스터를 실행하지 못할 수 있습니다. .

Microsoft, OpenAI 및 Meta와 같은 헤비급 고객은 Nvidia의 새로운 칩을 간절히 기다리고 있으며 이러한 기술을 사용하여 ChatGPT, Meta AI 보조자 및 일련의 혁신적인 자동화의 핵심 소프트웨어인 차세대 대규모 언어 모델을 업그레이드하고 개발하는 것을 목표로 하고 있습니다. 기능.

이들 회사는 복잡한 쿼리에 보다 정확하게 응답하고, 다단계 작업을 자동화하거나, 매우 사실적인 비디오 콘텐츠를 생성하기 위해 소프트웨어 성능의 비약적인 도약을 달성하기 위해 더 많은 컴퓨팅 성능이 필요하다고 강조합니다. 그들은 Nvidia의 차세대 인공 지능 칩, 특히 슈퍼컴퓨터 클러스터에 통합될 때 가져올 수 있는 성능 향상에 대한 높은 기대를 갖고 있습니다.

Nvidia 대변인은 배송 지연과 관련된 진술에 대해 조심스러웠으며, "올해 말에 계획대로 생산 진행이 가속화될 것"이라고만 말했습니다.

마이크로소프트, 구글, 아마존, 메타의 공식 대표자들은 논평을 거부했다. TSMC 대변인은 논평 요청에 응답하지 않았습니다.

Nvidia의 주요 고객이 GB200 칩에 대한 높은 기대를 갖고 야심찬 계획을 가지고 있다는 점은 주목할 가치가 있습니다. 최근 Google, Meta, Microsoft는 데이터 센터 및 인공 지능 칩에 대한 엄청난 투자 증가를 밝혔습니다. 이러한 드문 움직임은 Nvidia의 주가를 일시적으로 상승시켰을 뿐만 아니라 이들 회사의 투자 수익 주기 및 수익 전망에 대한 시장 우려를 불러일으켰습니다. 광범위하게 논의되었습니다.

블랙웰 대규모 주문

칩 생산 분야의 두 소식통에 따르면 Google은 관련 서버 하드웨어를 합하면 400,000개 이상의 GB200 칩을 주문했으며 총 주문 가격은 100억 달러를 훨씬 넘을 수 있지만 구체적인 배송 시기는 아직 불분명합니다. 이와 대조적으로 올해 Google의 칩, 장비 및 자산에 대한 투자는 약 500억 달러로 전년 대비 50% 이상 증가했습니다.

동시에 Meta도 총 수주액이 100억 달러 이상에 달할 것으로 예상되는 등 큰 행보를 보이고 있습니다. Microsoft는 총 주문 규모를 공개하지는 않았지만 최근 몇 주 동안 주문을 20% 증분 조정했습니다. 직접적인 지식을 가진 사람들에 따르면, 마이크로소프트는 2025년 1분기까지 OpenAI에 55,000~65,000개의 GB200 칩을 탑재할 준비를 하고 있습니다.

이 문제에 정통한 소식통에 따르면 마이크로소프트는 당초 블랙웰 기반 서버를 내년 1월까지 오픈AI에 제공할 계획이었지만 지금은 3월이나 초봄으로 조정해야 할 수도 있다고 말했다.

Blackwell 칩 제조 공정에 참여한 두 명의 내부자는 최근 몇 주 동안 칩의 설계 어려움이 나타났으며 TSMC 엔지니어는 대량 생산 준비 단계에서 주요 결함을 발견했다고 말했습니다. 구체적으로 문제는 듀얼 블랙웰 GPU를 연결하는 프로세서 칩에 집중돼 있다. 이 실리콘 부품의 고장은 전체 출력에 직접적인 영향을 미치기 때문에 TSMC가 엔비디아에 공급할 수 있는 칩 수가 제한된다. 이러한 문제로 인해 기업은 생산 활동을 중단하는 경우가 많습니다.

이를 고려하여 NVIDIA는 긴급하게 설계 계획을 조정하고 있으며 대량 생산 프로세스를 시작하기 전에 문제가 해결되었는지 확인하기 위해 TSMC에서 생산 테스트를 다시 실행해야 합니다.

이 문제에 정통한 소식통에 따르면, Nvidia는 현재의 어려움에 대처하고 제품 제공 속도를 높이기 위해 대안으로 단일 Blackwell 칩만 탑재한 버전 출시를 고려하고 있다고 적어도 한 곳의 클라우드 서비스 제공업체에 공개했습니다. .

비정상적인 지연

TSMC는 당초 3분기에 블랙웰 칩의 대량 생산을 시작할 계획이었고, 4분기에는 엔비디아 고객들에게 대량 출하를 시작할 것으로 예상됐다. 다만, 앞으로 새로운 문제가 발생하지 않으면 다음 분기에는 블랙웰 칩의 양산이 4분기까지 지연될 것으로 예상된다.

칩 생산 지연은 드문 일이 아닙니다. 이 문제에 정통한 소식통에 따르면 엔비디아도 2020년 자사의 주력 GPU 초기 버전 출시가 지연됐지만 당시 시장 영향력은 여전히 ​​낮았고 주문에 대한 고객의 기대도 높지 않았기 때문에 데이터센터에 즉각적인 영향을 미쳤다고 합니다. 그리고 칩 투자 수익이 제한되었습니다.

하지만 양산 직전에 중대한 설계 결함이 발견되는 것은 이례적이다. 정상적인 상황에서 칩 설계 팀은 TSMC와 같은 제조업체와 긴밀히 협력하고 대량 주문을 수락하기 전에 제품이 성숙하고 신뢰할 수 있는지 확인하기 위해 여러 차례의 생산 테스트 및 시뮬레이션을 거칩니다.

TSMC 내부 직원에 따르면, 세계 최고의 칩 제조업체인 TSMC는 양산을 앞둔 이 제품을 재설계하기 위해 생산 라인을 중단한 적이 거의 없습니다. GB200 칩의 대규모 생산 계획을 고려하여 TSMC는 생산 자원을 사전 할당했지만 이러한 자원은 문제가 해결될 때까지 유휴 상태로 유지됩니다.

또한 설계 결함은 Nvidia의 NVLink 서버 랙의 생산 및 배송 일정에도 영향을 미쳤습니다. 관련 회사가 랙 설계를 완료하려면 새로운 칩 샘플을 기다려야 하기 때문입니다. (컴파일/황금사슴)