소식

엔비디아의 새로운 칩이 "지연"됐다고?당황하지 마세요. 영향은 그리 크지 않습니다.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

이 글의 저자: 장이판(Zhang Yifan)

편집자: 심쓰치

출처: 하드 AI

Nvidia의 차세대 칩인 Blackwell이 약간의 문제를 겪고 있는 것 같습니다.

8월 1일, 연구 기관 ALETHEIA는 Nvidia의 Blackwell 칩이 지연될 수 있다고 보고했습니다. 이어 8월 2일에는 모건스탠리와 모건스탠리가 각각 분석 보고서를 발표했다. 전반적으로 Blackwell 칩 대기 시간의 영향은 그다지 나쁘지 않습니다.

1. 샤오모의 관점

• 지연 이유:Xiaomo는 세 가지 주요 이유가 있으며 그 중 칩 설계 문제가 핵심 원인이라고 믿습니다.
a. B100/B200 칩 설계 문제
b. CoWoS-L 패키징 수율 문제: 60%에 불과하며 CoWoS-S 수준인 90%보다 훨씬 낮습니다.
c. 시스템 수준의 문제: 가열 및 액체 누출 등
• 공급망 영향:B100의 지연은 한 분기 동안 지속될 것으로 예상되지만 GB200의 배송 시간은 크게 변하지 않습니다.
2. 모건스탠리의 관점
• 지연 이유: Damo는 이것이 지연이 아니라 개선이라고 믿습니다. Nvidia는 "재설계"를 통해 Blackwell의 안정성을 더욱 향상시키기를 희망합니다.
• 다양성:CoWoS-L 패키징 수율 문제로 인해 B200A는 CoWoS-S 패키징으로 전환됩니다.
• 공급망 영향:TSMC에서 블랙웰 생산이 2주 동안 중단됐지만, 4분기 생산능력 확대를 통해 지연을 회복하고 블랙웰은 예정대로 납품할 수 있다.

전반적으로 Nvidia의 칩 지연은 주로 다음 사항에 기인합니다.칩 설계 문제, 낮은 CoWoS-L 패키징 수율 및 시스템 수준 문제(예: 발열, 액체 누출 등)

3. 전문가 해석

주말 동안 Ronghe Semiconductor CEO Wu Zihao는 수년간의 Fab 경험과 공급망 뉴스를 결합하여 "NVIDIA의 차세대 칩 Blackwell 롤오버 프로세스에 대한 완전한 기록"이라는 기사를 작성하여 지연 이유와 롤오버에 미치는 영향을 자세히 설명했습니다. 공급망.

Wu Zihao는 "재설계된" 칩이 다음과 같다고 말했습니다.b102 및 b102는 모든 Blackwell 칩의 기본입니다.

- b102: GPU 다이 1개 + HBM3e 4개로 구성됩니다.
- b100: b102 2개로 구성;
- GB200 마더보드: b100 2개 + Grace CPU 1개로 구성;
- 서버: 마더보드 및 다양한 시스템 수준 액세서리(액체 냉각, 구리 케이블 등)로 구성됩니다.

기본 칩(b102 칩)의 재설계는이는 후속 마더보드, 서버, 심지어 전체 공급 일정에도 영향을 미칠 수 있습니다.

4. 블랙웰 지연 기대

당초 시장에서는 블랙웰이 3분기에 생산을 시작해 4분기에 일괄 출하하고, 2025년 1분기에 공식적으로 서버를 대량 출하할 것으로 예상했다.

Xiaomo와 Wu Zihao 모두 칩 문제가 원래 계획된 3분기 생산 일정에 영향을 미칠 수 있다고 생각하지만, TSMC가 4분기에 생산 능력을 확대함에 따라 3분기 지연은 회복될 수 있습니다. 전체적으로 올해 블랙웰의 출하량은 줄어들겠지만 크게 줄어들지는 않을 것으로 보이며, 2025년 1분기 서버 출하량에는 거의 영향을 미치지 않을 것으로 보인다.

시장 기대와는 다르다는 점은 주목할 만하다. NVIDIA는 1분기 결과 컨퍼런스에서 Blackwell 칩이 2분기에 생산을 시작하고 3분기에 점진적으로 출하량을 늘릴 것이라고 밝혔습니다. 올해 상당한 Blackwell 수익을 창출할 것으로 예상됩니다. Morgan Stanley의 보고서는 또한 이러한 "재설계"가 실제로 지연이 아닌 칩 개선이라고 지적했습니다.

따라서 현재 시장에서는 TSMC의 구체적인 생산 일정 계획에 대해 서로 다른 해석을 하고 있습니다. 생산이 2분기에 시작되어 3분기에 점진적으로 증가한다면 이러한 지연은 실제로 공급망에 어느 정도 영향을 미칠 수 있습니다.

5. 기타 질문

• CoWoS-L 포장 수율 문제: Xiaomo는 CoWoS-L 수율이 60%에 불과하다고 밝혔지만, Wu Zihao와 노무라 연구팀이 확인한 결과 실제 수율은 90%가 넘었습니다. 또한 Nvidia와 같은 Fabless 제조업체는 일반적으로 Plan B를 가지고 있습니다. Damon이 언급했듯이 CoWoS-S 패키징(현재 수율 99%)을 사용하여 CoWoS-L을 대체할 예정이며 이는 서버 출하에 영향을 미치지 않습니다.
• 발열 문제:모건스탠리는 신제품 출시 과정에서 발열, 고전압 등의 문제가 흔히 발생하며, 양산 계획에 큰 영향을 미치지 않을 것으로 보고, 양산은 차질 없이 진행될 것이라고 밝혔다.
• 액체 누출 문제:수냉식 방열판, 분기관, CDU, 퀵커넥터(QCD) 등 수냉식 방열 주요 부품 중 누수 발생 가능성이 가장 높은 부분은 퀵 커넥터에서 발생하며, 실제 도입 이후 구체적인 상황은 더욱 명확해질 것으로 보인다. .
6. 공급망 영향
• 엔비디아: H 시리즈 서버의 출하 피크는 2024년 하반기에 진입할 예정이다. H 시리즈 칩을 탑재한 서버는 올해 엔비디아의 주요 성능 원천이다. Blackwell은 올해 3분기 매출 전망이 없었고, Blackwell 서버 출하량도 4분기에 높지 않았습니다. 서버 출하량은 원래 2025년으로 예정되어 있어 Nvidia의 성능에 대한 전반적인 영향은 거의 없을 것입니다.
• TSMC:당초 올해 양산 예정이었던 CoWoS-L은 2만개(4만개 이상에서 2만개) 수정될 것으로 예상되는데, 이는 TSMC의 4분기나 내년 1분기 실적에 반영될 예정이다.
• 광학 모듈:B100에는 800G 광모듈이 기본 탑재되지만, 서버를 지원하는 광모듈 출하량은 2024~2025년 800G 수요에 영향을 미치지 않을 것으로 보인다.

전반적으로 Nvidia Blackwell 칩 지연은 주로 칩 설계 문제로 인한 것이며 그 영향은 처음 상상했던 것만큼 심각하지 않습니다. 몇 달간 공급망 지연이 있을 것도 아니고, CoWoS-L 패키징 수율도 시장 소문만큼 낮지는 않습니다. Nvidia는 인터뷰에서 다음과 같이 말했습니다. "Blackwell의 샘플 시험이 광범위하게 시작되었으며, 하반기에는 생산량이 증가할 것으로 예상됩니다."