2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
10월 2일 it house 뉴스에 따르면 ming-chi kuo는 어제(10월 1일) 시장 투자 브리핑을 발표했습니다. 고객 맞춤형 요구 사항이 없어 nvidia는 더 이상 gb200(2 nvl36)의 듀얼 캐비닛 버전을 제공하지 않는 것으로 알려졌습니다. ), 단일 캐비닛 버전인 gb200 nvl72만 제공하는 반면, 단일 캐비닛 버전 nvl36은 여전히 원래 개발 및 배송 계획을 유지합니다.
it home은 다음과 같이 ming-chi kuo의 브리핑 정보를 첨부합니다.
결론적으로:
이 문제는 ai와 nvidia의 장기적 긍정적 추세에 영향을 미치지 않지만 단기적으로는 일부 시장 참여자가 nvidia와 공급망의 실행 능력에 의문을 제기하게 할 수 있습니다.
nvidia는 최근 ai 서버 제품 청사진을 자주 수정했습니다. 이는 nvidia가 제한된 리소스 하에서 공급망 실행, 경쟁 우위 및 고객 요구 사이의 더 나은 균형을 달성하기를 원하기 때문이라고 생각합니다(nvl36*2 개발 중단은 하나의 예일 뿐입니다). 이는 좋은 일이며 제품 계획에 대한 nvidia의 보다 실용적인 접근 방식을 나타내지만, 변경 프로세스로 인해 일부 시장 참여자는 공급망 혼란에 대해 혼란을 겪을 수 있습니다.
현재 2025년 blackwell 서버의 제품 출하 구성에 대한 가시성이 낮기 때문에(몇 달 전만 해도 시장은 일반적으로 nvl36, nvl72 및 nvl36*2만 있을 것으로 믿었습니다), 조립 등 일부 공급업체의 2025년 전망 냉각에 큰 영향을 미치게 됩니다.
두 가지 72gpu 버전 비교: nvl72를 선택하고 nvl36을 취소하는 이유*2
개발 자원은 제한되어 있습니다.원래 계획은 gb200 케이스 3개(nvl36, nvl72, nvl36*2)를 동시에 개발하는 것이었습니다. 11월 중순부터 시작되는 개발 버전(development drop: devdrop)은 nvl72와 nvl36*2로 수렴될 것으로 예상됩니다(nvl36은 "이론적으로" 양산 단계에 들어갈 준비가 되어 있기 때문입니다). 2025년 3월 중순까지 완료됩니다. 품질 보증(qa). 그러나 두 가지 72 gpu 버전(nvl72 및 nvl36*2)의 동시 개발은 말할 것도 없고 nvl36 개발에는 여전히 불확실성이 있습니다.
nvl72는 데이터 센터 공간을 절약합니다.nvl72가 사이드카의 방열 설계 문제를 적절하게 해결할 수 있다면 nvl36*2보다 캐비닛이 하나 덜 필요하므로 데이터 센터 공간 효율성이 향상됩니다.
nvl72의 추론 효율성이 더 좋습니다.소프트웨어의 병렬화 가능 설계 덕분에 nvl72와 nvl36*2 사이의 ai llm 교육 결과에는 거의 차이가 없습니다. 그러나 설계 병렬화가 쉽지 않거나 쉽지 않은 추론 프로세스(예: 자기회귀 모델)에서는 nvl72의 성능이 nvl36*2보다 더 쉽게 성능을 발휘합니다.
주요 고객 선호도.예를 들어 microsoft는 nvl36*2보다 nvl72를 선호합니다.
공개적인 약속을 이행하세요. nvidia의 홍보 초점은 항상 nvl72의 단일 캐비닛 버전에 있었습니다. 제한된 자원으로 공개 약속을 이행하기 위해 nvl72의 개발 우선 순위는 nvl36*2보다 높습니다.
nvl72 개발은 전례 없는 기술적 과제에 직면해 있으며 현재 양산 일정 가시성은 여전히 낮습니다.
nvl72 개발의 가장 큰 과제는 주로 132kw의 tdp(열 설계 포인트) 요구 사항에서 비롯됩니다. 이는 역사상 가장 높은 전력 소비 서버이며 nvidia와 공급망은 전례 없는 기술적 문제를 해결하는 데 더 많은 시간이 필요합니다.
tdp는 연속 작동의 평균 전력 소비를 의미합니다. 잘못된 설계로 인해 순간 최대 전력 소비(nvidia에서는 edp(electrical design point)라고 함)가 tdp보다 높아지는 경우 사이드카가 2개 이상 필요할 수 있습니다. 그렇다면 방열 설계의 복잡성과 대량 생산의 어려움이 증가할 뿐만 아니라, 데이터 센터 공간 절약에 대한 nvl72의 장점도 상실됩니다.
사이드카의 또 다른 설계 과제는 접근 온도를 5~10°c 내에서 안정적으로 제어하는 것입니다. 기준이 완화되면 시스템 안정성에 영향을 미칠 수 있습니다.
위에서 언급한 높은 전력 소비 문제에는 사이드카뿐만 아니라 모든 구성 요소 및 시스템 설계도 포함된다는 점에 유의해야 합니다.
최근 공급망 조사에 따르면 nvl72의 대량 생산 일정은 2h25 이후가 아닐 수도 있습니다(nvidia의 낙관적 목표는 1h25임).