Новости

Нвидиа на поле бомбардировки сама "взорвалась"?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Автор — Лесли Ву, бывший эксперт по строительству завода TSMC (публичный аккаунт: Цзихао Танксин)

Редактор Су Ян

NVIDIA, которая часто бомбит рынок, не смогла удержать рыночную стоимость в 3 триллиона долларов США.

19 июня по пекинскому времени рыночная стоимость Nvidia достигла 3,335 триллиона долларов США, одним махом превзойдя Microsoft и Apple и став номером один в мире. После этого важного момента рыночная стоимость Nvidia начала снижаться. По состоянию на закрытие торгов 2 августа рыночная стоимость Nvidia сократилась на 26%.

До этого некоторые аналитики призывали инвесторов «нажать на тормоза». Газета Daily Economic News процитировала аналитика инвестиционного банка DA Davidson Джила Луриа, который заявил, что рекордные показатели Nvidia достигли 26 миллиардов долларов США, что обусловлено расходами крупнейших клиентов на продукты графических процессоров. Он полагает, что эта тенденция пошатнется в будущем, а также ценой акций Nvidia. Двузначное снижение произойдет в течение 18 месяцев.

По мнению таких аналитиков, как Гиль Лурия,Топ-клиенты передумали, а собственные «ошибки» Nvidia также дали клиентам возможность изменить свое мнение, а конкурентам — отрезать их. Все начинается с негативных слухов об архитектурных чипах Blackwell, в том числе о низких показателях доходности CoWoS. Ключевые проблемы, такие как отказ от SKU B100, задержки поставок B200 и повторная запись на пленку.

Судя по тому, что мы узнали внутри TSMC,Новость о том, что чип Nvidia Blackwell перезаписывается, действительно верна, но в основном речь идет о базовых чипах серии B100.Проблема заключается в базовой стандартной ячейке (стандартной ячейке).—— Это заранее разработанный стандартный модуль схемы с определенными функциями и размерами. Если понимать конструкцию микросхемы как строительные блоки, то стандартная единица — это наименьшая единица из строительных блоков——В условиях высокого давления могут возникнуть ненормальные условия труда., проблемы на данный момент обнаружены, и маску необходимо открыть заново.

Однако общее время производства пластин не может быть сокращено. К счастью, в 2024 году будут отгружены только небольшие партии, а это не время отгрузки серверов Blackwell. Производственные мощности будут расширены до конца этого года. для отправки небольшими партиями По моему личному опыту, TSMC не составляет труда восстановить прогресс.

01 Уровень доходности, который берет на себя вину за задержку поставок

Отказ от B100, задержка поставки B200 и повторной серии — это одностороннее понимание «случайного отскока» чипа Blackwell, связанного со сложным наименованием Nvidia.

Серия чипов Blackwell включает в себя два основных чипа: B100 и B102. Все эти SKU, включая B200GB200, используют чиплетные решения на основе серии B100, а B200A основан на B102.

Чтобы облегчить понимание, мы составили таблицу для всех. Вы можете сравнить базовые чипы B102 и B100, а также соответствующие SKU серверов. Серверы для разных приложений также можно объединять в большее количество стилей, например HGX B200A/HGX. B200/NVL36/ Модель 72 – это даже версия NVL8 или GB210A с воздушным охлаждением.

Названия чипов Blackwell и различных SKU сбивают с толку посторонних, и это понятно, но«Доходность CoWoS составляет всего 66%, а из одной пластины можно вырезать только 10 хороших плашек». Это утверждение противоречит здравому смыслу.

Мы можем кратко поговорить о понятии «выход» на переднем и последнем этапах производства пластин.

Для кристаллов внешнего графического процессора, таких как Apple, Qualcomm и AMD, Nvidia на этот раз использует процесс N4P, который является очень зрелым, поэтому нет необходимости беспокоиться о доходности.

Внутренняя часть упаковки, особенно часть «oS» CoWoS, включает не только кристалл графического процессора, но и память HBM, и стоимость 8 блоков HBM очень высока. Если кристалл графического процессора выйдет из строя, весь пакет станет пустой тратой. кусок.Следовательно, невозможно запланировать производство, если уровень доходности ниже 80%, иначе затраты будут бесконечно увеличены, и валовая прибыль не может быть гарантирована. Если уровень доходности составляет 66%, производство вообще не будет запланировано.

Что касается риска ненормальной производительности в производственном процессе, ни NVIDIA, ни Apple, будучи фабрикой Fabless, не могут делать ставку на новые решения для всех продуктов. Если с новым решением возникнет проблема, все поколение продуктов может быть списано. . Этот риск слишком велик, поэтому при размещении заказа одновременно должны быть доступны альтернативы. Другими словами, даже если возникнет проблема с выходом CoWoS-L, на поставках чипов Blackwell это не отразится.

Позвольте мне привести вам пример: если Apple захочет использовать новый 2-нм техпроцесс TSMC для своего чипа A18 в следующем году, она обязательно одновременно разработает технологическое решение N3P, чтобы гарантировать, что «ничего не потеряно». Естественно, Nvidia сделает это. такой же.

По полученным данным, Blackwell использует упаковку CoWoS-L, и текущая доходность составляет около 90%. И он продолжает расти, что согласуется с мнением команды Nomura, которая проводит наиболее тщательные исследования CoWoS в отрасли. Кроме того, TSMC ожидала, что доходность CoWoS-L в начале года составит 95%. По сравнению с 99% доходностью продуктов H200 и H100 с использованием упаковки CoWoS-S, 90%, естественно, являются плохим показателем, но для новый процесс, едва приемлемый.

Таким образом, текущая доходность CoWoS-L действительно не так хороша, как ожидалось, ноКристаллу внешнего графического процессора необходимо изменить конструкцию маски из-за стандартных проблем с блоком, в результате чего чип Blackwell не может производиться бесперебойно, что косвенно приводит к остановке производственных мощностей CoWoS-L на внутреннем сервере. , существуют серьезные отклонения в доходности CoWoS-L. Утверждение о том, что чипы Backwell не могут поставляться гладко, противоречит фактам и здравому смыслу.

Фактически, до проблемы с повторным кремнием базового чипа серии B100 Nvidia уже внесла коррективы из-за проблемы с выходом CoWoS-L менее 95%. На B200A, использующем базовый чип B102, он был заменен на CoWoS-L. S Что касается упаковки, первоначальный план заключался в том, чтобы разделить нагрузку производственных мощностей CoWoS-L и обеспечить выпуск большего количества чипов Blackwell в 2025 году. Теперь эта корректировка также может помочь Nvidia решить проблему задержки графика, вызванную проблемами конструкции кристалла графического процессора, и может Также помогите увеличить общий объем поставок чипов Blackwell в 2025 году.

02 Кто зажимает «шею» Nvidia?

В прошлом было много дискуссий о том, что NVIDIA застряла в шее вычислительной мощности, но собственная «шея» NVIDIA зажата более крупными компаниями, такими как HBM Memory.

Следует сказать, что поставки модулей быстрого подключения HBM и QCD с жидкостным охлаждением в настоящее время относительно ограничены, ноДефицит поставок не приведет к задержке поставок, а в лучшем случае приведет к их сокращению., и технология этих деталей, которых на данном этапе не хватает, по-прежнему гарантирована. Например, компания Samsung решила присоединиться к системе поставщиков HBM NVIDIA.

Что действительно повлияет на поставки чипов Blackwell, так это последующее производство различных серверов.

Согласно новостям из отраслевой цепочки, в настоящее время в стадию производства выходят не только чипы, но и компоненты плат, коммутационное оборудование, стойки, решения для охлаждения и т. д.

При расширении от шкафа на 8 карт до шкафа на 72 карты необходимо учитывать множество вопросов, включая конвергенцию пропускной способности сети и оптимальные условия работы различных параллельных стратегий (сегментация данных модели, сегментированные вычисления, копирование и реорганизация) в целом. шкаф и т.п. . Кроме того, поскольку поддонов больше, плотность выше и компактнее, сложные проблемы, такие как количество внутренней проводки, высокая скорость переключения и рассеивание тепла, означают, что стеллаж также необходимо перепроектировать, и все они должны быть проверены. сейчас.

Поскольку сервер NVL36/72 представляет собой совершенно новое техническое решение, совершенствование всех подсистем и интеграция также являются одним из рисков. В прошлом внимание внешнего мира уделялось производительности. Фактически, высокая зрелость и надежность. всей системы также являются основой качества продукции этого поколения.

Для серии GB200, в которой для отвода тепла используется водяное охлаждение, необходимо также учитывать проблему утечки жидкости, которая в основном затрагивает три компонента: пластину водяного охлаждения, патрубок, распределитель жидкостного охлаждения CDU и быстроразъемный соединитель QCD. , быстрые разъемы наиболее подвержены утечкам, поэтому утечка Это также самая неприятная проблема для производителей серверов. Ее качество является наиболее важным и напрямую связано с разделением обязанностей. Обычно,В случае утечки Nvidia сначала выплатит компенсацию клиенту, а затем предъявит претензии производителям систем, таким как Hon Hai и Quanta. Серверная стойка AI может легко стоить миллионы долларов. Компенсация утечки Liquid может привести к банкротству малого бизнеса.

Судя по полученным нами новостям, такие производители систем, как Nvidia, Hon Hai и Quanta, все еще тестируют систему отвода тепла с водяным охлаждением и еще не внедрили ее в больших количествах.

Как упоминалось ранее, независимо от того, является ли это заводом по производству микросхем, заводом по производству систем или заводом по производству теплоотводов, ни один производитель не готов легко пойти на этот риск, столкнувшись с компенсацией в миллионы долларов. морская свинка», прежде чем они смогут быть реализованы в больших масштабах.

03 «Перевернется» ли Nvidia?

В начале статьи мы упоминали, что рыночная стоимость Nvidia упала с исторического максимума в более чем 3,3 триллиона долларов США до текущих 2,6 триллиона долларов США, то есть падение более чем на 26%. На момент публикации отчета Nvidia за первый квартал. уверенно ожидала операционные результаты второго квартала и собрала 28 миллиардов долларов США, а погрешность находилась в пределах ±2%.

Теперь из-за проблем с конструкцией кристалла графического процессора процент выхода упаковки CoWoS составляет менее 95%, а различные решения для серверных технологий еще не доработаны, что повлияет на бесперебойную поставку чипов Blackwell. Будут ли эти проблемы развиваться дальше и ударить Nvidia. из 2 Список с рыночной капитализацией в триллионы долларов?

Можно сказать, что в краткосрочной перспективе больших проблем не будет, главноеМелкосерийное производство чипов Blackwell запланировано на третий квартал и не будет увеличиваться до четвертого квартала, и это всего лишь ритм производственного графика TSMC. После завершения производства кристалла графического процессора следующим шагом будет возвращение. -конец CoWoS, а затем фабрика Bumping Наконец, мы поехали на заводы систем, такие как Industrial Fii и Wistron, для сборки., а затем завершить поставку серверов и внедрение производительности.

Короче говоря, на доходы Nvidia влияют поставки серверов, а не поставки чипов TSMC.

Согласно текущему ритмуДругими словами, Nvidia не добьется большого роста бизнеса по чипам Blackwell до первого квартала следующего года.Другими словами, этот чип не принесет Nvidia большого дохода до следующего года. Это также разумное ожидание исходного рынка и не отразится на результатах второго или даже третьего квартала.

Для Nvidia подходящее время для обнаружения проблем проектирования в третьем квартале, поиска решений и последующего запуска супергорячего запуска в TSMC все еще приходится на середину-конец четвертого квартала, вероятно, между ноябрем и декабрем, в эту часть года. Планируется, что сама производственная мощность будет завершена, и производство может быть продолжено через 3 месяца. Более того, TSMC, независимо от N4P или CoWoS-S/L, имеет больше производственных мощностей, чем сейчас, и увеличила коэффициент использования до. 120% справиться с конструктивными дефектами. Проблема, вызвавшая задержки поставок чипов, которые изначально планировалось отгружать небольшими партиями в третьем квартале, в принципе не была большой проблемой.В годовом исчислении поставки Blackwell хоть и будут меньше в этом году, но не намного меньше.

Для NVIDIA и всей цепочки переработки и переработки теперь выявлены проблемы с чипами, и различные подсистемы сервера также необходимо тестировать в различных реальных средах одновременно. Более оптимистично то, что производимые в настоящее время чипы будут иметь проблемы только в определенных высоковольтных средах. Эти чипы могут быть переданы производителям серверных систем, таким как Hon Hai, для различных настроек и испытаний. остаются такими же, как и раньше, есть еще полгода, чтобы получить чипы для моделирования испытаний в различных средах, а окончательный срок крупномасштабной поставки придется на февраль-март 2025 года.

Судя по текущей ситуации, во втором квартале на фоне паводковых поставок H200 показатели, скорее всего, будут соответствовать прогнозу и превысят ожидания. При этом основной выручкой в ​​2023 году станет серия H200. Как говорилось ранее. В этом году чипы Blackwell будут поставляться небольшими партиями. Масштаб поставок будет сокращен по сравнению с первоначальным планом примерно до 20 000 пластин (количество CoWoS-L сокращено с 41 тыс. до менее 20 тыс.), что соответствует расчетной производительности NVIDIA примерно на уровне США. 8-9,5 миллиардов долларов, но серия H увеличит количество пластин. Потеря производительности на этот раз, вероятно, составит около 5 миллиардов долларов США, а также меры реагирования на чрезвычайные ситуации, направленные на увеличение производственных мощностей после производства серии B. Это может быть отражено. в финансовом отчете за четвертый квартал, и это определенно повлияет на цену акций. В конце концов, это обновление продукта.

По сравнению с самим «обновлением» чипов Blackwell, проблема, которая заслуживает большего рассмотрения и внимания, заключается в том, что Nvidia каждый год выпускает новые SKU, что требует очень высоких темпов, если на оптимизацию и повышение надежности не хватает времени. Существует вероятность того, что определенный продукт полностью перевернется в ближайшие несколько лет. Это логика развития Nvidia, которую нам необходимо пересмотреть, и это также возможность, которую ждут конкуренты.

С более макроэкономической точки зрения, несмотря на отсутствие проблем с логикой роста NVIDIA в последние два года, долгосрочные риски развития растут.Этот риск отражается не только в сумасшедших и радикальных технологических изменениях каждого поколения, но также в проблемах применения и последующего спроса. Проще говоря, это известный «пузырь ИИ», или появятся ли сильные конкуренты у новых технологий. технологии, такие как новые технологии, которые имеют передовые технологии чипов или освоили большие модели, начали самоисследования.

Я действительно видел много сообщений за последние два дня. Что касается китайских и американских гигантов, все они прекратили проводить исследования самостоятельно. Вот новость для вашего сведения:OpenAIСамостоятельно разработанный проект чипа находится на стадии переговоров с TSMC.