новости

«источник упадка» nvidia: новейшие чипы, чем выше производительность, тем сложнее их производить

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

автор | гао чжимо

редактор | жесткий ии

если бы «источник упадка» nvidia можно было охарактеризовать одним предложением, то это были бы передовые чипы. чем выше производительность, тем сложнее их производить.

в среду, сообщая о высоких квартальных продажах и прибылях, nvidia также отметила, что трудности с производством новых чипов привели к снижению прибыли и что в последнем квартале компания зарезервировала 908 миллионов долларов в качестве резервов. в результате этого цена акций компании в четверг упала на 6,4%.

в своем заявлении компания признала, что графические процессоры с архитектурой blackwell имеют проблемы с производительностью и нуждаются в перепроектировании части конструкции процессора b200 для повышения производительности. поэтому массовое производство графических процессоров с архитектурой blackwell следующего поколения будет отложено до четвертого квартала 2024 года.

«мы скорректировали конструкцию графических процессоров blackwell, чтобы повысить производительность. производственный план blackwell начнется в четвертом квартале и продолжится до 2026 финансового года.

мы ожидаем, что продукция blackwell принесет миллиарды долларов дохода в четвертом квартале. "

nvidia не уточнила конкретную причину проблемы. но аналитики и руководители отрасли считают, что инженерные проблемы связаны в первую очередь со сложными проблемами производственного процесса, возникающими в конструкции чипа blackwell.

анализ показал, что огромные размеры и сложная конструкция blackwell привели к беспрецедентной сложности производства. дефекты в любом компоненте могут привести к списанию чипа, что повлияет на выпуск продукции и прибыль. кроме того, различия в коэффициентах теплового расширения различных частей чипа также могут вызывать коробление корпуса, что влияет на производительность и надежность.

чтобы повысить доходность, nvidia скорректировала конструкцию blackwell и планирует увеличить производство, как и планировалось. однако аналитики полагают, что сложность внедрения новой технологии соединения чипов tsmc и проблемы, связанные с размером чипов, по-прежнему будут основными препятствиями на пути массового производства blackwell.

дж. дэн хатчесон, вице-президент отраслевой аналитической компании techinsights, сказал:

«проблема в том, как заставить чипы работать вместе и повысить производительность. когда выход каждой части чипа недостаточно высок, все может быстро испортиться».

01

сложность чипов blackwell

чтобы сохранить лидирующие позиции в области чипов искусственного интеллекта, nvidia (nvda) делает ставку на концепцию «чем больше, тем лучше». однако, хотя больший размер обеспечивает более высокую производительность, он также увеличивает сложность производства.

последний ai-чип nvidia, blackwell, описывается хуанг джен-сюнем как «очень, очень большой графический процессор». в физическом смысле это действительно самый большой графический процессор на данный момент. он состоит из двух кристаллов blackwell и использует 4-нм техпроцесс tsmc. в нем 2080 миллиардов транзисторов — в 2,6 раза больше, чем в предыдущем поколении.

аналитики ubs заявили в своем отчете ранее в этом месяце, что основная проблема, с которой nvidia столкнулась с blackwell, заключалась в сложности внедрения нового метода упаковки tsmc cowos-l.

полуанализ, профессиональное сми в полупроводниковой промышленности, сообщил, что в этой технологии упаковки используется интерпозер rdl с локальными кремниевыми мостами (lsi) для соединения основных частиц, а скорость передачи данных может достигать около 10 тб/с. точность их размещения. мосты требуют чрезвычайно высокого качества. дефект в любом компоненте может привести к тому, что весь чип стоимостью 40 000 долларов будет утилизирован, что повлияет на выпуск продукции и прибыль.

кроме того, из-за несоответствия коэффициента теплового расширения (cte) между кристаллом графического процессора, мостами lsi, интерпозером rdl и подложкой материнской платы происходит коробление чипа и сбой системы. по имеющимся данным, чтобы повысить производительность, nvidia пришлось изменить дизайн верхнего металлического слоя и выступов чипа графического процессора.

хуан дженсюнь подчеркнул в ходе телеконференции с аналитиками, что чип blackwell не требует каких-либо «функциональных изменений» и что все изменения направлены на повышение производительности.

финансовый директор колетт кресс заявила, что nvidia увеличивает производство blackwell, как и планировалось, и ожидает, что blackwell принесет компании миллиарды долларов дохода в четвертом квартале.

02

micron добавляет новый план расширения производства dram

по сообщениям японских сми, micron планирует построить новый завод по производству чипов dram в префектуре хиросима, япония, с целью ввести его в эксплуатацию уже в конце 2027 года.

проблемы такого типа характерны не только для nvidia. инсайдеры отрасли говорят, что такие проблемы будут увеличиваться, поскольку производители чипов стремятся увеличить вычислительную мощность за счет увеличения размера чипов. изменения в конструкции чипов для устранения дефектов или повышения производительности также распространены в отрасли.

су цзифэн, генеральный директор гиганта процессоров amd, также отметил, что по мере того, как размер чипов продолжает увеличиваться, сложность производства неизбежно будет возрастать.чипы следующего поколения должны добиться прорыва в энергоэффективности и энергопотреблении, чтобы удовлетворить огромный спрос на вычислительную мощность в центрах обработки данных искусственного интеллекта.

«чтобы эти технологии заработали, требуются большие технические инвестиции», — сказала она. «будут ли они становиться более сложными и масштабными? в этом нет никаких сомнений. такова наша реальность».

конечно, радикальная стратегия nvidia по объединению двух крупнейших чипов для создания blackwell, направленная на то, чтобы преодолеть ограничение размера одного чипа, также вызвала сомнения у конкурентов.

эндрю фельдман, основатель конкурирующей компании cerebras systems, считает, что сложность разработки технологии объединения нескольких чипов будет возрастать в геометрической прогрессии. компания cerebras systems решила разработать гигантский одиночный чип и запустила на его основе сервис облачных вычислений с искусственным интеллектом, пытаясь бросить вызов рыночным позициям nvidia.

эндрю фельдман сказал:

«выполнение значимой работы в области искусственного интеллекта требует большой вычислительной мощности, а для этого требуется много транзисторов, больше, чем может вместить один чип…

разработать двухчиповую технологию уже сложно, еще труднее разработать четырехчиповую технологию и еще труднее разработать восьмичиповую технологию. "

сможет ли стратегия nvidia по созданию гигантских чипов в конечном итоге победить, еще предстоит проверить рынку. но что можно сказать наверняка, так это то, что главная задача производства чипов только началась.