Новости

Старый Хуан делает еще один неожиданный ход!Запущен первый сервер GB20 «специальной версии», который может быть запущен в следующем году.

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Новый отчет мудрости

Редактор: Редакционный отдел

[Введение в новую мудрость]Зарубежные СМИ сообщили о том, что в следующем году Nvidia выпустит чип искусственного интеллекта, адаптированный для китайского рынка, и даже разработает соответствующий ему сервер. Это первый случай в истории Nvidia.

Битва между Nvidia и Министерством торговли США снова обострилась!

В условиях экспортного контроля США Лао Хуан продолжает предлагать альтернативные стратегии, и происходит игра в кошки-мышки.


После введения новых правил экспортного контроля Лао Хуан не смог зарабатывать деньги на китайском рынке.

По состоянию на январь этого года новые экспортные правила действуют ровно на один год, а доля китайского рынка в доходах Nvidia упала до 17%. Два года назад это число все еще составляло 25%+.

В условиях регулирования Nvidia постоянно выпускает «специальные выпуски» чипов, адаптированных для Китая. Однако эти чипы с пониженной производительностью часто плохо продаются.

Продажи H20, у которых раньше был плохой старт, только начали расти, но Nvidia была шокирована, услышав плохие новости.

Аналитики Jefferies сообщили в исследовательском отчете на прошлой неделе, что Министерство торговли США проведет ежегодный обзор ограничений на экспорт полупроводников в октябре и может запретить экспорт чипов H20.

Надзор продолжает усиливаться, и на этот раз Лао Хуан проявил себя с лучшей стороны.

Компания не только выпустила новый флагманский AI-чип B20, но, опасаясь, что его будет непросто использовать, также запустила поддерживающий сервер GB20.


По названию нетрудно догадаться, что B20 — это вариант Blackwell B200, выпущенный Nvidia в марте этого года.

Будучи самым быстрым графическим процессором на сегодняшний день, B200 может обрабатывать определенные задачи до 30 раз быстрее, чем его предшественник. (например, позвольте чат-боту генерировать ответы)

К сожалению, к «специальному выпуску» чипа B20 это не имеет никакого отношения…

B20, созданный в условиях ограничений политики экспортного контроля США, призван стать продуктом начального уровня, что резко контрастирует с B200 с лучшими в отрасли характеристиками искусственного интеллекта.

Однако, по словам источника, хотя B20 и будет медленнее B200 в обработке ИИ-вычислений, совместная установка большого количества чипов в сервер GB20 может частично компенсировать этот недостаток.

Это гарантирует, что Nvidia сохранит определенную степень конкурентоспособности при конкуренции с китайской продукцией, а также будет соблюдать верхний предел вычислительной мощности чипов, требуемый экспортным контролем США.

Под контролем разыгрывается «игра в кошки-мышки»

С конца 2022 года Nvidia неоднократно реконфигурировала свои чипы для китайского рынка, ориентируясь на потребности китайских клиентов, которым нужны чипы для разработки LLM, пытаясь оставаться привлекательными для китайских клиентов, соблюдая при этом правила США.

В октябре 2022 года правительство США запретило продажу Nvidia A100 и H100, самых передовых на тот момент чипов искусственного интеллекта.

Несколько месяцев спустя Nvidia выпустила на китайский рынок два альтернативных продукта — A800 и H800.

Менее чем через год Министерство торговли США в очередной раз обновило меры экспортного контроля и ввело ограничения на эти два чипа.

NVIDIA отреагировала быстро,


Среди них чип H20 имеет ограниченную производительность, но более высокую скорость соединения. Благодаря памяти с высокой пропускной способностью и зрелой поддержке программного обеспечения он обеспечивает более высокую производительность.

Хотя первоначальные продажи были плохими, все больше и больше китайских покупателей предпочитают покупать этот чип.

По словам четырех человек, непосредственно участвующих в продажах чипов Nvidia в Китае, китайские компании заказали более 500 000 чипов H20 общей стоимостью почти 5,8 млрд долларов США, которые будут поставлены в 2024 году.

Исследовательская фирма SemiAnaанализ также сделала оптимистичные оценки, согласно которым в этом году Nvidia продаст в Китае более 1 миллиона чипов H20 на сумму более 12 миллиардов долларов США.

Но, как упоминалось ранее, этот бизнес сталкивается с новыми угрозами со стороны Министерства торговли. Когда в конце года правила будут скорректированы, H20 может быть запрещен к продаже.

Этот запрет может принимать разные формы, включая запреты на конкретные продукты, снижение вычислительной мощности чипа или ограничение объема его памяти.

В конце концов, макроэкономический фон таков, что, как ожидается, Соединенные Штаты продолжат оказывать давление на экспортный контроль, связанный с полупроводниками.

Соединенные Штаты хотят, чтобы Нидерланды и Япония еще больше ограничили поставки оборудования для производства чипов в Китай, сообщили источники.


Под усиливающимся контролем может появиться все больше и больше «специальных изданий».


Ходят слухи, что Nvidia также разрабатывает новую флагманскую игровую видеокарту RTX 5090D.


Видеокарта будет разработана специально для китайского рынка и станет продолжением RTX 4090D, первой видеокарты, ориентированной на потребителя и соответствующей экспортным стандартам.

Производительности чипа недостаточно, чтобы это компенсировать, нужен сервер

Конкретные характеристики B20 еще не определены, но можно сказать наверняка, что он определенно не преодолеет «потолок» экспортной политики графических процессоров США.

Как и его старые предшественники — ранее выпущенные H20, L20 и L2, производительность этих трёх чипов можно назвать «эпической». соединять.

TPP и PD — два основных индикатора, которые заткнут горло

В Соединенных Штатах действуют строгие правила экспорта графических процессоров из Китая и используется показатель под названием «Общая вычислительная мощность» (TPP).

Этот показатель учитывает терафлопс и точность вычислительной мощности графического процессора. В частности, умножение терафлопс (без разреженности) на точность (в битах) дает нам TPP.

Текущий лимит установлен на уровне 4800 TPP, что это значит?

Взяв за образец предыдущие продукты NVIDIA: Hopper H100 и H200 значительно превысили этот стандарт. TPP обоих графических процессоров достиг 16 000, что более чем в три раза превышает указанный верхний предел.


Даже RTX 4090 превышает предел с вычислительной мощностью FP8 в 660,6 терафлопс.

Самый мощный графический процессор Nvidia для настольных ПК, который не выходит за пределы 4800 TPP, — это RTX 4090D, созданный специально с учетом экспортных ограничений.


Компания Blackwell установила новый стандарт производительности вычислений: ее двухчиповое решение, вероятно, будет обеспечивать около 4500 терафлопс вычислительной мощности FP8, что в 7,5 раз превышает экспортный лимит.

Другими словами, производительность B20 будет меньше 1/7 производительности Blackwell B200!

Мало того, B20 также сталкивается с дополнительными ограничениями — ограничениями «Performance Density» (PD).

Это ограничение специально наложено на графические процессоры центров обработки данных в США, и оно не затрагивает потребительские графические процессоры.

Показатель PD можно получить, разделив показатель TPP на размер чипа. PD графических процессоров, экспортируемых в Китай, не должен быть выше 6,0.

По этому показателю графические процессоры серии RTX 40 (архитектура Ada Lovelace) больше не могут использоваться в дата-центрах.

Блэквелл явно лучше Ады Лавлейс с точки зрения плотности и производительности.

Другими словами, Nvidia необходимо строго ограничить производительность B20 или использовать большую долю чипов, чтобы соответствовать соответствующим нормам.

По данным Tom's Hardware, B20 станет преемником графических процессоров AI начального уровня Nvidia A30 и H20.

Если взять в качестве примера H20, то его вычислительная мощность FP16 составляет всего 296 терафлопс, TPP — 2368, PD — всего 2,90, а у H100/H200 — 1979 терафлопс.


При этом A30 имеет показатель TPP 2640 и показатель PD 3,20, что немного выше, чем у H20.

Видно, что AI-GPU, созданный Nvidia для китайского рынка, имеет некоторые возможности для улучшения производительности, но пространство очень ограничено.

В лучшем случае Nvidia может попытаться создать графический процессор с TPP от 4000 до 4500 и размером кристалла 800 квадратных миллиметров.

GB20: Прилагаем все усилия, чтобы сохранить производительность B20

Чтобы сделать предстоящий B20 более эффективным, Nvidia использует стратегии, которые она использовала с H20, такие как увеличение объема памяти, поскольку чипы памяти не подлежат текущему экспортному контролю.

По словам двух человек, участвовавших в разработке сервера, Nvidia работает над увеличением скорости передачи данных между памятью и процессорами B20, чтобы можно было быстрее обрабатывать большие наборы данных об энергопотреблении.

Мало того, Nvidia также будет использовать свою технологию NVLINK (которая обеспечивает быструю связь между различными чипами) и решения для охлаждения в конструкции стойки GB20.

Ожидается, что это увеличит использование чипов B20 и эффективность вычислительных кластеров GB20 в обеспечении искусственного интеллекта, добавил дуэт.

Система GB20 позволит клиентам выполнять обучение ИИ и делать выводы за счет более эффективной параллельной работы нескольких чипов.

Еще до того, как GB20 был представлен, компания Tom's Hardware смело предсказала, что B20 будет трудно продаваться.

Но теперь, с благословением GB20, похоже, появилась новая надежда.

Использованная литература:

https://www.tomshardware.com/pc-comComponents/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- нормативно-правовые акты

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules