3 триллиона компаний, производящих чипы, они тоже пытаются выжить?

2024-07-30

Nvidia планирует снова производить специальные чипы искусственного интеллекта для китайского рынка.

Согласно последнему отчету Reuters, люди, знакомые с этим вопросом, сообщили, что Intel разрабатывает новый флагманский чип искусственного интеллекта для китайского рынка, который соответствует требованиям действующего экспортного контроля США и добавляет еще одного члена в линейку специальных чипов Nvidia.

Стоит отметить, что в марте этого года Nvidia выпустила серию Blackwell, серийное производство которой ожидается позднее в этом году. По данным Nvidia, B200 в 30 раз быстрее своего предшественника при выполнении некоторых задач. из лучших чипов искусственного интеллекта, доступных в настоящее время.

Этот новый специальный флагманский чип также связан с B200. Источники сообщили, что Nvidia будет сотрудничать с Inspur Group, одним из своих основных партнеров по распространению в Китае, для запуска и распространения этого чипа, получившего предварительное название «B20». может иметь некоторые особенности B200.

Если считать эту B20, то всего за год с небольшим Nvidia выпустила семь или восемь специальных чипов для китайского рынка.

А800 и Н800

7 октября 2022 года правительство США объявило о ряде мер по экспортному контролю, включая прекращение поставок некоторых полупроводниковых чипов и оборудования для производства чипов в Китай.

Помимо воздействия на производственное оборудование, такое как фотолитографические машины, оно также ограничивает доступ Китая к высокопроизводительным чипам и чипам искусственного интеллекта в рамках передовых процессов, включая запрет американским компаниям, таким как Nvidia и AMD, продавать такие чипы в Китай, а также ограничение китайского искусственного интеллекта. Компании, производящие чипы, проводят ленточную обработку на зарубежных заводах Fab по американской технологии.

Это ограничение на экспорт затронуло как Nvidia, так и AMD.

После введения ограничений Nvidia заявила, что запрет затронул ее чипы A100 и H100, предназначенные для ускорения задач машинного обучения, и может помешать завершению разработки ее флагманского чипа H100, который будет выпущен в 2022 году. В нем отмечается, что продажи затронутых чипов в Китае за квартал достигли 400 миллионов долларов США. Если китайские компании решат не приобретать продукты-заменители Nvidia, то эти деньги будут потеряны напрасно.

Так как же именно экспортные ограничения США ограничивают чипы Nvidia?

Согласно правилам ограничения экспорта для современных вычислительных интегральных схем (ECCN 3A090 и 4A090), выпущенным Министерством торговли США 7 октября 2022 года, список контролируемых товаров должен соответствовать следующим условиям:

a. Интегральные схемы с общей скоростью двунаправленной передачи всех входов и выходов или программируемые 600 ГБ/с или более, кроме энергозависимой памяти, и любая из следующих интегральных схем:

a.1. Один или несколько цифровых процессорных блоков, выполняющих машинные инструкции, длина каждой операции в битах, умноженная на производительность обработки в TOPS, и сумма всех процессорных блоков составляет 4800 или более;

a.2 Один или несколько цифровых «необработанных вычислительных блоков» (за исключением блоков, которые помогают выполнять машинные инструкции, связанные с вычислением TOPS по пункту 3A090.a.1), чья битовая длина за операцию умножается на сумму всех вычислительных блоков. Производительность обработки TOPS составляет 4800 или выше;

a.3. Один или несколько симуляционных, многозначных или многоуровневых «исходных вычислительных блоков», производительность обработки которых рассчитывается как TOPS, умноженный на 8, а общее количество всех вычислительных блоков достигает или превышает 4800;

a.4 Любая комбинация цифровых процессорных блоков и «исходных вычислительных блоков», сумма которых, рассчитанная в соответствии с пунктами 3A090.a.1, 3A090.a.2 и 3A090.a.3, составляет 4800 или более.

Интегральная схема, описанная в пункте 3A090.a, включает в себя графический процессор (GPU), тензорный процессор (TPU), нейронный процессор, процессор памяти, процессор машинного зрения, текстовый процессор, сопроцессор/ускоритель, устройства адаптивной обработки, программируемые логические устройства. (FPLD) и интегральные схемы специального назначения (ASIC).

Нетрудно заметить, что самым важным из них является ограничение скорости межчипового соединения. Согласно этому регламенту, популярный процессор NVIDIA A100 точно соответствовал этому пределу, и его скорость передачи данных между чипами достигла 600 ГБ/с. В определенной степени, возможно, Министерство торговли США обозначило это ограничение на основе А100.

Чтобы справиться с экспортным контролем, NVIDIA быстро кастрировала замену A100-A800. О запрете в США было официально объявлено 7 октября 2022 года, а через месяц NVIDIA представила A800, который, можно сказать, адаптируется к новым правилам. быть адаптированным к местным условиям в прошлом, но теперь он адаптирован к условиям политики.

Согласно спецификациям, NVIDIA A800 будет использовать ту же архитектуру чипа, что и графический процессор Ampere A100. Он будет доступен в трех версиях: двух версиях PCIe емкостью 40 ГБ и 80 ГБ и версии SXM на 80 ГБ. Эти графические процессоры будут обеспечивать до 9,7 терафлопс FP64, 19,5 терафлопс FP64 Tensor Core, 19,5 терафлопс FP32, 156 терафлопс. (разреженность 312 терафлопс) TF32, 312 терафлопс (разреженность 624 терафлопс) BFLOAT16 и 624 TOPS (разреженность 1248 терафлопс) INT8. Версия на 40 ГБ оснащена памятью HBM2 с пропускной способностью до 1,555 ТБ/с, а версия на 80 ГБ — HBM2e с пропускной способностью до 2 ТБ/с.

Конечно, чтобы удовлетворить ограниченный спрос, пропускная способность неизбежно сократилась с первоначальных 600 ГБ/с до 400 ГБ/с. Представитель Nvidia заявил в заявлении Reuters: «Графический процессор A800 был введен в эксплуатацию в В третьем квартале производства, альтернатива графическому процессору A100 для китайских клиентов, A800 соответствует явным испытаниям правительства США на снижение экспортного контроля и не может быть запрограммирован за пределами этого стандарта».

Аналитик CCS Insight Уэйн Лам прокомментировал: «Похоже, что A800 представляет собой переупакованный графический процессор A100, разработанный для того, чтобы избежать недавних торговых ограничений со стороны Министерства торговли», отметив при этом, что 8 — счастливое число в Китае.

«Китай является важным рынком для Nvidia, и имеет смысл с коммерческой точки зрения переконфигурировать продукт, чтобы избежать торговых ограничений», — сказал Лам, который сказал, что возможности межчиповой связи A800 были значительно ограничены для центров обработки данных, использующих тысячи чипов.

В последующем H100 Nvidia последовала этому примеру и выпустила H800. На A100 Nvidia снизила скорость соединения графического процессора с 600 ГБ/с до 400 ГБ/с и сделала то же самое с H100. По имеющимся данным, скорость соединения чипов H800 снижена примерно вдвое по сравнению с H100, то есть с 800 ГБ/с до 400 ГБ/с. По сравнению с A800 производительность H800 имеет большее влияние, ведь первая снижена всего на 33%, а вторая — на целых 50%.

В то время представитель NVIDIA отказался раскрыть разницу между H800 и H100 для китайского рынка, заявив лишь, что «наши продукты серии 800 полностью соответствуют правилам экспортного контроля».

Когда зарубежные производители лихорадочно скупают A100 и H100, отечественные производители могут выбирать только H800 и A800 с более низкими конфигурациями. Специальная версия чипа NVIDIA в определенной степени ограничивает разработку крупных отечественных моделей искусственного интеллекта.

H20 и RTX 4090D

Для отечественных компаний A800 и H800 имеют хорошие и плохие качества. Плохо то, что после отключения интернет-трафика производительность этих двух чипов немного хуже, а скорость обучения тоже намного медленнее. они и хорошие, и плохие. Их можно заказать через каналы Zhengcheng, но по сравнению с зарубежными компаниями стоимость чипов будет выше.

Но A800 и H800 тоже не продержались больше года. 17 октября 2023 г. Министерство торговли США опубликовало новые правила контроля, регулирующие экспорт передовых вычислительных интегральных схем, оборудования для производства полупроводников и товаров, поддерживающих суперкомпьютерные приложения и конечное использование, выпущенные 7 октября 2022 г. Дополнительные обновления.

Главным из них являются изменения в параметрах управления. Временное окончательное правило удаляет «пропускную способность межсоединения» как параметр для идентификации ограниченных чипов согласно ECCN 3A090 и вместо этого заменяет его «пропускной способностью межсоединения» в качестве параметра для идентификации ограниченных чипов согласно ECCN 3A090, если чип превышает два параметра, откалиброванные в ECCN 3A090 (3A090.a и 3A090.b), экспорт будет ограничен.

Согласно документам Министерства торговли США, пересмотренные нормативные параметры 3A090.a будут регулировать интегральные схемы с одним или несколькими блоками цифровой обработки, а «общая производительность обработки» этих блоков должна составлять 4800 или выше, или «общая производительность обработки». Performance» составляет 1600 или выше, а «Плотность производительности» — 5,92 или выше. Новый ECCN 3A090.b будет регулировать интегральные схемы с одним или несколькими цифровыми процессорами, которые должны соответствовать одному из следующих условий: «общая производительность обработки» 2400 или более, но менее 4800 и «плотность производительности» 1,6 или 1,6. или более, но менее 5,92, или «общая производительность обработки» составляет 1600 или более, а «плотность производительности» составляет 3,2 или более 3,2, но менее 5,92.

Кроме того, правило создает исключение для лицензирования, которое создает новое «Уведомление об исключении для лицензирования для передовых вычислений» для микросхем потребительского уровня с возможностями искусственного интеллекта ниже ограничительного порога. Исключение применяется к двум продуктам, один из которых разработан или продан для использования в данных. центры (вторые — чипы, не предназначенные и не продаваемые для использования в центрах обработки данных), имеют «общую производительность обработки» 4800 или выше.

По сравнению с правилами, принятыми 7 октября 2022 года, новые правила еще раз расширили сферу контроля. В соответствии с двойными правилами общей производительности обработки и плотности производительности как некастрированные, так и кастрированные продукты включены в экспортный контроль. Под запрет были затронуты A800 и H800, в то время как другие продукты Nvidia также были затронуты. L40 и L40S для интеллектуального рынка, а также RTX 4090 для потребительского сектора также были включены в запрет.

Это стало тяжелым ударом для Nvidia, а это означало, что основные продукты, продаваемые Nvidia в то время, не могли быть проданы в Китае из-за экспортного контроля. Вы должны знать, что в предыдущие годы доходы от бизнеса центров обработки данных приходились на китайский рынок. примерно от 20% до 25% общего дохода Nvidia, а в четвертом квартале 2024 финансового года из-за экспортного контроля доходы на китайском рынке упали до однозначных цифр.

Беспомощная, Nvidia могла снова владеть только мачете.

16 ноября 2023 года, через месяц после публикации новых правил, NVIDIA выпустила чипы графического процессора специально для китайского рынка: H20, L20 и H20 основаны на архитектуре NVIDIA Hopper, а L20 и L2 — на Ada. архитектура.

Среди них два чипа L20 и L2 были скорректированы на основе L40 и L4 соответственно. Поскольку они имеют старую архитектуру и обычно не используются в рассуждениях и обучении, им не уделяется особого внимания. H20 более интересен, хотя он получил полную скорость NVLink 900 ГБ/с из-за новых правил, больше не ограничивающих скорость Интернета, по мнению аналитика Дилана Петала, производительность должна быть значительно снижена, даже если фактическое использование H20. Скорость может достигать 90%, но его производительность в реальной среде межсетевого взаимодействия с несколькими картами все еще близка к 50% от H100.

Для RTX 4090 на потребительском рынке NVIDIA также выпустила замену — RTX 4090D в декабре прошлого года. Этот специальный чип, соответствующий экспортному контролю США, был кастрирован с точки зрения ядра CUDA и уменьшено энергопотребление. 12,8%, энергопотребление также снижается с 450 Вт до 425 Вт, снижение на 5,9%, все остальные основные характеристики остаются прежними.

Из-за небольшого увеличения основной частоты в некоторых бенчмарк-тестах производительность 4090D всего примерно на 5% ниже, чем у 4090. По сравнению с AI-чипами этот разрыв, похоже, находится в пределах допустимого диапазона.

Четыре специальных чипа подряд в конце 2023 года в определенной степени облегчили затруднения Nvidia China и не позволили ей исчерпать товары для продажи. Однако после двух раундов ограничений крупные предприятия, а также малые и средние компании добились успеха. стали искать в другом месте. Выход - либо покупать отечественные чипы, строить серверы за границей, либо покупать H100/200 и A100 по неофициальным каналам, которым ничего не остается, как распространяться среди отечественных производителей.

Владение ножом Лао Хуана

Любители DIY, знакомые с игровыми графическими процессорами, не будут незнакомы с навыками владения ножом Лао Хуана.

Возьмем относительно недавний пример. Через год после выпуска серии RTX 20, чтобы лучше дифференцировать линейку продуктов и отреагировать на выпуск новых продуктов из соседней серии RX5000 от AMD, Nvidia выпустила серию RTX 20 Super.

Хотя они также основаны на ядрах TU106 и TU104, Nvidia использовала эти два ядра для создания пяти видеокарт, а именно RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super и RTX 2080. Среди них наименьший разрыв между Теоретический разрыв в производительности между RTX 2060 Super с ядром TU106 и RTX 2070 составляет всего около 5%, а фактические результаты работы и игровые тесты также очень близки. Можно сказать, что Nvidia довела кастрацию до крайности.

Сегодня специально модифицированные чипы, производимые NVIDIA для Китая, — это не что иное, как повторение прошлого и возврат к старому делу.

Помимо B20, о котором мы упоминали вначале, Nvidia также планирует продемонстрировать свои навыки на потребительском рынке. Согласно сообщениям, RTX 5090D, уменьшенная версия RTX 5090, как ожидается, будет выпущена в январе 2025 года. Ожидается, что он будет основан на архитектуре Nvidia Blackwell. Использование процесса TSMC 4NP может снизить основные характеристики, чтобы обойти экспортные ограничения США.

Если считать эти два чипа, по слухам, у Nvidia уже есть огромная специальная линейка в Китае: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Некоторые люди весьма оптимистичны в отношении перспектив этих специальных выпусков чипов. По оценкам исследовательской организации SemiAnaлиз, в этом году Nvidia продаст в Китае более 1 миллиона чипов H20 на сумму более 12 миллиардов долларов США.

Но Nvidia все еще есть о чем беспокоиться. Согласно отчету аналитиков Jeffries, когда в октябре Соединенные Штаты проведут ежегодный обзор контроля над экспортом полупроводников, они «весьма вероятно» запретят продажу чипов Nvidia H20 в Китай. Аналитик сказал, что запрет может быть связан с «конкретным продуктом». запреты, более низкие ограничения вычислительных возможностей и/или ограниченный объем памяти».

Кроме того, искусственно изготовленные карты соответствия типа H20 по сути основаны на кастрации существующих ядер. То же самое касается и B20. Его можно было использовать в качестве ядра H200 и B200, но теперь его можно использовать только для продажи более дешевых спец. издания, а срок продаж, скорее всего, составит всего больше года, так что это убыточный бизнес, с какой стороны на него ни посмотри.

Но у Nvidia нет выхода. Она может только изо всех сил стараться сбалансировать правила и рынок. Но сколько компаний в Китае готовы платить за чипы специального выпуска, которые снова и снова отключаются?

Новости

3 триллиона компаний, производящих чипы, они тоже пытаются выжить?

Введение

моя контактная информация