Новости

Кто планирует чип интеллектуального вычислительного центра?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Текст: Перспективы полупроводниковой промышленности

Отрасли, связанные с «вычислительной мощностью», в последнее время продолжают бурно развиваться, и повсеместно процветает строительство интеллектуальных вычислительных центров.

В 2024 году начали строительство или были введены в эксплуатацию Учанский интеллектуальный вычислительный центр, Китайский мобильный интеллектуальный вычислительный центр (Циндао), Южно-Китайский интеллектуальный вычислительный центр Data Valley, Чжэнчжоуский вычислительный центр искусственного интеллекта, интеллектуальный вычислительный центр Broad Data в Шэньчжэне Цяньхай и т. д.

По неполным статистическим данным, в настоящее время более 30 городов по всей стране строят или предлагают построить интеллектуальные вычислительные центры, при этом масштаб инвестиций превышает 10 млрд юаней.

Что такое интеллектуальный вычислительный центр? Для чего в основном используется интеллектуальный вычислительный центр? Каковы характеристики интеллектуальных вычислительных центров?

Что такое интеллектуальный вычислительный центр?

Согласно определению «Плана действий по качественному развитию вычислительной инфраструктуры», под интеллектуальными вычислительными центрами понимается использование крупномасштабных гетерогенных вычислительных ресурсов, включая общие вычислительные мощности (ЦП) и интеллектуальные вычислительные мощности (ГП, ПЛИС, ASIC и т. д.), в основном средства, которые обеспечивают необходимую вычислительную мощность, данные и алгоритмы для приложений искусственного интеллекта (таких как разработка моделей глубокого обучения искусственного интеллекта, обучение моделей, вывод моделей и другие сценарии).

Можно также сказать, что интеллектуальный вычислительный центр — это центр обработки данных, который фокусируется на вычислительных задачах искусственного интеллекта.

Центры обработки данных обычно включают три категории. Помимо интеллектуальных вычислительных центров, две другие — это вычислительные центры общего назначения, которые сосредоточены на общих вычислительных задачах, и суперкомпьютерные центры, которые сосредоточены на суперкомпьютерных задачах.


2023 год — важный поворотный год для развития искусственного интеллекта. Технология AIGC добилась революционного прогресса. Быстро появляются новые направления бизнеса, такие как обучение больших моделей и применение больших моделей. Центры обработки данных также стали носителями интеллектуальных вычислительных мощностей. компьютерные залы и общие вычислительные центры, развитые до современной стадии суперкомпьютерного центра и интеллектуального вычислительного центра.

В чем разница между интеллектуальным вычислительным центром и обычным центром обработки данных?

Интеллектуальные вычислительные центры, обычно тесно связанные с облачными вычислениями, подчеркивают гибкость контроля ресурсов и управления инфраструктурой. В облачной среде поставщик центра обработки данных отвечает за обслуживание оборудования и определенных программных инструментов, а клиент владеет данными. Напротив, традиционные локальные центры обработки данных требуют, чтобы предприятия самостоятельно управляли и обслуживали все ресурсы данных.

Существенные различия приводят к большим различиям между двумя моделями с точки зрения капиталовложений, размещения ресурсов и безопасности.

С точки зрения капиталовложений клиенты интеллектуальных вычислительных центров могут выбрать подходящую им модель обслуживания, например публичное облако, частное облако или гибридное облако, без больших затрат на оборудование и программное обеспечение, в то время как клиентам традиционных центров обработки данных необходимо вкладывать большие деньги; приобрести и обслуживать необходимые вам серверы, сетевое оборудование и оборудование для хранения данных.

Что касается развертывания ресурсов и безопасности, клиенты интеллектуального вычислительного центра могут удаленно получать доступ к своим данным и приложениям и управлять ими через Интернет в любое время и в любом месте. В то же время они также могут пользоваться профессиональными гарантиями безопасности, предоставляемыми поставщиками центров обработки данных, например. межсетевые экраны, шифрование, резервное копирование и восстановление и т. д., в то время как клиенты традиционных центров обработки данных ограничены офисами/определенными местами и должны защищать данные и управлять ими самостоятельно;

Интеллектуальный вычислительный центр — это просто центр обработки данных, который специально обслуживает искусственный интеллект и может обеспечить выделенную вычислительную мощность, необходимую для вычислений искусственного интеллекта. По сравнению с традиционными центрами обработки данных, интеллектуальные вычислительные центры могут удовлетворять более целевые потребности, иметь большие объемы вычислений и более высокую скорость вычислений, а также обеспечивать вычисления с использованием искусственного интеллекта для различных вертикальных отраслевых сценариев, таких как обучение больших моделей, автономное вождение и AIGC.

Какие чипы необходимы для интеллектуальных вычислений ИИ?

С точки зрения выбора оборудования аппаратная архитектура интеллектуальных вычислительных центров также отличается от традиционных центров обработки данных.

Какие вычислительные чипы необходимы для интеллектуальных вычислений ИИ?

Аппаратная архитектура традиционных центров обработки данных относительно проста и включает в себя в основном серверы, устройства хранения и сетевые устройства. По сравнению с этой аппаратной архитектурой интеллектуальный вычислительный центр будет более гибким, и для разных сценариев применения будут выбираться разные вычислительные узлы.

Интеллектуальный вычислительный сервер является основным вычислительным оборудованием интеллектуального вычислительного центра. Обычно он использует гетерогенную вычислительную архитектуру «ЦП+ГП», «ЦП+НПУ» или «ЦП+ТПУ», чтобы обеспечить полную свободу действий, стоимости и качества. Производительность различных вычислительных чипов. Преимущества в энергопотреблении.

GPU, NPU и TPU имеют большое количество ядер и хорошо справляются с параллельными вычислениями. Алгоритмы искусственного интеллекта включают в себя большое количество простых задач по работе с матрицами и требуют мощных возможностей параллельных вычислений.

Традиционные серверы общего назначения используют ЦП в качестве основного чипа для поддержки базовых вычислений общего назначения, таких как облачные вычисления и периферийные вычисления.

Какие микросхемы памяти необходимы для интеллектуальных вычислений ИИ?

Чипы вычислительной мощности не только различаются, но и интеллектуальные вычисления на базе искусственного интеллекта предъявляют более высокие требования к чипам памяти.

Во-первых, это дозировка. Емкость DRAM интеллектуальных вычислительных серверов обычно в 8 раз превышает емкость обычных серверов, а емкость NAND — в 3 раза больше, чем у обычных серверов. Даже его печатная плата имеет значительно больше слоев, чем традиционный сервер.

Это также означает, что интеллектуальным вычислительным серверам необходимо использовать больше микросхем памяти для достижения необходимой производительности.

По мере роста спроса также возникает ряд узких мест.

С одной стороны, традиционная архитектура фон Неймана требует загрузки данных в память, что приводит к низкой эффективности обработки данных, высокой задержке и высокому энергопотреблению, с другой стороны, проблема со стенкой памяти приводит к значительному ускорению роста производительности процессора; чем скорость памяти. В результате между SSD и памятью необходимо передавать большой объем данных, кроме того, ограничения емкости и пропускной способности SSD, установленного на ЦП, также становятся узкими местами в производительности.

Столкнувшись с такими проблемами, как «стена хранения» и «стена энергопотребления», архитектура вычислительного хранилища в традиционной вычислительной архитектуре нуждается в срочном обновлении. Только за счет органической интеграции хранилища и вычислений она может соответствовать огромному объему данных в эпоху интеллектуальных вычислений. с огромным потенциалом повышения энергоэффективности. Требования к хранению данных.

Хорошим решением этой серии проблем могут стать интегрированные микросхемы хранения и вычислений.

В дополнение к различным чипам, чтобы обеспечить полную производительность и стабильность работы, сервер AI также был разработан с улучшенной архитектурой, рассеиванием тепла, топологией и другими аспектами.

Кто выкладывает эти фишки?

Компоновка чипов вычислительной мощности

Что касается графических процессоров, графические процессоры хороши для массовых параллельных вычислений. Huawei, Tianshu Zhixin, Moore Thread, Sugon, Suiyuan Technology, Nvidia, Intel, AMD и т. д. выпустили соответствующие чипы. Например, компания Huawei выпустила серию чипов искусственного интеллекта Ascend — Ascend 910 и Ascend 310. Эти чипы специально разработаны для обучения и рассуждения искусственного интеллекта и отличаются высокой производительностью и низким энергопотреблением. Серия Ascend широко используется в центрах обработки данных, облачных сервисах, периферийных вычислениях и других областях, обеспечивая мощную поддержку вычислительной мощности для интеллектуальных вычислительных центров.

NVIDIA выпустила ряд продуктов графического процессора для обучения и вывода ИИ, таких как A100, H100 и т. д. Intel также выпустила ряд продуктов на основе искусственного интеллекта, таких как серия чипов Gaudi от Habana Labs, стремясь составить конкуренцию Nvidia. AMD также разработала планы в области чипов искусственного интеллекта и выпустила продукты серии MI GPU и APU.

Что касается FPGA, CPU+FPGA сочетает в себе гибкость и высокую производительность, позволяя адаптироваться к быстрым изменениям алгоритмов. Xilinx и Intel являются основными игроками на рынке. Сопутствующие продукты включают: серии продуктов Xilinx VIRTEX, KINTEX, ARTIX, SPARTAN и серию продуктов Intel Agilex; крупные отечественные производители включают Fudan Microelectronics, Unisoc Microelectronics и Anlu Technology.

Что касается ASIC, CPU+ASIC обеспечивает высокопроизводительные индивидуальные вычисления в соответствии с конкретными потребностями. Иностранные гиганты, такие как Google, Intel и NVIDIA, последовательно выпускают чипы ASIC. Отечественные производители, такие как Cambrian, Huawei HiSilicon и Horizon, также выпустили чипы ASIC, ускоряемые глубокими нейронными сетями.

Что касается NPU, NPU — это процессор, специально разработанный для сценариев искусственного интеллекта и машинного обучения. В отличие от ЦП и ГП, NPU был специально оптимизирован по аппаратной структуре и ориентирован на выполнение вычислительных задач, связанных с искусственным интеллектом, таких как вывод нейронных сетей. Сочетание универсальности ЦП и специфики NPU позволяет всей системе гибко реагировать на различные сценарии применения ИИ и быстро адаптироваться к изменениям алгоритмов и моделей.

В настоящее время на рынке существует множество серийно выпускаемых NPU или чипов, оснащенных модулями NPU. К наиболее известным из них относятся NPU Qualcomm Hexagon и серия Ascend от Huawei. Стоит отметить, что все крупные производители имеют уникальные разработки в конструкции вычислительных ядер чипов. . Стратегия.

Что касается TPU, TPU — это чип, разработанный Google специально для ускорения вычислительной мощности глубоких нейронных сетей. Он больше ориентирован на обработку крупномасштабных задач глубокого обучения и имеет более высокую вычислительную мощность и меньшую задержку. TPU также является чипом ASIC.

Что касается DPU, DPU специально разработан для задач обработки данных и имеет высокооптимизированную аппаратную структуру, подходящую для вычислительных нужд в конкретных областях. В отличие от ЦП, который используется для общих вычислений, и графического процессора, который используется для ускоренных вычислений, DPU является третьим основным чипом в центре обработки данных. Продукты DPU трех международных гигантов NVIDIA, Broadcom и Intel занимают большую часть внутреннего рынка. Многие производители, такие как Xilinx, Marvell, Pensando, Fungible, Amazon и Microsoft, в последние 2 года также производили продукты DPU или аналогичные продукты. 5 лет. . В число отечественных производителей входят Zhongke Yushu, Xinqiyuan, Yunbao Intelligence, Dayu Zhixin, Alibaba Cloud и т. д.

Куда пропали отечественные компьютерные чипы?

На Пекинской конференции по сетям мобильных вычислений 2024 года пекинский узел Китайского центра мобильных вычислений был официально введен в эксплуатацию, что ознаменовало новый этап в строительстве интеллектуального вычислительного центра моей страны. Являясь первым крупномасштабным интегрированным интеллектуальным вычислительным центром в Пекине по обучению и продвижению, проект занимает площадь около 57 000 квадратных метров, использует около 4000 карт ускорителей искусственного интеллекта, имеет уровень локализации 33% чипов искусственного интеллекта и имеет интеллектуальные вычисления. шкала мощности более 1000P.

Чжэнь Яньань, технический директор компании Beijing Beilong Super Cloud Computing Co., Ltd., операционной организации Пекинского центра супероблачных вычислений, недавно заявил, что в настоящее время он «прививает» отечественные большие модели отечественным чипам, и это занимает всего около 15 дней. пробежаться. Он считает, что распределение вычислительной мощности станет основной тенденцией в отрасли, а высокопроизводительные вычислительные ресурсы графических процессоров требуют усилий всех сторон.

В последние годы в структуре рынка китайских чипов вычислительной мощности искусственного интеллекта в основном доминирует NVIDIA, на долю которой приходится более 80% доли рынка.

Чжэнь Яньань сказал: «Мы также очень обеспокоены разработкой отечественных чипов. Понятно, что отечественные большие модели собственной разработки и даже некоторые большие модели с открытым исходным кодом постоянно пересаживаются на отечественные чипы. Теперь с точки зрения использования чипов некоторые модели имеют Его можно запустить, а что нужно догнать, так это в основном высокую производительность, такую ​​как графический процессор».

«Вся локализация иерархична. Чипы относятся к аппаратному уровню. Кроме того, существует экосистема программного обеспечения. Для отечественных чипов и структура, и экосистема требуют определенного цикла разработки». Чжэнь Яньань призвал сторону окончательного приложения предоставить». достаточно доверия к отечественным чипам.

Расположение микросхем памяти

Интеллектуальные вычислительные центры должны обладать высокой производительностью, высокой надежностью, высокой доступностью и другими характеристиками с точки зрения хранения данных. Устройства хранения данных обычно используют высокопроизводительные жесткие диски или твердотельные накопители и оснащены резервной архитектурой хранения данных для обеспечения безопасности и доступности данных. Samsung, Micron, SK Hynix и т. д. имеют соответствующие чипы, которые широко используются в центрах обработки данных, облачных вычислениях и других областях для предоставления высокопроизводительных решений хранения данных для интеллектуальных вычислительных центров.

В последние годы отечественные производители также добились быстрого развития, догоняя технологии DRAM и NAND.

В дополнение к традиционным микросхемам памяти интеллектуальным вычислительным центрам также необходимы новые интегрированные микросхемы хранения данных, упомянутые выше, чтобы играть более важную роль.

Судя по истории развития интегрированных систем хранения данных и вычислений, с 2017 года крупные производители, такие как NVIDIA, Microsoft и Samsung, предложили прототипы интегрированных систем хранения данных и вычислений. В том же году начали появляться отечественные компании, производящие интегрированные системы хранения и вычислений.

Потребность крупных производителей в интегрированной архитектуре хранения данных и вычислений является практичной и быстрой в реализации. Поскольку технология, наиболее близкая к инженерной реализации, вычисления с использованием близкой к памяти стали первым выбором крупных производителей. Крупнейшие производители с богатыми экосистемами, такие как Tesla и Samsung, а также традиционные производители чипов, такие как Intel и IBM, все внедряют вычисления, работающие с оперативной памятью.

Отечественные стартапы фокусируются на вычислениях в памяти, которые не требуют передовых технологических процессов. Среди них такие стартапы, как Zhicun Technology, Yizhu Technology и Jiutian Ruixin, делают ставку на PIM, CIM и другие технологические направления, которые более тесно интегрируют хранение и вычисления с «хранилищем» и «вычислениями». Yizhu Technology, Qianxin Technology и т. д. фокусируются на сценариях использования больших вычислительных мощностей искусственного интеллекта, таких как расчеты больших моделей и автономное вождение; ShaNYi, XiNY Technology, Pingxin Technology, Zhicun Technology и т. д. фокусируются на Интернете вещей, носимых устройствах и умных домах; . Такие сценарии, как предельная вычислительная мощность.

Компания Yizhu Technology стремится разрабатывать высокопроизводительные чипы искусственного интеллекта с использованием интегрированной архитектуры хранения и вычислений. Впервые она сочетает в себе мемристорную память ReRAM с интегрированной архитектурой хранения и вычислений. Благодаря идее проектирования полностью цифровых чипов она обеспечивает лучшее решение. В современной промышленной структуре чипы большой вычислительной мощности AI с экономической эффективностью, более высоким коэффициентом энергоэффективности и большими возможностями для развития вычислительной мощности пошли по новому пути развития.

Qianxin Technology специализируется на исследованиях и разработках накопителей большой вычислительной мощности, интегрированных вычислительных микросхем и вычислительных решений для области искусственного интеллекта и научных вычислений. В 2019 году компания первой предложила реконфигурируемую архитектуру интегрированных технологий хранения и вычислений. По сравнению с другими компаниями по производительности вычислений традиционные ИИ-чипы могут быть улучшены в 10-40 раз. В настоящее время реконфигурируемый интегрированный чип хранения и вычислений (прототип) компании Qianxin Technology был опробован или внедрен в облачных вычислениях, автономном восприятии вождения, классификации изображений, распознавании номерных знаков и других областях. первым в Китае прошел внутреннее тестирование крупных интернет-компаний.

План Zhicun Technology состоит в том, чтобы перепроектировать память, использовать физические характеристики ячеек флэш-памяти, преобразовать массив хранения и перепроектировать периферийные схемы так, чтобы он мог вмещать больше данных, и в то же время хранить операторы в памяти, чтобы каждый Устройство может выполнять операции моделирования и напрямую выводить результаты операций для достижения цели интеграции хранения и вычислений.

На интеллектуальные вычисления приходится более 30% масштаба, а строительство вычислительных мощностей идет полным ходом.

В начале июля Юго-западный вычислительный центр Tianfu Intelligence был официально введен в эксплуатацию в Чэнду, Сычуань. Согласно сообщениям, центр будет использовать вычислительную мощность для поддержки создания в Чэнду основной отрасли искусственного интеллекта объемом 100 миллиардов долларов и расширения возможностей инноваций в области искусственного интеллекта в таких областях, как промышленное производство, естественные науки, биомедицина и эксперименты по моделированию научных исследований.

Это не единичный случай. В прошлом месяце интенсивно стартовал проект Иньчуаньского зеленого интеллектуального вычислительного центра; компания Beijing Mobile построила в Пекине первый крупномасштабный интегрированный интеллектуальный вычислительный центр по обучению и продвижению, предназначенный для поддержки десятков миллиардов и сотен миллиардов крупных моделей, обучающих и рассуждающих с помощью них. высокая сложность и высокие требования к вычислениям; Чжэнчжоу Начало строительства вычислительного центра искусственного интеллекта с общим объемом инвестиций более 1,6 млрд юаней... Новая цифровая инфраструктура, представленная интеллектуальным вычислительным центром, ускоряет его строительство и внедрение.

Данные, опубликованные Национальным бюро статистики 15 июля, показали, что по состоянию на конец мая по всей стране было построено 460 000 базовых станций 5G; запланировано более 10 интеллектуальных вычислительных центров с высокопроизводительными компьютерными кластерами и интеллектуальными вычислительными мощностями; приходилось более 30% от общей вычислительной мощности%.

По неполным статистическим данным China IDC Circle, по состоянию на 23 мая 2024 года на территории материкового Китая действуют 283 интеллектуальных вычислительных центра, охватывающих все провинции, автономные районы и муниципалитеты материкового Китая. Среди них 140 проектов интеллектуальных вычислительных центров со статистикой инвестиций с общим объемом инвестиций 436,434 млрд юаней. Существует 177 проектов интеллектуальных вычислительных центров с плановой статистикой масштаба вычислительной мощности, а общий масштаб вычислительной мощности достигает 369 300 Пфлопс.

Эти «интеллектуальные вычислительные центры» имеют разные стандарты и масштабы. Шкала вычислительной мощности обычно составляет 50P, 100P, 500P, 1000P, а некоторые даже достигают более 12000P. Хотя волна искусственного интеллекта открыла широкие перспективы развития интеллектуальных вычислительных центров. Спрос и предложение Несоответствие спроса и предложения, высокие цены и дублирование строительства по-прежнему остаются проблемами, с которыми сталкивается моя страна при строительстве вычислительных мощностей.

В то же время во многих местах также были введены специальные планы для уточнения целей строительства на ближайшие несколько лет и улучшения мер поддержки с точки зрения технологий, применения и финансирования. Например, Цзянсу опубликовал специальный план развития провинциальной вычислительной инфраструктуры, предполагая, что к 2030 году общая вычислительная мощность, используемая в провинции, превысит 50 эфлопс (эфлопс означает 10 миллиардов операций с плавающей запятой в секунду), а интеллектуальные вычислительная мощность составит более 45%; Ганьсу предлагает обеспечить политическую поддержку новой инфраструктуры вычислительных сетей с точки зрения землепользования, строительства муниципальных вспомогательных объектов, привлечения талантов и финансирования.

«Взрывное развитие таких приложений, как большие модели искусственного интеллекта, привело к резкому росту спроса на интеллектуальные вычислительные мощности», — сказал Шань Чжигуан, директор Департамента информатизации и промышленного развития Национального информационного центра, сказал, что интеллектуальные вычисления развиваются быстро. и стал самым быстрорастущим в структуре вычислительных мощностей моей страны. Среди них большие модели являются крупнейшими потребителями интеллектуальной вычислительной мощности, на их долю приходится почти 60% спроса. Ожидается, что к 2027 году совокупный годовой темп роста интеллектуальных вычислительных мощностей Китая достигнет 33,9%.