Что осталось от большой модели, приземлившейся на краю?

2024-08-07

Поскольку крупные модели начинают процесс расширения возможностей отрасли, их крупномасштабное развертывание на периферии/стороне стало главным приоритетом дальнейшего развития. Однако развертывание на периферии/стороне, безусловно, более способствует обеспечению мгновенного реагирования и защиты конфиденциальности для больших моделей, но оно также столкнется с проблемами с точки зрения фрагментации вычислительной мощности, проблем с энергоэффективностью и сценариев реализации. Для предприятий это одновременно и трудность, и возможность.

В связи с потребностями отраслевых приложений большие модели развиваются в направлении периферии.

В настоящее время крупная модельная индустрия моей страны переживает бурное развитие. Статистика показывает, что по состоянию на конец марта количество выпущенных в Китае крупных моделей достигло 117. Однако в процессе разработки, в отличие от США, которые фокусируются на оригинальных прорывах, крупные модельные компании Китая уделяют больше внимания внедрению приложений. Чжоу Хунъи, основатель и председатель 360 Group, в своем предыдущем выступлении сказал, что объемные модели, вычислительная мощность и данные — не единственные варианты разработки моделей с учетом триллионов параметров. Большие модели искусственного интеллекта имеют более разнообразные пути развития. Ли Дахай, соучредитель и генеральный директор Face Wall Intelligence, также подчеркнул важность отраслевых моделей, которые сейчас стали одним из важных трендов развития.

Если вы хотите более эффективно расширить возможности тысяч отраслей, большие модели и связанные с ними вычислительные мощности нельзя развертывать только в облаке. Модели Edge и End-Side имеют сравнительные преимущества, которых нет у облака. Во-первых, конечная модель имеет более высокую надежность. Модели, развернутые на терминалах, могут взаимодействовать с окружающей средой в режиме реального времени и непрерывно, однако облачным моделям сложно поддерживать эту непрерывность. Во-вторых, модель на стороне клиента может лучше гарантировать конфиденциальность пользователей. Эта проблема привлекает все большее внимание. Если в будущем роботы широко проникнут в дом, проблемы конфиденциальности станут более серьезными. Преимущества клиентской модели в обеспечении конфиденциальности данных еще более очевидны.

Основываясь на этом понимании, некоторые компании, занимающиеся периферийными вычислениями, взяли на себя инициативу в реализации сценариев, связанных с периферийным ИИ, и успешно внедрили периферийный ИИ во многие области. Например, в области интеллектуального производства платформа периферийных вычислений NVIDIA Jetson может привнести возможности вычислений на основе искусственного интеллекта в промышленные сценарии и решать такие проблемы, как обнаружение дефектов и гибкое производство на сборочной линии, используя визуальное мышление искусственного интеллекта с ускорением на графическом процессоре. Решения Intel также используются в таких областях, как интеллектуальный мониторинг, образование и обучение, а также интеллектуальное медицинское обслуживание. Благодаря управлению различными периферийными устройствами они помогают периферийным интеллектуальным службам стать более гибкими, эффективными и точными.

Развитие периферийных и конечных моделей также привело к росту периферийных вычислений ИИ, а связанные с ними вычислительные мощности, чипы и другие звенья отраслевой цепочки положили начало волне крупномасштабного развития. Цю Сяосинь, основатель и председатель Aixin Yuanzhi, отметил, что по-настоящему крупномасштабная реализация больших моделей требует тесной интеграции облака, периферии и конечной стороны на трех уровнях. Ключ к сочетанию краевой и конечной сторон лежит в искусственном интеллекте. вычисления и восприятие. Цю Сяосинь считает, что интеллектуальные чипы и мультимодальные большие модели стали «золотой комбинацией» в эпоху искусственного интеллекта. Когда большие модели будут использоваться все более широко, ключевыми словами «умных» станут более экономичные, более эффективные и более экологически чистые. чипы и оснащенные искусственным интеллектом. Эффективный чип вывода процессора будет более разумным выбором для реализации больших моделей, что также является ключом к продвижению инклюзивного искусственного интеллекта. STL Partners прогнозирует, что к 2030 году потенциальный размер мирового рынка периферийных вычислений вырастет до 445 миллиардов долларов США, а совокупный годовой темп роста отрасли достигнет 48%.

Диверсифицированное развертывание вычислительных мощностей для решения проблем фрагментации

Однако развертывание крупных моделей на периферийной/конечной стороне невозможно осуществить в одночасье. Из-за ограничений вычислительных ресурсов периферийных устройств и разнообразия требований к вычислительным ресурсам крупных моделей периферийное развертывание в первую очередь столкнется с проблемами с точки зрения вычислительной мощности. С одной стороны, производителям моделей необходимо выполнять техническую обработку, такую как сжатие, сокращение и количественную оценку больших моделей, чтобы уменьшить размер и вычислительную сложность модели, чтобы она могла адаптироваться к требованиям производительности периферийных/конечных устройств; с другой стороны, какова база вычислительной мощности? Развертывание объектов также находится в центре внимания.

Чжан Юй, технический директор китайского подразделения Intel Network and Edge, подчеркнул, что, поскольку искусственный интеллект расширяет возможности тысяч отраслей, разные приложения предъявляют разные требования к вычислительной мощности, и диапазон очень широк. Те, у кого высокие требования к производительности, должны размещаться в кластере вычислительной мощности, в то время как можно использовать одно или несколько устройств с низкими требованиями к вычислительной мощности. Ян Лей, директор по продуктам Arm Technology, также сказал, что при развертывании таких крупных моделей искусственного интеллекта на терминалах он по-прежнему сталкивается с множеством проблем, таких как стоимость, энергопотребление и экосистема программного обеспечения.

В ответ на такие тенденции спроса поставщики вычислительной инфраструктуры, такие как Inspur и Lenovo, в последние годы строят схемы вычислительной мощности на базе «конечного облачного сетевого интеллекта». Продукция включает интеллектуальные пограничные шлюзы, пограничные серверы, промышленные контроллеры, встраиваемые компьютеры и другие аппаратные устройства для удовлетворения потребностей в вычислительной мощности в различных отраслях. Что касается чипов, то интеграция CPU+GPU+NPU стала направлением разработки процессоров, позволяющих справляться с более сложными вычислительными мощностями ИИ. Qualcomm запускает интегрированный специализированный нейронный процессор Snapdragon X Elite, который поддерживает десятки миллиардов моделей на уровне параметров. Процессор Intel Meteor Lake сочетает в себе NPU с функцией искусственного интеллекта вычислительного механизма процессора для повышения энергоэффективности ПК, на котором выполняются функции искусственного интеллекта. Что касается отечественных чипов искусственного интеллекта, компания Aixin Yuanzhi также недавно выпустила «процессор искусственного интеллекта Aixin Tongyuan». Базовый набор инструкций оператора и микроархитектура потока данных используют микроархитектуру программируемого потока данных, которая может эффективно повысить энергоэффективность и вычислительную мощность. Плотность, подходящая для разработки областей периферийных вычислений и искусственного интеллекта.

Проблемы энергоэффективности на периферийной стороне являются заметными, и ключевым моментом является облегченная разработка.

Энергоэффективность также является ключевым вопросом, который необходимо учитывать при разработке больших моделей. Фактически, если крупные модели хотят эффективно развертывать на периферийной/конечной стороне, по сравнению с облаком, проблемы энергоэффективности становятся более заметными. Сачин Катти, старший вице-президент Intel и генеральный менеджер подразделения Network and Edge, заявил в интервью автору, что при обсуждении вычислительной мощности, помимо оптимизации вычислительной мощности, экологии программного обеспечения и т. д., ключевым вопросом является энергопотребление. особенно когда он развернут на краю. Потребление энергии периферийного оборудования может составлять около 200 Вт; энергопотребление облачного развертывания может составлять от 1 до 2 кВт, а энергопотребление одноуровневой стойки в центре обработки данных может достигать 100 кВт. Если сложить энергопотребление всего центра обработки данных, оно может достичь масштаба от 50 до 100 ГВт.

Периферийные устройства часто имеют ограниченную вычислительную мощность и память, а большие модели требуют значительных ресурсов для высокопроизводительного вывода. «Поэтому ключевым вопросом стало то, как оптимизировать использование ресурсов и снизить потребление энергии, обеспечивая при этом точность модели и скорость реагирования. В ответ на эту тенденцию соответствующие производители продвигают облегченные среды разработки и библиотеки ускорения, такие как механизм развертывания моделей искусственного интеллекта Ryzen, выпущенный AMD, библиотека ускорения вывода Intel OpenVINO, высокопроизводительная библиотека ускорения вывода NVIDIA TensorRT и т. д. в сочетании с целевыми Облегченные среды разработки для встраиваемых и мобильных терминалов (такие как PyTorch Mobile, TensorFlow Lite, Paddle Lite и т. д.) могут способствовать широкому применению искусственного интеллекта в мобильных устройствах, Интернете вещей и других сценариях периферийных вычислений.

Кроме того, отрасль начала широко внедрять технологию жидкостного охлаждения в качестве средства охлаждения серверов и постепенно используется в центрах обработки данных и крупных моделях. Понятно, что существующая технология жидкостного охлаждения уже может охлаждать парк мощностью 100 кВт, и ожидается, что в будущем она будет расширена до 300 кВт.

Изучая приложения искусственного интеллекта, кто станет «звездой» в будущем?

Поскольку люди все больше подчеркивают возможности крупных моделей в промышленных приложениях, поиск подходящих «звездных сцен» стал ключевым вопросом, определяющим успех или провал отрасли. В настоящее время мобильные телефоны с искусственным интеллектом, компьютеры с искусственным интеллектом и автономное вождение стали наиболее перспективными рынками приложений для крупных моделей.

Последние исследования компании IDC, занимающейся исследованиями рынка, показывают, что рынок мобильных телефонов с искусственным интеллектом достигнет объема поставок в 234,2 миллиона единиц в 2024 году, что на 363,6% больше, чем 50,5 миллионов единиц, поставленных в 2023 году, и на него будет приходиться 19% от общего объема продаж смартфонов. рынок в этом году. В 2028 году поставки мобильных телефонов с искусственным интеллектом достигнут 912 миллионов единиц, а совокупный годовой темп роста составит 78,4%. Энтони Скарселла, директор по исследованиям компании IDC Worldwide Quarterly Mobile Phone Tracking, сказал, что стоимость останется ключевым фактором, сдерживающим выпуск телефонов с искусственным интеллектом, поскольку многие мощные чипы и NPU стоят дорого и в основном продаются на рынке сверхвысокого класса. Однако с течением времени и усилением конкуренции мы считаем, что эти компоненты найдут свое применение в моделях среднего и более доступного класса.

Компьютеры с искусственным интеллектом развиваются быстрее, чем первоначально ожидалось, и, как ожидается, они вызовут волну замен в мировой компьютерной индустрии. По прогнозу Canalys, глобальный уровень проникновения ПК с искусственным интеллектом увеличится с 19% до 71% в период с 2024 по 2028 год, а поставки увеличатся с 51 миллиона единиц до 208 миллионов единиц, при совокупном годовом темпе роста 42,11%. Morgan Stanley прогнозирует, что ПК с искусственным интеллектом будут составлять 2% от общего рынка ПК в этом году и вырастут до 16% в следующем году, 28% в 2026 году, 48% в 2027 году и 64% в 2028 году.

Использование больших моделей в автомобилях все еще находится на ранней стадии. Однако по мере того, как концепция интеллекта постепенно укореняется в сердцах людей, большинство людей пришли к единому мнению, что автомобили в конечном итоге станут «ходячими мобильными терминалами». большие модели искусственного интеллекта в автомобилях также «поедут по экспрессу». Есть два основных направления установки больших моделей в автомобили: первое — это проникновение в кабину для достижения более интеллектуального взаимодействия человека и компьютера; другое — взаимодействие с системой автоматического вождения для дальнейшего совершенствования интеллектуальных решений для вождения. Чжан Чи, технический директор Maichi Intelligent Technology Co., Ltd., заявил, что крупные модели ускоряют переход автономного вождения от автомагистралей к более сложным городским сценариям, а также способствуют формированию сквозного восприятия и интеграции управления. Лю Цзяньвэй, соучредитель и вице-президент Aixin Yuanzhi, сказал, что Aixin Yuanzhi предсказал появление Transformer в 2022 году и возглавил выпуск чипа, оснащенного процессором Aixin Tongyuan AI. Чипы интеллектуального вождения Aixin Yuanzhi, такие как M55H и M76H, установлены на текущие модели, пользующиеся спросом.

Новости

Что осталось от большой модели, приземлившейся на краю?

Введение

моя контактная информация