Звездные компании искусственного интеллекта яростно борются за использование небольших моделей, стоимость которых резко падает, и они экономят счета за электроэнергию, что ускоряет популярность AI

Звездные компании ИИ конкурируют с небольшими моделями, их стоимость резко падает, и они экономят счета за электроэнергию, что ускоряет популярность ИИ.

2024-07-22

Умные вещи (паблик аккаунт:zhidxcom）
Составлено Мэн Цян
Редактор Юнпэн

Согласно отчетам Venture Beat, на прошлой неделе 16 и 18 июля Hugging Face, Mistral AI и OpenAI запустили свои соответствующие малые модели (SLM), обещая популяризировать расширенные возможности обработки естественного языка. В прошлом технологические компании конкурировали за создание более крупных и сложных нейронных сетей на пути к большим языковым моделям. Venture Beat считает, что эти небольшие модели открывают новые пути и могут также повлиять на то, как предприятия используют решения искусственного интеллекта.

Маленькие модели, как следует из названия, относятся к большим языковым моделям (LLM). Они обычно имеют меньше параметров и меньшие требования к вычислительным ресурсам. По сравнению с большими языковыми моделями с параметрами, часто исчисляемыми сотнями миллиардов или даже триллионами, параметры трех новых малых моделей: SmolLM, Mistral NeMo и GPT-4o mini могут варьироваться от сотен миллионов до десятков миллиардов, в зависимости от обучения. Объем энергопотребления ниже, чем у больших языковых моделей. Хотя эти три модели используют разные методы популяризации ИИ, все они имеют общую цель: предоставить мощные возможности обработки языка большему количеству устройств и приложений.

1. Как небольшие модели меняют периферийные вычисления

Venture Beat считает, что SmolLM от Hugging Face — самый инновационный из трех. Он специально разработан для работы на мобильных устройствах и имеет три спецификации: 135 миллионов, 360 миллионов и 1,7 миллиарда параметров, что облегчает обработку ИИ на периферийных устройствах и решает ключевые проблемы конфиденциальности данных и задержки.

Значение СмолЛМ выходит далеко за рамки повышения эффективности. Разрешение периферийным устройствам использовать обработку ИИ может позволить приложениям устройств работать с низкой задержкой и высоким уровнем защиты конфиденциальности. В прошлом многие сложные функции искусственного интеллекта не могли быть реализованы из-за проблем с конфиденциальностью или подключением. Благодаря SmolLM эти функции могут стать реальностью.

Кроме того, Mistral AI запустила модель Mistral NeMo, которая имеет 12 миллиардов параметров и контекстное окно до 128 тысяч. Mistral NeMo ориентирован на настольные компьютеры и занимает промежуточное положение между большими облачными моделями и сверхкомпактными мобильными ИИ. Первый представляет собой крупномасштабную модель ИИ, обученную и работающую на платформе облачных вычислений, а второй — мобильное устройство с ограниченными ресурсами. например, мобильный телефон) и носимые устройства).

Venture Beat заявила, что вычислительный метод Mistral NeMo может принести значительные изменения в корпоративную сферу. Эта модель потенциально может использовать аппаратное обеспечение потребительского уровня для демократизации сложных возможностей искусственного интеллекта, которые когда-то были прерогативой технологических гигантов и хорошо финансируемых исследовательских институтов. Это может помочь различным отраслям популяризировать приложения на основе искусственного интеллекта, например оптимизировать обслуживание клиентов и предоставить более сложные инструменты анализа данных.

2. Эффективная маленькая модель GPT-4o mini от OpenAI имеет прекрасную цену.

OpenAI также присоединилась к конкуренции небольших моделей, выпустив GPT-4o mini, которую называют самой экономичной маленькой моделью на рынке. Venture Beat утверждает, что GPT-4o mini значительно снижает доступ к фонду интеграции ИИ.

Кроме того, ценовая стратегия GPT-4o mini может породить новую волну инноваций, основанных на искусственном интеллекте, особенно среди стартапов и малого бизнеса. Значительно снижая стоимость интеграции ИИ, эта модель эффективно снижает входной барьер для внедрения решений на основе ИИ. Ventrue Beat считает, что это может ускорить технологические инновации и реформы во многих отраслях. Кроме того, этот сдвиг в сторону более мелких моделей отражает новые тенденции в сообществе ИИ: исследователи и разработчики все больше внимания уделяют эффективности, доступности и нишевым приложениям. Эта тенденция может привести к появлению более целенаправленных и эффективных решений искусственного интеллекта, оптимизированных для конкретных задач и отраслей.

3. Маленькие модели способствуют инновациям в области «зеленых» технологий и уменьшают выбросы углекислого газа в результате технологий.

Сдвиг в сторону более мелких моделей также согласуется с растущей обеспокоенностью по поводу воздействия ИИ на окружающую среду. Обучение и эксплуатация небольших моделей потребляют меньше энергии, что может снизить выбросы углекислого газа от технологии искусственного интеллекта. Поскольку технологические компании сталкиваются с растущим давлением в вопросах устойчивого развития, Venture Beat считает, что низкое энергопотребление и низкий уровень выбросов небольшой модели могут стать важным аргументом в пользу ее продажи.

Экологические последствия этого перехода к более мелким моделям могут быть глубокими. Поскольку ИИ становится все более распространенным, экономия энергии за счет распространения более эффективных моделей может быть огромной. Это может позволить ИИ взять на себя ведущую роль в «зеленых» инновациях, а не продолжать способствовать глобальному потеплению.

Однако распространение небольших моделей не обходится без проблем. По мере того как ИИ становится все более распространенным, вопросы предвзятости, подотчетности и этического использования становятся все более актуальными. Если оставить это без регулирования, распространение ИИ с помощью небольших моделей может усилить существующие предубеждения или создать новые этические дилеммы. Для разработчиков и пользователей небольших моделей, помимо технических возможностей, в приоритете должны стоять и этические вопросы.

Вывод: будущее развития ИИ указывает на диверсификацию и специализацию.

Хотя небольшие модели имеют преимущества в эффективности и возможности обобщения, их вычислительная мощность может не соответствовать мощности больших языковых моделей при решении многих задач из-за ограничений в количестве параметров. Venture Beat заявила, что это показывает, что в будущем ландшафте разработки ИИ будут языковые модели разных размеров, а более мелкие модели будут иметь определенные аспекты, в которых они хороши.

Заглядывая в будущее, мы ожидаем, что разработка моделей ИИ будет процветать. Будь то большая языковая модель или маленькая модель, универсальный подход не рекомендуется. Ключевым моментом является поиск баланса между размером модели. требования к производительности и конкретным приложениям. Для предприятий и лиц, принимающих технические решения, эти три небольшие модели представляют собой переход к более эффективным, профессиональным и легко развертываемым решениям ИИ, предоставляя новые возможности для интеграции ИИ в корпоративные среды. Что касается того, смогут ли малые модели заменить нынешнее доминирование крупных моделей в облаке, то выводы делать пока рано.

Источник: VentureBeat

Новости

Звездные компании ИИ конкурируют с небольшими моделями, их стоимость резко падает, и они экономят счета за электроэнергию, что ускоряет популярность ИИ.

Введение

моя контактная информация