Новости

Звездный ИИ-единорог Mistral AI представляет нового короля больших моделей с превосходными способностями к программированию и математическим вычислениям

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Zhidixi (публичный аккаунт: zhidxcom)

Составлено | Ло Тяньцзинь

Редактор | Юнпэн

Zhidongzhi News от 17 июля, согласно вчерашнему сообщению VentureBeat, французский стартап Mistral AI недавно выпустил две новые модели искусственного интеллекта: Codestral Mamba 7B, модель генерации кода для программистов и разработчиков, а другая предназначена для математики. Модель искусственного интеллекта, предназначенная для соответствующих рассуждений и научных открытий.

Codestral Mamba 7B обеспечивает более быстрый вывод и более длинный контекст, обеспечивая быстрое время отклика даже при вводе длинного текста. В то же время модель может обрабатывать входные данные до 256 000 токенов, что вдвое больше, чем у GPT-4o.

Mathstral 7B имеет контекстное окно размером 32 КБ и будет использовать лицензию Apache 2.0 с открытым исходным кодом. Он может достигать лучших результатов, чем другие модели математических рассуждений, в тестах с большим количеством вычислений времени вывода. Модель также имеет возможности тонкой настройки.

1. Модели генерации кода могут обрабатывать более длинные контексты.

Хорошо финансируемый французский стартап Mistral AI, известный своими мощными моделями искусственного интеллекта с открытым исходным кодом, сегодня представил две новые модели в своем растущем семействе больших языковых моделей (LLM): математическую модель и модель для программистов, а также модель генерации кода для разработчики на основе Mamba, новой архитектуры, разработанной другими исследователями в конце прошлого года.

Mamba пытается повысить эффективность архитектуры преобразователя, используемой большинством ведущих LLM, за счет упрощения механизма внимания. Модели на основе Mamba отличаются от более распространенных моделей на основе Transformer тем, что они могут иметь более высокую скорость вывода и большие контекстные окна. Другие компании и разработчики, в том числе AI21, выпустили на его основе новые модели ИИ.

Теперь, благодаря этой новой архитектуре, Mistral AI удачно называет ееКодестрал Мамба 7Б , что обеспечивает быстрое время отклика, даже если вводимый текст длинный. Codestral Mamba подходит для повышения производительности кода, особенно для локальных проектов кодирования.

Mistral AI протестировал модель, которая будет доступна бесплатно через API Plateforme от Mistral AI, обрабатывая входные данные до 256 000 токенов, что в два раза быстрее, чем GPT-4o от OpenAI.

Mistral AI показывает, что Codestral Mamba работает лучше, чем конкурирующие модели с открытым исходным кодом CodeLlama 7B, CodeGemma-1.17B и DeepSeek в таких тестах, как HumanEval.

Разработчики могут модифицировать и развертывать Codestral Mamba из репозитория GitHub и HuggingFace. Он будет доступен под лицензией Apache 2.0 с открытым исходным кодом.

Mistral AI утверждает, что ранние версии Codestral превосходят другие генераторы кода, такие как CodeLlama 70B и DeepSeek Coder 33B.

Помощники по генерации кода и кодированию стали широко используемыми приложениями для моделей искусственного интеллекта, при этом популярность таких платформ, как Copilot от GitHub, CodeWhisperer от Amazon и Codenium на базе OpenAI, растет.

2. Модель математического рассуждения обладает отличными возможностями, а также имеет возможности тонкой настройки.

Вторая модель, выпущенная Mistral AI, —Математика 7Б , модель искусственного интеллекта, предназначенная для математических рассуждений и научных открытий. Mistral AI разработал Mathstral в рамках проекта Numina.

Mathstral имеет контекстное окно размером 32 КБ и будет использовать лицензию с открытым исходным кодом Apache 2.0. Mistral AI утверждает, что эта модель превосходит все модели, предназначенные для математических рассуждений. Он может достичь «значительно лучших результатов» в тестах с большим количеством вычислений времени вывода. Пользователи могут использовать его как есть или настроить модель.

Mistral AI написал в своем блоге: «Mathstral — еще один пример достижения превосходной производительности при построении моделей для конкретной цели — философия разработки, которую мы активно продвигаем в духе Plateforme, особенно с ее новой функцией точной настройки».

Доступ к Mathstral можно получить через Mistral AI a la Plataforme и HuggingFace.

Mistral AI предпочитает делать свои модели доступными в системах с открытым исходным кодом, и компания конкурирует с другими разработчиками ИИ, такими как OpenAI и Anthropic.

Недавно компания привлекла $640 млн в рамках финансирования серии B, оценив его почти в $6 млрд. Компания также получила инвестиции от таких технологических гигантов, как Microsoft и IBM.

Вывод: битва за производительность больших моделей достигает новых высот

С точки зрения отрасли, новые модели Mistral AI подчеркивают тенденцию того, что инструменты искусственного интеллекта становятся более профессиональными. Предоставляя мощные и доступные модели, такие как Mistral 7B и Codestral Mamba 7B, Mistral AI становится важным игроком в области искусственного интеллекта. разработка инновационных и практических приложений.

Эти модели также подчеркивают важность ИИ с открытым исходным кодом, поощряя сотрудничество и большую прозрачность в технологическом сообществе. Предоставляя мощные инструменты искусственного интеллекта более широкой аудитории, мы будем способствовать дальнейшему ускорению итерации и развитию области больших моделей искусственного интеллекта.

Источник: VentureBeat