Новости

Meta выпускает Llama 3.1, самую сильную модель с открытым исходным кодом, Цукерберг: Это станет поворотным моментом для отрасли

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Вечером 23 июля по пекинскому времени компания Meta официально выпустила новейшую серию крупных моделей Llama 3.1 с открытым исходным кодом, что еще больше сократило разрыв между моделями с открытым исходным кодом и моделями с закрытым исходным кодом. Llama 3.1 включает в себя три размера параметров: 8B, 70B и 450B. Модель параметров 450B превзошла OpenAI GPT-4o в нескольких тестах производительности и сравнима с ведущими моделями с закрытым исходным кодом, такими как Claude 3.5 Sonnet.


Основатель и генеральный директор Meta Цукерберг в то же время разместил блог на официальном сайте, чтобы придать импульс этому выпуску. Он сказал, что версия Llama 3.1 станет поворотным моментом в отрасли. Большинство разработчиков начнут в основном использовать открытый исходный код. источник ИИ – это будущее.

Старший научный сотрудник NVIDIA Джим Фан опубликовал сообщение на X, чтобы поздравить команду Meta. Он отметил: «Сила GPT-4 в наших руках. (Это) поистине исторический момент».

Что касается конкретных деталей, то контекстное окно модели трех версий Llama 3.1 увеличено с 8К до 128К, расширено в 16 раз и поддерживает 8 языков одновременно. Модель Llama 3.1-405B использовала для обучения более 15 триллионов токенов, а для достижения такого масштаба обучения команда использовала 16 000 графических процессоров H100. Официально модель 405B является первой моделью Llama, обученной в таком масштабе.

Модели больших языков с открытым исходным кодом в основном отстают от моделей с закрытым исходным кодом с точки зрения функциональности и производительности, «но сейчас мы вступаем в новую эру, возглавляемую открытым исходным кодом».

В официальном блоге Meta оценила производительность более чем 150 наборов тестовых данных и сравнила производительность Llama 3.1 с другими моделями. Флагманская модель Llama 3.1-405B может конкурировать с GPT в ряде задач, таких как здравый смысл, работоспособность, производительность. и математика -4, GPT-4o сравнима с Сонетом Клода 3.5. Более того, небольшие модели 8B и 70B конкурентоспособны с моделями с закрытым и открытым исходным кодом с аналогичным количеством параметров.


В реальных сценариях Llama 3.1 405B сравнивался с оценкой человеком, и его общая производительность оказалась лучше, чем у GPT-4o и Claude 3.5 Sonnet.


На этот раз Meta также обновила лицензию с открытым исходным кодом, что позволило разработчикам впервые использовать результаты модели Llama (включая 405B) для улучшения других моделей. Оценивая GPT-4o, официальные лица заявили, что они также будут использовать комбинированный метод для интеграции функций изображения, видео и голоса в Llama 3, чтобы модель могла распознавать изображения и видео и поддерживать взаимодействие посредством голоса. Однако эта функция все еще находится в стадии разработки и еще не готова к выпуску.

В официальном блоге Meta сообщила, что общее количество загрузок всех версий Llama на данный момент превысило 300 миллионов раз.

В дополнение к этому выпуску модели Цукерберг также опубликовал на официальном сайте длинную статью «ИИ с открытым исходным кодом — путь вперед», в которой упомянул важность открытого исходного кода. Он считает, что открытый исходный код выгоден всем разработчикам, Мете и другим. для мира это хорошая вещь.


Цукерберг привел в качестве примера победу системы с открытым исходным кодом Linux над системой с закрытым исходным кодом Unix и полагал, что искусственный интеллект будет развиваться аналогичным образом. «Есть несколько технологических компаний, разрабатывающих ведущие закрытые модели, но открытый исходный код быстро сокращает этот разрыв». Он отметил, что в прошлом году Llama 2 можно было сравнивать только с моделью старшего поколения. И в этом году Llama 3 в некоторых областях конкурентоспособен, а в некоторых даже опережает самые продвинутые модели.

Цукерберг считает, что открытый исходный код может способствовать инновациям, снижению затрат и повышению безопасности. Разработчикам использование открытого исходного кода позволяет обучать, настраивать и анализировать собственные модели. У каждой организации разные потребности, и эти потребности лучше всего удовлетворяются за счет использования моделей разных размеров, которые обучаются или настраиваются на конкретных данных. из.

В то же время разработчики не привязаны к закрытым поставщикам для защиты безопасности данных. «Программное обеспечение с открытым исходным кодом, как правило, более безопасно, потому что его разработка более прозрачна и может быть широко проверена».

Цукерберг также упомянул, что модель с открытым исходным кодом дешевле и эффективнее. Разработчики могут выполнять логический вывод на Llama 3.1 405B в своей собственной инфраструктуре при затратах около 50% по сравнению с использованием закрытой модели, такой как GPT-4o, подходящей для пользовательского интерфейса. и автономные задачи вывода.

«Искусственный интеллект с открытым исходным кодом представляет собой лучшую возможность в мире». По мнению Цукерберга, использование этой технологии может создать величайшие экономические возможности и безопасность.