Мощный инструмент для настройки моделей Llama 3.1 уже здесь! NVIDIA создает платформу генеративного искусственного интеллекта и ускоряет развертывание

2024-07-24

умные вещи
АвторZeR0
Редактор Мо Ин

24 июля компания Zhidongxi сообщила, что NVIDIA объявила о запуске нового сервиса NVIDIA AI Foundry и микросервиса вывода NVIDIA NIM. Вместе с недавно выпущенной серией моделей с открытым исходным кодом Meta Llama 3.1 это обеспечит мощную поддержку генеративного искусственного интеллекта для глобальных предприятий.

Большая языковая модель Llama 3.1 имеет три размера параметров: 8B, 70B и 405B. Модели обучены на более чем 16 000 графических процессорах NVIDIA Tensor Core и оптимизированы для ускоренных вычислений и программного обеспечения NVIDIA, будь то в центре обработки данных, в облаке и на локальных рабочих станциях с графическими процессорами NVIDIA RTX или ПК с графическими процессорами GeForce RTX.

Подобно тому, как TSMC является фабрикой для мировых производителей чипов, NVIDIA также создала фабрику искусственного интеллекта корпоративного уровня — NVIDIA AI Foundry.

Основатель и генеральный директор NVIDIA Дженсен Хуанг сказал: «Модель с открытым исходным кодом Meta 3.1 Llama 3.1 знаменует собой критический момент для глобальных предприятий по внедрению генеративного ИИ. Llama 3.1 положит начало волне компаний и отраслей, создающих передовые приложения генеративного ИИ. NVIDIA AI Foundry Llama 3.1 интегрирован на протяжении всего процесса и может помочь предприятиям создавать и внедрять специальные супермодели Llama».

NVIDIA AI Foundry, основанная на платформе NVIDIA DGX Cloud AI и разработанная совместно NVIDIA с ведущими публичными облаками мира, предоставляет комплексный сервис, который можно использовать для быстрого создания пользовательских супермоделей с целью предоставить предприятиям масштабные вычисления. предоставленные ресурсы. Вычислительные ресурсы можно легко расширить по мере изменения потребностей ИИ.

«С помощью NVIDIA AI Foundry предприятия могут легко создавать и настраивать самые передовые сервисы искусственного интеллекта, которые им нужны, и развертывать их с помощью NVIDIA NIM», — сказал основатель и генеральный директор Meta Марк Цукерберг.

Предприятия, которым требуется больше обучающих данных для создания моделей, специфичных для предметной области, могут использовать свои собственные данные, а также синтетические данные, созданные моделями Llama 3.1 405B и NVIDIA Nemotron Reward, для обучения этих супермоделей для повышения точности. Клиенты, имеющие собственные данные обучения, могут использовать NVIDIA NeMo для настройки моделей Llama 3.1, дополнительно повышая точность моделей за счет адаптивного предварительного обучения в домене (DAPT).

NVIDIA и Meta также работают вместе, чтобы предоставить разработчикам метод дистилляции Llama 3.1 для создания меньших по размеру пользовательских моделей Llama 3.1 для генеративных приложений искусственного интеллекта. Это позволяет предприятиям запускать приложения искусственного интеллекта на базе Llama в более ускоренной инфраструктуре, такой как рабочие станции искусственного интеллекта и ноутбуки.

После создания пользовательской модели предприятия могут создавать микросервисы вывода NVIDIA NIM, чтобы использовать выбранные ими лучшие в своем классе операции машинного обучения (MLOps) и искусственного интеллекта на предпочитаемой ими облачной платформе и сертифицированных NVIDIA системах от мировых производителей серверов. (AIOps) платформы запускают эти модели в производство.

Микросервисы NIM помогают развертывать модели Llama 3.1 в рабочей среде с пропускной способностью в 2,5 раза выше, чем при выполнении вывода без NIM.

Узнайте о микросервисах вывода NVIDIA NIM для моделей Llama 3.1 на сайте ai.nvidia.com, чтобы ускорить развертывание моделей Llama 3.1 для искусственного интеллекта промышленного уровня.

Сочетание микросервисов NIM Llama 3.1 с новыми микросервисами NIM NVIDIA NeMo Retriever позволяет создавать расширенные рабочие процессы поиска для ИИ-пилотов, помощников и цифровых человеческих аватаров.

Используя новый микросервис вывода NIM NVIDIA NeMo Retriever для реализации расширенной генерации извлечения (RAG), предприятия могут развертывать в производстве собственные супермодели Llama и микросервисы Llama NIM, чтобы повысить точность ответа.

В сочетании с микросервисом вывода NVIDIA NIM для Llama 3.1 405B микросервис NeMo Retriever NIM обеспечивает чрезвычайно высокую точность поиска для ответов на открытые и коммерческие текстовые вопросы в рабочих процессах RAG.

NVIDIA AI Foundry объединяет программное обеспечение, инфраструктуру и опыт NVIDIA с моделями открытого сообщества, технологиями и поддержкой экосистемы NVIDIA AI. Эксперты NVIDIA AI Enterprise и глобальные системные интеграторы работают с клиентами AI Foundry, чтобы ускорить весь процесс от разработки до развертывания.

Компания Accenture, предоставляющая профессиональные услуги, первой использовала NVIDIA AI Foundry для использования платформы Accenture AI Refinery для создания пользовательских моделей Llama 3.1 для себя и для клиентов, которые хотят, чтобы генеративные приложения искусственного интеллекта, которые они развертывают, отражали их культуру, язык и отрасль.

Предприятия в сфере здравоохранения, энергетики, финансовых услуг, розничной торговли, транспорта, телекоммуникаций и других отраслей уже используют микросервисы NVIDIA NIM для Llama. Первыми компаниями, которые будут использовать новые микросервисы NIM для Llama 3.1, являются Aramco, AT&T, Uber и т. д.

Сотни партнеров NVIDIA NIM, предоставляющих корпоративные платформы, платформы данных и инфраструктуры, теперь могут интегрировать эти новые микросервисы в свои решения искусственного интеллекта, обеспечивая генеративный искусственный интеллект для сообщества NVIDIA, насчитывающего более 5 миллионов разработчиков и 19 000 стартапов. Окажите помощь.

Производственная поддержка микросервисов Llama 3.1 NIM и NeMo Retriever NIM доступна через NVIDIA AI Enterprise. Участники программы разработчиков NVIDIA вскоре получат бесплатный доступ к микросервисам NIM для проведения исследований, разработок и тестирования предпочитаемой ими инфраструктуры.

Новости

Мощный инструмент для настройки моделей Llama 3.1 уже здесь! NVIDIA создает платформу генеративного искусственного интеллекта и ускоряет развертывание

Введение

моя контактная информация