новости

OpenAI выпускает новые функции, которые позволяют компаниям настраивать самые мощные модели ИИ на основе собственных данных

2024-08-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

ТенсентНовости науки и технологий, 21 августа, вторник, местное время США,OpenAIЗапущена новая функция, которая позволит корпоративным клиентам настраивать этот продукт, используя данные своей компании.ИИ (ИИ) Самая мощная модель для стартаповГПТ-4о

OpenAI планирует во вторник запустить возможности настройки, широко известные в индустрии искусственного интеллекта как подталкивания. Точная настройка позволяет обучать существующие модели ИИ дополнительной информацией о конкретной задаче или предметной области.

Например, компания, производящая скейтборды, может настроить модель искусственного интеллекта так, чтобы ее можно было использовать в качестве чат-бота для обслуживания клиентов, способного отвечать на вопросы о деталях колес и уходе за скейтбордом.

В нынешних условиях жесткой конкуренции среди стартапов в области продуктов искусственного интеллекта, когда компаниям срочно необходимо продемонстрировать окупаемость инвестиций в искусственный интеллект, доработка новейших функций флагманской модели OpenAI особенно важна.

Стоит отметить, что эта функция была впервые представлена ​​в GPT-4o и его предшественниках, а OpenAI ранее предоставляла пользователям разрешения на тонкую настройку для нескольких типов моделей, включая GPT-4o mini, предоставляя пользователям более экономичные варианты.

Столкнувшись с услугами по настройке моделей, предоставляемыми многими технологическими компаниями на рынке, директор по продуктам OpenAI API Оливье Годеман подчеркнул, что OpenAI стремится упростить и ускорить настройку клиентов в своих лучших моделях путем установления прямых партнерских отношений с предприятиями, чтобы избежать обращения пользователей к внешним источникам. услуги или более слабые альтернативы.

Он также отметил: «Мы всегда стремимся снизить технический порог и уменьшить эксплуатационные барьеры, тем самым уменьшая нагрузку пользователя на запуск и настройку моделей».

Когда клиенты выполняют тонкую настройку модели, им необходимо передавать данные на сервер OpenAI. По словам инженера-программиста OpenAI Джона Алларда, этот процесс занимает в среднем около часа или двух. Первоначально точная настройка будет ограничена текстовыми данными без поддержки изображений или других медиаформатов.

Поскольку OpenAI выпускает бесплатные токены, она сталкивается с проблемами со стороныGoogleАнтропныйи другие поставщики запатентованных моделей и Nous Research Hermes 3.Мета Жесткие ценовые войны за модели с открытым исходным кодом, такие как Llama 3.1.

Однако преимущество использования OpenAI и аналогичных моделей с закрытым исходным кодом/проприетарных моделей заключается в том, что разработчикам не нужно выполнять задачи по размещению серверов, связанные с выводом моделей или обучением. Они могут либо использовать ресурсы сервера OpenAI, либо беспрепятственно подключать предпочитаемые ими серверы через API.

Однако исследования показывают, что точная настройка модели может повлечь за собой риски, в том числе отклонения от первоначальных показателей безопасности и гарантий производительности, что, в свою очередь, влияет на ее общую эффективность. Готовы ли компании пойти на этот риск, нужно взвесить самостоятельно. Но OpenAI явно считает, что оно того стоит, и призывает пользователей рассмотреть возможность тонкой настройки как вариант оптимизации.

Кроме того, во вторник OpenAI заявила, что будет включать в свои продукты контент от таких брендов, как Vogue, The New Yorker и Wired. Соглашение также позволяет OpenAI использовать контент Condé Nast для обучения своих моделей искусственного интеллекта, для изучения которых требуются большие объемы данных.

Это объявление знаменует собой усиление усилий OpenAI заключать сделки с медиакомпаниями, а не бороться с ними за то, как использовать новостные статьи и другой контент в своих инструментах искусственного интеллекта. Стороны не раскрыли сумму сделки по соглашению.

Ниже приводится полный текст официальных новостей, опубликованных OpenAI:

Сегодня мы запускаем тонкую настройку GPT-4o, одной из самых востребованных функций у разработчиков. С 23 сентября мы также будем ежедневно бесплатно предоставлять каждому предприятию 1 миллион обучающих жетонов.

Теперь разработчики могут точно настраивать GPT-4o, используя свои уникальные наборы данных, чтобы добиться более высокой производительности при меньших затратах для конкретных случаев использования. Технология тонкой настройки дает модели возможность гибко настраивать структуру и тон ответов и даже следовать сложным и узкоспециализированным инструкциям предметной области. Для получения значимых результатов требуется лишь небольшое количество обучающих выборок (например, десятки примеров). приложение.

Функция точной настройки охватывает широкий спектр областей — от кодирования до творческого письма, глубоко влияя и улучшая общую производительность модели. Это только начало, и мы продолжим инвестировать в расширение возможностей настройки модели для разработчиков.

Отныне функция тонкой настройки GPT-4o полностью открыта для всех платящих разработчиков. Посетите панель тонкой настройки напрямую, нажмите кнопку «Создать» и выберите «GPT-4o -2024-08-06» в раскрывающемся списке базовой модели, чтобы начать процесс тонкой настройки. Что касается затрат, затраты на обучение тонкой настройке GPT-4o установлены на уровне 25 долларов США за миллион токенов, в то время как затраты на вывод составляют 3,75 долларов США за миллион входных токенов и 15 долларов США за миллион выходных токенов.

Кроме того, функция мини-тонкой настройки GPT-4o также доступна всем платящим разработчикам. Вам просто нужно выбрать «GPT-4o-mini-2024-07-18» в качестве базовой модели в панели тонкой настройки. Специальное предложение: в честь запуска мы бесплатно предоставляем пользователям GPT-4o mini до 2 миллионов токенов обучения каждый день. Это предложение действительно до 23 сентября.

Истории успеха

За последние несколько месяцев мы работали с рядом доверенных партнеров над тонкой настройкой и тестированием GPT-4o и пониманием вариантов их использования. Вот несколько успешных примеров:

1. Cosine показал отличные результаты в тесте SWE-bench.

Стартап КосинусДжиннЭто помощник по разработке программного обеспечения с искусственным интеллектом, который может самостоятельно выявлять и устранять уязвимости, создавать функции и эффективно сотрудничать с пользователями для рефакторинга кода. Он также может решать сложные технические проблемы и вносить изменения в код с более высокой точностью и меньшими требованиями к токенам.

В основе Genie лежит тщательно настроенная модель GPT-4o, которая включает в себя реальный опыт реальных инженеров-программистов, что позволяет модели научиться реагировать определенным образом. Кроме того, модель также позволяет форматировать выходные данные в определенные форматы, такие как исправления, которые можно легко интегрировать в базу кода, что еще больше повышает эффективность работы.

Результаты тестов SWE-bench, опубликованные в прошлый вторник, показали, что производительность Genie составила 43,8%.СОТАРезультат выдающийся, особенно в полном тесте. Его показатель SOTA достигает 30,08%, что является значительным скачком по сравнению с предыдущим лучшим результатом в 19,27%, что означает значительный прорыв в истории этого эталонного теста. SWE-Bench — это тест, который оценивает возможности разработки программного обеспечения искусственного интеллекта.

2.Distyl занимает первое место в тесте BIRD-SQL.

Distyl, партнер по решениям в области искусственного интеллекта для компаний из списка Fortune 500, недавно занял первое место в тесте BIRD-SQL, ведущем тесте преобразования текста в SQL. Точно настроенный GPT-4o от Distyl достигает точности выполнения 71,83% в таблице лидеров и хорошо справляется с такими задачами, как переформулирование запросов, классификация намерений, формирование цепочки мыслей и самокоррекция, а особенно выдающиеся результаты при генерации SQL.

Конфиденциальность и безопасность данных

Модель точной настройки полностью находится под контролем пользователя, который полностью владеет бизнес-данными, охватывающими все входные и выходные данные. Это гарантирует, что данные пользователя никогда не будут переданы или использованы для обучения других моделей.

Кроме того, мы внедрили многоуровневые механизмы защиты для точно настроенных моделей для предотвращения злоупотреблений. Например, мы постоянно проводим автоматизированные оценки безопасности для точно настроенных моделей и отслеживаем использование, чтобы гарантировать соответствие приложений нашим политикам использования.

Мы с нетерпением ждем возможности увидеть, что вы создадите, настроив GPT-4o. Если вы хотите изучить больше возможностей для настройки модели, свяжитесь с нашей командой, и мы будем рады предоставить вам поддержку и помощь! (Составлено/Золотой олень)