тяжелый! на рынке появилась большая модель рассуждения openai, которая может «думать о логике решения проблем», и познание подскочит до «уровня аспиранта в области естественных наук»

тяжелый! на сцене появится крупномасштабная модель рассуждения openai, которая может «думать о логике решения проблем», и познание подскочит до «уровня аспиранта в области естественных наук».

2024-09-13

примерно в час ночи в пятницу по пекинскому времени эра искусственного интеллекта открыла новую отправную точку — на первый план наконец вышли большие модели, способные к общим и сложным рассуждениям.

источник изображения: visual china-vcg31n2008743681.

openai объявила на своем официальном сайте, что:начата рассылка всем подписчикам предварительной модели openai o1 — долгожданной большой модели «клубника».. openai заявила, что для сложных задач рассужденияновая модель представляет собой новый уровень возможностей искусственного интеллекта., поэтому стоит сбросить счетчик на 1 и дать ему новое имя, отличное от серии «gpt-4».

характеристики больших моделей вывода:ии будет тратить больше времени на размышления, прежде чем ответить, точно так же, как люди думают о процессе решения проблем.. логика предыдущих больших моделей заключалась в том, чтобы предсказать последовательность генерации слов путем изучения шаблонов в большом количестве наборов данных. строго говоря, они не совсем понимали вопрос.

в качестве первой версии модели серии o1 openai выпустила только предварительную версию o1-preview и мини-версию o1-mini, и она запускалась поэтапно для платных пользователей, бесплатных пользователей и разработчиков, а цена для разработчиков довольно дорогая. .

стоимость использования модели o1 как минимум в 3 раза выше, чем у gpt-4o. она обучается по новому методу.

по имеющимся данным, новая модель o1 может решать более сложные задачи программирования, математики и науки благодаря новому методу обучения, лежащему в ее основе. она «думает», прежде чем дать ответ, и работает быстрее, чем люди. меньшая и более дешевая мини-версия ориентирована на сценарии использования в программировании.

платные пользователи chatgpt plus и team получат немедленный доступ к обеим моделям, выбрав их вручную из раскрывающегося меню выбора модели ai в пользовательском интерфейсе. оба режима будут доступны пользователям chatgpt enterprise и edu на следующей неделе, а доступ к o1-mini будет доступен всем бесплатным пользователям в неизвестное время в будущем. openai надеется в будущем автоматически выбирать правильную модель на основе подсказок.

однако доступ разработчика к o1 очень дорог. в api (интерфейс прикладного программирования) o1-preview взимает 15 долларов за 1 миллион входных токенов, что в три раза превышает стоимость gpt-4o, и 60 долларов за 1 миллион выходных токенов. в четыре раза дороже гпт-4о. один миллион токенов — это размер текстового блока, который анализирует модель, что эквивалентно примерно 750 000 слов.

джерри творек, руководитель отдела исследований openai, сообщил сми:о1метод обучения, лежащий в его основе, принципиально отличается от предыдущих моделей.

во-первых, o1 был «обучен с использованием совершенно нового алгоритма оптимизации и нового набора обучающих данных, специально предназначенного для него», который содержал «данные вывода» и научную литературу, специально предназначенную для него.

во-вторых, предыдущий метод обучения модели gpt заключался в имитации правил/парадигм набора данных, тогда как o1 использует «обучение с подкреплением», чтобы научить модель решать проблемы самостоятельно через вознаграждения и наказания, а затем через «цепочку идей». «(цепочка идей) мыслей), чтобы разобраться с проблемами запросов пользователей и дать краткую версию цепочки мыслей, подобно тому, как люди шаг за шагом решают проблемы.

на картинке справа можно нажать на цепочку идей, чтобы увидеть, как «думает» модель о1.

диаграмма, показывающая цепочку идей для сложной математической задачи.

openai считает, что этот новый метод обучения сделает модель o1 более точной и уменьшит проблему «галлюцинаций» при составлении ответов, но он не может полностью исключить возникновение «галлюцинаций». основное различие между новой моделью и gpt-4o заключается в том, что она может лучше решать сложные задачи, такие как программирование и математика, а также совершенствовать процесс рассуждения, пробовать разные стратегии, а также выявлять и исправлять ошибки в собственных ответах.

познание подскочит до «уровня аспиранта наук»

в openai пояснили, что gpt-4, выпущенный в 2023 году, аналогичен уровню интеллекта старшеклассников, а gpt-5 завершает рост ии от «старшеклассников до докторов наук». эта модель o1 является ключевым шагом.

по сравнению с существующими большими моделями, такими как gpt-4o, openai o1 может решать более сложные задачи рассуждения, одновременно устраняя механические недостатки, существующие в предыдущих моделях.

например, новая модель умеет подсчитывать, сколько букв «р» в слове «клубника».

в то же время ии будет более организованно отвечать на вопросы по программированию.прежде чем приступить к написанию кода, продумайте весь процесс ответа., а затем выведите код.

например, в задании на написание стихов с заранее заданными условиями (например, последнее слово второго предложения должно заканчиваться на i) gpt-4o, который «берёт ручку и пишет», всё же даёт ответ, но часто соблюдается только часть условий. это также не самокорректируется. это означает, что ии должен встретить правильный ответ при первом его генерировании, иначе он будет совершать ошибки. но в модели o1 ии продолжит методом проб и ошибок оттачивать свои ответы, тем самым значительно улучшая точность и качество получаемых результатов.

что интересно, когда вы нажимаете на мыслительный процесс ии, ии тоже появляется и говорит: «я думаю об этом, можно ли это сделать?», «ой, у меня мало времени, я должны дать ответ как можно скорее» и т. д. openai подтвердила, что представленное здесь не является оригинальной цепочкой мыслей, а «резюме, сгенерированным моделью», а также компания откровенно признала, что здесь есть факторы для сохранения «конкурентного преимущества».

джерри творек, руководитель отдела исследований openai, рассказал, что обучение, лежащее в основе модели o1, фундаментально отличается от предыдущих продуктов.в то время как предыдущие модели gpt были разработаны для имитации закономерностей в обучающих данных, o1 был обучен решать проблемы самостоятельно. в процессе обучения с подкреплением используются механизмы вознаграждения и наказания, чтобы «обучить» ии использовать «мыслительные цепочки» для решения проблем, точно так же, как люди учатся разбирать и анализировать проблемы.

согласно тесту,модель o1 смогла набрать 83% на квалификационном экзамене международной математической олимпиады, тогда как gpt-4o смогла правильно решить только 13% задач.в соревновании по программированию codeforces модель o1 набрала 89%, а gpt-4o — только 11%.

в openai заявили, что по результатам тестирования в следующей обновленной версииии может выполнять сложные задачи по физике, химии и биологии на уровне докторской степени.。

недостатки: невозможность просматривать веб-страницы в реальном времени, невозможность загружать файлы и изображения, отсутствие обширных знаний о мире или склонность к галлюцинациям.

но, как и первоначальная версия модели o1, выпущенная сегодня предварительная версия o1 также имеет очевидные недостатки. например, это просто «текстовая версия», которая временно не может просматривать веб-информацию и загружать файлы и изображения, что означает, что она не имеет многих функций chatgpt. во многих распространенных функциях она не так мощна, как gpt-4o. вариантов использования и существуют ограничения на использование, предварительная версия o1 имеет еженедельный лимит в 30 сообщений, а мини-версия имеет еженедельный лимит в 50 сообщений.

другие упомянутые ограничения включают в себя: модель o1 не так эффективна, как gpt-4o, во многих областях и плохо справляется с фактическими знаниями о мире; в некоторых случаях способность к рассуждению медленнее, и для ответа на вопросы может потребоваться больше времени; только чисто текстовая модель, лишенная возможности рассуждать о конкретных документах или собирать информацию из сети в реальном времени.

кроме того, позволить модели ии играть в крестики-нолики всегда считалось проблемой в отрасли. новая модель o1 с возможностями рассуждения по-прежнему будет совершать ошибки в этой игре, то есть не сможет полностью преодолеть технические трудности. .

openai также признала в техническом документе, что получила некоторые «неофициальные отзывы» о том, что предварительный просмотр o1 и мини-версия с большей вероятностью будут вызывать «иллюзии», чем gpt-4o и его мини-версия, то есть ии все еще был очень уверенно придумывайте ответы, и o1 редко признает, что не знает ответа на вопрос.

techcrunch, известное технологическое издание, отметило, что openai в сообщении в блоге, посвященном модели o1, отметила, что решила не показывать пользователям исходную «цепочку мышления» этой новой модели, а решила дать краткое изложение цепочка мышления в ответе. цель: чтобы сохранить «конкурентное преимущество» и компенсировать возможные недостатки, «мы стремимся научить модель воспроизводить в своих ответах любые полезные идеи в цепочке мышления».

ежедневные экономические новости, комплексная общественная информация

ежедневные экономические новости

отчет/отзыв

новости

стоимость использования модели o1 как минимум в 3 раза выше, чем у gpt-4o. она обучается по новому методу.

познание подскочит до «уровня аспиранта наук»

введение

моя контактная информация