интерпретация｜сяо янхуа: какое влияние окажет модель o1 с математическими способностями на докторском уровне?

2024-09-13

· способность рассуждать на экспертном уровне – это не тактика вопросов и ответов, она требует сильных мыслительных способностей. трудность в обучении способности рассуждения на больших моделях заключается в том, что большое количество мыслительных процессов человека никогда не выражается, поэтому данных о процессе мышления крайне мало. он предположил, что openai на этот раз должен использовать большой объем синтетических данных.

· людям становится все труднее совершенствовать свое понимание искусственного интеллекта, чтобы догнать скорость развития искусственного интеллекта. это огромная проблема управления. если искусственный интеллект обладает сверхчеловеческими способностями, то именно люди. возможности, весьма вероятно, что настанут времена, когда люди не смогут активировать свои сверхспособности, потому что они находятся за пределами человеческого познания.

новая модель o1, выпущенная openai, обладает мощными возможностями рассуждения. визуальная карта китая

12 сентября по местному времени openai выпустила серию моделей нового поколения o1. по сравнению с предыдущими моделями эта модель продемонстрировала сильные способности к рассуждению и показала хорошие результаты у аспирантов при выполнении контрольных задач по физике, химии и биологии. этой возможности не было в предыдущих моделях.

13 сентября сяо янхуа, профессор и научный руководитель школы компьютерных наук и технологий фуданьского университета и директор шанхайской ключевой лаборатории науки о данных, заявил в интервью the paper, что появление модели o1 означает, что возможности рассуждения больших моделей могут полностью достичь экспертного уровня. это можно рассматривать как важный прогресс в области искусственного интеллекта, который значительно улучшит применение моделей на стороне предприятия.

но он также признал, что по мере дальнейшего совершенствования интеллектуальных, перцептивных и рациональных способностей модели она превзойдет человеческие возможности. трудно предсказать, какое влияние искусственный интеллект окажет на людей в будущем. скорость развития сейчас превышает скорость человеческого понимания, и управление искусственным интеллектом станет огромной проблемой», — сказал сяо янхуа.

хорошо рассуждает о сложных задачах, успеваемость на уровне кандидата наук.

будучи ранней моделью, новая модель вывода o1 еще не в полной мере обладает функциями, используемыми chatgpt, такими как просмотр сетевой информации, загрузка файлов и изображений и т. д. но в openai заявили, что это значительное улучшение для сложных задач рассуждения и представляет собой новый уровень возможностей искусственного интеллекта.

«благодаря обучению они учатся совершенствовать свои мыслительные процессы, пробовать разные стратегии и признавать свои ошибки». крупномасштабные алгоритмы обучения с подкреплением учат модели эффективно мыслить, используя свои мыслительные цепочки во время процесса обучения, а модель o1 может думать раньше. ответ пользователю. создайте длинную внутреннюю цепочку мыслей. благодаря большему обучению с подкреплением и большему количеству времени на размышления производительность o1 продолжает улучшаться. он учится разбивать сложные шаги на более простые. когда текущий метод не работает, он пробует другой подход.

новая модель вывода o1 превосходно справляется с математикой и программированием, обеспечивая точность генерации и отладки сложного кода. openai оценил математические характеристики модели в aime (американское соревнование по математике). на экзамене aime 2024 года gpt-4o решил в среднем только 12% (1,8/15) задач. для одной выборки каждой задачи o1 в среднем составил 74. %(11,1/15). на квалификационном экзамене международной математической олимпиады (imo) gpt-4o правильно решил только 13% задач, в то время как новая модель рассуждения набрала 83%.

новая модель может рассуждать о сложных задачах, выполняя контрольные задачи по физике, химии и биологии, как аспирант. openai провела алмазные тесты gpqa по химии, физике и биологии. для сравнения модели с людьми были наняты эксперты с докторской степенью, которые вместе отвечали на вопросы.

«мы обнаружили, что o1 превзошла результаты экспертов-людей, став первой моделью, добившейся такого результата в этом тесте. эти результаты не означают, что o1 более способен, чем доктора наук во всех аспектах, просто модель лучше справляется с потребностями докторов наук в области здравоохранения. o1 может использовать o1 для аннотирования данных секвенирования клеток, физики могут использовать o1 для генерации сложных математических формул, необходимых для квантовой оптики, и его могут использовать разработчики во всех областях, говорит openai, для создания и выполнения многоэтапных рабочих процессов.

возможности рассуждения milestone значительно улучшат эффективность применения

«предыдущая модель большого языка больше походила на студента гуманитарных наук и все еще далека от уровня студента-естественника. но основная способность человеческого интеллекта — это думать и думать. новая модель рассуждения openai серии o1 показывает процесс человеческого мышления. сяо янхуа сказал: «суть новой модели вывода o1 по-прежнему остается большой языковой моделью, но она полностью раскрывает потенциал большой модели. в прошлом способность генерации больших моделей определялась корпусом, который был похож на «знаком с тремястами танских стихотворений, и вы можете их декламировать, даже если не знаете, как их сочинять». однако способность экспертного рассуждения — это не тактика вопросов и ответов, она требует сильных мыслительных способностей. трудность в обучении способности рассуждения на больших моделях заключается в том, что большое количество мыслительных процессов человека никогда не выражается, поэтому данных о процессе мышления крайне мало. он предположил, что openai на этот раз должен использовать большой объем синтетических данных.

«openai имеет явное преимущество первопроходца. его базовая модель сильнее, она собирает много данных о процессах мышления, анализирует и синтезирует большое количество высококачественных данных о мышлении, а также обладает сильными возможностями оценки. какие процессы рассуждения являются правильными?» и какие процессы рассуждения. для этого требуется использование обучения с подкреплением. обучение с подкреплением — это, по сути, процесс исследования, проб и ошибок. если он не работает, попробуйте другой метод», — сказал сяо янхуа, с помощью этих технологий и данных. openai сделал большую модель реальной для студентов-естественников и достигла экспертного уровня.

чэнь юньвэнь, председатель daguan data, сказал, что предыдущие модели не могли решать сложные сложные математические задачи, а o1 обладает расширенными математическими и логическими возможностями, что является большим улучшением. однако улучшение математических возможностей не означает, что парадигма ниокр больших моделей претерпела существенные изменения, а лишь направлено на устранение прежних недостатков.

по мнению сяо янхуа, появление o1 не было неожиданным: «на самом деле мы очень рано решили, что крупные модели будут обладать более сильными эмоциональными и рациональными способностями. неожиданным было то, что мы не ожидали увидеть это так скоро. здесь, и эффект настолько потрясающий». он считает, что в будущем openai может дифференцироваться на множество больших моделей, которые смогут делать разные вещи на основе общей большой модели.

например, предыдущие версии gpt-4 были знакомы со всеми знаниями и фактами и подчеркивали интеллектуальные способности; gpt-4o подчеркивал мультимодальное взаимодействие и подчеркивал способности восприятия; серия o1 делала упор на мышление и рациональные способности; улучшение рациональности модели позволит индустрии to b начать колоссальное развитие. «самая большая проблема и узкое место to b заключается в возможностях рассуждения больших моделей. появление новой серии моделей вывода o1 означает, что многие проблемы в индустрии to b могут быть значительно облегчены в будущем».

проблемы, вызванные быстрым развитием искусственного интеллекта

«openai действительно мощный инструмент. хотя техническая дорожная карта openai пока не вышла за рамки познания, мы все знаем направление развития больших моделей, включая мультимодальность и улучшенные возможности рассуждения, но только openai быстро превратил это в реальность. они тренируют большие модели точно так же, как и люди. у них очень четкие представления об интеллектуальном и когнитивном развитии человека, и они имеют очень четкое представление о человеческом росте и эволюции. пока они не обнаружили ни одного неправильного шага. " объяснять.

openai имеет очевидные преимущества первопроходца. что касается разработки крупномасштабных отечественных моделей: «все преимущества openai являются для нас недостатками. нам нужно успокоиться и медленно наверстывать упущенное. в общем направлении искусственного интеллекта есть только первые, а не вторые». однако в долгосрочной перспективе сяо янхуа заявил, что существует потолок для улучшения индивидуальных возможностей больших моделей. потому что реальные исходные данные людей ограничены, а скорость производства низкая. «в настоящее время openai использует человеческие данные для синтеза новых данных для улучшения способностей к рассуждению. однако синтетические данные ограничены исходными данными. он не может синтезировать бесконечные данные и не может получать принципиально новые данные. из-за этого он не может изобретать новые предметы. предлагаю новая теория, подобная эйнштейну. «с точки зрения аппаратуры рассуждение требует меньших вычислительных мощностей, чем обучение, но из-за расширения цепочки мышления требования к эффективности рассуждения становятся выше, что выдвигает более высокие требования к ускорению и оптимизации процесса. процесс рассуждения.

однако, поскольку большие модели улучшились во многих аспектах, они создали проблемы для управления. проблема заключается в том, что человеческое понимание их не улучшалось так быстро, как оно развивалось.

философ кант разделил процесс познания человека на три стадии: перцептивную, интеллектуальную и рациональную. в настоящее время чувствительность, интеллект и рациональность крупных моделей улучшаются и, вероятно, превзойдут людей. очень немногие люди могут быть сильны в этих трех познаниях.

«в настоящее время o1 достиг уровня докторанта. в будущем достижение уровня ученого будет лишь процессом достижения количественных изменений. люди постепенно попадут в когнитивное слепое пятно развития искусственного интеллекта. ибо например, что означает нынешняя способность к рассуждению больших моделей? можно ли ее действительно использовать в ии? доля людей с уровнем знаний выше будет становиться все меньше и меньше. почти никто в мире не сможет достичь степени доктора философии. уровень знаний по математике, физике, химии или математике. многие ли из нас могут понимать, распознавать и контролировать ии? сяо янхуа сказал, что люди в настоящее время находятся на уровне докторантуры. базовых когнитивных рамок искусственного интеллекта не хватает. это огромная цифра? такие темы, как занятость, экономика, этика и социальные отношения, вызовут широкую дискуссию: «человеческие существа являются разблокировщиками магии искусственного интеллекта. если искусственный интеллект обладает сверхчеловеческими способностями, вероятно, это будут сверхспособности, которые люди не могут активировать, потому что они. находятся за пределами человеческого познания».

репортер the paper чжан цзин

(эта статья взята из the paper. для получения более оригинальной информации загрузите приложение «the paper»).

отчет/отзыв

новости

интерпретация｜сяо янхуа: какое влияние окажет модель o1 с математическими способностями на докторском уровне?

введение

моя контактная информация