OpenAI любит упоминать Яо Шунюя, лучшего ученика класса Яо: автора «Дерева мышления», доктора философии из Принстона, который тоже умеет читать рэп

OpenAI любит упоминать Яо Шуньюя, лучшего ученика в классе Яо: автора «Дерева мышления», доктора философии из Принстона, а также умеющего читать рэп.

2024-08-02

Западный ветер Цзинь Лея исходит из храма Аофэй.
Кубиты | Публичный аккаунт QbitAI

Лучший ученик класса Яо Университета ЦинхуаЯо Шуньюй, официально объявила о присоединении к OpenAI.

Но именно такое короткое сообщение привлекло внимание и благословение всех в кругу. Приходите и почувствуйте это чувство:

Среди них много таких, как директор по передовым исследованиям OpenAI и американский тренер IOI.Марк Чен, а также профессора, инвесторы и т. д. в области ИИ.

Так почему же Яо Шуньюй привлекает столько внимания?

Судя по его прошлому резюме, мы можем выделить следующие ключевые слова:

Класс Яо в Университете Цинхуа
Председатель Объединенного комитета класса Яо
Соучредитель студенческого рэп-клуба Университета Цинхуа
Доктор компьютерных наук из Принстона.

△Яо Шуньюй, источник фото: личная домашняя страница

Но помимо его относительно яркого резюме, именно его многочисленные научные достижения по-настоящему привлекли внимание общественности к Яо Шуньюю:

думающее дерево(Древо мыслей): Позвольте LLM думать неоднократно и значительно улучшите способность к рассуждению.
SWE-скамья: большой набор данных для оценки возможностей модели.
SWE-агент: Программист искусственного интеллекта с открытым исходным кодом.

Не будет преувеличением сказать, что почти каждое исследование вызывало значительные волнения в обществе, и совершенно очевидно, что все они глубоко затрагивают;большая модельИ развернуться.

Это также может соответствовать предложению в официальном заявлении Яо Шуньюя:

Пришло время воплотить исследовательское видение в реальность.

Что касается этого «исследовательского видения», давайте продолжим рассматривать его поближе.

Ключевые слова исследования: Языковые агенты

Если вы посмотрите на домашнюю страницу Яо Шуньюя, особенно на раздел исследований диссертаций, нетрудно найти фразу, которая появляется очень часто:Языковые агенты。

В профиле, размещенном на его домашней странице X, первое предложение также звучит как Language Agents:

А еще это название его докторской диссертации:Языковые агенты: от прогнозирования следующего токена до цифровой автоматизации。

Языковые агенты, а именноязыковой агент, именно Яо Шунюй предложил новый тип агента.

В отличие от традиционных агентов, этот метод использует языковые модели для рассуждений и действий агентов, уделяя особое внимание их реализации.цифровая автоматизация(Цифровая автоматизация).

Что касается конкретных методов реализации, есть три ключевые технологии (все с независимыми статьями):

Реакт: метод, сочетающий рассуждения и действия для создания траекторий рассуждений и действий с помощью языковых моделей для решения различных задач языкового рассуждения и принятия решений.
думающее дерево: метод, основанный на поиске по дереву, который решает сложные проблемы и улучшает способность языковых моделей к рассуждению путем создания и оценки нескольких путей мышления.
CoALA: Концептуальная основа для организации и проектирования языковых агентов, включая такие аспекты, как память, пространство действий и принятие решений.

На примере ReAct исследование направлено на расширение пространства действий языковой модели до объединения набора действий и языкового пространства.

Действия (т. е. траектории мышления или рассуждения) в языковом пространстве не влияют на внешнюю среду, но могут обновлять контекст посредством рассуждений о текущем контексте и могут поддерживать будущие рассуждения или действия.

Например, в диалоге, показанном на рисунке ниже, метод ReAct можно использовать, чтобы направить агента по циклу процесса «генерации идей → принятия мер → наблюдения за результатами».

Таким образом, траекторию и операцию рассуждения можно объединить, что позволяет модели выполнять динамические рассуждения, улучшая принятие решений агентом и конечные результаты.

Если метод ReAct сводится к тому, чтобы позволить агенту«причина действовать», то следующий методдумающее дерево, то задача состоит в том, чтобы позволить агенту«причина планировать»。

Дерево мышления представляет проблему как поиск по древовидной структуре. Каждый узел представляет собой состояние, представляющее частичное решение, а ветви соответствуют операциям, изменяющим состояние.

В основном это касается четырех вопросов:

Декомпозиция мышления: разложите сложную проблему на ряд промежуточных шагов, каждый шаг можно рассматривать как узел дерева.
Генерация мыслей: используйте языковые модели для генерации потенциальных мыслей для каждого узла, которые являются промежуточными шагами или стратегиями решения проблем.
Оценка состояния: используйте языковую модель для оценки состояния каждого узла, чтобы определить его прогресс и потенциал в решении проблем.
Алгоритм поиска. Используйте различные алгоритмы поиска (например, поиск в ширину BFS или поиск в глубину DFS), чтобы исследовать дерево мышления и найти оптимальное решение.

Применяя дерево мышления к игре «24 очка», по сравнению с предыдущей цепочкой мышления (ЦТ), точность была значительно улучшена.

Что касается последней ключевой технологии в Language Agents, то естьCoALA, представляет собой концептуальную основу для организации и проектирования языковых агентов.

Судя по структурной схеме ниже, он условно разделен на три модуля: хранение информации, пространство действий и принятие решений.

Хранение информации означает, что языковой агент хранит информацию в нескольких модулях памяти, включая кратковременную рабочую память и долговременную память (например, семантическую память, эпизодическую память и процедурную память).

Эти модули памяти используются для хранения различных типов информации, такой как сенсорные данные, знания, опыт и т. д., и играют роль в процессе принятия решений агентом.

Кроме того, CoALA делит пространство действий агента на внешние действия и внутренние действия, предполагающие взаимодействие с внешней средой, например управление роботами, общение с людьми или выполнение операций в цифровой среде.

Внутренние действия взаимодействуют с внутренним состоянием и памятью агента, включая такие операции, как рассуждение, извлечение и обучение.

В конечном итоге языковой агент выберет действие, которое необходимо выполнить, в процессе принятия решения, и этот процесс также найдет оптимальное решение на основе различных факторов и обратной связи;

Кроме того, есть такие вакансии, как программисты искусственного интеллекта с открытым исходным кодом.SWE-агенти т. д., также широко распространено в кругу.

Но среди многих тем научных исследований Яо Шуньюя, помимо «Языковых агентов», мы также можем увидеть еще одно ключевое слово, которое он преследует ——вычислительное мышление。

На самом деле это выяснилось, когда он был студентом.

Прежде чем отправиться в Принстонский университет для получения докторской степени в области компьютерных наук, Яо Шуньюй, будучи выпускником 2015 года, поделился своим опытом обучения и роста в Университете Цинхуа с кандидатами, сдающими повторные экзамены, на церемонии открытия различных типов независимого отбора Цинхуа в 2019 году. -обследования.

Соответствующее содержание записано в написанной им статье под названием «Чему вы научились на занятиях Яо в Университете Цинхуа? Яо Шунюй: достаточно, чтобы изменить мир».

В то время он сосредоточился на обмене вычислительным мышлением как с теоретических, так и с практических аспектов, и рассказал, что, по его мнению, через четыре годаСамый большой выигрыш — вычислительное мышление：

Сейчас мы видим много вещей, которые теоретически невозможны. Так называемая теория направляет практику. Я думаю, это означает больше, что мы должны понимать пределы возможностей системы и сложность вещей на высоком уровне, а затем выбирать, что можно сделать и что имеет смысл.

Закрепленный за тегом солнечного и жизнерадостного мальчика, Яо Шуньюй также поделился своим опытом поездки в Аргентину по программе южной инфильтрации Цинхуа:

Я встретил группу аргентинских детей... Не все говорят по-английски, аргентинцы говорят по-испански. Однажды я пытался выучить испанский, но отказался, потому что изучал компьютеры и вытащил Google Translate. Я рассказал им о Запретном городе и Великой стене в Пекине...

△Источник: Официальный аккаунт приемной комиссии Цинхуа.

По его мнению, в эту эпоху информатику можно сочетать с любой дисциплиной, мир огромен, и в Цинхуа можно делать все, что захочешь.

После разговора о Яо Шуньюй, кто еще из класса Яо работает над большими моделями?

Популярная большая модель, кто еще из класса Яо над ней работает?

Я должен упомянутьМа ТэнъюйиЧэнь Данци。

В то время они были одноклассниками, выпускниками класса Цинхуа Яо в 2008 году, и оба позже выиграли премию Слоана, известную как «Люгер тренда Нобелевской премии».

Доктор Ма Тэнъю учился в Принстонском университете, где его наставником был профессор Санджив Арора, ученый-теоретик и двукратный лауреат премии Гёделя.

После получения степени доктора философии ведущие университеты, такие как Массачусетский технологический институт, Гарвард и Стэнфорд, предложили ему должность доцента, и Ма Тэнъюй в конце концов выбрал Стэнфорд.

В конце прошлого года Ма Тэнъюй также официально объявил об основании Voyage AI, крупномасштабного стартапа по моделированию. Он сообщил, что возглавит команду по созданию лучшей на сегодняшний день встроенной модели, а также предоставит индивидуальные модели, ориентированные на конкретные задачи. определенной области или предприятия.

Три профессора, в том числе Кристофер Мэннинг, директор Стэнфордской лаборатории искусственного интеллекта, и Ли Фейфей, известный китайский ученый в области искусственного интеллекта, служат научными консультантами Voyage AI.

Что касается Чэнь Даньци, после окончания бакалавриата в Цинхуа Яо Бане он получил докторскую степень в Стэнфордском университете в 2018 году, специализируясь на НЛП. В конечном итоге он стал доцентом кафедры компьютерных наук Принстонского университета и заместителем директора Принстонского языкового факультета. и Intelligence Project, соруководитель Принстонской группы НЛП.

Его личная домашняя страница показывает, что «сейчас меня в основном привлекает разработка больших моделей», а темы, которые он исследует, включают:

Как извлечение может сыграть важную роль в моделях следующего поколения, повышая реалистичность, адаптируемость, интерпретируемость и надежность.
Недорогое обучение и развертывание больших моделей, улучшенные методы обучения, управление данными, сжатие моделей и оптимизация адаптации последующих задач.
Также заинтересован в работе, которая действительно улучшает понимание возможностей и ограничений современных больших моделей, как эмпирически, так и теоретически.

Большие модельные работы команды Чэнь Даньци и кубиты также продолжают привлекать внимание.

Например, алгоритм отбора данных LESS, предлагаемый метод снижения затрат для больших моделей, выбирает только 5% данных, наиболее соответствующих задаче для точной настройки инструкций, что лучше, чем использование всего набора данных.

Точная настройка инструкций — ключевой шаг на пути превращения базовой модели в модель помощника ChatGPT.

Предложил популярный метод «стрижки альпаки» - метод обрезки больших моделей LLM-Shearing, который использует только 3% расчетной суммы и 5% стоимости для получения SOTA, доминируя в масштабе 1B-3B больших моделей с открытым исходным кодом.

Помимо этих двоих, многие выпускники Yao Class работают над крупномасштабными моделями в промышленности и научных кругах.

Нативное приложение большой модели, популярное во всем Интернете, было «Готово!» «Я окружен большими моделями» и его продолжение «Я сломал большие модели» были разработаны командой, возглавляемой лучшими учениками класса Яо.

автор игрыФань Хаоцян , Сотрудник Мегвии №6. В то время его провозглашали гениальным мальчиком за его легендарные поступки, такие как золотая медаль IOI, рекомендация в класс Цинхуа Яо и стажировка на втором курсе средней школы. Сейчас он является генеральным менеджером по исследованиям в Megvii Technology и лидером отрасли с индексом Хирша Google Scholar 32.

Первый результат исследования xAI Маска — Tensor Programs VI, также включает в совместную работу выпускников класса Яо.

Тензорные программы VI являются продолжением предыдущей серии работ Грега Янга, одного из основателей xAI и ученика Цю Чэнтуна. В статье основное внимание уделяется тому, «как обучать бесконечно глубокие сети».

Говорят, что результаты, связанные с тензорными программами, были применены в GPT-4. Чтобы интерпретировать статью, сам Ян также провел прямую трансляцию на X.

Работать вместеДингли Юй, окончил факультет Яо Университета Цинхуа со степенью бакалавра. В настоящее время Динли Юй собирается получить докторскую степень на факультете компьютерных наук в Принстоне.

Их еще много, много......

Говоря о наборе Яо Шуньюя в OpenAI на этот раз, усилия OpenAI по набору персонала все еще продолжаются.

Инженер OpenAI Карина Нгуен опубликовала последнее сообщение о наборе персонала:

Команда по моделированию поведения OpenAI приглашает на работу! Это должность мечты, которая сочетает в себе инженерное проектирование и исследования после обучения, и это самая редкая работа в мире❤️
Мы используем методы согласования, такие как RLHF/RLAIF, для определения основного поведения модели, чтобы отразить основные ценности и повысить творческий интеллект AGI. Благодаря этим результатам мы работаем с группами разработчиков и разработчиков продуктов и моделей над созданием новых моделей интерфейсов и взаимодействий искусственного интеллекта, которые повлияют на миллионы пользователей...

Что интересно, Карина Нгуен раньше была исследователем в Anthropic AI (команда Клода). В мае прошлого года она также участвовала в словесной дуэли на X (ранее Twitter) с Джейсоном Веем из OpenAI, автором книги Think Chain. Фондовый документ».

Я не ожидал, что Карина Нгуен так быстро перейдет на OpenAI…

Кстати, буквально вчера появилась новость о том, что в OpenAI также принят исследователь Google DeepMind Тибо Соттио.

Вы знаете, Тибо Соттио был одним из основных авторов таких статей, как оригинальные Gemini и Gemini 1.5.

Это показывает, насколько популярна в настоящее время большая модельная трасса. Компании соперничают за трассу, а люди соперничают за людей.

Еще кое-что

Было еще двое Яо Шуньюй, окончивших Университет Цинхуа в том же году, что и Яо Шуньюй!

Когда трое студентов Яо Шуньюй окончили учебу в 2019 году, представители Университета Цинхуа опубликовали сообщение в Weibo и разместили групповую фотографию троих из них.

Помимо Яо Шуньюя, который сейчас присоединился к OpenAI, есть еще один Яо Шуньюй изшкола гуманитарных наукДевушка, специализирующаяся на японском языке.

Другой Яо Шуньюй — Яо Шунь.Ю, отКафедра физикиОн является лауреатом специальной премии для студентов в 2018 году. Во время учебы в бакалавриате он опубликовал две статьи в качестве первого автора в ведущем физическом журнале PRL (Physical Review Letters) и одну в PRB (Physical Review B).

Справочные ссылки:
[1]https://x.com/ShunyuYao12/status/1818807946756997624
[2]https://ysymyth.github.io
[3]https://x.com/karinanguyen_/status/1819082842238079371
[4]https://weibo.com/1676317545/HCR7yuXAl?refer_flag=1001030103_

Новости

OpenAI любит упоминать Яо Шуньюя, лучшего ученика в классе Яо: автора «Дерева мышления», доктора философии из Принстона, а также умеющего читать рэп.

Ключевые слова исследования: Языковые агенты

Популярная большая модель, кто еще из класса Яо над ней работает?

Еще кое-что

Введение

моя контактная информация