berita

OpenAI suka menyebut Yao Shunyu, siswa terbaik di Kelas Yao: penulis Thinking Tree, PhD dari Princeton, dan juga tahu cara melakukan rap

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Angin barat Jin Lei berasal dari Kuil Aofei
Qubit |. Akun publik QbitAI

Siswa terbaik di kelas Yao di Universitas TsinghuaYao Shunyu, secara resmi mengumumkan bahwa mereka telah bergabung dengan OpenAI.



Namun pesan singkat seperti itu telah menarik perhatian dan berkah dari semua orang di lingkaran. Datang dan rasakan perasaan ini:



Di antara mereka, ada banyak orang seperti direktur penelitian terdepan OpenAI dan pelatih IOI Amerika.Mark Chen, serta profesor, investor, dll di bidang AI.

Lalu mengapa Yao Shunyu menarik begitu banyak perhatian?

Dilihat dari resume masa lalunya, kita dapat mengekstrak kata kunci berikut:

  • Kelas Yao di Universitas Tsinghua
  • Ketua Komite Gabungan Kelas Yao
  • Salah satu pendiri Klub Rap Mahasiswa Universitas Tsinghua
  • PhD di bidang Ilmu Komputer dari Princeton



△Yao Shunyu, sumber foto: beranda pribadi

Namun selain resumenya yang relatif cemerlang, banyak pencapaian penelitian ilmiahnya yang benar-benar membawa Yao Shunyu ke perhatian publik:

  • pohon berpikir(Pohon Pikiran): Biarkan LLM berpikir berulang kali dan meningkatkan kemampuan penalaran secara signifikan.
  • bangku SWE: Kumpulan data evaluasi kemampuan model yang besar.
  • agen SWE: Pemrogram AI sumber terbuka.

Tidaklah berlebihan untuk mengatakan bahwa hampir setiap penelitian telah menimbulkan dampak yang besar di kalangan masyarakat; dan sangat jelas bahwa semua penelitian tersebut terjadi secara mendalammodelnya besarDan terungkap.



Hal ini mungkin juga sesuai dengan kalimat dalam pengumuman resmi Yao Shunyu:

Saatnya mewujudkan visi penelitian menjadi kenyataan.

Mengenai “visi penelitian” ini, mari kita terus mencermatinya.

Kata kunci penelitian: Agen Bahasa

Jika melihat beranda Yao Shunyu, khususnya bagian penelitian tesis, tidak sulit menemukan ungkapan yang sangat sering muncul——Agen Bahasa



Dalam profil yang disertakan di beranda X-nya, kalimat pertama juga merupakan Agen Bahasa:



Dan ini juga judul tesis doktornya:Agen Bahasa: Dari Prediksi Token Berikutnya hingga Otomasi Digital



Agen Bahasa, yaituagen bahasa, Yao Shunyu-lah yang mengusulkan agen jenis baru.

Berbeda dengan agen tradisional, metode ini menggunakan model bahasa untuk penalaran dan tindakan agen, dengan fokus untuk menyadarkan merekaotomatisasi digital(Otomatisasi Digital)。

Adapun metode implementasi spesifiknya, ada tiga teknologi utama (semuanya dengan makalah independen), yaitu:

  • Reaksi: Suatu metode yang menggabungkan penalaran dan tindakan untuk menghasilkan lintasan penalaran dan tindakan melalui model bahasa untuk menyelesaikan berbagai tugas penalaran bahasa dan pengambilan keputusan.
  • pohon berpikir: Suatu metode berdasarkan pencarian pohon yang memecahkan masalah kompleks dan meningkatkan kemampuan penalaran model bahasa dengan menghasilkan dan mengevaluasi berbagai jalur pemikiran.
  • CoALA: Kerangka konseptual untuk mengatur dan merancang agen bahasa, termasuk aspek seperti memori, ruang tindakan, dan pengambilan keputusan.



Mengambil ReAct sebagai contoh, penelitian ini bertujuan untuk memperluas ruang tindakan model bahasa ke dalam gabungan kumpulan tindakan dan ruang bahasa.

Tindakan (yaitu lintasan berpikir atau penalaran) dalam ruang bahasa tidak mempengaruhi lingkungan eksternal, namun dapat memperbarui konteks melalui penalaran tentang konteks saat ini dan dapat mendukung penalaran atau tindakan di masa depan.

Misalnya, dalam dialog yang ditunjukkan pada gambar di bawah, metode ReAct dapat digunakan untuk memandu agen melakukan siklus melalui proses "menghasilkan ide → mengambil tindakan → mengamati hasil".

Dengan cara ini, lintasan dan pengoperasian penalaran dapat digabungkan, memungkinkan model melakukan penalaran dinamis, membuat pengambilan keputusan dan hasil akhir agen menjadi lebih baik.



Jika metode ReAct diringkas menjadi membiarkan agen“alasan untuk bertindak”, maka cara selanjutnya adalahpohon berpikir, maka fokusnya membiarkan agen tersebut“alasan untuk merencanakan”



Pohon pemikiran mewakili masalah sebagai pencarian pada struktur pohon. Setiap node adalah keadaan, mewakili solusi parsial, dan cabang-cabangnya berhubungan dengan operasi yang mengubah keadaan.

Ini terutama melibatkan empat masalah:

  • Dekomposisi berpikir: Menguraikan masalah yang kompleks menjadi serangkaian langkah perantara, setiap langkah dapat dianggap sebagai simpul pohon.
  • Pembuatan pemikiran: Gunakan model bahasa untuk menghasilkan pemikiran potensial untuk setiap simpul, yang merupakan langkah perantara atau strategi untuk memecahkan masalah.
  • Evaluasi status: Gunakan model bahasa untuk mengevaluasi status setiap node guna menentukan kemajuan dan potensinya dalam memecahkan masalah.
  • Algoritme pencarian: Gunakan algoritma pencarian yang berbeda (seperti BFS pencarian luas pertama atau DFS pencarian mendalam pertama) untuk menjelajahi pohon pemikiran dan menemukan solusi optimal.



Menerapkan pohon pemikiran pada permainan "24 poin", dibandingkan dengan rantai pemikiran (CoT) sebelumnya, tingkat akurasinya telah meningkat secara signifikan.



Adapun teknologi kunci terakhir dalam Agen Bahasa adalahCoALA, adalah kerangka konseptual untuk mengatur dan merancang agen bahasa.



Dilihat dari diagram struktur di bawah ini, secara kasar dibagi menjadi tiga modul: penyimpanan informasi, ruang tindakan dan pengambilan keputusan.

Penyimpanan informasi berarti agen bahasa menyimpan informasi dalam beberapa modul memori, termasuk memori kerja jangka pendek dan memori jangka panjang (seperti memori semantik, memori episodik, dan memori prosedural).

Modul memori ini digunakan untuk menyimpan berbagai jenis informasi, seperti masukan sensorik, pengetahuan, pengalaman, dll., dan berperan dalam proses pengambilan keputusan agen.

Selain itu, CoALA membagi ruang tindakan agen menjadi tindakan eksternal dan tindakan internal yang melibatkan interaksi dengan lingkungan eksternal, seperti mengendalikan robot, berkomunikasi dengan manusia, atau melakukan operasi di lingkungan digital.

Tindakan internal berinteraksi dengan keadaan internal dan memori agen, termasuk operasi seperti penalaran, pengambilan, dan pembelajaran.

Pada akhirnya, agen bahasa akan memilih tindakan yang akan dilakukan melalui proses pengambilan keputusan; dan proses ini juga akan menemukan solusi optimal berdasarkan berbagai faktor dan umpan balik.



Selain itu, ada pekerjaan seperti programmer AI open sourceagen SWEdll, juga tersebar luas di kalangan.

Namun dari sekian banyak topik penelitian ilmiah Yao Shunyu, selain Agen Bahasa, kita juga bisa melihat kata kunci lain yang ia kejar—pemikiran komputasi

Hal ini sebenarnya terungkap saat ia masih menjadi sarjana.

Sebelum berangkat ke Universitas Princeton untuk belajar gelar doktor di bidang ilmu komputer, Yao Shunyu, sebagai senior tahun 2015, berbagi pengalaman belajar dan pertumbuhannya di Universitas Tsinghua dengan para kandidat ujian ulang pada upacara pembukaan berbagai jenis seleksi independen Tsinghua tahun 2019. -pemeriksaan.

Konten yang relevan terekam dalam artikel yang ditulisnya berjudul "Apa yang Anda pelajari di Kelas Yao di Universitas Tsinghua? Yao Shunyu: Cukup untuk Mengubah Dunia."

Saat itu, ia fokus pada berbagi pemikiran komputasional baik dari aspek teoretis maupun praktis, dan mengungkapkan bahwa ia merasakannya setelah empat tahun,Keuntungan terbesar adalah pemikiran komputasi

Kita sekarang melihat banyak hal yang secara teoritis mustahil. Apa yang disebut teori memandu praktik, menurut saya ini lebih berarti bahwa kita harus memahami batasan kemampuan sistem dan kesulitan berbagai hal dari tingkat tinggi, lalu memilih apa yang bisa dilakukan dan apa yang bermakna.

Terkunci dalam tag seorang anak laki-laki yang ceria dan ceria, Yao Shunyu juga berbagi pengalamannya pergi ke Argentina untuk Program Infiltrasi Selatan Tsinghua:

Saya bertemu dengan sekelompok anak-anak Argentina...Bahasa Inggris tidak digunakan secara universal, orang Argentina berbicara bahasa Spanyol. Saya pernah mencoba belajar bahasa Spanyol, tapi saya menyerah karena saya belajar komputer dan saya mengeluarkan Google Terjemahan. Saya memberi tahu mereka tentang Kota Terlarang dan Tembok Besar di Beijing...



△Sumber: Akun Resmi Penerimaan Tsinghua

Menurutnya, di era ini, komputasi dapat digabungkan dengan disiplin ilmu apa pun, dan dunia adalah tempat yang besar, dan Anda dapat melakukan apapun yang Anda inginkan di Tsinghua.

Setelah membicarakan tentang Yao Shunyu, siapa lagi di kelas Yao yang mengerjakan model besar?

Model besar yang populer, siapa lagi dari kelas Yao yang mengerjakannya?

Yang harus saya sebutkan adalahMa TengyuDanChen Dan Qi





Keduanya adalah teman sekelas saat itu, alumni Kelas Tsinghua Yao tahun 2008, dan keduanya kemudian memenangkan Hadiah Sloan, yang dikenal sebagai "Nobel Prize Trend Vane".



Dr Ma Tengyu belajar di Universitas Princeton, di mana mentornya adalah Profesor Sanjeev Arora, seorang ilmuwan komputer teoretis dan pemenang Hadiah Gödel dua kali.

Setelah lulus Ph.D., universitas ternama seperti MIT, Harvard, dan Stanford semuanya memberinya tawaran sebagai asisten profesor, dan Ma Tengyu akhirnya memilih Stanford.

Pada akhir tahun lalu, Ma Tengyu juga secara resmi mengumumkan pendirian Voyage AI, sebuah startup model berskala besar. Ia mengungkapkan bahwa ia akan memimpin tim untuk membangun model tertanam terbaik saat ini, dan juga menyediakan model khusus yang fokus pada a bidang atau perusahaan tertentu.

Tiga profesor, termasuk Christopher Manning, direktur Laboratorium Kecerdasan Buatan Stanford, dan Li Feifei, seorang sarjana Tiongkok terkenal di bidang AI, bertindak sebagai penasihat akademis untuk Voyage AI.



Bagi Chen Danqi, setelah menyelesaikan studi sarjananya di Tsinghua Yao Ban, ia memperoleh gelar PhD di Universitas Stanford pada tahun 2018, dengan fokus pada NLP. Ia akhirnya menjadi asisten profesor di Departemen Ilmu Komputer di Universitas Princeton dan wakil direktur Bahasa Princeton dan Proyek Intelijen, yang ikut memimpin kelompok NLP Princeton.

Beranda pribadinya menunjukkan bahwa “saat ini saya terutama tertarik dengan pengembangan model besar” dan topik yang dia teliti meliputi:

  • Bagaimana pengambilan dapat memainkan peran penting dalam model generasi berikutnya, meningkatkan realisme, kemampuan beradaptasi, interpretasi, dan kepercayaan.
  • Pelatihan berbiaya rendah dan penerapan model besar, peningkatan metode pelatihan, pengelolaan data, kompresi model, dan optimalisasi adaptasi tugas hilir.
  • Juga tertarik pada pekerjaan yang benar-benar meningkatkan pemahaman tentang kemampuan dan keterbatasan model besar saat ini, baik secara empiris maupun teoritis.



Model kerja besar dan qubit tim Chen Danqi juga terus mendapat perhatian.

Misalnya, algoritme pemilihan data LESS, metode pengurangan biaya yang diusulkan untuk model besar, hanya memilih 5% data yang paling relevan dengan tugas penyempurnaan instruksi, yang lebih baik daripada menggunakan seluruh kumpulan data.

Penyempurnaan instruksi adalah langkah penting dalam menjadikan model dasar menjadi model asisten ChatGPT.

Mengusulkan metode "pencukuran alpaka" yang populer - metode pemangkasan model besar LLM-Shearing, yang hanya menggunakan 3% dari jumlah perhitungan dan 5% biaya untuk mendapatkan SOTA, mendominasi skala 1B-3B model besar sumber terbuka.

Selain keduanya, masih banyak alumni Kelas Yao yang mengerjakan model skala besar di industri dan akademisi.

Aplikasi asli model besar yang populer di seluruh Internet adalah "Selesai!" "Aku Dikelilingi Model Besar" dan sekuelnya "Aku Menghancurkan Model Besar" dikembangkan oleh tim yang dipimpin oleh siswa terbaik dari Kelas Yao.

penulis permainanFan Haoqiang , Pegawai Megvii No.6. Saat itu, ia dipuji sebagai anak jenius atas prestasi legendarisnya seperti medali emas IOI, direkomendasikan ke Kelas Tsinghua Yao, dan magang di tahun kedua sekolah menengahnya. Sekarang dia adalah manajer umum penelitian di Megvii Technology dan pemimpin industri dengan h-index 32 Google Cendekia.



Hasil penelitian xAI pertama Musk - Tensor Programs VI, juga menyertakan alumni kelas Yao dalam kerja sama tersebut.



Tensor Programs VI merupakan kelanjutan dari rangkaian karya Tensor Programs sebelumnya yang ditulis oleh Greg Yang, salah satu pendiri xAI dan murid dari Qiu Chengtong. Makalah ini berfokus pada "cara melatih jaringan yang sangat dalam".

Dikatakan bahwa hasil terkait Program Tensor telah diterapkan di GPT-4. Untuk menafsirkan makalah tersebut, Yang sendiri juga melakukan siaran langsung di X.

Bekerja samaDingli Yu, lulus dari Kelas Yao Universitas Tsinghua dengan gelar sarjana. Saat ini, Dingli Yu akan lulus dengan gelar Ph.D.



Masih ada banyak, banyak sekali......

Berbicara tentang rekrutmen Yao Shunyu ke OpenAI kali ini, upaya rekrutmen OpenAI masih terus berlanjut.

Insinyur OpenAI Karina Nguyen merilis postingan rekrutmen terbaru:

  • Tim perilaku model OpenAI sedang merekrut! Ini adalah posisi impian yang menggabungkan teknik desain dan penelitian pasca pelatihan, dan merupakan pekerjaan paling langka di dunia❤️
  • Kami menggunakan metode penyelarasan seperti RLHF/RLAIF untuk menentukan perilaku inti model guna mencerminkan nilai-nilai dasar dan meningkatkan kecerdasan kreatif AGI. Melalui hasil ini, kami bekerja dengan tim desain dan teknik produk + model untuk menciptakan model antarmuka dan interaksi AI baru yang akan berdampak pada jutaan pengguna...



Menariknya, Karina Nguyen sebenarnya pernah menjadi peneliti di Anthropic AI (tim Claude) sebelumnya. Pada Mei tahun lalu, ia juga mengikuti duel kata cepat di X (sebelumnya Twitter) dengan Jason Wei dari OpenAI, penulis Think Chain's “. Makalah Dasar”.



Saya tidak menyangka Karina Nguyen akan beralih ke OpenAI secepat ini…

Omong-omong, baru kemarin tersiar kabar bahwa peneliti Google DeepMind Thibault Sottiaux juga dipekerjakan di OpenAI.

Anda tahu, Thibault Sottiaux adalah kontributor inti di makalah seperti Gemini dan Gemini 1.5 yang asli.



Ini menunjukkan betapa populernya jalur model besar saat ini. Perusahaan berlomba-lomba untuk mendapatkan jalur tersebut dan orang-orang berlomba-lomba untuk mendapatkan orang.

Satu hal lagi

Ada dua Yao Shunyu lainnya yang lulus dari Universitas Tsinghua di tahun yang sama dengan Yao Shunyu!

Ketika ketiga mahasiswa Yao Shunyu lulus pada tahun 2019, pejabat Universitas Tsinghua memposting postingan di Weibo dan memposting foto grup mereka bertiga.

Selain Yao Shunyu yang kini telah bergabung dengan OpenAI, ada lagi Yao Shunyu darisekolah HumanioraSeorang gadis jurusan bahasa Jepang.

Yao Shunyu yang lain adalah Yao ShunYu, dariDepartemen Fisika, beliau merupakan peraih Undergraduate Special Award tahun 2018. Selama masa sarjananya, beliau menerbitkan dua makalah sebagai penulis pertama di jurnal fisika terkemuka PRL (Physical Review Letters) dan satu di PRB (Physical Review B).



Tautan referensi:
[1]https://x.com/ShunyuYao12/status/1818807946756997624
[2]https://ysymyth.github.io
[3]https://x.com/karinanguyen_/status/1819082842238079371
[4]https://weibo.com/1676317545/HCR7yuXAl?refer_flag=1001030103_