berita

interpretasi|xiao yanghua: apa dampak model o1 dengan kemampuan matematika tingkat doktoral?

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·kemampuan penalaran tingkat ahli bukanlah taktik tanya jawab, melainkan membutuhkan kemampuan berpikir yang kuat. kesulitan dalam melatih kemampuan penalaran model besar adalah banyaknya proses berpikir manusia yang tidak pernah diungkapkan, sehingga data tentang proses berpikir tersebut sangat langka. dia berspekulasi bahwa openai harus menggunakan data sintetis dalam jumlah besar kali ini.
· semakin sulit bagi manusia untuk meningkatkan pemahaman mereka tentang kecerdasan buatan untuk mengejar kecepatan perkembangan kecerdasan buatan. ini adalah tantangan tata kelola yang sangat besar. manusialah yang membuka keajaiban kecerdasan buatan kemampuan, kemungkinan besar akan ada saatnya manusia tidak dapat mengaktifkan kekuatan supernya karena berada di luar tingkat kognisi manusia.
model o1 baru yang diluncurkan oleh openai memiliki kemampuan penalaran yang kuat. peta visual tiongkok
pada 12 september waktu setempat, openai meluncurkan model generasi baru seri o1. dibandingkan dengan model sebelumnya, model ini telah menunjukkan kemampuan penalaran yang kuat dan tampil sebaik mahasiswa doktoral ketika menangani tugas-tugas benchmark dalam fisika, kimia, dan biologi kemampuan ini adalah sesuatu yang tidak dimiliki model sebelumnya.
pada tanggal 13 september, xiao yanghua, profesor dan pembimbing doktoral di sekolah ilmu dan teknologi komputer di universitas fudan, dan direktur laboratorium kunci ilmu data shanghai, mengatakan dalam sebuah wawancara dengan the paper bahwa kemunculan model o1 berarti bahwa kemampuan penalaran model besar dapat sepenuhnya mencapai tingkat ahli. hal ini dapat dianggap sebagai tonggak kemajuan dalam kecerdasan buatan, yang akan sangat meningkatkan penerapan model di sisi perusahaan.
namun ia juga mengakui bahwa seiring dengan peningkatan kemampuan intelektual, persepsi, dan rasional model tersebut, maka akan melampaui kemampuan manusia. sulit untuk memprediksi apa dampak kecerdasan buatan terhadap manusia di masa depan pembangunan kini melebihi kecepatan pemahaman manusia, dan tata kelola kecerdasan buatan akan menjadi tantangan besar,” kata xiao yanghua.
pandai memikirkan tugas-tugas kompleks, kinerja serupa dengan gelar ph.d.
sebagai model awal, model inferensi baru o1 belum sepenuhnya memiliki fungsi yang digunakan oleh chatgpt, seperti menelusuri informasi jaringan, mengunggah file dan gambar, dll. namun openai mengatakan bahwa ini adalah peningkatan yang signifikan untuk tugas-tugas penalaran yang kompleks dan mewakili tingkat kemampuan kecerdasan buatan yang baru.
“melalui pelatihan, mereka belajar menyempurnakan proses berpikir mereka, mencoba strategi yang berbeda, dan mengenali kesalahan mereka.” algoritma pembelajaran penguatan skala besar mengajarkan model bagaimana berpikir secara efektif menggunakan rantai pemikiran mereka selama proses pelatihan, dan model o1 dapat berpikir sebelumnya. menanggapi pengguna menghasilkan rantai pemikiran internal yang panjang. dengan lebih banyak pembelajaran penguatan dan lebih banyak waktu untuk berpikir, kinerja o1 terus meningkat. ia belajar untuk memecah langkah-langkah rumit menjadi langkah-langkah yang lebih sederhana. ketika metode saat ini tidak berhasil, ia mencoba pendekatan lain.
model inferensi baru o1 unggul dalam matematika dan pemrograman, unggul dalam menghasilkan dan men-debug kode kompleks secara akurat. openai mengevaluasi performa matematika model di aime (american mathematics invitational competition). pada ujian aime 2024, gpt-4o hanya menyelesaikan rata-rata 12% (1,8/15) soal untuk satu sampel dari setiap soal, o1 rata-rata 74 %(11.1/15). dalam ujian kualifikasi olimpiade matematika internasional (imo), gpt-4o hanya menyelesaikan 13% soal dengan benar, sedangkan model penalaran baru memperoleh nilai 83%.
model baru ini dapat menjelaskan tugas-tugas kompleks, seperti mahasiswa phd pada tugas-tugas benchmark dalam fisika, kimia, dan biologi. openai melakukan benchmark berlian gpqa di bidang kimia, fisika, dan biologi. untuk membandingkan model dengan manusia, para ahli dengan gelar phd direkrut untuk menjawab pertanyaan bersama.
“kami menemukan bahwa o1 mengungguli para ahli manusia, sehingga menjadi model pertama yang mencapai hal tersebut dalam tolok ukur ini. hasil ini tidak berarti bahwa o1 lebih mampu dibandingkan phd dalam segala aspek, hanya saja model tersebut lebih baik dalam menyelesaikan kebutuhan phd peneliti layanan kesehatan dapat menggunakan o1 untuk memberi anotasi pada data pengurutan sel, fisikawan dapat menggunakan o1 untuk menghasilkan rumus matematika kompleks yang diperlukan untuk optik kuantum, dan dapat digunakan oleh pengembang di semua bidang, kata openai untuk membangun dan menjalankan alur kerja multi-langkah.
kemampuan penalaran pencapaian akan sangat meningkatkan efek aplikasi
model bahasa besar sebelumnya lebih seperti mahasiswa seni liberal dan masih jauh dari level mahasiswa sains. namun kemampuan inti dari kecerdasan manusia adalah berpikir dan berpikir. model penalaran baru openai seri o1 menunjukkan proses berpikir manusia. xiao yanghua berkata, inti dari model inferensi baru o1 masih berupa model bahasa besar, tetapi sepenuhnya memanfaatkan potensi model besar. di masa lalu, kemampuan generasi model besar ditentukan oleh korpus, yang seperti "familiar dengan tiga ratus puisi tang, dan anda dapat melafalkannya meskipun anda tidak tahu cara mengarangnya". namun kemampuan penalaran tingkat ahli bukanlah taktik tanya jawab, melainkan membutuhkan kemampuan berpikir yang kuat. kesulitan dalam melatih kemampuan penalaran model besar adalah banyaknya proses berpikir manusia yang tidak pernah diungkapkan, sehingga data tentang proses berpikir tersebut sangat langka. dia berspekulasi bahwa openai harus menggunakan data sintetis dalam jumlah besar kali ini.
"openai memiliki keunggulan yang jelas sebagai penggerak pertama. model dasarnya lebih kuat, ia mengumpulkan banyak data proses berpikir, menyaring dan mensintesis sejumlah besar data pemikiran berkualitas tinggi, dan memiliki kemampuan evaluasi yang kuat. proses penalaran mana yang benar dan proses penalaran yang mana itu salah, yang memerlukan penggunaan pembelajaran penguatan. pembelajaran penguatan pada dasarnya adalah proses eksplorasi dan coba-coba. jika tidak berhasil, coba saja metode lain." xiao yanghua mengatakan itu dengan bantuan teknologi dan data ini, openai telah membuat model besar menjadi nyata bagi siswa sains dan mencapai tingkat ahli.
chen yunwen, ketua daguan data, mengatakan bahwa model sebelumnya tidak dapat menghitung masalah matematika tingkat lanjut yang kompleks, dan o1 telah meningkatkan kemampuan matematika dan penalaran, yang merupakan kemajuan besar. namun peningkatan kemampuan matematis bukan berarti paradigma r&d model besar telah mengalami perubahan mendasar, melainkan hanya mengarahkan perbaikan pada kekurangan-kekurangan sebelumnya.
dalam pandangan xiao yanghua, kemunculan o1 bukanlah hal yang tidak terduga. “faktanya, kami sudah menilai sejak awal bahwa model besar akan memiliki kemampuan emosional dan rasional yang lebih kuat di sini, dan efeknya sangat luar biasa.” ia percaya bahwa di masa depan, openai dapat berdiferensiasi menjadi banyak model besar yang mampu melakukan berbagai hal berdasarkan model besar secara umum.
misalnya, gpt-4 versi sebelumnya akrab dengan semua pengetahuan dan fakta dan menekankan kemampuan intelektual; gpt-4o menekankan interaksi multi-modal dan menekankan kemampuan persepsi; peningkatan rasionalitas model akan memungkinkan industri to b mengantarkan perkembangan yang luar biasa. "kesulitan dan hambatan terbesar to b terletak pada kemampuan penalaran model-model besar. munculnya model inferensi baru seri o1 berarti bahwa banyak masalah dalam industri to b dapat diatasi secara signifikan di masa depan."
tantangan yang ditimbulkan oleh pesatnya perkembangan kecerdasan buatan
"openai benar-benar hebat. meskipun peta jalan teknis openai sejauh ini belum melampaui cakupan kognisi, kita semua mengetahui arah pengembangan model besar, termasuk multi-modalitas dan peningkatan kemampuan penalaran, namun hanya openai yang dengan cepat mewujudkannya. mereka melatih model-model besar dengan cara yang persis sama seperti manusia. mereka memiliki gagasan yang sangat kuat tentang perkembangan intelektual dan perkembangan kognitif manusia, dan memiliki pemahaman yang sangat jelas tentang pertumbuhan dan evolusi manusia. " menjelaskan.
openai jelas memiliki keunggulan sebagai penggerak pertama. mengenai pengembangan model domestik skala besar, "kelebihan openai adalah kerugian bagi kami. kami harus tenang dan mengejar ketertinggalan secara perlahan. hanya ada yang pertama dalam jalur kecerdasan buatan secara umum, bukan yang kedua." ." namun, dalam jangka panjang, xiao yanghua mengatakan bahwa ada batas atas peningkatan kemampuan individu model besar. karena data asli manusia yang sebenarnya terbatas dan kecepatan produksinya lambat. "saat ini openai menggunakan data manusia untuk mensintesis data baru guna meningkatkan kemampuan penalaran. namun, data sintetik dibatasi oleh data asli. ia tidak dapat mensintesis data yang tidak terbatas, juga tidak dapat memperoleh data yang pada dasarnya baru. ia tidak dapat menciptakan subjek baru karena hal ini. usulkan teori baru seperti einstein. "dalam hal perangkat keras, penalaran memerlukan daya komputasi yang lebih sedikit daripada pelatihan, namun karena perluasan rantai pemikiran, persyaratan untuk efisiensi penalaran menjadi lebih tinggi, yang mengedepankan persyaratan yang lebih tinggi untuk percepatan dan optimalisasi dari pemikiran tersebut. proses penalaran.
namun, seiring dengan kemajuan model-model besar dalam banyak aspek, hal ini menimbulkan tantangan bagi tata kelola. tantangannya adalah pemahaman manusia terhadap model-model tersebut tidak meningkat secepat perkembangannya.
filsuf kant membagi proses kognitif manusia menjadi tiga tahap: persepsi, intelektual dan rasional. saat ini, kepekaan, kecerdasan, dan rasionalitas model-model besar semuanya meningkat, dan kemungkinan besar akan melampaui manusia. sangat sedikit orang yang bisa menjadi kuat dalam tiga kognisi ini.
“saat ini o1 sudah mencapai level mahasiswa doktoral. di masa depan, mencapai level ilmuwan hanya akan menjadi proses mencapai perubahan kuantitatif. manusia lambat laun akan terjerumus ke dalam titik buta kognitif perkembangan kecerdasan buatan. misalnya, apa yang dimaksud dengan kemampuan penalaran model besar saat ini? bisakah itu benar-benar digunakan dalam ai? proporsi orang dengan tingkat pengetahuan di atas hanya akan semakin kecil. tingkat dalam matematika, fisika, kimia atau matematika. berapa banyak dari kita yang dapat memahami, mengenali, dan mengendalikan ai? "xiao yanghua berkata, manusia saat ini berada pada tingkat doktoral. kerangka kognitif dasar kecerdasan buatan masih kurang. ini adalah tingkat yang sangat besar tantangan tata kelola. topik-topik seperti ketenagakerjaan, ekonomi, etika, dan hubungan sosial akan menimbulkan diskusi luas. “manusia adalah pembuka keajaiban kecerdasan buatan. jika kecerdasan buatan memiliki kemampuan manusia super, kemungkinan besar mereka akan menjadi kekuatan super yang tidak dapat diaktifkan oleh manusia karena mereka tidak dapat mengaktifkannya. berada di luar tingkat kognisi manusia.”
reporter surat kabar zhang jing
(artikel ini berasal dari the paper. untuk informasi lebih orisinal, silakan unduh aplikasi “the paper”)
laporan/umpan balik