berat! model penalaran openai besar yang dapat "berpikir tentang logika pemecahan masalah" sudah ada di pasaran, dan kognisi akan melonjak ke "tingkat mahasiswa phd di bidang sains"

berat! model penalaran openai berskala besar yang dapat "berpikir tentang logika pemecahan masalah" telah hadir, dan kognisi akan melonjak ke "tingkat mahasiswa phd dalam sains"

2024-09-13

sekitar pukul 1 dini hari pada hari jumat, waktu beijing, era ai membuka titik awal baru—model besar yang mampu melakukan penalaran umum dan kompleks akhirnya muncul ke permukaan.

sumber gambar: visual china-vcg31n2008743681

openai mengumumkan di situs resminya bahwa,mulai mendorong model pratinjau openai o1 ke semua pelanggan - model besar "strawberry" yang sangat dinantikan. openai menyatakan bahwa untuk tugas penalaran yang kompleks,model baru mewakili tingkat kemampuan kecerdasan buatan yang baru, jadi sebaiknya atur ulang hitungannya menjadi 1 dan beri nama baru yang berbeda dari seri "gpt-4".

ciri-ciri model inferensi besar adalahai akan menghabiskan lebih banyak waktu untuk berpikir sebelum menjawab, sama seperti manusia memikirkan proses penyelesaian masalah. logika di balik model besar sebelumnya adalah untuk memprediksi urutan pembentukan kata dengan mempelajari pola dalam kumpulan data dalam jumlah besar. sebenarnya, mereka tidak terlalu memahami pertanyaannya.

sebagai versi pertama dari model seri o1, openai hanya meluncurkan versi pratinjau o1-preview dan versi o1-mini mini, dan diluncurkan secara bertahap untuk pengguna berbayar, pengguna dan pengembang gratis, dan harga untuk pengembang cukup mahal. .

biaya penggunaan model o1 setidaknya 3 kali lipat dari biaya gpt-4o. model ini dilatih menggunakan metode baru.

menurut laporan, model baru o1 dapat menjawab masalah pemrograman, matematika, dan sains yang lebih kompleks melalui metode pelatihan baru di baliknya. ia akan "berpikir" sebelum memberikan jawaban dan lebih cepat daripada manusia. versi mini yang lebih kecil dan lebih murah berfokus pada kasus penggunaan pemrograman.

pengguna berbayar chatgpt plus dan tim akan memiliki akses langsung ke kedua model, memilih secara manual dari menu tarik-turun di pemilih model ai di antarmuka pengguna. kedua mode tersebut akan tersedia untuk pengguna chatgpt enterprise dan edu minggu depan, dan akses ke o1-mini akan tersedia untuk semua pengguna gratis pada waktu yang tidak diketahui di masa mendatang. openai berharap dapat secara otomatis memilih model yang benar berdasarkan petunjuk di masa mendatang.

namun, akses pengembang ke o1 sangat mahal. dalam api (application programming interface), o1-preview mengenakan biaya $15 per 1 juta token masukan, tiga kali lipat biaya gpt-4o, dan $60 per 1 juta token keluaran empat kali lipat biaya gpt-4o. satu juta token adalah ukuran blok teks yang diurai model, yang setara dengan sekitar 750.000 kata.

jerry tworek, kepala penelitian di openai, mengatakan kepada media,o1metode pelatihan di baliknya pada dasarnya berbeda dari model sebelumnya.

pertama, o1 “dilatih menggunakan algoritme pengoptimalan yang benar-benar baru dan kumpulan data pelatihan baru yang dirancang khusus untuknya”, yang berisi “data inferensi” dan literatur ilmiah yang dirancang khusus untuknya.

kedua, metode pelatihan model gpt sebelumnya adalah dengan meniru aturan/paradigma kumpulan data, sedangkan o1 menggunakan "pembelajaran penguatan" untuk mengajarkan model memecahkan masalah sendiri melalui penghargaan dan hukuman, dan kemudian melalui "rantai ide" (rantai ide) pemikiran) untuk menangani masalah permintaan pengguna dan memberikan versi ringkasan rantai pemikiran, mirip dengan cara manusia menangani masalah langkah demi langkah.

pada gambar di sebelah kanan, anda dapat mengklik rantai ide untuk melihat bagaimana model o1 "berpikir"

diagram yang menunjukkan rantai ide untuk masalah matematika yang kompleks

openai percaya bahwa metode pelatihan baru ini akan membuat model o1 lebih akurat dan mengurangi masalah "halusinasi" dalam mengarang jawaban, namun tidak dapat sepenuhnya menghilangkan terjadinya "halusinasi". perbedaan utama antara model baru dan gpt-4o adalah model ini dapat memecahkan masalah kompleks seperti pemrograman dan matematika dengan lebih baik, sekaligus meningkatkan proses penalaran, mencoba berbagai strategi, serta mengidentifikasi dan memperbaiki kesalahan dalam jawabannya sendiri.

kognisi akan melonjak ke "tingkat mahasiswa phd dalam sains"

openai telah menjelaskan bahwa gpt-4 yang dirilis pada tahun 2023 serupa dengan tingkat kecerdasan siswa sekolah menengah, sedangkan gpt-5 melengkapi pertumbuhan ai dari "siswa sekolah menengah ke ph.d." model o1 ini adalah langkah kunci.

dibandingkan dengan model besar yang ada seperti gpt-4o, openai o1 dapat memecahkan masalah penalaran yang lebih sulit sekaligus memperbaiki kelemahan mekanis yang ada pada model sebelumnya.

misalnya, model baru dapat menghitung berapa banyak huruf "r" yang ada di stroberi.

di saat yang sama, ai akan lebih terorganisir saat menjawab pertanyaan pemrograman.sebelum mulai menulis kode, pikirkan seluruh proses jawabannya., lalu keluarkan kodenya.

misalnya, pada tugas menulis puisi dengan kondisi yang telah ditentukan sebelumnya (misalnya, kata terakhir kalimat kedua harus diakhiri dengan i), gpt-4o yang “mengambil pena dan menulis” memang memberikan jawaban, namun sering kali hanya sebagian dari kondisi yang terpenuhi. artinya ai harus menemukan jawaban yang benar saat pertama kali dihasilkan, jika tidak maka akan membuat kesalahan. namun dalam model o1, ai akan terus melakukan uji coba dan menyempurnakan jawabannya, sehingga secara signifikan meningkatkan akurasi dan kualitas hasil yang dihasilkan.

menariknya, ketika anda mengklik proses berpikir ai tersebut, maka akan muncul juga ai yang berkata “saya sedang memikirkan hal ini, apakah boleh melakukan ini?”, “oh, saya tidak punya cukup waktu, saya harus memberikan jawabannya sesegera mungkin”, dll. openai menegaskan bahwa apa yang ditampilkan di sini bukanlah rantai pemikiran asli, melainkan "ringkasan yang dihasilkan oleh model", dan perusahaan juga secara jujur mengakui bahwa ada faktor untuk mempertahankan "keunggulan kompetitif" di sini.

jerry tworek, kepala penelitian di openai, mengungkapkan bahwa pelatihan di balik model o1 pada dasarnya berbeda dari produk sebelumnya.meskipun model gpt sebelumnya dirancang untuk meniru pola dalam data pelatihannya, o1 dilatih untuk memecahkan masalahnya sendiri. dalam proses pembelajaran penguatan, mekanisme reward dan punishment digunakan untuk “mendidik” ai agar menggunakan “rantai berpikir” dalam menghadapi masalah, seperti halnya manusia belajar membongkar dan menganalisis masalah.

menurut tes,model o1 mampu memperoleh nilai 83% pada ujian kualifikasi olimpiade matematika internasional, sedangkan gpt-4o hanya mampu menyelesaikan 13% soal dengan benar.dalam kompetisi kemampuan pemrograman codeforces, model o1 mendapat skor 89%, sedangkan gpt-4o hanya mendapat skor 11%.

openai mengatakan bahwa berdasarkan pengujian, pada versi pembaruan berikutnya,ai dapat mencapai tingkat phd pada tolok ukur yang menantang dalam fisika, kimia, dan biologi。

kekurangan: tidak dapat menelusuri halaman web secara real-time, tidak dapat mengunggah file dan gambar, kurangnya pengetahuan dunia yang luas, atau rentan terhadap halusinasi

namun sebagai versi awal model o1, versi pratinjau o1 yang dirilis hari ini juga memiliki kekurangan yang jelas. misalnya, ini hanyalah "versi hanya teks" yang untuk sementara tidak dapat menelusuri informasi web dan mengunggah file dan gambar, yang berarti versi ini tidak memiliki banyak fungsi chatgpt. ini tidak sekuat gpt-4o pada umumnya kasus penggunaan, dan ada batasan penggunaan. , versi pratinjau o1 memiliki batas mingguan 30 pesan, dan versi mini memiliki batas mingguan 50 pesan.

keterbatasan lain yang disebutkan meliputi: model o1 tidak sekuat gpt-4o di banyak bidang dan memiliki kinerja yang buruk dalam pengetahuan faktual tentang dunia; kemampuan penalaran lebih lambat dalam beberapa kasus penggunaan dan mungkin memerlukan waktu lebih lama untuk menjawab pertanyaan hanya model teks murni, tidak memiliki kemampuan untuk mempertimbangkan dokumen tertentu atau mengumpulkan informasi real-time dari jaringan.

selain itu, membiarkan model ai memainkan tic-tac-toe selalu dianggap sebagai masalah di industri. model o1 baru dengan kemampuan penalaran masih akan membuat kesalahan dalam permainan ini, yaitu tidak dapat sepenuhnya mengatasi kesulitan teknis .

openai juga mengakui dalam makalah teknis bahwa mereka telah menerima beberapa "umpan balik anekdotal" bahwa pratinjau o1 dan versi mini lebih cenderung menghasilkan "ilusi" daripada gpt-4o dan versi mininya, yaitu ai masih sangat percaya diri. buatlah jawaban, dan o1 jarang mengakui bahwa ia tidak mengetahui jawaban atas sebuah pertanyaan.

techcrunch, sebuah media teknologi ternama, menunjukkan bahwa openai menunjukkan dalam postingan blog terkait model o1 bahwa mereka memutuskan untuk tidak menunjukkan kepada pengguna "rantai pemikiran" asli dari model baru ini, tetapi memilih untuk memberikan ringkasan dari model tersebut. rantai pemikiran dalam jawabannya. tujuannya adalah untuk mempertahankan "keunggulan kompetitif", dan untuk mengkompensasi kemungkinan kekurangan, "kami berusaha untuk mengajarkan model untuk mereproduksi ide-ide berguna dalam rantai pemikiran dalam jawabannya."

berita ekonomi harian, informasi publik yang komprehensif

berita ekonomi harian

laporan/umpan balik

berita

berat! model penalaran openai berskala besar yang dapat "berpikir tentang logika pemecahan masalah" telah hadir, dan kognisi akan melonjak ke "tingkat mahasiswa phd dalam sains"

biaya penggunaan model o1 setidaknya 3 kali lipat dari biaya gpt-4o. model ini dilatih menggunakan metode baru.

kognisi akan melonjak ke "tingkat mahasiswa phd dalam sains"

kekurangan: tidak dapat menelusuri halaman web secara real-time, tidak dapat mengunggah file dan gambar, kurangnya pengetahuan dunia yang luas, atau rentan terhadap halusinasi

perkenalan

informasi kontak saya