bagaimana o1 "bernalar" seperti manusia? tanya jawab tim peneliti openai: mengungkap detail model, rencana masa depan, dan tips untuk memaksimalkan kinerja o1

2024-09-15

pada tanggal 13 september, openai mengumumkan debut resmi model seri o1, menandai era baru di bidang ai dan mengantarkan era model besar yang mampu melakukan tugas penalaran kompleks untuk tujuan umum. setelah model tersebut dirilis, tim peneliti openai mengadakan acara ama (ask me anything) di platform sosial x, mengungkap banyak detail model seri o1 secara mendalam.

sumber gambar: x platform sosial

asisten ai tingkat “alien”.

openai mengatakan seri o1 mencakup dua versi: o1-preview, yang merupakan iterasi awal dari model lengkap, dan o1-mini yang lebih cepat dan ringan. berbeda dengan model sebelumnya,o1 mampu menghasilkan rantai panjang proses berpikir tersembunyi sebelum memberikan jawaban akhir, menunjukkan kemampuan penalaran seperti manusia。peneliti mengibaratkan o1 dengan “alien” yang memiliki kekuatan super。

sumber gambar: x platform sosial

selama proses penalaran,o1 menggunakan pembelajaran penguatan untuk mencapai kinerja "penalaran".. meskipun saat ini tidak ada rencana untuk menampilkan token rantai pemikiran ini kepada pengguna api atau chatgpt, para peneliti mengungkapkan bahwa instruksi yang tertanam dalam petunjuknya dapat memengaruhi cara berpikir o1. sebaliknya,gpt-4o tidak dapat mencapai tingkat kinerja rantai pemikiran o1 melalui perintah。

sumber gambar: x platform sosial

model seri o1 menggunakan tokenizer yang sama dengan gpt-4o dan tetap konsisten pada token masukan. tetapi,o1 mampu menangani tugas-tugas yang lebih panjang dan terbuka, sehingga mengurangi kebutuhan akan pengelompokan input. di masa depan, o1 juga akan mendukung jendela konteks masukan yang lebih besar。

o1 juga menunjukkan kemampuan penalaran dan generalisasi yang mengesankan, seperti menguraikan kode, merenungkan pertanyaan filosofis, dan melakukan tes mandiri untuk menilai kemampuannya.

tim peneliti pun mengungkapkan hal ituperforma o1-pratinjau pada beberapa tugas penulisan yang dipersonalisasi setara atau sedikit lebih baik daripada gpt-4o.

apakah versi mininya lebih kuat?

dibandingkan dengan o1-preview, o1-mini dioptimalkan dalam ukuran dan kecepatan.

sumber gambar: x platform sosial

meskipun mungkin ada keterbatasan dalam beberapa bidang seperti pengetahuan dunia,o1-mini menunjukkan keunggulannya dalam tugas-tugas stem (sains, teknologi, teknik, matematika) dan tugas-tugas terkait kode. juga,o1-mini dapat menjelajahi lebih banyak rantai pemikiran daripada o1-pratinjau。

sumber gambar: x platform sosial

o1 akan segera mendukung integrasi alat dan pemahaman multimodal

meskipun o1-preview saat ini tidak menggunakan alat,openai berencana menambahkan kemampuan seperti panggilan fungsi, penerjemah kode, dan penjelajahan web. dukungan alat, keluaran terstruktur, dan petunjuk sistem juga akan diperkenalkan di pembaruan mendatang。

sumber gambar: x platform sosial

selain itu, tim pengembang openai menyatakan,di masa depan, pengguna akan dapat mengontrol waktu berpikir dan batas token o1., dan berjanji untuk secara aktif mempromosikan penerapan fungsi ini.

openai juga secara aktif mempromosikan dukungan streaming dan umpan balik kemajuan inferensi di api. juga,o1 sudah memiliki kemampuan multimodal bawaan,diharapkan dapat mencapai tingkat tercanggih dalam tugas pemahaman multi-modal (mmlu).

sumber gambar: x platform sosial

o1-mini memiliki batas 50 perintah per minggu

o1-mini saat ini terbuka untuk pengguna chatgpt plus, tetapi ada batasan 50 permintaan per minggu.semua tip diperhitungkan dalam kuota yang sama. openai berjanji,tingkat akses api dan batasan tarif akan ditingkatkan secara bertahap di masa mendatang, dan diskon harga volume akan diberikan setelah pembatasan dilonggarkan.。

penetapan harga model o1 diperkirakan mengikuti tren penurunan harga setiap 1-2 tahun. juga,dukungan penyesuaian yang dipersonalisasi ada pada peta jalan produk, namun jadwal rilis spesifiknya belum jelas.

sumber gambar: x platform sosial

rahasia memaksimalkan kinerja o1

o1-mini saat ini dilatih menggunakan data per oktober 2023, dan iterasi mendatang akan menggunakan kumpulan data yang lebih baru untuk memperluas pengetahuannya tentang dunia.

untuk memberikan gambaran penuh tentang keuntungan penalaran o1,tim merekomendasikan agar pengguna memberikan contoh yang informatif dan konkrit yang mencakup kasus-kasus ekstrem saat merancang petunjuk, dan dengan jelas menentukan langkah dan gaya penalaran yang diperlukan. tapi hati-hati,konteks yang tidak relevan dapat mengganggu proses inferensi model。

berita ekonomi harian, informasi publik mandiri yang komprehensif

berita ekonomi harian

laporan/umpan balik

berita

bagaimana o1 "bernalar" seperti manusia? tanya jawab tim peneliti openai: mengungkap detail model, rencana masa depan, dan tips untuk memaksimalkan kinerja o1

asisten ai tingkat “alien”.

apakah versi mininya lebih kuat?

o1 akan segera mendukung integrasi alat dan pemahaman multimodal

o1-mini memiliki batas 50 perintah per minggu

rahasia memaksimalkan kinerja o1

perkenalan

informasi kontak saya