informasi kontak saya
surat[email protected]
2024-09-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
pada tanggal 13 september, openai mengumumkan debut resmi model seri o1, menandai era baru di bidang ai dan mengantarkan era model besar yang mampu melakukan tugas penalaran kompleks untuk tujuan umum. setelah model tersebut dirilis, tim peneliti openai mengadakan acara ama (ask me anything) di platform sosial x, mengungkap banyak detail model seri o1 secara mendalam.
openai mengatakan seri o1 mencakup dua versi: o1-preview, yang merupakan iterasi awal dari model lengkap, dan o1-mini yang lebih cepat dan ringan. berbeda dengan model sebelumnya,o1 mampu menghasilkan rantai panjang proses berpikir tersembunyi sebelum memberikan jawaban akhir, menunjukkan kemampuan penalaran seperti manusia。peneliti mengibaratkan o1 dengan “alien” yang memiliki kekuatan super。
selama proses penalaran,o1 menggunakan pembelajaran penguatan untuk mencapai kinerja "penalaran".. meskipun saat ini tidak ada rencana untuk menampilkan token rantai pemikiran ini kepada pengguna api atau chatgpt, para peneliti mengungkapkan bahwa instruksi yang tertanam dalam petunjuknya dapat memengaruhi cara berpikir o1. sebaliknya,gpt-4o tidak dapat mencapai tingkat kinerja rantai pemikiran o1 melalui perintah。
model seri o1 menggunakan tokenizer yang sama dengan gpt-4o dan tetap konsisten pada token masukan. tetapi,o1 mampu menangani tugas-tugas yang lebih panjang dan terbuka, sehingga mengurangi kebutuhan akan pengelompokan input. di masa depan, o1 juga akan mendukung jendela konteks masukan yang lebih besar。
o1 juga menunjukkan kemampuan penalaran dan generalisasi yang mengesankan, seperti menguraikan kode, merenungkan pertanyaan filosofis, dan melakukan tes mandiri untuk menilai kemampuannya.
tim peneliti pun mengungkapkan hal ituperforma o1-pratinjau pada beberapa tugas penulisan yang dipersonalisasi setara atau sedikit lebih baik daripada gpt-4o.
dibandingkan dengan o1-preview, o1-mini dioptimalkan dalam ukuran dan kecepatan.
meskipun mungkin ada keterbatasan dalam beberapa bidang seperti pengetahuan dunia,o1-mini menunjukkan keunggulannya dalam tugas-tugas stem (sains, teknologi, teknik, matematika) dan tugas-tugas terkait kode. juga,o1-mini dapat menjelajahi lebih banyak rantai pemikiran daripada o1-pratinjau。
meskipun o1-preview saat ini tidak menggunakan alat,openai berencana menambahkan kemampuan seperti panggilan fungsi, penerjemah kode, dan penjelajahan web. dukungan alat, keluaran terstruktur, dan petunjuk sistem juga akan diperkenalkan di pembaruan mendatang。
selain itu, tim pengembang openai menyatakan,di masa depan, pengguna akan dapat mengontrol waktu berpikir dan batas token o1., dan berjanji untuk secara aktif mempromosikan penerapan fungsi ini.
openai juga secara aktif mempromosikan dukungan streaming dan umpan balik kemajuan inferensi di api. juga,o1 sudah memiliki kemampuan multimodal bawaan,diharapkan dapat mencapai tingkat tercanggih dalam tugas pemahaman multi-modal (mmlu).
o1-mini saat ini terbuka untuk pengguna chatgpt plus, tetapi ada batasan 50 permintaan per minggu.semua tip diperhitungkan dalam kuota yang sama. openai berjanji,tingkat akses api dan batasan tarif akan ditingkatkan secara bertahap di masa mendatang, dan diskon harga volume akan diberikan setelah pembatasan dilonggarkan.。
penetapan harga model o1 diperkirakan mengikuti tren penurunan harga setiap 1-2 tahun. juga,dukungan penyesuaian yang dipersonalisasi ada pada peta jalan produk, namun jadwal rilis spesifiknya belum jelas.
o1-mini saat ini dilatih menggunakan data per oktober 2023, dan iterasi mendatang akan menggunakan kumpulan data yang lebih baru untuk memperluas pengetahuannya tentang dunia.
untuk memberikan gambaran penuh tentang keuntungan penalaran o1,tim merekomendasikan agar pengguna memberikan contoh yang informatif dan konkrit yang mencakup kasus-kasus ekstrem saat merancang petunjuk, dan dengan jelas menentukan langkah dan gaya penalaran yang diperlukan. tapi hati-hati,konteks yang tidak relevan dapat mengganggu proses inferensi model。
berita ekonomi harian, informasi publik mandiri yang komprehensif
berita ekonomi harian