lambat dan mahal? model inferensi openai "strawberry" telah hadir, seberapa jauh gpt-5?

2024-09-13

“strawberry” openai akhirnya hadir.

pada 12 september, waktu setempat, raksasa kecerdasan buatan (ai) openai merilis seri model inferensi ai openai o1 dengan nama kode "strawberry", termasuk openai o1-preview dan versi kecil o1-mini.

menurut openai, o1 akan menghabiskan lebih banyak waktu untuk memikirkan masalah sebelum bereaksi, sama seperti manusia. melalui pelatihan, saya belajar menyempurnakan proses berpikir saya, mencoba berbagai strategi, dan mengenali kesalahan saya. bernalar tentang tugas-tugas kompleks dan memecahkan masalah yang lebih sulit daripada model ilmiah, pengkodean, dan matematika sebelumnya.

openai menyatakan bahwa rangkaian model ini merupakan kemajuan besar untuk tugas-tugas penalaran yang kompleks, sehingga ia juga menyetel ulang penghitung produk ke 1 dan menamakannya openai o1. huruf "o" pada namanya mungkin merujuk pada orion.

kemampuan penalaran yang lebih kuat, rantai pemikiran memberikan peluang baru untuk keamanan model

proyek "strawberry" sebelumnya disebut "q*", yang merupakan alasan yang memicu "pertempuran pengadilan" openai dan menyebabkan pemecatan mendadak ceo perusahaan sam altman. pada saat itu, chief technology officer openai mira murati mengatakan kepada karyawannya bahwa sebuah surat tentang terobosan ai q* (diucapkan q-star) mendorong dewan untuk mengambil tindakan tersebut, menurut sumber.

kemajuan openai pada q* telah membuat beberapa orang dalam perusahaan percaya bahwa ini mungkin merupakan terobosan mereka dalam menemukan "kecerdasan super (agi, kecerdasan umum buatan)".

menurut informasi resmi, o1 memiliki banyak kemampuan yang jauh melebihi gpt-4o. peringkat ke-89 di codeforces, termasuk di antara 500 siswa terbaik di negara tersebut pada american mathematical olympiad (aime), dan melampaui tingkat doktoral manusia.

menurut laporan, mirip dengan bagaimana manusia berpikir lama sebelum menjawab masalah yang sulit, o1 juga menggunakan serangkaian pemikiran ketika mencoba memecahkan suatu masalah. melalui pembelajaran penguatan, o1 dapat belajar mengasah rantai pemikirannya dan meningkatkan strategi yang digunakannya. ia belajar untuk mengenali dan memperbaiki kesalahan, memecah langkah-langkah rumit menjadi langkah-langkah yang lebih sederhana, dan mencoba pendekatan yang berbeda ketika pendekatan yang ada saat ini tidak berhasil.

openai mengatakan bahwa penggunaan rantai pemikiran dapat meningkatkan keamanan dan konsistensi secara signifikan karena pemikiran model dapat diamati dengan jelas, dan alasan model mengenai aturan keamanan lebih kuat untuk skenario di luar distribusi.

xu li, ketua eksekutif dan ceo sensetime, sebelumnya mengatakan bahwa di masa depan, cerdas atau tidaknya suatu model bergantung sepenuhnya pada apakah metodologi untuk membangun data rantai pemikiran model cukup kuat, dan apakah metodologi yang cukup kuat ini dapat berkelanjutan. dan berulang.

tangkapan layar sebagian dari rantai pemikiran lengkap asli openai o1

namun, openai pada akhirnya memilih untuk tidak menampilkan rantai pemikiran asli kepada pengguna, melainkan menampilkan ringkasan rantai pemikiran tersebut. openai lebih lanjut menjelaskan: "rantai pemikiran tersembunyi memberikan peluang unik untuk memantau model. dengan asumsi bahwa model dapat dibaca dengan tepat, maka rantai pemikiran tersembunyi memungkinkan kita untuk 'membaca' pemikiran model dan memahami proses berpikirnya. misalnya, di masa depan mungkin ingin memantau rantai pemikiran untuk mencari tanda-tanda manipulasi pengguna. namun, untuk melakukan hal ini, model harus dapat dengan bebas mengekspresikan pemikirannya dalam bentuk yang tidak diubah, sehingga kami tidak dapat melatih kepatuhan kebijakan apa pun pada rantai pemikiran atau preferensi pengguna tidak ingin pengguna melihat rantai pemikiran yang tidak konsisten secara langsung.”

saat ini, dua model o1 tersedia untuk pengguna chatgpt plus dan tim, dan pengguna perusahaan dan pendidikan akan dapat menggunakannya mulai minggu depan.

lebih lambat tapi lebih mahal, bukan "penerus" gpt-4o

saat ini, batas pesan mingguan adalah 30 untuk o1-preview dan 50 untuk o1-mini. openai mengatakan pihaknya bekerja keras untuk meningkatkan batas pesan dan memungkinkan chatgpt untuk secara otomatis memilih mode yang sesuai berdasarkan permintaan yang diberikan. ini juga memperluas akses ke lebih banyak tingkat pengguna dan berencana untuk menyediakan akses o1-mini ke semua pengguna gratis.

di sisi api (application programming interface), o1-preview mengenakan biaya $15 per 1 juta token masukan (model besar memecah teks menjadi kata, kumpulan karakter, atau kombinasi kata dan tanda baca) dan $60 per 1 juta token keluaran. dibandingkan dengan gpt-4o, biaya masukannya 3 kali lipat dan biaya keluarannya 4 kali lipat.

o1-mini lebih cepat dalam penentuan posisi dan lebih hemat biaya. ia juga dikatakan memiliki kinerja yang sangat baik dalam matematika dan pemrograman. hal ini hampir setara dengan kinerja o1 pada tolok ukur evaluasi seperti aime dan codeforces ke o1-preview. dengan batas kecepatan yang lebih tinggi dan latensi yang lebih rendah, o1-mini 80% lebih murah dibandingkan o1-preview untuk pengguna api.

kelemahan lainnya juga terlihat jelas. menurut laporan media asing, mungkin diperlukan waktu lebih dari 10 detik bagi o1 untuk menjawab pertanyaan tertentu, dan model memilih untuk menampilkan kemajuan dengan menampilkan label untuk subtugas yang sedang dijalankan.

pada saat yang sama, mengingat model ai generatif yang tidak dapat diprediksi, o1 mungkin memiliki kelemahan dan keterbatasan lain. misalnya, terkadang kesalahan bisa terjadi dalam permainan tic-tac-toe. dalam makalah teknisnya, openai mengatakan beberapa penguji memiliki rumor bahwa o1 lebih rentan terhadap halusinasi dibandingkan gpt-4o dan kurang mau mengakuinya ketika tidak mengetahui jawaban atas sebuah pertanyaan.

selain itu, o1 saat ini tidak dapat menelusuri web atau menganalisis file.

altman mengakui dengan jujur bahwa o1 merupakan rangkaian model openai yang paling kuat dan selaras saat ini, namun masih memiliki kekurangan.

presiden openai greg brockman juga mengatakan bahwa teknologi o1 masih dalam tahap awal dan openai secara aktif melakukan eksplorasi, termasuk keandalan, halusinasi, dan ketahanan (stabilitas) terhadap penyerang.

openai mengatakan bahwa sebagai model awal, openai o1 belum memiliki banyak fitur yang membuat chatgpt berguna, seperti menelusuri informasi jaringan, mengunggah file dan gambar, dll. dalam banyak kasus umum, gpt-4o akan memiliki kemampuan lebih besar dalam jangka pendek. pembaruan dan penyempurnaan rutin akan menyusul, dan "pekerjaan masih dilakukan untuk menjadikan model baru ini mudah digunakan seperti model saat ini."

openai menekankan bahwa openai o1 bukanlah "penerus" gpt-4o. 4o dapat digunakan bersama dengan fungsi inferensi o1. ia berencana untuk terus mengembangkan dan merilis model seri gpt setelah seri o1.

perbandingan beberapa tolok ukur antara openai o1 dan gpt-4o

perlu disebutkan bahwa menurut laporan media asing sebelumnya, openai mungkin mempertimbangkan untuk menetapkan standar pengisian daya yang lebih tinggi untuk model besar "strawberry" atau model andalan generasi berikutnya, yang mungkin mencapai maksimum $2.000 per bulan. sebagai perbandingan, biaya chatgpt plus saat ini adalah $20 per bulan.

openai yang bergejolak, kapan gpt-5 akan tiba?

menurut pemberitaan media asing, mulati mengatakan model utama generasi berikutnya gpt-5 saat ini sedang dibangun, yang akan jauh lebih besar dari pendahulunya. meskipun perusahaan masih yakin bahwa skala akan membantu membuka kemampuan baru dari kecerdasan buatan, gpt-5 kemungkinan juga akan menyertakan teknologi inferensi yang diluncurkan kali ini.

“ada dua paradigma,” kata murati, “paradigma penskalaan dan paradigma baru ini. kami ingin menyatukan keduanya.”

jalur pengembangan gpt-5 tidaklah mudah.

pada 11 september, waktu setempat, alexis conneau, pemimpin penelitian gpt-4o/gpt-5 dan pemimpin teknis “her” versi openai, tiba-tiba mengumumkan pengunduran dirinya. sebelumnya, salah satu pendiri dan kepala ilmuwan openai ilya sutskever, ketua tim “super alignment” jan leike, dan salah satu pendiri john schulman, kepala chatgpt peter deng, dan lainnya telah mengundurkan diri satu demi satu... saat ini, hanya dua dari 11 pendiri tetap di openai.

tak hanya gejolak personel, openai juga terungkap menghadapi kesenjangan pendapatan dan pengeluaran sebesar us$5 miliar pada tahun ini.

namun yang terlihat adalah openai sudah mengambil tindakan.

rencana terbaru openai adalah mengumpulkan dana sekitar us$6,5 miliar, sehingga valuasi putaran pembiayaan ini menjadi us$150 miliar. pada akhir bulan lalu, terungkap bahwa openai sedang mempersiapkan putaran baru pembiayaan sebesar us$1 miliar yang dipimpin oleh perusahaan modal ventura thrive capital, dengan microsoft, apple, dan nvidia kemungkinan berpartisipasi dalam investasi tersebut lebih dari us$100 miliar.

pada 29 agustus waktu setempat, openai menyatakan bahwa chatgpt saat ini memiliki lebih dari 200 juta pengguna aktif mingguan, dua kali lipat dibandingkan musim gugur lalu.

openai mengatakan 92% perusahaan fortune 500 menggunakan produknya, dan penggunaan api-nya meningkat dua kali lipat sejak peluncuran chatgpt-4o mini pada bulan juli.

reporter surat kabar qin sheng

(artikel ini berasal dari the paper. untuk informasi lebih orisinal, silakan unduh aplikasi “the paper”)

laporan/umpan balik

berita

lambat dan mahal? model inferensi openai "strawberry" telah hadir, seberapa jauh gpt-5?

perkenalan

informasi kontak saya