apakah openai "strawberry" bernilai satu triliun?

2024-09-13

penulis |. bi andi, editor |

apa persamaan ultraman dan ma baoguo? jawaban: mereka semua suka melakukan serangan diam-diam.

kabar tentang "strawberry" telah beredar selama beberapa bulan. dikatakan bahwa ini adalah proyek misterius dalam openai, yang tampaknya sangat berbeda dari model generasi sebelumnya. namun openai merahasiakannya. momen terdekat yang terungkap adalah foto stroberi asli yang diposting oleh ceo sam altman di media sosial.

beberapa hari yang lalu, the information mengabarkan bahwa "strawberry" akan dirilis dalam dua minggu ke depan.

bahkan dengan perhatian yang begitu besar, openai masih mengejutkan dunia: pada sore hari tanggal 12 september, waktu setempat, tanpa pemberitahuan atau konferensi pers apa pun, openai tiba-tiba merilis model baru.

namun, nama model baru ini tidak sedap "strawberry", tapi sangat serius dan bermakna: o1.

tahukah anda, model openai telah diiterasi pada seri "gpt" sebelumnya, dari gpt-1 pada tahun 2018 hingga gpt-4o pada bulan mei tahun ini. hari ini, openai membuka lini baru.

dalam postingan blog resmi yang mengumumkan o1, openai mengatakan ini: "sebagai model awal, ia belum memiliki banyak fitur yang membuat chatgpt berguna...tetapi untuk tugas inferensi yang kompleks, ini merupakan peningkatan yang signifikan dan mewakili kemampuan ai. mengingat hal ini, kami menyetel ulang penghitungnya kembali ke 1 dan menamai seri ini openai o1.”

model baru saat ini hanya terbuka untuk pelanggan berbayar chatgpt dan beberapa pemrogram. untuk menunjukkan bahwa model tersebut belum matang, untuk sementara disebut "o1-preview", dan pratinjau berarti pratinjau. selain itu, openai juga merilis versi model kecil o1-mini. baik itu o1-preview atau o1-mini, saat ini ada batasan jumlah tanggapan per minggu.

ultraman sendiri memuji model barunya di media sosial

gary marcus, seorang pakar ai yang selalu suka menuangkan air dingin ke chatgpt, bercanda bahwa langkah openai adalah "resep yang sudah dikenal": umumkan demo, buka untuk sejumlah pengguna terbatas, kumpulkan dana, dan lakukan lagi.

saat o1 dirilis, openai sedang menjalani putaran pendanaan baru. menurut kabar terkini dari bloomberg, putaran pembiayaan ini akan menjadi peristiwa besar dengan skala puluhan miliar dolar as dan target valuasi us$150 miliar.

mari kita lihat modelnya sendiri terlebih dahulu.

seperti yang dikabarkan sebelumnya, fokus utama o1 adalah "penalaran". kunci dibalik “penalaran” adalah “berpikir”.

bagi pengguna, perasaan paling intuitif adalah pratinjau o1 akan memakan waktu lebih lama sebelum menjawab pertanyaan.

di bawah model pratinjau o1, daftar alfabet menanyakan chatgpt "hari apa dalam bulan dan hari dalam seminggu hari ini?" setelah pertanyaan dikirim, chatgpt menampilkan langkah berpikir yang sedang berlangsung satu per satu: menjawab pertanyaan tanggal, meninjau pedoman, memahami tanggal saat ini, dan kemudian memberikan jawaban yang bertanda "berpikir selama 8 detik".

sebaliknya, pada model gpt-4o, chatgpt memberikan jawaban langsung dalam waktu 3 detik tanpa menunjukkan langkah perantara.

"ini adalah model oracle besar baru yang dilatih melalui pembelajaran penguatan dan dirancang untuk melakukan tugas penalaran yang kompleks. o1 berpikir sebelum menjawab pertanyaan - ini dapat menghasilkan 'rantai pemikiran' internal yang panjang sebelum menjawab pengguna."

kali ini model o1 dirilis, pejabat openai mengungkapkan sangat sedikit detail teknis, dan yang berulang kali mereka tekankan adalah "rantai pemikiran".

menurut openai, o1 menggunakan rantai pemikiran ketika mencoba memecahkan masalah, seperti halnya manusia berpikir panjang dan keras sebelum menjawab pertanyaan sulit. melalui pembelajaran penguatan, o1 belajar menyempurnakan rantai pemikirannya dan mengoptimalkan strategi penggunaannya. ia mampu mengenali dan memperbaiki kesalahannya sendiri dan belajar memecah langkah-langkah rumit menjadi langkah-langkah yang lebih sederhana. jika metode saat ini tidak berhasil, ia akan mencoba metode lain.

“proses ini sangat meningkatkan kemampuan inferensi model.”

lalu seberapa kuatkah kemampuan o1? selain beberapa video demonstrasi yang dirilis openai, yang paling meyakinkan adalah hasil pengujiannya. openai mengatakan kinerja o1 "sebanding dengan pakar manusia" pada sejumlah tolok ukur intensif inferensi dan mengungguli teknik sebelumnya. misalnya pada international mathematical olympiad (imo), skor teknis sebelumnya adalah 13%, dan skor o1 mencapai 83%.

dalam kompetisi pemrograman codeforces, o1 meraih skor sangat baik sebesar 89%. berdasarkan o1, openai juga mengembangkan o1-ioi, yang lebih baik dalam pemrograman, dan hasilnya melampaui 93% kontestan dalam satu kali kejadian.

tes lain yang secara khusus "dipamerkan" oleh openai adalah gpqa-diamond, yang merupakan tes benchmark keahlian di bidang kimia, fisika, dan biologi. openai mengundang para ahli dengan gelar phd untuk berkompetisi dan menemukan bahwa "kinerja o1 melebihi para pakar manusia ini."

openai juga mengatakan bahwa setelah mengaktifkan kemampuan persepsi visual, o1 mendapatkan skor 78,2% dalam tes mmmu, "menjadi model pertama yang dapat bersaing dengan pakar manusia." selain itu, o1 mengungguli gpt-4o pada 54 dari 57 subkategori mmlu.

singkatnya, o1 lebih memperhatikan kemampuan penalaran dibandingkan model openai sebelumnya, dan kemampuannya dalam matematika dan pemrograman telah ditingkatkan secara khusus. terlebih lagi, ini seperti seorang dokter dalam tinju dan ahli dalam menendang dan melalui "rantai berpikir". , hal ini juga diharapkan dapat mengurangi ilusi model.

namun, o1 masih dalam tahap yang relatif awal. seperti yang ditekankan ultraman, "masih ada kekurangan dan keterbatasan."

hanya dalam upaya dangkal daftar alfabet, kesalahan terjadi di pratinjau o1. misalnya, ketika ditanya "mana yang lebih besar, 9.11 atau 9.9?", gpt-4o menjawab salah, dan o1-preview juga menjawab salah, dengan serius mengatakan bahwa "9.11 memang lebih besar dari 9.9. karena 9.11 (yaitu 9.11) lebih besar dari 9,9 (9,90)." ada sedikit humor dalam verbositasnya, belum lagi butuh 15 detik untuk memikirkannya.

informasi tersebut juga melaporkan bahwa beberapa pengguna yang mencoba o1-preview mengatakan bahwa banyak interaksi "tidak sebanding dengan tambahan waktu menunggu 10 hingga 20 detik" dan mereka lebih menyukai kecepatan respons gpt-4o.

saat ini, o1-preview dan o1-mini terbuka untuk pengguna berbayar, namun jumlahnya terbatas: o1-preview memiliki 30 pesan per minggu, dan o1-mini memiliki 50 pesan per minggu.

mulai minggu depan, kedua model tersebut juga akan dapat diakses oleh pengguna chatgpt perusahaan dan pendidikan (edu). openai juga menyatakan ingin memberikan o1-mini kepada semua pengguna secara gratis di masa mendatang, namun waktu spesifiknya belum diumumkan.

ini adalah pertama kalinya openai menambahkan akhiran yang mirip dengan "pratinjau" saat merilis model. sebelumnya, gpt-4 dan gpt-4o telah merilis model lengkap secara langsung.

salah satu fitur o1 yang tidak dapat diabaikan adalah harganya yang mahal.

biaya akses pengembang ke o1 sangat tinggi: dalam hal api, o1-preview mengenakan biaya $15 per 1 juta token masukan atau blok teks yang diurai oleh model, tiga kali lipat dari gpt-4o, dan $60 per 1 juta token keluaran usd , empat kali lipat dari gpt-4o.

the atlantic menganalisis dalam laporannya bahwa o1 dirancang khusus untuk membutuhkan lebih banyak waktu, yang pasti akan menghabiskan lebih banyak sumber daya dan meningkatkan kesulitan profitabilitas aigc.

gary marcus, yang disebutkan di awal artikel ini, adalah seorang sarjana di persimpangan ilmu saraf manusia dan kecerdasan buatan, seorang profesor kehormatan di universitas new york, dan pendiri dan ceo dari startup ai geometric intelligence adalah " "duri di dunia ai" telah berulang kali mengkritik openai.

dalam pandangannya, rilis o1-preview openai secara tiba-tiba lebih merupakan metode propaganda.

bagaimanapun, openai sedang menjalani putaran pendanaan yang penting. menurut laporan terbaru dari bloomberg, openai sedang bernegosiasi untuk mengumpulkan us$6,5 miliar dari investor dengan penilaian sebesar us$150 miliar bank dalam bentuk kredit bergulir.

"kirim demo, buka untuk pengguna terbatas, kumpulkan uang, dan ulangi." beginilah cara marcus merangkum "sarana" openai.

pada bulan juli tahun ini, the information melaporkan bahwa openai mungkin mengalami kerugian sebanyak $5 miliar tahun ini. diantaranya, biaya karyawan openai tahun ini sekitar us$1,5 miliar, biaya pelatihan dan inferensi ai mungkin mencapai us$7 miliar, dan pendapatan tahunan diperkirakan antara us$3,5 miliar hingga us$4,5 miliar.

pada saat itu, the information memperkirakan bahwa dengan laju pembakaran uang sebesar ini, openai perlu segera mengumpulkan dana. pembiayaan penting terakhir untuk openai terjadi pada awal tahun 2023, ketika microsoft menginvestasikan puluhan miliar dolar.

ini bukan pertama kalinya openai merilis "produk yang belum matang" pada node-node utama.

pada oktober tahun lalu, ada kabar bahwa openai ingin menjual sahamnya. saat itu, dikabarkan kemungkinan valuasinya mencapai us$86 miliar. namun pada bulan berikutnya, openai mengalami perubahan mengejutkan dalam manajemen puncaknya. altman dikeluarkan dari perusahaan, namun ia segera kembali ke posisinya sebagai ceo, memenangkan "pertempuran istana". namun, rencana penjualan saham tersebut sempat tertunda, dan belum ada kabar bahwa transaksi tersebut "kembali ke jalurnya" hingga akhir november. saat itu, pihak yang mengetahui hal tersebut mengatakan bahwa para karyawan khawatir keadaan darurat tersebut akan mempengaruhi penjualan saham dan mempengaruhi valuasi perusahaan.

menariknya, pada tanggal 15 februari tahun ini, openai tiba-tiba mengumumkan model generasi video baru sora, dan demo tersebut menimbulkan kejutan bagi dunia luar. dalam tiga hari, new york times melaporkan bahwa openai menyelesaikan penjualan saham karyawannya, dan valuasi perusahaan tersebut melampaui us$80 miliar “seperti yang diharapkan.”

lebih dari setengah tahun telah berlalu, dan sora belum dibuka untuk umum, atau bahkan mempromosikan pengujian skala besar. dunia luar mulai curiga bahwa sora sebenarnya tidak memiliki daya komputasi yang cukup untuk mendukung pengoperasiannya. sebuah laporan yang dirilis oleh organisasi riset pasar factorial funds percaya bahwa 720,000 chip nvidia h100 akan dibutuhkan untuk menggunakan sora.

pada awal september, "taiwan economic daily" melaporkan bahwa chip tingkat angstrom a16 tsmc telah menerima pesanan dari pelanggan besar, termasuk apple dan openai. openai akan menggunakan chip khusus untuk meningkatkan kemampuan pembuatan video sora. ini juga sepertinya mengkonfirmasi bahwa sora pernah mengalami kemacetan daya komputasi sebelumnya.

kini chatgpt rasa stroberi telah hadir, mungkin kita akan segera melihat berita bahwa openai telah berhasil menyelesaikan putaran pembiayaan baru dan bernilai lebih dari satu triliun yuan.

berita

apakah openai "strawberry" bernilai satu triliun?

perkenalan

informasi kontak saya