berita

"pemrograman sebagai sebuah profesi berakhir hari ini", hal yang menakutkan tentang model baru openai o1

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

penulis: fanfan, editor: odette, judul gambar dari: generasi ai

masih ingat gempa openai bertingkat tinggi sebelumnya?

apa yang memicu pemecatan sam altman, kepergian salah satu pendiri greg brockman, dan meningkatnya konflik internal dalam openai adalah proyek yang disebut q* (diucapkan q-star).

menurut orang-orang yang mengetahui masalah tersebut, proyek q* telah mencapai kemajuan yang signifikan pada saat itu dan sudah dapat memecahkan masalah matematika dasar. berbeda dengan kalkulator, yang hanya dapat menyelesaikan sejumlah operasi tertentu, dan gpt-4, yang memberikan jawaban berbeda untuk pertanyaan yang sama setiap saat,q* mungkin sudah memiliki kemampuan untuk menggeneralisasi, mempelajari dan memahami, yang merupakan langkah kunci menuju agi.peneliti openai mengirimkan surat kepada dewan direksi untuk memperingatkan bahwa penemuan besar q* dapat mengancam seluruh umat manusia, namun sam altman menyembunyikannya.

openai telah mengalami perubahan internal yang mengejutkan, dan openai sendiri tidak pernah merespons secara langsung keberadaan q*.

hari ini, openai tiba-tiba merilis model baru, yang masih merupakan versi pratinjau, yaitu q* yang legendaris, yang kemudian diberi nama kode "strawberry", dan sekarang openai o1-preview.

model penalaran baru untuk memecahkan masalah kompleks, yang tidak lagi satu seri dengan chatgpt|openai

o, masih "omini", yang mencakup segalanya, tetapi menurut openai, model ini "mewakili tingkat kecerdasan buatan yang baru" dan sangat berbeda dari model besar sebelumnya dalam metode kerja, sehingga model baru dapat dibuat secara terpisah seri, dihitung dari 1 (gpt5: saya sudah tua!).

mengenai apakah model ini akan "mengancam umat manusia" seperti yang dinilai oleh ilya sutskever dan mantan ilmuwan inti openai lainnya yang memberontak, mendorong umat manusia ke era agi (kecerdasan buatan) tanpa batasan moral yang sempurna, anda dapat membaca artikel lalu menilai sendiri.

o1, mengungguli segalanya

yang pertama adalah tautan penilaian yang familiar.

setiap generasi model besar keluar dan mencapai tingkatan baru yang belum pernah terjadi sebelumnya, namun kali ini o1 berbeda secara mendasar.

sebagian besar model besar yang populer saat ini berbentuk chatbot, yang jalur berpikirnya sulit dijelaskan, dan arah pengembangannya multimodal (dapat berbicara, melihat, dan mendengarkan), dan menjadi semakin mirip manusia dalam hal nada. dan reaksi. o1 berbeda dari mereka.

pertama-tama, tujuannya bukan untuk menjadi semakin cepat, atau bahkan semakin lambat.

ilmuwan openai noam brown mengatakan bahwa saat ini o1 dapat memberikan jawaban dalam beberapa detik, namun di masa depan ia harus mampu berpikir selama berjam-jam, berhari-hari, atau bahkan berminggu-minggu. kemudian sebuah gambar dilampirkan. o1 mendiagnosis sebuah kasus setelah berpikir lebih dari sepuluh detik. yang dimaksud noam brown,waktu inferensi yang lama berarti model dapat membangun rantai pemikiran yang lebih panjang dan melakukan pemikiran yang lebih dalam.

kedua, o1 menerobos kelemahan model bahasa besar sebelumnya, matematika.

aime, ujian undangan matematika amerika, lebih sederhana daripada olimpiade dan jauh lebih sulit daripada sat. aime umumnya digunakan untuk memilih siswa sekolah menengah terbaik dalam bidang matematika di amerika serikat. saat gpt4-o diminta menulis soal untuk kompetisi undangan, ia hanya memperoleh 12 poin, namun o1 menjawab soal sekaligus dan memperoleh 74 poin. jika anda mengambil sampel 1.000 kali dan kemudian menyusun ulang 1.000 sampel dengan fungsi penilaian (ini akan lebih mencerminkan tingkat model yang diharapkan), o1 mendapat skor 93 poin dan dapat menjadi salah satu dari 500 teratas di amerika serikat dan dapat diciutkan untuk amerika olimpiade matematika.

membandingkan kinerja o1 dan gpt-4o, kemajuan matematikanya sangat besar|openai

izinkan o1 menulis soal untuk olimpiade internasional informatika (ioi) 2024. dalam waktu 10 jam, setiap soal boleh diajukan hingga 50 kali, dan mendapat skor 213 poin, termasuk dalam 49% pemain manusia teratas.jika jumlah kiriman ditambah menjadi 10.000, o1 dapat memperoleh 362,14 poin, serta dapat memperoleh medali emas ioi dan direkomendasikan ke universitas tsinghua.

dalam pengujian sebenarnya, versi o1 yang disempurnakan digunakan, bukan versi masa depan yang dapat kita gunakan |

selain itu, banyak tes yang tidak tersedia. misalnya, dalam gpqa (tes kecerdasan yang menggabungkan fisika, kimia, dan biologi), o1 melampaui gelar phd di bidang terkait dalam beberapa pertanyaan.

pendeknya,involusi di bidang yang sudah kuat sudah lama tidak lagi menjadi tujuan o1. ini adalah untuk mencapai terobosan dalam logika kompleks yang tidak dapat dilakukan dengan baik oleh model bahasa besar.

satu langkah mundur, dua langkah maju

seperti disebutkan di atas, kecepatan reaksi o1 melambat.

dibutuhkan lebih banyak waktu untuk berpikir sebelum bereaksi, kemudian menyempurnakan proses berpikir, mencoba berbagai strategi, dan belajar dari kesalahannya. ini menakutkan.

selain itu, o1 sekarang bukan model multi-modal. openai menghabiskan waktu dua tahun untuk membuat model besar yang mampu melihat dan mendengarkan.

lebih lambat dan monoton, untuk o1,itu satu langkah mundur dan dua langkah maju. orang-orang yang telah menggunakan o1 mengatakan bahwa o1 adalah model paling cerdas yang pernah mereka gunakan, dan percakapan dengannya telah melampaui pertengkaran kecil sebelumnya.

dalam satu pengujian, pengguna menanyakan o1 pertanyaan paradoks logis: "berapa banyak kata yang ada dalam jawaban pertanyaan ini?"

o1 berpikir selama sepuluh detik dan menunjukkan proses berpikirnya. pertama-tama, dianggap bahwa ini adalah paradoks referensial diri, atau pertanyaan rekursif. jika jawabannya tidak ditentukan, maka jumlah kata dalam jawabannya tidak dapat ditentukan.“menghindari ekspresi yang tidak perlu penting untuk mendapatkan jawaban yang jelas dan ringkas”. langkah selanjutnya adalah menghitung kata, dimana angka yang muncul pada kalimat harus sesuai dengan jumlah kata pada kalimat. kemudian ia mencantumkan banyak kalimat dan menemukan opsi pencocokan yang paling sesuai. ditemukan bahwa "ini memiliki lima kata" memiliki lima kata, jadi setelah mengubah struktur kalimat menjadi jawaban yang lengkap, lima harus diganti dengan tujuh.

maka dijawab: "jawabannya ada tujuh kata."

proses penalaran ini tidak jauh berbeda dengan proses penalaran saya|x

dalam contoh lain, o1 membutuhkan 5,6 detik dan 631 token untuk menjawab pertanyaan sederhana "berapa banyak r yang ada di straberry?"

dari contoh di atas terlihat bahwametode kerja o1 pada dasarnya berbeda dari chatgpt.sekarang o1 telah menambahkan token penalaran, yang akan membagi pertanyaan menjadi beberapa langkah, memikirkannya secara terpisah, dan kemudian menghapus token penalaran untuk menghasilkan jawaban.

gambar di bawah menunjukkan cara kerja rantai ide, yang juga menjelaskan mengapa kecepatan respons o1 menjadi lebih lambat.

saat menggunakan o1, anda sebaiknya menggunakan beberapa soal logika klasik dan soal matematika untuk menguji kemampuannya.

mungkin ketika menjawab pertanyaan sederhana, perbedaan antara melakukan beberapa putaran penalaran tidak terlihat jelas, tetapi jika digunakan untuk menyelesaikan masalah kompleks dalam menulis kode, mengerjakan soal matematika, dan sains, kemampuan berpikir seperti ini sangat penting.

openai mengatakan dalam makalahnya bahwa sekarang, tenaga medis dapat menggunakan o1 untuk memberi anotasi pada data pengurutan sel, fisikawan dapat menggunakan o1 untuk menghasilkan rumus matematika kompleks yang diperlukan untuk optik kuantum, dan pengembang di berbagai bidang dapat menggunakan o1 untuk membangun dan melakukan pekerjaan multi-langkah. . proses.

terlebih lagi,inilah prototipe cara berpikir dan bentuk awal kebijaksanaan.

model baru, kebiasaan baru

karena cara kerja o1 berbeda dengan chatgpt, tutorial yang saya lihat sebelumnya yang mengajarkan anda cara menulis perintah tidak berlaku lagi - dalam situasi saat ini, terlalu banyak deskripsi hanya akan menggunakan token dalam jumlah besar, tetapi belum tentu mendapatkannya . hasil yang lebih baik.

untuk memperjelas hal ini kepada semua pengguna, openai telah menulis pedoman token baru. dalam panduannya, openai menjelaskan bahwa perintah terbaik di o1 bersifat langsung dan ringkas. menginstruksikan model untuk melakukannya langkah demi langkah atau memberikan beberapa kata perintah yang tersebar mungkin kontraproduktif. berikut adalah beberapa rekomendasi resmi:

anjuran harus sederhana dan langsung. model memberikan respons terbaik terhadap instruksi singkat dan jelas yang tidak memerlukan terlalu banyak panduan.

hindari rantai pemikiran dalam petunjuknya. o1 melakukan penalaran internalnya sendiri, jadi membimbingnya langkah demi langkah dan menjelaskan jalur berpikir anda tidak ada gunanya.

lebih baik menggunakan pembatas untuk meningkatkan kejelasan. gunakan pembatas seperti "", <>, dan § untuk membedakan dengan jelas bagian-bagian perintah yang berbeda untuk membantu model memproses masalah dalam batch.

batasi pengambilan konteks tambahan dalam generasi yang disempurnakan. berikan hanya informasi yang paling relevan untuk menghindari terlalu memikirkan model.

saat saya melihat artikel ketiga, saya merasa sedikit familiar dengan format ini. pemrogram masa depan cenderung menggunakan pemrograman bahasa alami. instruksi dasarnya masih sama, tetapi sudah menjadi bahasa sehari-hari. mengikuti pedoman terbaru, perintah yang bagus akan terlihat seperti ini:

atau sesuatu seperti ini:

§ pembawa acara § penulis § pemilik bar § pelukis cat minyak § pengrajin kulit § pengrajin perak § penyanyi § seniman rebana § backpacker § pipi kiri emas § ksatria perancis § murid zen §

biarkan model melakukan sisanya.

beri saya waktu sebentar untuk membuat ular 3d

ada alasan untuk menggunakan ular sebagai contoh. kurang dari sehari setelah o1 dirilis, orang-orang telah melakukan banyak upaya dengannya, termasuk 3d snake.

@ammaar reshi di x menggunakan perintah yang sangat sederhana untuk menulis ular 3d hanya dalam satu menit, dan o1 juga mengajarinya cara menggunakan kode tersebut.

sudahkah anda belajar menulis petunjuknya? |@ammaar reshi

meski efeknya agak kasar, tidak ada yang bisa mengatakan bahwa itu bukanlah ular yang rakus.

dan itu cukup menyenangkan|@ammaar reshi

netizen @james wade menggunakan o1 untuk membuat aplikasi analisis data yang dapat menampilkan deskripsi singkat dan contoh setiap distribusi. hanya membutuhkan waktu 15 menit, termasuk waktu penerapan. dia berkata: saya tidak pernah berpikir untuk melakukan hal seperti ini sebelumnya.

efeknya seperti yang ditunjukkan pada gambar|@james wade

insinyur full-stack lainnya @dallas lones, yang telah bekerja selama 16 tahun, berkata dengan penuh emosi setelah membuat aplikasi pengembangan full-stack react native dalam beberapa menit,saya tidak memulai bisnis secepatnya, namun kini kerajinan ini telah menjadi sobekan zaman.dia berkata,"pemrograman sebagai sebuah profesi secara resmi berakhir hari ini."

ada lebih banyak orang yang menantang batas o1, dan beberapa orang sudah memainkannya“mari kita lihat pertanyaan siapa yang lebih sulit dan bisa membuat o1 berpikir paling lama.”permainan.

saat ini, o1 terbuka untuk pengguna chatgpt plus dan tim terlebih dahulu, sedangkan akses api akan dibuka terlebih dahulu untuk pengguna level 5 yang menghabiskan lebih dari $1.000 pada openai api. pada langkah berikutnya, openai secara bertahap akan membuka o1-mini versi low-profile untuk pengguna gratis.

apakah ini akan menjadi matahari terbenamnya umat manusia?