berita

"Fungsi paling kuat dan biaya rendah"! OpenAI merilis GPT-4o mini untuk mengikuti kompetisi model kecil

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI meluncurkan "GPT-4o mini" pada hari Kamis Waktu Bagian Timur, mengikuti kompetisi model AI "kecil namun halus". OpenAI menyebut model baru ini sebagai "model paling kuat dan berbiaya rendah" dan berencana untuk mengintegrasikan gambar, video, dan audio di masa depan.

Lebih murah 60% dibandingkan GPT-3.5 Turbo, dan performa chat lebih baik dibandingkan produk pesaing

Perusahaan mengatakan GPT-4o mini tersedia untuk pengguna gratis ChatGPT, pelanggan ChatGPT Plus, dan Teams mulai Kamis, dan akan tersedia untuk pengguna perusahaan ChatGPT minggu depan. GPT-4o mini akan menggantikan model lama GPT-3.5 Turbo di ChatGPT. OpenAI mengatakan GPT-4o mini berharga 15 sen per juta token masukan dan 60 sen per juta token keluaran, menjadikannya lebih dari 60% lebih murah dibandingkan GPT-3.5 Turbo.

Perusahaan juga mengatakan bahwa model baru tersebut saat ini mengungguli model GPT-4 dalam hal preferensi obrolan dan mencapai skor 82% pada tes pemahaman bahasa multi-tugas (MMLU) besar-besaran. Menurut laporan media, MMLU adalah tolok ukur kecerdasan teks dan penalaran yang digunakan untuk mengevaluasi kemampuan model bahasa. Skor MMLU yang lebih tinggi menunjukkan pemahaman dan penggunaan bahasa yang lebih baik di berbagai domain, sehingga meningkatkan penerapannya di dunia nyata.

Menurut data OpenAI, model mini GPT-4o memperoleh skor 82%, lebih tinggi dibandingkan dua pesaing berbiaya rendah lainnya, Gemini Flash dari Google memperoleh skor 77,9%, dan Claude Haiku dari Anthropic memperoleh skor 73,8%.

Di antara model yang lebih besar, GPT-3.5 mendapat skor 70% dalam pengujian ini, GPT-4o mendapat skor 88,7%, dan Google mengklaim Gemini Ultra mencapai skor tertinggi yang pernah ada yaitu 90%.

Analisis tersebut menunjukkan bahwa model bahasa yang lebih kecil memerlukan lebih sedikit daya komputasi untuk dijalankan, menjadikannya pilihan yang lebih terjangkau bagi perusahaan dengan sumber daya terbatas untuk menerapkan AI generatif.

Selain itu, model ringan baru ini juga akan mendukung fitur teks dan visual di API, dan OpenAI mengatakan akan segera menangani semua input dan output multi-modal seperti video dan audio. Dengan kemampuan ini, asisten virtual ini berpotensi bertindak seperti asisten virtual yang lebih canggih, mampu memahami rencana perjalanan Anda dan membuat rekomendasi. Namun, model ini saat ini hanya dapat digunakan terutama untuk tugas-tugas sederhana.

Persaingan untuk model AI yang “kecil namun halus” sangat ketat dan OpenAI akhirnya ikut serta

Menurut laporan media, valuasi OpenAI, yang didukung oleh Microsoft, telah melampaui US$80 miliar. Meskipun masih menempati posisi terdepan di pasar AI generatif, perusahaan ini menghadapi tekanan persaingan yang semakin meningkat. OpenAI juga perlu menemukan cara untuk menghasilkan uang, karena perusahaan menghabiskan banyak uang untuk prosesor dan infrastruktur untuk membangun dan melatih modelnya.

Namun, banyak perusahaan tidak mampu membeli model yang lebih besar dan mahal, sehingga model yang lebih ringan dan lebih murah mungkin lebih populer. Sampai saat itu, banyak pengembang akan memilih Claude 3 Haiku atau Gemini 1.5 Flash daripada membayar biaya komputasi tinggi yang diperlukan untuk menjalankan model paling canggih. Misalnya, model yang lebih kecil mungkin paling cocok untuk mengotomatiskan tugas-tugas dasar bervolume tinggi, sementara model yang lebih besar mungkin menangani pekerjaan yang lebih kompleks. Beberapa pengembang mungkin ingin menggunakan kedua model dalam satu aplikasi.

Olivier Godement, pimpinan produk API OpenAI, menjelaskan dalam sebuah wawancara dengan media mengapa perusahaan gagal meluncurkan model AI "kecil dan halus" lebih awal. Dia mengatakan bahwa ini murni masalah "prioritas" karena OpenAI fokus pada penciptaan Lebih besar dan lebih baik model, seperti GPT-4, memerlukan sumber daya manusia dan komputasi yang signifikan. Seiring berjalannya waktu, OpenAI menyadari bahwa para pengembang semakin bersemangat untuk menggunakan model yang lebih kecil, sehingga perusahaan memutuskan bahwa sekarang adalah waktu yang tepat untuk menginvestasikan sumber daya dalam mengembangkan GPT-4o Mini.

“Misi kami adalah membuat teknologi paling mutakhir dan membangun aplikasi yang paling kuat dan berguna, dan kami tentunya berharap untuk terus membuat model mutakhir dan mendorong kemajuan teknologi,” kata pemimpin produk API OpenAI Olivier Godement dalam sebuah wawancara dengan media. "Tapi kami juga ingin memiliki model kecil terbaik dan saya pikir model ini akan sangat populer."

“Saya pikir GPT-4o Mini benar-benar mewujudkan misi OpenAI untuk menjadikan AI lebih mudah diakses. Jika kita ingin AI memberikan manfaat bagi setiap sudut dunia, setiap industri, dan setiap aplikasi, kita harus membuat AI lebih terjangkau, Direktur produk platform API OpenAI.” kata Godement kepada media.

GPT-4o mini membantu karyawan fokus

Godement mengatakan beberapa pengembang telah menguji model tersebut selama seminggu terakhir.

OpenAI meminta startup fintech Ramp untuk menguji model tersebut, menggunakan GPT-4o Mini untuk membuat alat yang mengekstrak data pengeluaran dari tanda terima. Jadi pengguna dapat mengunggah foto kwitansi mereka dan model akan mengatur datanya. Klien email Superhuman juga menguji GPT-4o Mini dan menggunakannya untuk membuat fitur yang secara otomatis menyarankan balasan email.

Awalnya, GPT-4o mini akan mampu memproses dan menghasilkan teks dan gambar. Setelah versi final selesai, OpenAI mengatakan akan mampu menangani jenis konten lainnya.

OpenAI juga mengatakan bahwa GPT-4o mini adalah model AI pertama perusahaan yang menggunakan "hierarki instruksi" kebijakan keamanan barunya. Tujuan dari pendekatan ini adalah untuk membuat sistem AI memprioritaskan instruksi tertentu - seperti instruksi dari perusahaan - untuk mempersulit orang membuat alat tersebut melakukan sesuatu yang tidak seharusnya dilakukan.

Analisis percaya bahwa model mini GPT-4o adalah bagian dari komitmen OpenAI terhadap "multimodalitas", yaitu menyediakan berbagai media yang dihasilkan AI (seperti teks, gambar, audio, dan video) dalam satu alat: ChatGPT.

Tahun lalu, COO OpenAI Brad Lightcap mengatakan kepada media:

"Dunia ini multimodal. Jika Anda berpikir tentang cara kita sebagai manusia memproses dan berinteraksi dengan dunia, kita melihat sesuatu, mendengar sesuatu, berbicara - dunia bukan sekedar teks. Jadi, bagi kita, yang ada hanyalah teks dan kode sebagai Sebuah modalitas tunggal, sebuah antarmuka tunggal, selalu terasa tidak lengkap karena kekuatan model-model ini dan apa yang dapat mereka lakukan jauh lebih besar.”