berita

paket hadiah openai: penyulingan suara dan model real-time semuanya tersedia, menjual produk terbaik, dan menghasilkan uang paling banyak

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

penulis|jessica

hari ini, devday pertama openai pada tahun 2024 diadakan secara sederhana di gateway pavilion di pier 2 di san francisco.

berbeda dengan pengumuman resmi tahun lalu yang penuh gejolak, berita developer day tahun ini hanya muncul satu kali di akun x openai developers dua bulan lalu, sehingga banyak orang yang belum mengetahuinya.

peserta pada dasarnya adalah pelanggan yang diundang dan pengembang lini depan terpilih. lokasinya dirahasiakan hingga saat-saat terakhir, jadwal misteriusnya baru terungkap hingga hari itu, dan tidak ada siaran langsung.

sebelum pertemuan tersebut, sam altman dengan cepat men-tweet:

“beberapa alat baru untuk pengembang diluncurkan hari ini!

dari devday terakhir hingga hari ini: biaya per token dari gpt-4 ke 4o mini telah turun sebesar 98%, jumlah token di sistem kami meningkat sebesar 50 kali lipat, kecerdasan model telah mengalami kemajuan luar biasa, dan terdapat sedikit peningkatan drama dalam prosesnya.

saya menantikan kemajuan dari devday ini ke devday berikutnya. jalan menuju agi kini semakin jelas. "

seperti yang diinformasikan sebelumnya oleh romain huet, direktur pengalaman pengembang perusahaan tentang platform x, devday tahun ini tidak merilis model baru apa pun dan hanya berfokus pada peningkatan api.

dan openai memang mengemas serangkaian api real-time, caching cepat, distilasi model, penyesuaian visual, pengoptimalan taman bermain, serta memperluas cakupan api o1 dan meningkatkan batas kecepatan bagi pengembang di "hari pengembang" yang sesungguhnya ini. pembaruan alat penting.

harga api baru ini tidak sepenuhnya murah. banyak pengembang berkomentar bahwa kombinasi harga dan kemampuan menjadikannya menarik. paket hadiah pengembang yang tulus ini dihadirkan sekaligus, dan openai tetap ingin menghasilkan uang sebanyak-banyaknya dengan menjual produk terbaik.

sumber gambar: @swyx |.x.com

1

api real-time: bangun aplikasi “dia” anda sendiri dalam satu langkah

sebagai fitur yang paling menarik perhatian saat ini, realtime api memungkinkan pengembang memanggil gpt-4o-realtime-preview, model yang mendasari mode suara lanjutan chatgpt, untuk membangun pengalaman percakapan suara-ke-suara yang cepat dan alami dalam aplikasi. mendukung 6 suara preset untuk mencapai interaksi suara latensi rendah.

saat membuat asisten suara di masa lalu, pengembang harus mengandalkan beberapa model untuk menyelesaikan tugas yang berbeda: pertama menggunakan model pengenalan suara seperti whisper untuk mentranskripsikan audio menjadi teks, kemudian meneruskan teks ke model bahasa untuk inferensi, dan terakhir menghasilkan ucapan melalui keluaran model text-to-speech. tidak hanya prosesnya yang rumit, namun emosi dan aksen mudah hilang, dan terdapat penundaan yang signifikan.

api real-time hanya memerlukan satu panggilan untuk menyelesaikan seluruh proses percakapan. secara dramatis meningkatkan kealamian dan daya tanggap percakapan dengan streaming input dan output audio. ia menggunakan koneksi websocket yang persisten untuk bertukar pesan dengan gpt-4o dan mendukung panggilan fungsi, yang dapat dengan cepat merespons permintaan, melakukan operasi seperti melakukan pemesanan atau menyediakan layanan yang dipersonalisasi. ini juga dapat secara otomatis menangani gangguan seperti mode suara tingkat lanjut untuk memastikan pengalaman pengguna yang lebih lancar. sangat cocok untuk dukungan pelanggan, pembelajaran bahasa, dan skenario lain yang memerlukan interaktivitas tinggi.

di tempat kejadian, staf mendemonstrasikan asisten suara yang dibangun melalui api real-time, membantu lebih dari 100 pengembang di antara penonton untuk "menelepon dan memesan 400 stroberi untuk dikirim".