informasi kontak saya
surat[email protected]
2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
penulis artikel ini: li dan
pada hari selasa, 1 oktober, waktu bagian timur, openai mengadakan konferensi pengembang tahunan devday. konferensi tahun ini tidak mengadakan rilis produk besar apa pun. konferensi ini lebih sederhana dibandingkan konferensi tahun lalu, tetapi openai juga mendistribusikan beberapa "paket hadiah" besar pengembang. ”, melakukan perbaikan pada alat kecerdasan buatan (ai) dan rangkaian api yang ada.
openai devday ini meluncurkan serangkaian alat baru, terutama mencakup empat inovasi utama: prompt caching, vision fine-tuning, realtime api, dan model distillation. ini membawa kabar baik bagi pengembang dalam hal biaya, meningkatkan tingkat pemahaman visual model, dan meningkatkan tingkat pemahaman visual model. meningkatkan fungsi ai suara dan kinerja model kecil.
beberapa komentar mengatakan bahwa fokus devday tahun ini adalah untuk meningkatkan kemampuan para pengembang dan menampilkan kisah-kisah dari kalangan pengembang, yang menunjukkan bahwa seiring persaingan di bidang ai yang semakin ketat, strategi openai pun berubah. alat-alat baru di atas menyoroti fokus strategis openai dalam memperkuat ekosistem pengembangnya dibandingkan bersaing secara langsung dalam aplikasi pengguna akhir.
beberapa media menyebutkan bahwa pada konferensi pers sebelum acara devday, chief product officer openai kevin weil berbicara tentang kepergian chief technology officer openai mira murati dan chief research officer bob mcgrew baru-baru ini, dengan mengatakan bahwa kepergian mereka tidak akan mempengaruhi perkembangan perusahaan, " kami tidak melakukannya. ini akan melambat.”
caching cepat dapat mengurangi biaya token masukan hingga 50%
penyimpanan kata cepat dianggap sebagai pembaruan paling penting yang dirilis pada devday ini. fitur ini dirancang untuk mengurangi biaya pengembang dan mengurangi latensi.
sistem cache kata cepat yang diperkenalkan oleh openai secara otomatis memberikan diskon 50% pada token masukan yang baru diproses oleh model, yang dapat menghasilkan penghematan yang signifikan untuk aplikasi yang sering menggunakan kembali konteks. pengurangan biaya yang drastis ini memberikan peluang besar bagi perusahaan dan startup untuk mengeksplorasi aplikasi baru yang sebelumnya tidak terjangkau karena biaya yang mahal.
olivier godement, manajer produk platform openai, mengatakan bahwa gpt-3 meraih kesuksesan besar dua tahun lalu, dan kini openai telah mengurangi biaya terkait hampir 1.000 kali lipat. dia tidak bisa menyebutkan contoh lain dimana biaya telah dikurangi dengan jumlah yang sama dalam dua tahun.
bagan openai berikut menunjukkan bahwa penyimpanan kata cepat dalam cache dapat secara signifikan mengurangi biaya penerapan model ai. dibandingkan dengan token non-cache pada berbagai model pdb, biaya penyimpanan token masukan dalam cache dapat dikurangi hingga 50%.
vision fine-tuning: garis depan baru ai visual
openai devday mengumumkan bahwa model bahasa besar (llm) terbaru openai, gpt-4o, memperkenalkan penyempurnaan visual. fitur ini memungkinkan pengembang untuk menyesuaikan pemahaman visual model dengan gambar dan teks.
ini adalah pembaruan besar yang dikenal sebagai batas baru ai visual. hal ini dapat memiliki dampak yang luas di berbagai bidang seperti mobil self-driving, pencitraan medis, dan kemampuan pencarian visual.
openai mengatakan grab, meituan + didi versi asia tenggara, telah menggunakan teknologi tersebut untuk meningkatkan layanan petanya. hanya dengan menggunakan 100 contoh, grab meningkatkan akurasi penghitungan jalur sebesar 20% dan lokasi rambu batas kecepatan sebesar 13%.
aplikasi dunia nyata ini menunjukkan kemungkinan penyesuaian visual, menggunakan sejumlah kecil data pelatihan visual, untuk meningkatkan layanan ai secara signifikan di berbagai industri.
api realtime menjembatani kesenjangan ai percakapan
openai devday merilis api real-time, yang saat ini berada dalam tahap beta publik. api real-time secara inheren menyederhanakan proses pembuatan asisten suara dan alat ai percakapan lainnya, sehingga menghilangkan kebutuhan untuk menggabungkan beberapa model untuk transkripsi, inferensi, dan konversi text-to-speech.
produk baru ini memungkinkan pengembang untuk menciptakan pengalaman multi-modal dengan latensi rendah, terutama dalam aplikasi ucapan-ke-ucapan. ini berarti pengembang dapat mulai menambahkan kontrol suara chatgpt ke dalam aplikasi.
untuk menggambarkan potensi api, openai memamerkan versi terbaru dari wanderlust, sebuah aplikasi perencanaan perjalanan yang didemonstrasikan pada konferensi tahun lalu.
dengan bantuan api waktu nyata, pengguna dapat berbicara langsung dengan aplikasi versi baru dan melakukan percakapan alami untuk merencanakan rencana perjalanan mereka. sistem ini bahkan memungkinkan pengguna untuk menyela di tengah kalimat, menirukan percakapan manusia.
perencanaan perjalanan hanyalah salah satu contohnya, api real-time membuka berbagai kemungkinan untuk aplikasi suara di berbagai industri. baik yang berspesialisasi dalam layanan pelanggan, pendidikan, atau alat aksesibilitas untuk penyandang disabilitas, pengembang kini dapat memanfaatkan sumber daya baru untuk menciptakan pengalaman berbasis ai yang lebih intuitif dan responsif.
beberapa aplikasi, termasuk aplikasi pelatihan nutrisi dan kebugaran healthify dan platform pembelajaran bahasa speak, telah memimpin dalam mengintegrasikan api real-time ke dalam produk mereka.
komentar mengatakan api real-time tidak murah, membebankan biaya $0,06 per menit untuk input audio dan $0,24 per menit untuk output audio, namun tetap dapat mewakili proposisi nilai yang signifikan bagi pengembang yang ingin membuat aplikasi berbasis suara.
distilasi model memungkinkan model kecil memiliki fungsi model mutakhir
distilasi model dianggap sebagai alat baru openai yang paling transformatif saat ini. alur kerja terintegrasi ini memungkinkan pengembang untuk menyempurnakan model universitas yang relatif kecil dan hemat biaya dengan menggunakan keluaran model mutakhir seperti gpt o1-preview dan gpt-4o, sehingga meningkatkan model yang lebih efisien seperti gpt-4o mini pertunjukan.
pendekatan ini memungkinkan perusahaan kecil untuk memanfaatkan kemampuan serupa dengan model-model mutakhir tanpa mengeluarkan biaya komputasi untuk menggunakan model-model tersebut. hal ini membantu menjembatani kesenjangan yang telah lama dimiliki industri ai antara sistem mutakhir dan intensif sumber daya dengan sistem yang lebih mudah diakses namun kurang bertenaga.
misalnya, sebuah startup kecil yang bergerak di bidang teknologi medis ingin mengembangkan alat diagnostik berbasis ai untuk klinik di pedesaan. dengan menggunakan distilasi model, perusahaan dapat melatih model ringkas yang menangkap sebagian besar kekuatan diagnostik model yang lebih besar dan hanya perlu dijalankan pada laptop atau tablet standar.
oleh karena itu, penyulingan model dapat memungkinkan lingkungan dengan sumber daya terbatas untuk menikmati fungsi ai yang kompleks, sehingga berpotensi meningkatkan tingkat layanan medis di wilayah yang kurang terlayani.