berita

openai sepenuhnya merilis asisten suara chatgpt mirip manusia, yang dapat berbicara dalam 50 bahasa termasuk bahasa mandarin

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

penulis artikel ini: li dan

sumber: ai keras

empat bulan setelah openai pertama kali dirilis ke publik, fitur asisten suara kecerdasan buatan (ai) canggih yang mirip manusia dari chatgpt akhirnya tersedia untuk pengguna berbayar.

pada hari selasa, 24 september waktu bagian timur, openai mengumumkan bahwa semua pengguna yang membayar untuk berlangganan openai chatgpt plus dan paket tim akan dapat menggunakan mode suara lanjutan chatgpt yang baru. suara tingkat lanjut. fitur ini akan diluncurkan secara bertahap di masa mendatang beberapa hari dan pertama kali akan tersedia di pasar as secara online. minggu depan, fitur tersebut akan tersedia untuk pelanggan paket openai edu dan enterprise.

artinya, minggu ini, pengguna individu chatgpt versi plus dan pengguna tim bisnis kecil versi teams dapat mengaktifkan fitur suara baru hanya dengan berbicara, tanpa harus memasukkan kata-kata cepat secara manual dan melakukan percakapan gpt. saat mengakses mode suara lanjutan di aplikasi, pengguna dapat mengetahui bahwa mereka telah memasuki asisten suara lanjutan melalui jendela pop-up, dan pengguna akan menerima pemberitahuan dari aplikasi.

openai telah memberikan dua fungsi chatgpt versi suara baru, satu adalah fungsi menyimpan "instruksi khusus" untuk asisten suara, dan yang lainnya adalah fungsi "memori" untuk mengingat perilaku apa yang diinginkan pengguna untuk dilakukan oleh asisten suara, serupa seperti yang diberikan openai kepada chatgpt pada bulan april tahun ini. pengguna dapat memanfaatkan fitur-fitur ini untuk memastikan pola suara dipersonalisasi, memungkinkan asisten ai merespons berdasarkan preferensi pengguna untuk semua percakapan.

openai meluncurkan lima suara baru dengan gaya berbeda pada hari selasa, bernama arbor, maple, sol, spruce dan vale, ditambah empat suara breeze, juniper, cove, dan ember yang sebelumnya diluncurkan dalam mode suara versi lama, suara opsional mencapai sembilan jenis. openai juga meningkatkan kecepatan, kelancaran, dan aksen percakapan dalam beberapa bahasa asing.

openai memperkenalkan bahwa asisten suara tingkat lanjut dapat mengucapkan "maaf, saya terlambat" dalam 50 bahasa, dan melampirkan video ke postingan media sosial untuk menunjukkan bahwa pengguna dapat meminta asisten suara untuk berekspresi kepada nenek karena dia telah menunggu. waktu yang lama. minta maaf. video tersebut menunjukkan bahwa asisten ai terlebih dahulu merangkum apa yang ingin diungkapkan pengguna sesuai kebutuhan dan mengatakannya dalam bahasa inggris. kemudian, setelah pengguna meminta nenek ai untuk hanya berbicara bahasa mandarin, asisten ai kembali mengucapkannya bahasa mandarin standar.

fitur suara baru tersedia untuk model ai openai gpt-4o dan bukan untuk model pratinjau o1 yang baru dirilis.

peluncuran fungsi suara baru sudah lama tertunda. wall street news pernah menyebutkan bahwa pada bulan mei tahun ini, openai mendemonstrasikan mode suara mode suara saat meluncurkan model andalan barunya gpt-4o. suara chatgpt yang didukung oleh gpt-4o pada saat itu terdengar seperti suara wanita dewasa amerika dan dapat merespons permintaan secara instan. ketika mendengar direktur penelitian openai dari demo tersebut, mark chen, menghembuskan napas berlebihan, hal itu sepertinya meningkatkan kegugupannya, dan kemudian dia berkata, "mark, kamu bukan penyedot debu," menyuruh chen untuk rileks dan bernapas.

openai awalnya berencana untuk meluncurkan mode suara ke sekelompok kecil pengguna paket plus pada akhir bulan juni, namun mengumumkan pada bulan juni bahwa peluncurannya akan ditunda selama satu bulan untuk memastikan bahwa fitur tersebut dapat menangani permintaan dari jutaan pengguna dengan aman dan efektif. . pada saat itu, openai mengatakan pihaknya berencana membuat fitur tersebut dapat diakses oleh semua pengguna plus pada musim gugur ini, dengan jangka waktu pastinya bergantung pada pemenuhan standar internal yang tinggi untuk keamanan dan keandalan.

pada akhir juli, openai meluncurkan chatgpt dalam mode suara lanjutan untuk sejumlah pengguna plus berbayar, dengan mengatakan bahwa mode suara tidak dapat meniru cara orang lain berbicara, dan menambahkan filter baru untuk memastikan bahwa perangkat lunak dapat menemukan dan menolak musik tertentu yang dihasilkan. atau bentuk lainnya. namun, mode suara baru tidak memiliki banyak fitur yang ditunjukkan oleh openai pada bulan mei, seperti kemampuan computer vision. fitur ini memungkinkan gpt memberikan feedback suara pada gerakan tarian pengguna hanya dengan menggunakan kamera smartphone.