berita

OpenAI meluncurkan mode suara lanjutan untuk beberapa pengguna ChatGPT Plus

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

· Fitur audio baru memungkinkan pengguna untuk berbicara dengan ChatGPT dan menerima tanggapan real-time dengan segera, atau menyela saat ChatGPT sedang berbicara. Fitur yang lebih canggih seperti berbagi video dan layar akan diperkenalkan di kemudian hari.

Pada tanggal 31 Juli, OpenAI mengumumkan peluncuran mode suara lanjutan untuk beberapa pengguna ChatGPT Plus dan berencana untuk membukanya untuk semua pengguna ChatGPT Plus pada musim gugur.

OpenAI mendorong pengembangan asisten suara kecerdasan buatan generasi baru. Fitur audio baru akan memungkinkan pengguna untuk berbicara dengan ChatGPT dan menerima tanggapan real-time dengan segera, serta mengganggu ChatGPT saat sedang berbicara. Pola bicara membedakan informasi yang disampaikan dengan intonasi bicara yang berbeda. Kedengarannya lebih natural dan menggunakan suara untuk menyampaikan berbagai emosi.

Mode bicara baru ini didukung oleh model GPT-4o OpenAI, yang menggabungkan kemampuan bicara, teks, dan penglihatan. Untuk mengumpulkan masukan, OpenAI pada awalnya meluncurkan fitur suara premium ke "sekelompok kecil pengguna" ChatGPT Plus, namun OpenAI mengatakan fitur tersebut akan tersedia untuk semua pengguna ChatGPT Plus pada musim gugur ini.

OpenAI menunda peluncuran pengalaman panggilan suara dari akhir Juni hingga Juli, dengan alasan akan memerlukan waktu untuk memenuhi standar rilis. OpenAI mengatakan telah menguji kemampuan bicara GPT-4o dengan lebih dari 100 tim merah eksternal, yang mencakup 45 bahasa. Perusahaan tersebut mengatakan bahwa mereka telah membangun beberapa mekanisme keamanan, seperti untuk melindungi privasi dan mencegah model tersebut digunakan untuk membuat suara palsu. Perusahaan tersebut bekerja dengan aktor suara untuk membuat empat suara preset GPT-4o yang tidak meniru atau menghasilkan suara orang lain . suara dari.

Saat OpenAI pertama kali meluncurkan GPT-4o, OpenAI menghadapi reaksi keras karena menggunakan suara yang disebut "Sky", yang sangat mirip dengan suara aktris Scarlett Johansson. Scarlett Johansson telah mengeluarkan pernyataan yang mengatakan bahwa dia dihubungi oleh OpenAI untuk mengizinkan model tersebut menggunakan suaranya, tetapi dia menolak. OpenAI membantah bahwa itu adalah suara Johnson namun telah menangguhkan penggunaan Sky.

OpenAI juga mengatakan bahwa mereka telah mengadopsi filter untuk mengidentifikasi dan memblokir permintaan untuk menghasilkan musik atau audio lain yang dilindungi hak cipta, dan telah menerapkan mekanisme keamanan yang sama yang digunakan dalam model teks ke GPT-4o untuk mencegah mereka melanggar hukum dan menghasilkan konten berbahaya. “Kami memiliki pagar pembatas untuk memblokir permintaan konten kekerasan atau hak cipta.” Selain itu, fitur-fitur yang lebih canggih seperti berbagi video dan layar akan diluncurkan di kemudian hari.