berita

AI menyerang industri sulih suara! 5.000 pengisi suara Australia kehilangan pekerjaan karena klon AI menggantikan karakter asli

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Laporan Kebijaksanaan Baru

Editor: Er Qiao Yang

[Pengantar Kebijaksanaan Baru] Ketika gelombang perkembangan AI melanda, peran sejumlah besar media dan stasiun radio mulai digantikan oleh tiruan kecerdasan buatan yang murah. Australian Voice Actors Association bahkan menyatakan bahwa diperkirakan ada 5.000 pengisi suara yang berisiko kehilangan pekerjaan.

Baru-baru ini di berbagai platform video, AI menjadi kata sandi lalu lintas baru di jalur inovasi kedua.


Dari penyanyi, karakter game seluler, hingga karakter anime, sulih suara AI ada di mana-mana di Internet.

Penyanyi dapat berkolaborasi melintasi ruang dan waktu, dan karakter anime favorit Anda juga dapat bernyanyi untuk Anda. Orang-orang di area komentar berkata: Dua koki sangat gembira! Istana! Ibu Xiaoba benar-benar akan memujimu kali ini!


Pesatnya perkembangan teknologi AI terlihat jelas bagi semua orang, dan teknologi penggunaan AI untuk menghasilkan suara, gambar, dan video secara cerdas memiliki tren yang tidak dapat dihentikan.

Penggunaan sulih suara AI dalam bidang produksi video tidak terbatas pada kreasi sekunder saja. Dengan munculnya sejumlah besar produk AI generatif, sulih suara AI sudah dapat memuaskan kreasi media mandiri yang sederhana.


Dalam software produksi video, terdapat sebanyak 70 atau 80 jenis AI dubbing dan pembacaan efek suara.

Pekerjaan dubbing yang membutuhkan kualitas suara lebih rendah dan waktu lebih singkat secara bertahap digantikan oleh dubbing AI.

Dalam beberapa tahun terakhir, AI hampir menjadi tren umum untuk menumbangkan industri tradisional. Kepala staf Anthropic mengakui bahwa karirnya mungkin hanya tersisa tiga tahun, dan ChatGPT menggantikan tim editorialnya yang beranggotakan 60 orang.

Banyak tugas yang awalnya mengandalkan tenaga manusia secara bertahap digantikan oleh AI, dan kini industri sulih suara juga akan bergabung dalam hal ini.

Menghadapi gejolak baru dalam industri ini, orang-orang bertanya-tanya, ke mana para aktor sulih suara harus pergi?

Pengisi suara "Rumah yang Tidak Pernah Runtuh"?

ElevenLabs, sebuah perusahaan startup suara, menggunakan AI untuk men-dubbing video klasik Sora setelah Sora diluncurkan pada bulan Februari tahun ini.

Pada tanggal 25 Juni, ElevenLabs meluncurkan aplikasi membaca AI tanpa henti.


Memperkenalkan Aplikasi Pembaca ElevenLabs. Dengarkan artikel, PDF, ePub, atau teks apa pun di mana pun, kapan pun dengan suara AI kualitas tertinggi.

Selain itu, setelah dievaluasi, Aplikasi ini juga mendapat rating yang sangat tinggi dari pengguna.


Dengarkan apa yang dikatakan beberapa penguji kami: Secara keseluruhan, ini sempurna. Pengucapan, intonasi, aksen, dan kefasihan semuanya sangat baik. Kami merasa senang menggunakan layanan pembaca seluler Anda selama beberapa minggu terakhir dan itu luar biasa. Ini bagus untuk meninjau dokumen dan draf, mengetahui kemajuan, dan suara-suara berbeda yang ditambahkan baru-baru ini menjadikannya pengalaman yang luar biasa. Mampu mempertahankan tone dan tone di sejumlah besar artikel membuktikan betapa hebatnya aplikasi ini dan membedakannya dari produk serupa yang ada di pasaran.

Dan ketika beberapa orang mempertanyakan apakah sulih suara AI benar-benar dapat menyampaikan emosi, bagian komentar juga mengutip produk Elevenlabs dan GPT-4o.


Menurut saya, akan selalu ada kebutuhan akan pengisi suara manusia, terutama yang membutuhkan emosi dan nuansa nyata. Sulih suara AI sangat bagus untuk penyiar atau narasi, tapi menurut saya sulih suara tersebut tidak benar-benar dapat menangkap jiwa suara manusia.


Saya telah mendengar contoh karya Elevenlabs dan itu luar biasa, dan kemampuan suara GPT-4o mendatang bahkan lebih baik lagi.

Sulih suara AI sering kali menggunakan teknologi yang disebut Deepfake Voice, yang dapat mereplikasi suara manusia dengan sangat akurat dalam nada dan kesamaan.

Teknologi ini memberikan banyak kemudahan pada pekerjaan sulih suara. Di satu sisi, teknologi ini mengurangi biaya, dan di sisi lain, ketika aktor sulih suara tidak dapat menyelesaikan pekerjaan, suara simulasi dapat mengambil alih pekerjaan tersebut.

Dengan cara ini, CV di kehidupan nyata dengan biaya penampilan yang tinggi dan risiko runtuhnya rumah memang menjadi peringatan: AI itu murah dan berkualitas tinggi, bagaimana dengan kita?

Krisis karir pengisi suara

Para pengisi suara mengatakan pekerjaan mereka akan sepenuhnya digantikan oleh AI, dan peran sulih suara komersial dan radio sudah mulai digantikan oleh kloningan GenAI yang murah.

Aktor biasa yang bekerja di bidang iklan, buku audio, dan video game khawatir bahwa suara mereka berisiko dikloning atau kehilangan pekerjaan sepenuhnya karena munculnya kloning suara dengan kecerdasan buatan.

Cooper Mortlock adalah pengisi suara Australia yang mulai mengisi suara pada awal pandemi Covid-19.


Cooper Mortlock mengatakan sebuah proyek animasi yang dia ikuti mengkloning suaranya dan menggunakannya tanpa persetujuan setelah pekerjaan dihentikan.

Dia mengatakan hal ini akan melemahkan karya para pengisi suara baru yang mencoba memantapkan diri mereka di industri sulih suara.

Cooper Mortlock berkata, "Ini tidak hanya membatasi peluang bagi para seniman itu sendiri, tetapi juga membatasi ruang lingkup kreatif proyek."

Karena AI yang beroperasi sesuai prosedur tetap tidak memiliki kemungkinan kejutan atau kejutan, kecerdasan buatan menggunakan hal-hal yang sudah ada dan menggunakannya kembali atas dasar ini, sehingga tidak ada percikan tabrakan yang tidak disengaja dalam proses sulih suara.

Dengan kata lain, penggunaan ucapan AI untuk menghasilkan dialog akan mengurangi kreativitas dibandingkan penggunaan aktor suara manusia untuk dialog bernaskah.

Cooper Mortlock menggunakan metafora yang jelas untuk menggambarkannya, "Ini seluas lautan tetapi dangkal seperti genangan air."

Misalnya, bandingkan beberapa video game terbaru yang sangat menekankan narasi cerita dan karakter, seperti "Cyberpunk 2077", "The Witcher 3", "Baldur's Gate 3"... Semua game ini dibuat dengan sangat indah. Pikirkan baik-baik. "

Hingga saat ini, kloning suara AI sering kali bermasalah dengan aksen non-Amerika. Misalnya, suara orang Australia cenderung memiliki aksen Amerika.

Layanan sulih suara baru kini menawarkan berbagai macam aksen berbeda untuk warga Australia dari segala usia.

Cooper Mortlock berharap bahwa pernyataan yang “terlambat namun telah tiba” ini merupakan tanda bahwa masyarakat Australia tidak akan menyerah dalam bersuara.

Asosiasi Aktor Suara Australia (AAVA) mengatakan kepada komite parlemen yang menyelidiki kecerdasan buatan bahwa sekitar 5.000 aktor suara lokal berisiko kehilangan pekerjaan mereka.

Kelompok ini mencatat bahwa salah satu jaringan penyiaran nasional secara aktif berinvestasi dalam teknologi untuk menggantikan pengisi suara manusia.

Dalam pengajuannya, organisasi tersebut mengkritik tindakan perusahaan tersebut sebagai “membakar jembatan.”

“Ini adalah langkah mengecewakan dari pemain di industri yang mengandalkan artis sulih suara selama 100 tahun terakhir untuk menghadirkan kualitas, kredibilitas, dan kemanusiaan pada media mereka.”

Simon Kennedy, presiden asosiasi tersebut, mengatakan kepada Guardian Australia bahwa kemunculan kecerdasan buatan dan dampaknya terhadap industri suara adalah bagian dari katalisator pembentukan organisasi tersebut.

Namun dia mengatakan mereka “tidak menentang teknologi, dan kami tentu saja tidak menentang kecerdasan buatan.” Kelompok ini hanya menginginkan aturan yang adil seputar penggunaan teknologi dan perlindungan suara masyarakat agar tidak disalahgunakan oleh kecerdasan buatan.

Bagi pengisi suara, buku audio pertama-tama akan berfungsi sebagai pertanda berbahaya bahwa pekerjaan mereka akan digantikan.

Simon Kennedy berkata, "Buku audio adalah bidang yang mutakhir karena banyaknya volume materi, dan perusahaan yang memproduksi buku audio percaya bahwa penggunaan sulih suara AI dapat menghemat biaya."

Namun coba pikirkan dari sudut pandang lain, jika suara pembaca buku adalah kecerdasan buatan, apakah ekspresi konten dan emosi akan terpengaruh?

Simon Kennedy menambahkan, "Jika ini adalah suara kecerdasan buatan, saya rasa orang-orang akan menyadari bahwa orang-orang terlalu malas untuk mendengarkan buku audio."

Orang-orang hanya akan berkata, "Saya tidak punya perasaan kalau mesin bercerita."

Simon Kennedy mengatakan bahwa bagi organisasi yang ingin mengurangi pekerjaan sulih suara manual, penggunaan sulih suara AI dalam pekerjaan perusahaan dan materi pendidikan hanyalah sebuah cabang dari pohon besar, namun area yang lebih luas seperti iklan sulih suara AI masih sulit untuk digantikan.

“Yang dibutuhkan pengiklan besar adalah kualitas tinggi, dan sulih suara AI tidak akan dipertimbangkan oleh pengiklan untuk beberapa waktu.”

Tahun lalu, Guardian Australia melaporkan bahwa pengembang perangkat lunak Australia, Replica Studios, melisensikan 120 suara aktor untuk pengembangan video game dan akan membayar aktor ketika suara kloning mereka digunakan dalam video game.

Pada bulan Januari, perusahaan tersebut menandatangani perjanjian dengan Screen Actors Guild yang menyatakan bahwa ini adalah penggunaan suara AI yang etis dan semua konten dilisensikan.

Terkait pengisi suara yang menjual lisensi suaranya, Simon Kennedy mengatakan bahwa pengisi suara yang menjual lisensi suaranya tidak mempertimbangkan rencana jangka panjangnya.

"Saya rasa mereka tidak terlalu memikirkan konsekuensinya, bahwa suara tersebut kini ada di pasar sebagai tiruan digital dari diri Anda sendiri, yang pada dasarnya menghilangkan pekerjaan yang bisa Anda dapatkan sendiri."

Perlindungan Hak dan Kepentingan Pengisi Suara

Kemudian, substitusi kembali ke substitusi, dan apakah substitusi tersebut berada dalam jangkauan hukum juga merupakan persoalan yang patut mendapat perhatian.

Pada tanggal 16 Mei, pengisi suara Amerika Paul Lehrman dan pengisi suara lainnya Linnea Sage mengajukan gugatan terhadap startup kecerdasan buatan Lovo di pengadilan federal New York, menuduh perusahaan tersebut menggunakan AI untuk menyalin dan menggunakan suara mereka secara ilegal.


dakwaan kasus

Pada tahun 2020, Lehrman menerima pekerjaan menyediakan satu set sampel pidato.

Beberapa tahun kemudian, dia terdengar menceritakan suaranya sendiri di video YouTube dan podcast, meskipun dia tidak pernah meminjamkan suaranya ke video tersebut.

Mereka menuduh Lovo menjual versi AI dari suara mereka tanpa izin setelah menipu mereka agar memberikan sampel suara. Kedua aktor tersebut juga berusaha menyatukan orang-orang yang suaranya telah dicuri untuk lebih lanjut melancarkan gugatan class action.

Dengan kata lain, otorisasi rekaman suara tidak berarti otorisasi atas suara yang dilengkapi AI juga dapat dianggap sebagai pelanggaran.

Pada May Day, pengisi suara terkenal Xia Lei memposting ulang di Weibo, menyerukan penggunaan teknologi "sound watermarking" untuk melindungi hak dan kepentingan sah dari pengisi suara.


Xia Lei, pengisi suara terkenal, karya perwakilannya termasuk Mao Mao dalam "Legend of Sword and Fairy 3", Yu Wenzhou dalam "The Master", dan Xu Mo dalam "Love and Producer"

Tidak hanya di Tiongkok, AAVA yang disebutkan di atas juga menyerukan undang-undang yang mengatur penggunaan suara AI, memastikan artis mendapat kompensasi yang adil, dan mengatur cara suara mereka digunakan (jika berlisensi).

Pengisi suara pada dasarnya adalah "penguasa jiwa" karakter dalam film, game, animasi, dan karya lainnya. Mereka menafsirkan dan mengekspresikan kesadaran diri mereka dengan berempati terhadap nasib karakter, dan hasil kerja mereka juga harus dihormati.

Pada saat yang sama, aktor sulih suara menggunakan emosi manusia untuk beresonansi dengan karakter dan berkomunikasi dengan penonton melalui suara mereka. Ini bukan hanya tempat di mana sekadar meniru suara manusia, emosi, dan jeda bahasa dapat sepenuhnya menggantikan manusia.

Referensi:

https://www.theguardian.com/technology/article/2024/jun/30/ai-clones-voice-acting-industry-impact-australia