berita

perusahaan kloning suara ai menggunakan teknologi rekaman three sheep untuk terlibat dalam "pemasaran bunuh diri"?

2024-09-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

insiden tiga domba cukup membuat heboh. tak disangka, korbannya ternyata adalah ai.

kemarin malam, polisi hefei mengeluarkan pemberitahuan tentang "rekaman insiden lu wenqing, pendiri three sheep group", mengatakan bahwa audio yang beredar luas itu dihasilkan oleh ai dan tersangka telah dikenakan tindakan pemaksaan pidana sesuai dengan hukum.

sebagai penutup, pemberitahuan ini tidak hanya memberikan posisi resmi, tetapi juga menampar "orang pertama di ai domestik" yang dikabarkan di internet beberapa hari yang lalu " pada saat itu adalah "teknologi kloning ai voice belum semulus sutra.”

namun yang lebih mengejutkan adalah sebuah perusahaan ai langsung "mengeluarkan pernyataan" kemarin, mengatakan bahwa konten audio tersebut diproduksi oleh tersangka melalui model besar sulih suara ai yang dikembangkan sendiri.

netizen pun kaget. setelah semua ini, mereka tetap tak lupa beriklan. kami mengikuti perusahaan yang disebutkan dalam pernyataan tersebut untuk menemukan sumber pernyataan tersebut dan menemukan konten yang relevan di weibo dengan nama yang sama. namun, akun tersebut belum disertifikasi secara resmi, jadi kami tidak dapat membuat kesimpulan akhir.

namun, diskusi seputar pernyataan ini masih terus meningkat. netizen menyebutnya sebagai "pemasaran bunuh diri". beberapa bayi yang penasaran bertanya apakah produk kloning suara dari perusahaan ai itu benar-benar ampuh .”

coba saja... atas dasar menyembunyikan nama perusahaan dan produk terkait, kami melakukan beberapa pengujian aktual pada produk. perlu dicatat bahwa pengujian berikut hanya untuk tujuan sains populer alatnya terletak pada cara pengguna menggunakannya, kami tidak akan pernah mendukung siapa pun yang menggunakan ai untuk menguji batasan hukum.

pada saat yang sama, kami juga telah berkonsultasi dengan pengacara terkait untuk mengetahui apakah ada preseden untuk kasus pelanggaran suara kloning ai semacam ini, dan masalah hukum apa yang perlu diperhatikan oleh pembuat dan platform saat menggunakan atau mempromosikan teknologi baru, untuk referensi anda .

ai mengkloning suara seseorang,

sampel suara hanya beberapa detik

memasukkan teks, menetapkan peran, mengelompokkan teks kalimat demi kalimat secara otomatis, dan menghasilkannya dengan satu klik.

setelah memasuki halaman produk, kami melakukan langkah-langkah di atas dan hanya butuh 1 menit untuk membuat jiang wen membacakan baris-baris liu zi dalam "let the bullets fly".

ayah, aku sudah mencari semuanya, tapi tidak ada uang, tidak ada barang, dan tidak ada perak. hanya ada dua orang yang masih hidup, haruskah kita membunuh mereka atau tidak?

dengan irama dan nada ini, saya tidak tahu apakah menurut saya peran liu zi dimainkan oleh jiang wen. faktanya, liu zi berperan sebagai putra dalam film tersebut, dan jiang wen berperan sebagai ayah liu zi.

audio ini dihasilkan menggunakan karakter suara "jiang wen" dalam produk.

saat ini, terdapat banyak karakter pengisi suara dalam produk ini, termasuk selebriti internet terkenal seperti "sun xiaochuan" dan "ding zhen", serta superstar di kalangan budaya dan olahraga seperti "kobe bryant" dan "jay chou" .

semua karakter suara ini diunggah oleh pengguna komunitas. mengklik karakter resmi di platform akan menampilkan "segera hadir, jadi pantau terus."

selain menggunakan karakter suara yang diunggah oleh pengguna komunitas, kloning suara selebritis di platform tersebut juga mudah dilakukan.

di sini kami telah mengunggah rekaman wawancara nyata musk, di mana ai musk "secara pribadi" berkata "kamu angsa, dia katak! (katak ingin makan daging angsa)", sebuah ungkapan chinglish yang sangat populer di luar negeri.

platform ini mengharuskan sampel suara hanya perlu berdurasi lebih dari 2 detik, dan kualitas sampel lebih penting daripada panjangnya, jadi saat melakukan kloning suara, langkah yang paling memakan waktu adalah menemukan rekaman musk yang jelas.

menurut pihak berwenang, rekaman ini akan digunakan untuk menentukan penampilan vokal default karakter, termasuk suara, emosi, kecepatan berbicara, intonasi, ritme, dll. jika anda menginginkan gaya suara berbeda untuk karakter yang sama, anda juga dapat menambahkan contoh gaya berbeda dari karakter suara tersebut.

saat ini, kami hanya mengunggah sepotong audio dalam versi ini, dan kami masih menggunakan mode kloning cepat platform daripada mode kloning profesional berbayar (secara resmi dikatakan bahwa tingkat pemulihan timbre dan emosional mode tersebut mencapai 99,9%). performa kalimat pendek lebih baik. sudah 6 hingga 7 poin mirip dengan suara musk sendiri.

dari segi bentuk konten, ai generatif telah "menyerang" konten teks, audio, video, dan bahkan 3d. diantaranya, audio dapat dikatakan sebagai salah satu jalur yang lebih matang untuk penerapan teknologi.

kloning suara ai hanyalah subdivisi dari pembuatan audio ai. aplikasi lain mencakup musik yang dihasilkan ai dan efek suara yang dihasilkan ai.

jauh sebelum munculnya ai generatif, ai kloning suara sebenarnya sudah ada. saat itu, saya ingin mengkloning suara, yang didasarkan pada teknologi tts (text-to-speech, text-to-speech) tradisional. untuk itu diperlukan pembuatan perpustakaan suara ai dan pengumpulan sejumlah besar spesimen suara manusia untuk membuat database. nanti, itu harus disimulasikan melalui debugging manual.

atau berdasarkan proyek sumber terbuka seperti bert vits, teknologi sintesis ucapan pembelajaran mendalam terbaru dapat digunakan untuk secara langsung mengonversi teks menjadi ucapan guna memulihkan timbre, tetapi peralatan dan persyaratan teknisnya relatif tinggi.

sumber gambar: tutorial gpt-sovits dari master up stasiun b “henji weizi”

saat ini, di bawah gelombang aigc, alat ai yang "digulung" hanya memerlukan sampel suara 10 detik atau kurang untuk mereproduksi suara secara akurat.

sebelumnya, kami memperkenalkan prinsip teknologi kloning suara ai dalam siaran langsung, yang umumnya dibagi menjadi beberapa langkah seperti pengumpulan suara, ekstraksi fitur, pelatihan model, dan sintesis ucapan termasuk fish audio, cosyvoice, elevenlabs, cutting, dll ., memungkinkan ambang batas untuk operasi kloning suara menjadi lebih rendah. (untuk tayangan ulang siaran langsung terkait, anda dapat mengikuti akun video "daftar baru ai" atau memindai kode qr pada gambar di bawah untuk melihatnya)

oleh karena itu, secara teknis “gerbang pencatatan tiga domba” layak diproduksi oleh ai. terutama di tangan "orang-orang yang berhati-hati", selain pembuatan ai, debugging manual, pasca-editing, dan metode lainnya juga dapat digunakan untuk mendapatkan efek palsu dan nyata.

belum lagi banyaknya kebisingan lingkungan yang kompleks dan pengaturan “keadaan mabuk” pembicara dalam rekaman yang beredar, yang sangat meningkatkan kesulitan dalam mengidentifikasi keaslian rekaman tersebut. tak heran jika banyak netizen yang berspekulasi bahwa ai hanya berperan sebagai "pekerja sementara" dan mampu menolak segalanya.

faktanya, hal ini juga mencerminkan bahwa dengan pesatnya perkembangan teknologi ai, terdapat kesenjangan informasi antara kita sebagai masyarakat awam dan praktisi garis depan mengenai apa yang dapat dilakukan ai dan sejauh mana ai dapat melakukannya.

selain itu, insiden "gerbang perekaman tiga domba" juga mengungkap masalah hukum seperti kurangnya pengawasan platform dan penggunaan yang tidak semestinya oleh pembuat konten.

diskusi tentang pelanggaran suara ai pada platform konten

faktanya, ini bukan kasus pertama pelanggaran audio melalui pemalsuan ai.

pada bulan april tahun ini, pengadilan internet beijing menyidangkan “kasus pelanggaran suara ai” yang pertama di negara tersebut.

penggugat yin moumou adalah artis dubbing dan telah merekam banyak karya audio. dia secara tidak sengaja menemukan bahwa suaranya telah diubah menjadi ai dan dijual di aplikasi bernama "magic sound workshop". pengadilan pada akhirnya memutuskan bahwa penggunaan suara penggugat oleh tergugat tanpa izin penggugat merupakan pelanggaran, dan memberikan kompensasi kepada penggugat sebesar 250.000 yuan untuk berbagai kerugian.

menurut pasal 1023 kuh perdata republik rakyat tiongkok, suara orang perseorangan dilindungi undang-undang, dan cara perlindungannya serupa dengan hak potret. artinya, jika suara yang dihasilkan oleh ai dapat diidentifikasi dan dapat dikaitkan oleh publik dengan orang tertentu, maka penggunaan suara tersebut tanpa izin dari orang tersebut dapat dianggap sebagai pelanggaran.

li yunkai, penggugat dalam kasus hak cipta lukisan ai pertama di tiongkok dan mitra di firma hukum tianyuan beijing, mengatakan kepada “daftar baru ai”:

saat ini, undang-undang kita tidak perlu direvisi. karena teknologi ai masih dalam proses pengembangan, teknologi baru mungkin akan diulang dalam dua tahun. jika undang-undang kita akan disahkan untuk hal ini, undang-undang tersebut akan memakan waktu sekitar 3 hingga 5 tahun hukum sebenarnya itu menjadi selembar kertas.

undang-undang kita saat ini telah memberikan kerangka dasar. yang perlu disesuaikan adalah bagaimana menafsirkan undang-undang tersebut dan bagaimana membentuk sikap peradilan yang relevan melalui kasus-kasus yang khas. hanya ketika teknologinya sudah benar-benar matang barulah kita bisa mendorong undang-undang untuk memperjelas aturan-aturan yang telah ditetapkan dalam praktik peradilan.

selain kasus pelanggaran dalam praktik peradilan, pelanggaran suara ai pada platform konten juga lebih luas dan rahasia.

saat ini, kemunculan alat ai yang tiada henti telah menurunkan ambang batas penciptaan, dan aigc telah menjadi metode produksi konten yang populer setelah pgc dan ugc.

sangat umum untuk menggunakan teknologi kloning suara ai untuk membuat ulang musik populer, membiarkan karakter anime dan game menampilkan cover ai, atau membiarkan selebriti yang sudah meninggal berbicara, dll. di platform konten dalam dan luar negeri.

dibandingkan dengan kreasi penggemar yang klise, penggunaan ai untuk kreasi sekunder adalah konsep yang lebih luas. karya penggemar biasanya terbatas pada kreasi dalam kelompok penggemar, sedangkan kreasi sekunder mungkin berasal dari penggemar teknologi ai biasa, dan dengan berkat teknologi ai, terdapat ruang imajinasi yang lebih besar untuk adaptasi dan inovasi.

karya ai sound generasi kedua dengan kualitas dan kuantitas yang tinggi tidak hanya dapat menjangkau basis penggemar dengan memanfaatkan popularitas ip asli atau selebritis itu sendiri, tetapi juga berpotensi menembus lingkaran tersebut.

secara umum, mengingat kuantitas dan pengaruh konten generasi kedua saat ini serta ekologi platform konten, perlindungan hak cipta terutama bergantung pada kesadaran pencipta, pemilik hak cipta, dan pengawasan publik.

jika karya asli dan pemegang hak cipta tidak mengajukan klaim terhadap karya generasi kedua, secara umum tidak akan ada masalah hukum.

sebagian besar platform konten juga memilih untuk mengizinkan konten ini berkembang secara bebas sambil menerapkan batasan tertentu. lagi pula, pengawasan hak cipta yang terlalu ketat pasti akan menyurutkan antusiasme pembuat konten dan menghambat penyebaran konten, yang juga akan menjadi kerugian besar bagi platform konten.

tentu saja, selain mendorong inovasi konten, platform konten juga perlu meningkatkan mekanisme peninjauan, pelabelan, dan pengawasan yang sesuai.

pada tanggal 14 september 2024, administrasi ruang siber tiongkok merilis "langkah-langkah untuk pelabelan konten sintetis yang dihasilkan oleh kecerdasan buatan (draf untuk komentar)", yang selanjutnya memperjelas persyaratan khusus untuk menambahkan label konten aigc.

mereka yang menyediakan layanan pengeditan yang menghasilkan ucapan seperti suara manusia yang disintesis atau suara tiruan atau mengubah karakteristik identitas pribadi secara signifikan harus menambahkan perintah suara atau perintah ritme audio dan tanda-tanda lain di awal, akhir atau tengah audio pada posisi yang sesuai, atau menambahkannya ke antarmuka adegan interaktif.

selain persoalan kepemilikan hak cipta yang ambigu dan sulit ditentukan, kontroversi lain datang dari konflik etika dan moral yang realistis.

misalnya, menggunakan ai untuk "menghidupkan kembali" suara dan senyuman selebritas yang telah meninggal, dengan kedok kehangatan dan kenangan, juga dianggap sebagai konsumsi yang tidak sopan dan berlebihan terhadap almarhum.

baik itu karya suara ai generasi kedua dari platform konten atau insiden kriminal sulih suara ai oleh three sheep, masih banyak masalah hak cipta, etika, privasi data, ilegal dan kriminal seputar teknologi kloning suara ai yang perlu ditangani lebih lanjut. dibahas.

penulis |. tsukiyama tachibana ishize

penyunting |.zhang jie