bisakah rekaman ai tuan lu dari three sheeps dibuat? jawaban saya adalah: tentu saja

2024-09-27

pagi-pagi sekali, sejumlah n orang mengirimi saya gambar, mengatakan bahwa polisi telah melaporkannya, dan bertanya kepada saya bagaimana cara mengetahui apakah rekaman tiga domba itu ai.

beberapa teman bercerita kepada saya bahwa ada orang yang mengaku sebagai orang ai nomor satu di china, sebelumnya dia bersumpah bahwa rekaman ini tidak bisa dibuat oleh ai dan ai tidak bisa memproduksinya. jadi, mungkinkah ada teori konspirasi di balik laporan ini?

saya hampir muncrat. siapa ai pertama di china? reaksi pertama saya adalah para akademisi juga berhenti berpartisipasi dalam hal-hal membosankan seperti itu?

lalu aku mencarinya...oh...lupakan saja.

saya rasa perlu bagi saya untuk mempopulerkan beberapa ilmu pengetahuan, yaitu apakah ai dapat mencapai tingkat perekaman sanyanglu?

saya bisa memberi anda jawaban yang jelas: ya.

pertama, mari kita bahas secara singkat tentang latar belakangnya.

ketiga domba dan simba sedang berselingkuh. mereka hanya saling berkelahi, bolak-balik, dan begitu meriah.

kemudian, ketika kekacauan mencapai puncaknya, rekaman ledakan lu wenqing, ketua three sheep, menjadi viral di internet.

itu saja. saya membuat beberapa pemotongan, dan saya juga membungkam beberapa bagian yang tidak senonoh.

kontennya eksplosif dan mengejutkan, dengan kredibilitas tinggi dan konten yang mengejutkan. ini melibatkan perebutan kekuasaan, kecurangan, dll. singkatnya, lu mengungkapkan bahwa dia memiliki hubungan yang tidak pantas dengan semua pembawa acara wanita three sheep. dia juga menyebut nama zhang yiming dan meremehkannya. . .

mungkin itulah yang terjadi, dan kemudian three sheep melaporkannya, mengatakan bahwa rekaman tersebut disintesis oleh ai.

ada banyak pertengkaran di internet. pemahaman terbesar kebanyakan orang adalah bahwa ai tidak dapat menghasilkan rekaman sebesar ini. karena "orang pertama di ai dalam negeri" yang mengatakannya.

rekaman ini terdengar sangat nyata bukan? ada emosi, dialek, dan suara, jadi sebenarnya ada dua pertanyaan. apakah rekaman ini dibuat oleh ai? dan, bisakah ai mencapai tingkat perekaman ini?

pertanyaan pertama telah terjawab hari ini. saya akan selalu percaya tanpa syarat pada keamanan publik kami. saya juga percaya bahwa laporan yang mereka keluarkan adalah fakta. jadi jawaban dari pertanyaan pertama cukup jelas, itulah yang dilakukan ai.

jadi pertanyaan kedua, yang paling penting, adalah apakah ai dapat mencapai tingkat perekaman ini.

jawaban saya tentu saja.

pertama-tama, saya perlu mempopulerkan beberapa ilmu pengetahuan di sini. ai adalah kategori yang luas, dan ada banyak jalur dalam subdivisinya.

ada model bahasa besar (gpt, claude, doubao, dll.), gambar ai (mj, sd, flux, dll.), audio ai (11labs, svc, gpt-sovtis, suno, dll.), video ai (runway , keling, doubao, pixverse, dll.), dan ai 3d (tripoai, meshy, dll.).

dalam audio ai, dibagi menjadi musik yang dihasilkan ai, efek suara yang dihasilkan ai, dan kloning suara.

rekaman ini milik jalur kloning suara.

jadi jangan bilang kalau ai bisa melakukan ini, itu lebih kuat dari openai atau chatgpt. mereka tidak berada di jalur yang sama, jadi tidak ada bandingannya pakaian, bahkan lebih baik dari kulkas itu. . .

kloning suara dibagi menjadi dua jenis: tts (text to speech) dan svc (ai voice changing).

tts adalah memberikan materi beberapa detik dan puluhan detik pada suara seseorang untuk melatih model ai, dan kemudian secara langsung menggunakan teks untuk menghasilkan sintesis ucapan dari audio suara orang tertentu. proyek sumber terbuka terbaik saat ini adalah gpt -sovits。

svc secara umum dapat dipahami sebagai pengubah suara ai, yang merupakan pengubah suara di era ai. saat ini ada tiga subproyek terkemuka di bidang pengubah suara ai: so-vits-svc, rvc, dan ddsp.

oke, sekarang sudah jelas bahwa di bidang kloning suara ai, ada dua metode untuk melakukan pemalsuan suara.

keuntungan dari proyek tts adalah kebutuhan datanya singkat, materi audio hanya cukup 5 detik, dan suara anda dapat dikloning. setelah itu, anda hanya perlu menyediakan teks untuk menghasilkan audio sangat cepat. namun kelemahannya adalah batas atas emosi, jeda, dan realisme sangat rendah. setelah mendengarkan selama puluhan detik, anda dapat dengan mudah mengetahui bahwa ini adalah varian ai.

sebelumnya, semua orang mengira ai tidak dapat melakukan pemalsuan audio tuan lu. mereka semua memiliki gagasan tentang tts dan mengira itu harus dibuat dengan tts.

sejujurnya, memang agak sulit bagi tts untuk menghasilkan audio setingkat pak lu, berdasarkan produk yang tersedia untuk umum di pasar yang saya ketahui (tidak termasuk proyek di laboratorium internal perusahaan besar).

namun jika dipikir-pikir, tts tidak bisa melakukan ini, tapi bagaimana dengan svc?

kerugian dari svc adalah biayanya yang mahal, memerlukan kumpulan data audio selama 30 menit, dan kemudian beberapa jam pelatihan alkimia untuk melatih model vokal orang tersebut svc untuk mengubah suara.

keuntungannya sangat jelas. benda ini dapat mempertahankan semua emosi, jeda, nada, dialek pembicara, dll. batas atas kualitasnya kira-kira tidak terbatas bukan. .

bahkan suara nyanyian pun dapat diubah dengan mulus. mengubah suara bicara anda hanyalah kasus kecil.

stefanie sun, ai yang menjadi populer tahun lalu, terbuat dari svc.

saya juga telah menulis beberapa tutorial tentang svc.

izinkan saya juga mendengarkan anda. setelah saya menggunakan svc untuk mengubah suara saya, saya menggantinya dengan suara saya sendiri.li ronghaopengaruh model.

ini langsung ai, saya hanya menambahkan musik latar.

ini svc.

jadi menggunakan svc untuk melakukan pemalsuan audio ai tuan lu, langkahnya sangat sederhana.

1. kumpulkan data pidato tuan lu selama sekitar 30 menit dari internet. ini mudah ditemukan.

2. gunakan svc atau rvc untuk membersihkan suara tuan lu dan melatihnya menjadi model ai.

3. tuan lu berasal dari anqing, dan ada banyak orang anqing di hefei.temukan seseorang dengan aksen yang mirip dengannya, dan bacalah audio yang akan disintesis sendiri terlebih dahulu.

4. terakhir, gunakan model ai svc untuk mengganti audio yang sudah jadi dengan suaranya.

hal yang sama berlaku untuk suara perempuan.

itu saja, sudah berakhir.

jika anda masih ingin mendengarkan dengan lebih realistis, cukup gunakan kliping atau sesuatu untuk menambahkan suara angin dan suara sekitar. ada terlalu banyak. temukan saja apa pun yang anda inginkan. tentu saja, perangkat lunak audio tradisional dapat menanganinya. anda juga dapat menggunakannya dengan suara sekitar. kumpulan data digunakan untuk pelatihan, meskipun saya tidak merekomendasikan ini. . .

khususnya cara video aslinya adalah dengan mengirimkan rekamannya ke ponsel, kemudian memutarnya di ponsel, dan menggunakan ponsel lain untuk merekamnya. suara sekitar sendiri banyak, dan juga bercampur dengan latar belakang gelak tawa teman-temanku yang kacau balau. ini semua adalah faktor di luar lapangan. . .

jadi, kembali ke pertanyaan kedua, bisakah ai membuat rekaman palsu seperti milik tuan lu? tentu saja bisa.

jangan menganggap ai terlalu mistis, dan jangan menganggap ai terlalu sampah.kecerdasan buatan sering kali merupakan kecerdasan buatan + kecerdasan.

tts yang ada saat ini tidak bisa menyelesaikan masalah emosional, lalu mengapa ai harus mengatasi emosi?

tidak bisakah anda mengubah timbre setelah anda selesai melafalkannya secara manual? ini adalah kecerdasan buatan + kecerdasan.

buka pikiran anda dan jangan terlalu dibatasi.

ai adalah asisten anda, alat bantu, untuk anda gunakan, bukan untuk anda serahkan segalanya kepada ai sebagai penjaga toko yang lepas tangan.

akhirnya, saya ingin membuat pernyataan.

saya menulis artikel ini agar semua orang tidak mengetahui tentang teknologi ini, lalu melanggar hukum, melakukan beberapa hal di luar hukum, dan menjadi gangster di luar hukum.

sebaliknya, saya berharap dapat melakukan sedikit ilmu pengetahuan populer tentang audio ai, memperlancar kesenjangan informasi, dan memberi tahu semua orang bahwa ada teknologi seperti itu, dan batas atasnya ada di sini . namun kita perlu mengetahui di mana dan tingkat apa yang dapat dicapai oleh ai saat ini.

apa yang bisa dilakukan dengan dukungan kecerdasan buatan + kecerdasan.

kemajuan ilmu pengetahuan dan teknologi tidak dapat diubah. setiap orang adalah setetes air dalam arus deras yang besar ini, dan hanya akan terbawa ke depan. mengetahui selalu lebih baik daripada tidak mengetahui. hanya dengan mengenal diri sendiri dan musuh anda dapat menang dalam setiap pertempuran.

kita belajar banyak hal dan mempelajari ai, seringkali untuk melindungi diri kita sendiri.

juga, lindungi keluarga kita.

lalu, kehidupan yang lebih baik.

sekarang setelah anda melihatnya, jika menurut anda bagus, silakan beri suka, tonton, dan retweet tiga kali. jika anda ingin menerima notifikasi sesegera mungkin, anda juga dapat memberi saya bintang⭐ ~terima kasih telah membaca artikel saya, sampai jumpa lagi.

>/ penulis: kazik

berita

bisakah rekaman ai tuan lu dari three sheeps dibuat? jawaban saya adalah: tentu saja

perkenalan

informasi kontak saya