berita

Model-model besar membuka peluang terjadinya pemalsuan yang mendalam, dan industri ini menyerukan upaya bersama lintas disiplin untuk mengatasi pemalsuan teknologi

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·Perkembangan teknologi identifikasi pemalsuan memerlukan kerjasama lintas disiplin ilmu. Teknologi identifikasi pemalsuan saat ini sebagian besar didasarkan pada algoritma perangkat lunak, dan ke depan akan mengarah pada integrasi perangkat lunak dan perangkat keras.


Maraknya model-model besar telah melahirkan landasan bagi pemalsuan yang mendalam, dan industri ini telah menyerukan upaya bersama lintas disiplin untuk mengatasi pemalsuan teknologi.

Di era model besar, batasan antara ucapan yang disintesis dengan kecerdasan buatan dan ucapan nyata menjadi semakin kabur, dan peningkatan teknologi pengenalan pencocokan merupakan hal yang mendesak. Pada tanggal 23 Juli, final Kompetisi Algoritma Kecerdasan Buatan Global Piala Teknologi Xinye ke-9, bertema deteksi suara dalam dan pemalsuan, diadakan di Shanghai secara akurat mengidentifikasi model suara palsu.

Deepfake adalah metode yang menggunakan pembelajaran mendalam dan teknologi kecerdasan buatan untuk menghasilkan konten palsu yang sangat realistis. Munculnya model-model besar telah menjadi dasar pemalsuan yang mendalam. Cukup masukkan kata yang cepat, dan sistem AI akan mengeluarkan gambar, video, dan audio, sehingga sulit untuk membedakan yang benar dari yang salah.

Dengan mengambil contoh suara palsu, model besar dapat menghasilkan berbagai suara palsu. Suara palsu ini lebih realistis, antropomorfik, dan memiliki percakapan yang lancar, sehingga menghadirkan tantangan yang lebih besar pada pengenalan suara palsu. "Dalam beberapa skenario bernilai tinggi, penipuan suara yang disebabkan oleh AI sering terjadi. Namun, perkembangan teknologi identifikasi suara saat ini tertinggal dibandingkan teknologi sintesis ucapan." kata Chen Lei, wakil presiden Xinye Technology dan kepala data besar dan AI.

Di final, para kontestan menggunakan model algoritma dan ide pelatihan yang berbeda untuk mengidentifikasi ucapan palsu, termasuk teknologi pengenalan berbasis model besar dan teknologi pengenalan end-to-end tradisional. Teknologi pengenalan ujung ke ujung memiliki jumlah parameter yang lebih kecil dan berfokus pada masalah yang lebih vertikal; model besar memiliki jumlah parameter yang lebih besar, memiliki persyaratan data yang lebih tinggi, dan memiliki kemampuan generalisasi yang kuat. Tingkat pengenalan data ucapan palsu yang dihasilkan oleh model besar telah ditingkatkan secara signifikan.

Menurut Lu Qiang, seorang ilmuwan algoritme di Xinye Technology, kumpulan data ucapan untuk kompetisi pendahuluan sebagian besar terdiri dari ucapan palsu yang dihasilkan oleh TTS (text-to-speech) end-to-end tradisional, yang lebih mudah diidentifikasi pertama kalinya, kumpulan data semi final menambahkan ucapan palsu yang dihasilkan berdasarkan model besar terbaru, menyalin suara palsu dan sampel yang digabungkan dari bahasa asli dan palsu, mencakup lebih dari lima bahasa termasuk Inggris, Prancis, Spanyol. , dll., dan kesulitan persaingan meningkat. “Penambahan suara palsu yang dihasilkan oleh model-model besar di babak semifinal telah membuat persaingan semakin sulit, yang juga menunjukkan bahwa kemampuan model-model besar terbaru untuk 'menyamarkan yang palsu sebagai asli' menjadi lebih kuat, yang membutuhkan teknologi pengenalan deepfake yang sesuai. untuk menjaga."

"Kami sengaja menambahkan beberapa data adegan baru ke dalam kompetisi, seperti menyalin suara palsu, yang merupakan data yang dihasilkan setelah beberapa kali rekaman suara asli. Kami pikir ini adalah suara palsu." Lu Qiang berkata, untuk skenario ini, kompetisi menggunakan suara asli dan pemotongan dan pencampuran ucapan palsu untuk membangun data yang berlawanan untuk menghindari mendengarkan ucapan dan pelabelan yang dibuat-buat untuk mengganggu kompetisi pengakuan Tantangannya sangat besar. Jika masalah ripping dan konfrontasi antara keaslian dan kepalsuan dapat diselesaikan, ini akan menjadi nilai akademis. "Lv Qiang juga mengatakan bahwa informasi multi-modal seperti teks dan video akan membantu dalam deteksi pemalsuan ucapan , dan model besar serta multi-modalitas akan menjadi kunci deteksi pemalsuan ucapan.

Teknologi pemalsuan dan teknologi pendeteksi pemalsuan "berlomba", dan perkembangan keduanya semakin meningkat. Chen Lei mengatakan bahwa penelitian tentang model pidato besar harus mengabstraksi dan menyempurnakan masalah aplikasi menjadi masalah akademis, setelah menyelesaikan masalah akademis, masalah tersebut harus direkayasa untuk memecahkan kebutuhan nyata dari skenario bisnis tertentu. Perkembangan teknologi anti-pemalsuan memerlukan kerja sama lintas disiplin. Teknologi anti-pemalsuan saat ini terutama didasarkan pada algoritma perangkat lunak. Di masa depan, teknologi ini akan mengintegrasikan perangkat lunak dan perangkat keras. Dengan bantuan pengumpulan suara ketertelusuran perangkat keras, dapat mencegah dan mengendalikan pemalsuan risiko suara dari tingkat perangkat keras.

"Tidak ada titik akhir untuk deteksi pemalsuan. Selama jalan generatif belum berakhir, deteksi pemalsuan akan terus menurun." Chen Lei mengatakan bahwa setelah pertandingan, Xinye Technology akan menggunakan data sumber terbuka untuk kepentingan akademis yang lebih luas meneliti dan menurunkan kepekaan materi para kontestan. Posting pembelajaran bersama. Pada saat yang sama, perusahaan ini menyerap ide-ide model mutakhir dalam skenario bisnis dan membangun platform pemalsuan AIGC. Ia percaya bahwa AI generatif harus mematuhi aturan tata kelola. Tata kelola kecerdasan buatan memerlukan rancangan tingkat tinggi dari regulator untuk menstandarisasi dan memandunya.