model audio besar diluncurkan pada yunqi conference

model audio besar diluncurkan pada konferensi yunqi 2024

2024-09-22

pada tanggal 19 september, konferensi yunqi 2024 dibuka di kota yunqi, hangzhou, dengan tema "lompatan cerdas yunqi, transformasi kupu-kupu industri". model besar multi-modal audio ai himalayan everest diluncurkan di paviliun bertema "kecerdasan buatan +", yang menarik banyak warga.

hingga akhir tahun lalu, ximalaya telah mengumpulkan 488 juta keping audio dalam 459 kategori, dengan total durasi konten lebih dari 3,6 miliar menit. konten audio online yang besar dan beragam memungkinkannya untuk terus mengembangkan kemampuan ai-nya. pada awal pendiriannya, platform ini selalu mementingkan penerapan ai. "model besar multi-modal audio ai everest" yang diluncurkan kali ini adalah model besar generasi audio ai yang dikembangkan secara independen. model ini mengandalkan lebih dari satu juta jam data audio berhak cipta untuk pembelajaran dan pelatihan mendalam, dan memiliki keluaran emosional. ekspresi alami, ia memiliki kemampuan teknis seperti terjemahan bahasa dan kloning yang sangat cepat, dan telah mencapai terobosan multi-dimensi di bidang pembuatan audio, yang banyak digunakan dalam buku audio dan bidang lainnya.

dalam "zona pengalaman interaktif platform intelijen digital ai everest", peserta dapat merasakan perubahan yang dibawa oleh ai pada penciptaan suara, seperti: pengalaman yang sangat cepat dari 535 perpustakaan suara ai di semua bidang dan kategori untuk menghasilkan konten audio aigc di semua kategori, 15 detik sesuaikan dengan cepat gambar homo sapiens di kehidupan nyata, kloning suara dalam 10 detik, dll., dan rasakan bagaimana ai memberdayakan pembuat konten secara efisien dan nyaman.

data menunjukkan bahwa pada tahun 2023, rata-rata pengguna aktif bulanan ximalaya di semua skenario akan mencapai 303 juta. pada desember tahun lalu, konten aigc di platform ini mencapai 240 juta menit, terhitung 6,6% dari konten audionya. pada saat yang sama, tingkat penetrasi aigc pada rata-rata pengguna aktif bulanan di terminal seluler telah mencapai 14,8%. model audio besar himalaya memiliki keunggulan model berupa "ekosistem model produksi terintegrasi dan roda gila ekologis yang terus berkembang". model ini telah banyak digunakan dalam pembuatan konten, avatar kecerdasan digital, interaksi suara, dan skenario lainnya, dan telah dikomersialkan. di masa depan, kami akan semakin membuka imajinasi tentang suara dan terus menggunakan suara untuk memberikan kehidupan yang lebih baik.

penulis: fu xinxin

teks: fu xinxin gambar: disediakan oleh orang yang diwawancarai editor: shen zhushi editor: fan bing

harap sebutkan sumbernya saat mencetak ulang artikel ini.

laporan/umpan balik

berita

model audio besar diluncurkan pada konferensi yunqi 2024

perkenalan

informasi kontak saya