berita

"Model pertama Tiongkok dengan kemampuan suara GPT-4o", model AI suara Xinchen Lingo terbuka untuk reservasi pengujian internal

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House melaporkan pada tanggal 24 Agustus bahwa Xihu Xinchen, yang diinvestasikan oleh Jinke Tomcat, meluncurkan model suara besar Xinchen Lingo pada bulan Agustus tahun ini. Ini adalah model suara besar end-to-end pertama di Tiongkok. Buka janji pengujian beta.

Dalam pengumuman yang dirilis pada 21 Agustus, perkenalan resmi menyatakan bahwa dibandingkan dengan TTS tradisional, model suara besar ujung ke ujung adalah teknologi yang lebih komprehensif.Ini tidak hanya mendukung pengenalan ucapan, tetapi juga mengintegrasikan berbagai tautan seperti pemrosesan bahasa alami, pengenalan maksud, manajemen dialog, dan sintesis ucapan, mewujudkan proses interaksi lengkap mulai dari masukan ucapan hingga umpan balik ucapan, yang sangat memperkaya kedalaman dan keluasan pemahaman manusia. interaksi komputer.

Mengutip siaran pers resmi, IT Home menyatakan bahwa model suara Xinchen Lingo adalah model pertama di Tiongkok yang dapat mengejar kemampuan suara GPT-4o. Model ini memiliki tiga fitur penting berikut dalam hal kemampuan teknis:

Pemahaman pidato asli:Sebagai model end-to-end, Xinchen Lingo tidak hanya dapat mengenali informasi tekstual dalam ucapan, namun juga secara akurat menangkap fitur penting lainnya, seperti emosi, nada, nada, dan bahkan suara lingkungan, sehingga membantu model memahami konten ucapan secara lebih komprehensif. , sehingga memberikan pengalaman interaktif yang lebih alami dan jelas.

Berbagai ekspresi gaya suara:Xinchen Lingo dapat secara adaptif menyesuaikan kecepatan, tinggi, dan intensitas kebisingan ucapan sesuai dengan konteks dan instruksi pengguna, dan dapat menghasilkan respons ucapan dalam berbagai gaya seperti dialog, nyanyian, crosstalk, dll., yang secara efektif meningkatkan fleksibilitas model dalam berbagai cara. skenario aplikasi. dan kemampuan beradaptasi.

Kompresi super modal ucapan:Xinchen Lingo menggunakan codec ucapan dengan kecepatan kompresi ratusan kali lipat, yang dapat mengompresi ucapan menjadi sangat pendek, sehingga secara signifikan mengurangi biaya komputasi dan penyimpanan sekaligus membantu model menghasilkan konten ucapan berkualitas tinggi.