modello audio di grandi dimensioni presentato alla yunqi conference

modello audio di grandi dimensioni presentato alla conferenza yunqi del 2024

2024-09-22

il 19 settembre, la conferenza yunqi 2024 si è aperta nella città di yunqi, hangzhou, con il tema "yunqi intelligent leap, industrial butterfly transformation". il grande modello audio multimodale ai dell'himalaya everest è stato presentato nel padiglione tematico "intelligenza artificiale +", attirando molti cittadini.

alla fine dello scorso anno, ximalaya aveva accumulato 488 milioni di brani audio in 459 categorie, con una durata totale dei contenuti di oltre 3,6 miliardi di minuti. l'enorme e diversificato contenuto audio online gli consente di evolvere continuamente le sue capacità di intelligenza artificiale. fin dalla sua creazione la piattaforma ha sempre attribuito grande importanza allo sviluppo dell’intelligenza artificiale. l'"everest ai audio multi-modal large model" presentato questa volta è il suo modello di grandi dimensioni per la generazione di audio ai sviluppato in modo indipendente. si basa su più di un milione di ore di dati audio proprietari protetti da copyright per l'apprendimento e la formazione approfonditi e ha un output emotivo. espressione naturale, ha capacità tecniche come la traduzione linguistica e la clonazione estremamente veloce e ha raggiunto scoperte multidimensionali nel campo della generazione audio, che viene ampiamente utilizzata negli audiolibri e in altri campi.

nella "zona di esperienza interattiva della piattaforma di intelligenza digitale everest ai", i partecipanti possono sperimentare i cambiamenti apportati dall'intelligenza artificiale alla creazione del suono, come ad esempio: esperienza estremamente veloce di 535 librerie di suoni ai in tutti i campi e categorie per generare contenuti audio aigc in tutte le categorie, 15 secondi personalizza rapidamente le immagini dell'homo sapiens nella vita reale, clona le voci in 10 secondi, ecc., e scopri come l'intelligenza artificiale potenzia in modo efficiente e conveniente i creatori di contenuti.

i dati mostrano che nel 2023, gli utenti attivi mensili medi di ximalaya in tutti gli scenari raggiungeranno i 303 milioni. a dicembre dello scorso anno, i contenuti aigc della piattaforma hanno raggiunto i 240 milioni di minuti, pari al 6,6% dei contenuti audio. allo stesso tempo, il tasso di penetrazione dell'aigc tra gli utenti medi mensili attivi sul terminale mobile ha raggiunto il 14,8%. il grande modello audio himalayano presenta i vantaggi del modello di "un ecosistema di modello di produzione integrato e un volano ecologico in continua evoluzione". è stato ampiamente utilizzato nella creazione di contenuti, avatar di intelligenza digitale, interazione vocale e altri scenari ed è stato commercializzato. in futuro, apriremo ulteriormente l’immaginazione del suono e continueremo a utilizzare il suono per servire una vita migliore.

autore: fu xinxin

testo: fu xinxin immagini: fornite dall'intervistato redattore: shen zhushi redattore: fan bing

si prega di indicare la fonte quando si ristampa questo articolo.

segnalazione/feedback

notizia

modello audio di grandi dimensioni presentato alla conferenza yunqi del 2024

introduzione

le mie informazioni di contatto