notizia

Il servizio vocale AI di Microsoft Azure lancia avatar umani virtuali per supportare la conversione da testo a video

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House ha riferito il 23 agosto che il servizio vocale AI di Microsoft Azure consente agli sviluppatori di creare applicazioni vocali AI generative multilingue. Il servizio vocale AI di Azure ha recentemente lanciato una funzione umana virtuale di sintesi vocale in grado di convertire testo semplice in video umano naturale .

Oggi, Microsoft ha annunciato il lancio completo della funzionalità Avatar di sintesi vocale. Questa nuova funzionalità consente agli sviluppatori di creare avatar personalizzati per i propri utenti. La risoluzione video in uscita del servizio è 1920 x 1080 a 25 fotogrammi al secondo.

L'avatar di sintesi vocale ha le seguenti funzionalità:

Converti testo in video parlati da persone con voci dal suono naturale basate sulla sintesi vocale di Azure AI.

Fornisce diverse immagini preimpostate di personaggi.

La voce visiva viene generata dalla sintesi vocale di Azure AI.

Utilizza l'API di sintesi batch per sintetizzare video con ritratto con sintesi vocale in modo asincrono o in tempo reale.

Gli strumenti per la creazione di contenuti sono forniti in Speech Studio per creare contenuti video senza codifica.

Abilita conversazioni con ritratti in tempo reale con lo strumento Avatar di chat dal vivo in Speech Studio.

In termini di prezzi,I costi del servizio text-to-video verranno calcolati in base alla lunghezza dell'output video e addebitati al secondo.Il servizio è ora disponibile nel sud-est asiatico, nell'Europa settentrionale, nell'Europa occidentale, nella Svezia centrale, negli Stati Uniti centro-meridionali e negli Stati Uniti occidentali.