Nachricht

Der Microsoft Azure AI Voice Service führt einen virtuellen menschlichen Avatar ein, um die Text-zu-Video-Konvertierung zu unterstützen

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House berichtete am 23. August, dass der Microsoft Azure AI Voice Service es Entwicklern ermöglicht, mehrsprachige generative KI-Sprachanwendungen zu erstellen, die kürzlich eine virtuelle Text-zu-Sprache-Funktion eingeführt haben, die einfachen Text in natürliche menschliche Sprache umwandeln kann .

Heute hat Microsoft die vollständige Einführung der Text-to-Speech-Avatar-Funktion angekündigt. Mit dieser neuen Funktion können Entwickler personalisierte Avatare für ihre Benutzer erstellen. Die Ausgabevideoauflösung des Dienstes beträgt 1920 x 1080 bei 25 Bildern pro Sekunde.

Der Text-to-Speech-Avatar verfügt über die folgenden Funktionen:

Konvertieren Sie Text in menschlich gesprochenes Video mit natürlich klingenden Stimmen, unterstützt durch Azure AI Text-to-Speech.

Bietet verschiedene voreingestellte Bilder von Charakteren.

Die visuelle Stimme wird durch Azure AI Text-to-Speech generiert.

Verwenden Sie die Batch-Synthese-API, um Text-zu-Sprache-Porträtvideos asynchron oder in Echtzeit zu synthetisieren.

In Speech Studio stehen Tools zur Inhaltserstellung zur Verfügung, mit denen Sie Videoinhalte ohne Codierung erstellen können.

Ermöglichen Sie Porträtgespräche in Echtzeit mit dem Live-Chat-Avatar-Tool in Speech Studio.

Was die Preisgestaltung betrifft,Die Gebühren für den Text-zu-Video-Dienst werden auf der Grundlage der Länge der Videoausgabe berechnet und pro Sekunde berechnet.Der Dienst ist jetzt in Südostasien, Nordeuropa, Westeuropa, Mittelschweden, Süd-Zentral-USA und Westen der USA verfügbar.