ニュース

Microsoft Azure AI Voice Service が、テキストからビデオへの変換をサポートする仮想人間アバターを開始

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House は 8 月 23 日、Microsoft Azure AI Voice Service を使用すると、開発者が多言語生成 AI 音声アプリケーションを構築できるようになり、単純なテキストを自然な人間の音声に変換できる音声合成仮想ヒューマン機能を開始したと報告しました。 。

本日、Microsoft は Text to Speech Avatar 機能の完全展開を発表しました。この新機能により、開発者はユーザー向けにパーソナライズされたアバターを作成できるようになります。サービスの出力ビデオ解像度は 1920 x 1080、25 フレーム/秒です。

テキスト読み上げアバターには次の機能があります。

Azure AI Text-to-Speech を利用して、テキストを自然な音声で人間が話すビデオに変換します。

さまざまなキャラクターのプリセット画像を提供します。

視覚的な音声は、Azure AI テキスト読み上げによって生成されます。

バッチ合成 API を使用して、テキスト読み上げポートレート ビデオを非同期またはリアルタイムで合成します。

Speech Studio には、コーディングなしでビデオ コンテンツを作成できるコンテンツ作成ツールが用意されています。

Speech Studio のライブ チャット アバター ツールを使用して、リアルタイムのポートレート会話を可能にします。

価格設定に関しては、Text-to-Video サービスの料金は、ビデオ出力の長さに基づいて計算され、1 秒ごとに請求されます。このサービスは現在、東南アジア、北欧、西ヨーロッパ、スウェーデン中部、米国中南部、米国西部で利用可能です。