Microsoft Azure AI 音声サービスが、テキストからビデオニュースへの変換をサポートするバーチャルヒューマンイメージを開始

2024-08-23

IT House は 8 月 23 日、Microsoft Azure AI Voice Service を使用すると、開発者が多言語生成 AI 音声アプリケーションを構築できるようになり、単純なテキストを自然な人間の音声に変換できる音声合成仮想ヒューマン機能を開始したと報告しました。。

本日、Microsoft は Text to Speech Avatar 機能の完全展開を発表しました。この新機能により、開発者はユーザー向けにパーソナライズされたアバターを作成できるようになります。サービスの出力ビデオ解像度は 1920 x 1080、25 フレーム/秒です。

テキスト読み上げアバターには次の機能があります。

Azure AI Text-to-Speech を利用して、テキストを自然な音声で人間が話すビデオに変換します。

さまざまなキャラクターのプリセット画像を提供します。

視覚的な音声は、Azure AI テキスト読み上げによって生成されます。

バッチ合成 API を使用して、テキスト読み上げポートレートビデオを非同期またはリアルタイムで合成します。

Speech Studio には、コーディングなしでビデオコンテンツを作成できるコンテンツ作成ツールが用意されています。

Speech Studio のライブチャットアバターツールを使用して、リアルタイムのポートレート会話を可能にします。

価格設定に関しては、Text-to-Video サービスの料金は、ビデオ出力の長さに基づいて計算され、1 秒ごとに請求されます。このサービスは現在、東南アジア、北欧、西ヨーロッパ、スウェーデン中部、米国中南部、米国西部で利用可能です。

ニュース