2024-10-05
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
it house news は 10 月 5 日、テクノロジー メディアの windows report が昨日 (10 月 4 日) ブログ記事を掲載し、microsoft が新しい特許を取得したことを報告し、copilot がユーザーのビデオ、テキスト、powerpoint などの作成を支援できることを想像しました。音楽。
it home からのメモ: microsoft の特許は「オーディオ スコアを作成するための人工知能モデル」と呼ばれており、主に入力コンテンツに基づいて音楽を作成する方法について説明しています。
この特許では主に次の手順の概要が説明されています。
データの収集: ビデオおよびオーディオ コンポーネントを含む多くのオーディオビジュアル データセットを含む、大量のトレーニング データを収集します。
分析抽出: データセットを分析し、さまざまなタイプの特徴を抽出します。例えば、テキストビデオの色、形、動き、シーンなどです。
相関関係: copilot はこれらの機能を分析し、それらの間の相関関係を探します。たとえば、特定のシーン (夕日など) には、特定の種類の音楽 (穏やかで心地よいメロディーなど) が伴うことがよくあります。
copilot はこれらの機能についてトレーニングされ、相関システムを使用して、新しいビデオの視覚的およびテキスト的特徴に一致する適切な音声スコアを生成します。
実際には、このテクノロジーは次のようなさまざまなアプリケーションで使用できます。
映画とビデオの制作: 映画、テレビ番組、オンライン ビデオ用の bgm を自動的に生成します。
広告: コマーシャルの雰囲気やメッセージにぴったり合う音楽を作成します。
ゲーム: ゲームのビジュアルとアクションの変化に基づいてダイナミックなサウンドトラックを作成します。
仮想現実: 視覚環境に適応するオーディオで没入型体験を強化します。
その他のシーン:例えばプロポーズなどのシーンに最適な音楽を自動でマッチングします。