ニュース

ビデオ生成が飛躍的に進歩、HiDream.ai HiDream.ai モデル 2.0 が分レベルに突入

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

最近、HiDream.ai HiDream.ai HiDream モデル 2.0 は文生ビデオの分野で大きな進歩を遂げ、ビデオの生成時間が昨年の 15 秒から分レベルに増加しました。これは、昨年 12 月に 4 秒の制限を突破した後のことです。さらなる技術的進歩。

HiDream.ai HiDream.ai 2.0 の文生ビデオ機能は、自社開発の DiT アーキテクチャのおかげで、再生時間、画像の自然さ、コンテンツ、文字の一貫性の点で大幅に改善されました。従来の U-Net アーキテクチャと比較して、DiT アーキテクチャは柔軟性が高く、画像とビデオ生成の品質を効果的に向上させることができます。ご存知のとおり、DiT アーキテクチャの基本的な実装は Transformer テクノロジーに依存しています。このテクノロジーのパフォーマンスをさらに向上させるために、HiDream.ai HiDream Large Model 2.0 は、Transformer ネットワーク構造全体、トレーニング データの構成、およびトレーニング戦略、特に詳細な調査とトレーニング戦略に関して、完全に自社開発したモジュールを採用しています。改善。

このモデルは、効率的な時空間共同注意メカニズムを採用しており、ビデオの時空間領域特性に適応するだけでなく、トレーニング プロセスにおける従来の注意メカニズムの速度問題も解決します。より長いビデオ クリップのトレーニングをサポートするために、HiDream.ai HiDream Large Model 2.0 は数分から 10 分のビデオ クリップを処理でき、数分間のビデオを直接出力することができます。同時に、HiDream.ai はビデオ コンテンツの詳細かつ正確な説明を実現するビデオ説明生成用のキャプション モデルも開発しました。

トレーニング戦略に関しては、HiDream.ai HiDream Large Model 2.0 は、ビデオと画像データの共同トレーニングにさまざまな長さのビデオ クリップを使用し、さまざまな長さのビデオのサンプリング レートを動的に調整してロングショット トレーニングを完了します。さらに、このモデルはユーザーのフィードバック データに基づいて強化された化学分析も実行します。、パフォーマンスをさらに最適化します。

HiDream.ai の HiDream Large Model 2.0 は、当初の 15 秒から分レベルまで延長され、ビデオ生成時間の大幅な増加を達成し、業界をリードするレベルに達しました。ビデオの長さが分レベルまで大幅に改善されたことに加えて、このアップグレードのもう 1 つのハイライトは、ビデオの長さとサイズの可変性です。以前のビデオ生成モデルには通常、事前に設定された固定時間があり、ユーザーが選択することはできません。 HiDream.ai は、ユーザーにビデオの長さを直接指定するか、入力されたプロンプトの内容に基づいてシステムに動的に判断させるかの選択権を与えます。コンテンツが複雑な場合は、システムはより長いビデオを生成し、コンテンツが単純な場合は、より短いビデオを生成します。この動的調整方法では、システムはユーザーのクリエイティブなニーズに適応的に対応できます。同時に、ビデオのサイズもユーザーのニーズに合わせてカスタマイズできるため、ユーザー エクスペリエンスが大幅に向上します。

HiDream.ai の HiDream Large Model 2.0 では、ビデオ画像の見た目と感触も大幅に向上し、オブジェクトの動きがより自然でスムーズになり、細部がより細かくレンダリングされ、4K 超高解像度がサポートされていることにも言及する価値があります。鮮明な画質。このテクノロジーのアップグレードにより、HiDream.ai HiDream Large Model 2.0 は、より高品質のマルチレンズ ビデオの生成に向けて急速に開発され、L3 ステージに向けて加速しています。アップグレードされたVincent Video機能が間もなく利用可能になり、ユーザーはよりリッチで高品質なビデオ生成サービスを体験できるようになることがわかっています。

業界関係者によると、HiDream.ai HiDream.ai の大型モデル 2.0 の継続的な改善とアップグレードにより、ビデオコンテンツ作成の分野にさらに革命的な変化をもたらし、ユーザーがクリエイティブな収益化を容易に実現し、業界全体のプロモーションを促進することが期待されていますより広範な開発スペースに向けて前進しています。

(出典:金融ビジネスインフォメーション)

さらに興味深い情報については、アプリケーションマーケットで「Jimu News」クライアントをダウンロードしてください。許可なく転載しないでください。ニュースのヒントを提供することは歓迎されており、受け入れられたら報酬が支払われます。

レポート/フィードバック