ニュース

FancyTech の秘密を明らかにします。「強力な削減」と「ハイパーコンバージェンス」を支えるアルゴリズムの革新

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

最近の技術革新の波の中で、AIGC (人工知能生成コンテンツ) は人々の自己表現と創造のための重要なツールになりつつあります。この技術革新の波の原動力は、巨大なアルゴリズム モデルだけではなく、特定の分野のニーズに焦点を当てた深くカスタマイズされたソリューションです。過去 2 年間で、AIGC は多くの予想よりも早く開発され、そのアプリケーションはテキスト生成から画像やビデオのあらゆる範囲に拡張されました。
最近、「Heart of the Machine」は中国の新興企業FancyTechとの独占インタビューを実施した。同社は、標準化された商用ビジュアルコンテンツ生成製品を提供することで市場を急速に拡大しただけでなく、実用化における垂直モデルの利点を初めて証明しました。
「Heart of the Machine」では、FancyTech の最新ビデオ垂直モデル DeepVideo についても詳しく紹介しています。DeepVideo は、製品を正確に復元し、ビデオに自然に統合する方法という課題に成功し、製品が動かないままであることを保証します。
FancyTech の垂直モデルは、オープンソースの基盤となるアルゴリズム フレームワークに基づいており、独自のデータ アノテーションを重ねて再トレーニングされ、良好な生成結果を達成するために必要な継続的なトレーニング反復には数百の GPU のみが必要です。対照的に、「製品データ」と「トレーニング方法」の 2 つの要素は、最終的な導入効果にとってより重要です。
FancyTech は、大量の 3D トレーニング データの蓄積に基づいて、モデルの 2D コンテンツ生成をガイドする空間インテリジェンスのアイデアを導入しました。画像コンテンツの生成に関して、チームは商品の復元を確実にするための「マルチモーダル機能デバイス」を提案し、特別なデータ収集を通じて商品と背景の自然な統合を確保しました。ビデオコンテンツの生成に関して、チームはビデオ生成、方向性設計フレームワーク、データエンジニアリングの基礎となるリンクを再構築し、製品を中心としたビデオを生成しました。
さらに、「Heart of the Machine」では、FancyTech が空間インテリジェンス研究のアイデアをビジュアル生成モデルにどのように適用しているかが詳しく明らかにされています。従来の生成モデルとは異なり、空間インテリジェンスは大量のセンサー データを分析し、正確なキャリブレーションを実行することで、モデルが現実世界を認識して理解できるようにします。
FancyTech は、従来のスタジオ撮影の代わりに LIDAR スキャンを使用し、大量の高品質の 3D データを蓄積しました。これらのデータは 2D データと結合され、モデルの現実世界の理解を大幅に強化します。
ビジュアル コンテンツ生成における光と影の効果を形成するという困難なタスクに対して、FancyTech は、各環境に調整可能な明るさと色温度を備えた複数のライトを導入し、できるだけ多くの自然光と影のデータを収集し、生成された画像の空間レイヤーを改善しました。
この高強度のデータ収集は、実際の撮影シーンの照明をシミュレートし、電子商取引シーンの特性にさらに適合します。高品質の 3D データの蓄積を組み合わせることで、FancyTech はアルゴリズム フレームワークに一連の革新をもたらし、空間アルゴリズムと画像およびビデオ アルゴリズムを有機的に組み合わせ、モデルがコア オブジェクトと環境の間の相互作用をより深く理解できるようにしました。
AIGC の分野では商業化の探求が止まることはありません。合意はありますが、開発の方向性も異なります。 「強力なリダクション」と「ハイパーフュージョン」の背後にあるFancyTechのアルゴリズム革新の記事で明らかになった「Heart of the Machine」。
FancyTech の「マルチモーダル特徴ジェネレーター」は、製品の特徴を多次元で抽出し、これらの特徴を使用してシーンに溶け込む画像を生成します。特徴抽出は、グローバル特徴とローカル特徴に分けられます。グローバル特徴には、製品の輪郭や色などの基本要素が含まれ、VAE エンコーダーを使用して抽出されます。ローカル特徴は、製品の詳細に焦点を当て、グラフ ニューラル ネットワークを通じて抽出されます。この方法では、製品の内部特徴と主要なピクセルの関係を詳細に把握できるため、製品の詳細を復元する精度が向上します。
商業化への道では、一般的なモデルが採用されるか垂直モデルが採用されるかにかかわらず、最終的な目標は商業的な成功を達成することです。 FancyTech は、豊富な独自のデータと業界の専門知識を活用して国内外の市場で広く認知されており、サムスン、LG、米国の東南アジアの電子商取引プラットフォーム Lazada などの国際パートナーと協力関係を確立しています。 Kate Somerville や Solawave などの地元ブランドに愛用されており、ヨーロッパでは LVMH イノベーション アワードを受賞しており、ヨーロッパの顧客と緊密な協力関係を築いています。
さらに、FancyTech は、AI ショート ビデオのフルリンク自動公開機能とデータ フィードバック機能も提供し、製品の売上の継続的な成長を効果的に推進します。
垂直モデルの適用が成功したことで、商業市場の発展が促進されるだけでなく、一般の人々が AIGC テクノロジーを使用して生産性を向上させることも容易になります。
テクノロジーの普及により、ほぼ誰もが携帯電話を通じてビデオを撮影したり、音楽を録音したり、自分の作品を世界と共有したりできるようになりました。私たちは、AIGC テクノロジーが個人の創造性を再び解き放ち、一般の人々がプロの限界を簡単に超え、アイデアを現実に変えることができるようになり、それによってあらゆる階層の生産性の飛躍を促進し、より多くの新興産業を生み出す未来を期待しています。
Text/AIに注目するLin Ke
レポート/フィードバック