ニュース

Communication Brain CTO Zhang Jian: メディア向けの大規模モデル実装のラストマイルを加速する

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Chao Newsのクライアント記者、黄雲玲(ファン・ユンリン)

メディア コンバージェンスが全体的な国家戦略として推進されて以来、過去 10 年間、新興テクノロジーがメディア コンバージェンスの開発を後押しし続けており、特に生成人工知能はメディア分野でますます重要な役割を果たしています。 8月23日、北京で「BIRTV2024AIGC生成人工知能イノベーションと応用技術交流会議」が開催され、Communication Brainの副総経理兼最高技術責任者のZhang Jian氏が「大規模人工知能の応用の加速」に関する基調講演に招待された。メディアモデル」。

生成型人工知能の機能は当然メディア業界のニーズと一致しています。メディア組織は大規模なモデルの適用を加速する必要があり、実装の最後のマイルは、メディアの多数の複雑なマルチタスク要件を直列または並列の単一タスクに変換することです。シンプルな命令、およびシナリオベースの大規模モデル命令セットを編集システムにシームレスに統合する機能。

それでは、張建氏はこの会議でどのような情報を共有したのでしょうか?

Communication Brain の副ゼネラルマネージャー兼最高技術責任者である Zhang Jian 氏が生スピーチを行いました。写真提供:スプレッド・ザ・ブレイン

メディア業界における大物モデルの“独占的存在”

2017 年の Microsoft Xiaoice AI Poetry Collection の登場から、GPT4 や Sora などのマルチモーダルな大規模モデルの継続的な出現に至るまで、多数の深層学習手法が提案され、反復的に更新され、AIGC の開発ブームが始まりました。生成人工知能は、写真、テキスト、ビデオ、その他のコンテンツの作成に重点を置いており、メディア業界の日常的なコンテンツ制作ニーズに完全に適合します。

しかし、メディア業界で大規模モデルが広く適用されるようになるにつれて、基盤となる一般的な大規模モデルを自分たちで開発する必要があるのか​​どうかなど、いくつかの疑問が徐々に表面化してきました。データ漏洩を防ぐために民営化された展開のための大規模なモデルを構築したいですか?大規模モデルはメディア制作の取得および編集システムとどのように統合されますか?

これらの問題に対して、Zhang Jian 氏は、メディア業界は基礎となる大規模モデルを「展開」する必要はなく、それを適切に適用することがより重要であると考えています。「大規模モデルの展開は問題ではなく、コンピューティング能力も問題ではありません。重要なのは、導入後に機能を継続的に改善する方法です。」

Zhang Jian氏は会議で、多くの大規模モデルは特定のシナリオのニーズに基づいてアプリケーションを完全に開発しておらず、さまざまなユーザーグループのニーズに合わせてパーソナライズされた設計を実行していないため、非実用的なサービスが提供されていると述べた。現在、大規模モデルの適用は主に単一の単純なタスクを解決することですが、メディアは複雑なマルチタスクを直列または並列で行う必要があります。プロンプトワードエンジニアリングの専門化では、コンテンツ、プロセス、および大規模モデルが分離されている現状を解決できません。システム。大規模メディア モデルの将来のトレンドは、メディアの複雑なマルチタスク要件を単純なシングルタスク プロセスに変換し、シナリオベースの命令セットを取得および編集システムにシームレスに統合することです。

一般モデルからメディアモデルへの移行

メディア作成シナリオでは、汎用の大きなモデルは単一のテキストのみを生成でき、生成されたビデオには著作権のリスクもあります。一般的な大規模モデル アプリケーションには、メディア ビジネス プロセスが詳しくない、シーンベースの適応が欠如している、パーソナライゼーションがないなどの問題が依然として残っていることは明らかです。

この点において、Communication Brain はニュース データ メディア ライブラリを一般的な大規模モデルと組み合わせ、微調整した後、メディアの垂直カテゴリを特定する大規模なコミュニケーション モデルを作成し、メディアにインテリジェントな作成、インテリジェントなレビュー、クリエイティブなデザイン、マルチメディアを提供します。モーダル検索、知的会話の5大サービス。報道によると、2024年2月に大規模コミュニケーションモデルが生成人工知能(大規模言語モデル)を通じてオンライン登録され、メディアテクノロジー企業が開発して登録プロセスを通過した初の大規模メディアモデルとなった。 8月には、Spread Brainのコンテンツ生成アルゴリズムが中国国家サイバースペース局に登録された。

写真提供:スプレッド・ザ・ブレイン

Zhang Jian 氏は、大規模コミュニケーション モデルには 3 つの大きな特徴があると述べました。「まず、高品質のニュース データをトレーニングに使用できます。これにより、大規模モデルのコンテンツ生成におけるランダムな捏造を効果的に軽減し、コンテンツの信頼性を確保できます。」 、安全で制御可能、第 2 に、大規模なモデルを使用して、著作権で保護されたコンテンツの高速かつ正確な検索を実現し、コンテンツ素材の信頼できる著作権を確保することで、プライベート ドメインのメディア リソース ライブラリを開くことができます。メディア業界はユーザーの役割、ビジネス シナリオ、コンテンツの様式に基づいて、シンプルで便利な使用を保証します。」

まさに上記の 3 つの特徴に基づいて、ビッグ コミュニケーション モデルは、「専門的なメディア知識ベース」、「完全なビジネス シナリオの網羅」、「完全なクリエイティブ プロセスへのアクセス」、および「マルチモーダル コンテンツ」という 4 つの独自の利点も形成しています。メディア向けの大規模モデル実装のラスト マイルを加速します。

現在、大規模通信モデルは主に、メディア コンバージェンス クライアントとコンテンツ制作プラットフォームという 2 つの主要なアプリケーション シナリオに焦点を当てています。統合メディア クライアント シナリオでは、コミュニケーション モデルはパーソナライズされたインテリジェントな音声コミュニケーションとコメント サービスを提供できます。コンテンツ制作シナリオでは、コミュニケーション モデルはより豊富な機能を備え、ニュース作成、ビデオ生成、マルチモーダル検索、AI ポスター生成を提供できます。 、画像素材の生成、コンテンツのインテリジェントなレビューなどの機能。

メディア業界における大型モデルの開発動向

大型モデル技術の継続的な進歩とメディア業界の統合により、張建氏はメディア業界における大型モデルの将来の傾向を分析し、大型モデルをメディアビジネス発展の中核的な原動力として使用することがトレンドになると判断した。これからのメディア業界。メディア業界の場合、ビジネス シナリオの要求に基づいてユーザー中心であり、大規模モデル テクノロジーを使用してデジタル テクノロジー サービスを変革する必要があります。

Communication Brain の開発目標は、AI アプリケーションのラストワンマイルを開拓することです。 Communication Brain は、ユーザーの役割、ビジネス シナリオ、コンテンツ モダリティに基づいて次世代メディア向けのアプリケーション スーパーマーケットを構築し、それぞれの独立したアプリケーション シナリオが制作エンド ビジネスと緊密に統合されるようにし、メディア ワークフロー全体をシームレスに統合して最適化します。これにより、メディア作業の効率と品質が向上します。

大型モデル テクノロジーの継続的な成熟とアプリケーション シナリオの拡大により、メディア業界のより効率的でインテリジェントな開発の新時代が到来します。Communication Brain は、このプロセスの重要な推進者および実現者となることに尽力しています。

「転載の際は出典を明記してください」

レポート/フィードバック