ニュース

大型模型は高度な偽造の土壌をもたらしており、業界は偽造技術に取り組むための学際的な共同努力を求めている

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

・偽造品識別技術の開発には学際的な協力が必要 現在の偽造品識別技術は主にソフトウェアアルゴリズムに基づいており、将来的にはソフトウェアとハ​​ードウェアの統合に進むでしょう。


大型モデルの台頭により、高度な偽造の基盤が生まれ、業界は偽造技術に取り組むための学際的な共同努力を求めています。

大規模モデルの時代において、人工知能によって合成された音声と実際の音声との境界はますます曖昧になり、照合認識技術の向上が急務となっています。 7月23日、深層音声偽造認識をテーマとした第9回信業技術杯世界人工知能アルゴリズムコンテストの決勝戦が上海で開催され、参加者はディープラーニングと人工知能対策を活用して正確に識別できるアルゴリズムを開発することが奨励された。裏声モデル。

ディープフェイクとは、ディープラーニングと人工知能技術を利用して、極めてリアルな偽コンテンツを生成する手法です。大型モデルの台頭により、高度な捏造が行われる土壌が生まれました。即座に単語を入力するだけで、AI システムが写真、ビデオ、音声を出力するため、真と偽の区別が困難になります。

裏声を例にとると、大きなモデルはさまざまな裏声を生成することができ、これらの裏声はより現実的で擬人化されており、スムーズな会話が可能となるため、裏声認識には大きな課題が生じます。 「一部の価値の高いシナリオでは、AI による音声詐欺が頻繁に発生します。しかし、現在の音声識別技術の開発は音声合成技術に比べて遅れています。」と Xinye Technology の副社長でビッグデータと AI の責任者を務める Chen Lei 氏は述べています。

決勝戦では、出場者は、大規模なモデルベースの認識テクノロジーや従来のエンドツーエンド認識テクノロジーなど、さまざまなアルゴリズム モデルとトレーニング アイデアを使用して、誤った発話を特定しました。エンドツーエンドの認識テクノロジーはパラメーターの数が少なく、より垂直的な問題に焦点を当てていますが、大規模なモデルはパラメーターの数が多く、より高いデータ要件があり、生成される偽音声データの認識率が強力です。大型モデルにより大幅に改良されました。

Xinye Technologyのアルゴリズム科学者であるLu Qiang氏によると、予選大会の音声データセットは主に、識別が難しくない従来のエンドツーエンドTTS(テキスト読み上げ)によって生成されたフェイクスピーチで構成されているという。初めて、準決勝のデータセットには、最新の大規模モデルに基づいて生成されたフェイク音声が追加され、本物の言語と偽の言語からつなぎ合わされた偽の音声とサンプルが追加され、英語、フランス語、英語などの 5 つ以上の言語がカバーされます。そしてスペイン語になり、競争の難易度は上がります。 「準決勝で大型モデルが生成した偽の音声が追加されたことで、競争はさらに難しくなりました。これはまた、最新の大型モデルが『偽物を本物に偽装する』能力が強化されていることを示しており、これには対応するディープフェイク認識技術が必要です」を続けるために。"

「私たちは、実際の声を複数回録音した後に生成されるデータである偽の音声をリッピングするなど、いくつかの新しいシーン データを意図的にコンテストに追加しました。私たちはこれが偽の音声であると考えています。このシナリオでは、コンテストは本物の音声と音声を使用します。」偽の音声をスライスしてミキシングして、競争を妨害するための人為的な音声の聞き取りとラベル付けを回避するために敵対的なデータを構築します。「1 つのスライスが偽の音声である限り、スライス全体が偽の音声になります。これは実際のシーンに近いですが、リッピング問題と真正性と虚偽性の対立が解決できれば、学術的な価値があるとの認識である。「テキストやビデオなどのマルチモーダル情報は音声偽造の検出に役立つだろう」とも述べた。 、大規模なモデルとマルチモダリティが音声偽造検出の重要な開発方向の鍵となります。

偽造技術と偽造識別技術は「競争」しており、両者の開発はスパイラル状に進んでいます。 Chen Lei 氏は、大規模な音声モデルの研究では、アプリケーションの問題を抽象化して学術的な問題に絞り込み、学術的な問題を解決した後、特定のビジネス シナリオの実際のニーズを解決するように設計する必要があると述べました。偽造防止技術の開発には、学際的な協力が必要です。現在の偽造防止技術は主にソフトウェアアルゴリズムに基づいており、ハードウェアのトレーサビリティサウンド収集の助けを借りて、偽造品を防止および制御することができます。ハードウェアレベルからの音声リスク。

「偽造検出に終着点はありません。生成の道が終わらない限り、偽造検出は減り続けるでしょう。」と陳磊氏は、試合後、Xinye Technology がソースデータをオープンして、それを次の目的に使用するだろうと述べた。参加者の教材の感覚を鈍らせるための広範な学術研究。共有された学習を投稿します。同時に、ビジネスシナリオにおける最先端のモデルアイデアを吸収し、AIGC偽造プラットフォームを構築します。同氏は、生成型 AI はガバナンス ルールに準拠する必要があると考えており、人工知能のガバナンスには、規制当局によるトップレベルの設計が必要であり、システム的なリスクを防ぐために、環境に配慮した共同構築と業界の共創も求めています。