逆襲の韓国nルーム2.0！一般人がai変面に完全敗北したとき、彼らは魔法を使って敗北した magic

逆襲の韓国nルーム2.0！ aiによる変面に一般人が完全に敗北したとき、彼らは魔法を使って魔法を打ち破った。

2024-09-09

最近韓国で起きた「room n 2.0」事件により、ディープフェイクというありふれた話題が再び最前線に浮上した。

犯人たちはテレグラムに集まり、aiを使って女性の写真をヌード写真に合成したということは、ディープフェイクの輪がすでに芸能界のスターや政治家から、あなたや私のような一般人まで広がっていることを示しています。

ai が科学として顕著になっているこの時代において、私たちは新しいものではないように見えますが、近年ますます普及しているこのテクノロジーが日常生活にどのような影響を与えるかを理解したいと考えています。

ディープフェイクはどこまで進化しており、どのような害をもたらすのでしょうか?ディープフェイクと戦うためにテクノロジーをどのように活用するか?一般人はどうやってディープフェイクを防ぐのでしょうか？

私たちはこれらの問題について、ruirai intelligent algorithm の科学者である chen peng 博士と話し合いました。 ruilai wisdom は 2018 年に設立され、清華大学の人工知能研究所によって育成され、長年にわたって ai の偽造品検出に深く関わってきました。

陳鵬氏は、一般人はディープフェイクの特定に惨めに失敗しており、ディープフェイク対策は依然としてaiに依存していると語った。

写真、数秒でディープフェイクがますます簡単に

ディープフェイクは2017年にredditで初めて登場し、「アメリカ版tieba」と呼ばれ、有名人の顔をポルノビデオの主人公に置き換えたり、政治家になりすましたりするのが主な形式だ。

現在でも、噂を広めたり、ポルノに参加したりすることがディープフェイクの主流の用途となっていますが、それらはさらに簡単になってきています。

chen peng 氏は、1 枚の写真を収集するだけで顔を変えるのに十分であると説明しました。もちろん、より多くのデータが収集されるほど、ほくろや顔の特徴などの顔の詳細がより適切にモデル化され、顔の変更効果がより現実的になります。。

今年 4 月に行われた 2 人のドイツ人アーティストによるパフォーマンスアートプロジェクトは、まさにその好例です。

彼らはaiカメラnucaを設計しました。カメラ本体は3dプリントされ、37mmの広角レンズが内蔵されています。撮影された写真はクラウドに送信され、そこでaiが「服を脱ぐ」と写真が撮影されます。 10秒以内に「取り出される」。

nuca は実際にはあなたの裸体がどのように見えるかを知りません。ai の目にあなたの裸体を提示するために、性別、顔、年齢、体型などを分析するだけです。

粗い？もしかしたら、それは問題ではないかもしれません。数秒以内に、あなたは ai にさらされており、他の人はそれがあなたであると信じているかもしれません。

韓国の「room n 2.0」も同様の詳細で暴露されている。227,000人が参加するtelegramのチャットルーム、女性の写真をヌード写真に合成し胸を調整できる内蔵ロボット、5～7秒でディープフェイクコンテンツを生成するものだ。

▲ディープフェイクの使い方を説明するチャットルームのスクリーンショット

顔を変えたり、服を脱いだりすることは、ディープフェイクの応用例の 1 つにすぎません。

生成 ai モデル (gan、vae、拡散モデルなど) を使用して、テキスト、画像、音声、ビデオなどのリアルなコンテンツを合成または偽造することをディープフェイクと呼ぶことができます。

その中で、音声ディープフェイクも非常に一般的です。

2023年初め、テクノロジー記者のジョセフ・コックス氏が銀行の自動サービスホットラインに電話し、イレブンラボで複製した「私の声は私のパスワード」というai音声を再生し、残高を確認するよう依頼したところ、予想外に音声認証が成功した。

陳鵬氏は、これまでは声紋情報を取得するのに数分から数十分かかっていたが、現在ではおおよそ30分から数十秒で取得できると述べた。あと数回嫌がらせの電話があれば、私たちの声が漏れてしまうかもしれません。

もちろん、郭徳剛に英語のクロストークを話させたり、スウィフトに中国語を話させたりするなど、より正確にクローンを作成して口調やその他の話し方をコピーしたい場合は、さらに多くのコーパスが必要です。

テキストですらかなり捏造されている領域です。 ai によって生成されたテキストは長い間どこでも見られており、生徒がカンニングや宿題に対処するためにそれを使用する場合、教師にとっては頭痛の種となっていますが、私たちはその背後にあるリスクに気づいていない可能性があります。

偽のニュースと噂はテキストディープフェイクの最も大きな被害を受けている分野であると陳鵬氏は、以前はまだ人間が自分でコピーを書く必要があったが、今ではaiが特定のイベントに関するさまざまなコメントを生成し、自動的にソーシャルメディアに投稿できると述べた。。

chen peng 氏によると、ディープフェイクの方が高速かつ簡単です。その理由は主に 3 つあります。

まず、vincent pictures や vincent video などの生成 ai テクノロジで画期的な進歩が見られました。第 2 に、コンピューティング能力がますます普及しており、消費者向けのグラフィックカードですでに生成 ai モデルを実行できるようになりました。

もう 1 つの非常に重要な点は、ディープフェイク技術が、より低いしきい値のさまざまなツールに最適化されているということです。

顔の変更を例に挙げると、github 上の deepfacelive や deep-live-cam など、ディープフェイクのオープンソースプロジェクトが多数あり、ユーザーは web サイトからコードをダウンロードして、ローカルで実行環境を構成できます。

▲deep-live-camを使用したai muskライブブロードキャスト

テクノロジーを理解していない初心者がまだ難しい場合は、ご飯を直接口に入れ、モデルをカプセル化して、プレイヤーが無料でダウンロードできるシンプルで使いやすいソフトウェアに作成する専門家もいます。ストリップ用のワンクリックアプリも多数含まれており、広告料を自分で稼ぐことができます。

オーディオディープフェイクに関しては、すでに成熟した商用企業が存在し、ユーザーがsdk（開発キット）やapi（アプリケーションプログラミングインターフェース）の形でサービスを簡単に利用できるようにしています。

ユーザーはプログラムを展開するためにグラフィックカードを搭載したデバイスさえ必要としませんが、代わりにオーディオなどのコンテンツを web サイトにアップロードし、結果が生成されるのを待ってからダウンロードします。

したがって、複雑な技術原理が舞台裏に隠されており、ユーザーの目の前にあるのは、10代の若者でも意のままに偽の情報を作成できる「すぐに使える」インターフェースです。

一言で言えば、chen peng の結論は次のとおりです。

ディープフェイクは一般人が簡単に入手できる段階に達しています。

人間は肉眼でディープフェイクを識別することに完全に失敗した可能性がある

テクノロジーが「一般の人々の家庭に侵入」した場合、最も影響を受ける可能性が高いのは一般の人々です。

詐欺は、ディープフェイクが悪を行う最も一般的な方法の 1 つです。

今年の初め、多国籍企業の香港支店がaiにより2,500万米ドルを騙し取られる事件が発生した。被害者はビデオ会議に参加しており、残りは「ai顔変更」「ai音声変更」を受けた詐欺師だった。

▲警察はディープフェイクを使って複数人でのビデオ会議を偽装する方法を実演した

事態がこのようになった今、私たちは自分自身を守るために何ができるでしょうか？

誰かがディープフェイクを使ってあなたを騙した場合、aiの抜け穴を利用するのも方法の1つですが、それには有効期限があります。

たとえば、ビデオ通話中に相手の顔が ai に置き換えられていると疑われる場合、相手が顔の前に手を置いて素早く数回スワイプするなどの特定の動作をするように誘導できます。または頭を大きく回転させます。

ai 顔置換の背後にあるモデルが手のオクルージョン用に特に最適化されていない場合、顔が露出して手の甲に顔が表示されたり、突然歪んだりする可能性があります。

頭を回す原理も同じです。データ収集の段階で、相手が意図的に 45 度以上の頭を回す素材を収集しなかった場合、顔のフィット感は不自然になります。

しかし、将来的には、このような肉眼で見える欠陥は確実に徐々に減少します。

▲ノースウェスタン大学の「トラブルシューティング」テスト：aiが生成するのか、それとも本物なのか？

chen peng 氏は、詐欺師があなたを屠殺されるのを待っている太った羊だと考え、意図的にあなたを騙し、ソーシャルメディア情報を剥奪し、モデルの最適化に数日を費やそうとしている場合、これらの方法が効果的である保証はないと冗談を言いました。

ビデオにこれらの欠陥がない場合、それは本物のビデオであることを意味しますか?これは真実ではありません。

効果があるかないかについては、もちろん完全に効果がある、100％効果があるというわけではありませんが、ある程度の効果はあります。

より専門的な言葉で言うと、人間の視覚認識は、物体やシーンの意味を簡単に区別できるなど、意味論的なレベルでは非常にうまく機能しますが、ピクセルレベルでの低レベルのニュアンスの処理となると、その認識は能力はaiほどではない。

この観点から、chen peng氏は、一般人はディープフェイクを区別することに惨めに失敗しているが、専門家は多くのことを見てきており、比較的包括的な分析能力を持っており、何かがルールに適合していないことがわかるため、まだ戦うことができるかもしれないと考えている。

私たちはレーウェンフックではないし、鋭い目を持っているわけでもありませんが、人間の本性は変わりません。したがって、テクノロジーとは何の関係もない伝統的な心理的防御線を引き上げることもできます。つまり、航海する際は注意してください。

詐欺は多くの場合、同じパターンに従います。つまり、プライバシーを盗み、恐怖、貪欲、感情的価値を利用して話をでっち上げ、知人のふりをしたり、信頼を得るために自分自身を装ったり、最終的な目的は金銭です。

▲realai smart の製品 realbelieve は、ビデオ通話中に早期警告を発します。

このことを念頭に置き、見慣れないリンクをクリックしたり、安易に認証コードを入力したり、顔、声、指紋などの個人生体情報をインターネット上に過度に公開したり、不審な電話を受けたりしないように注意してください。お金に関しては、お互いしか知らないことを尋ねるなど、お互いの身元を確認する方法を複数考えてください。

古いことわざにあるように、騙されるかもしれないと一度認識したら、騙されないようにするには、心を攻撃するのが最善です。

魔法対魔法、ai が ai に勝つ

韓国の「room n 2.0」事件は、ディープフェイクの悪の別の形を示しています。人々は家に座っていますが、鍋は天からやって来ます。

偽のヌード写真の被害者は、「リベンジポルノ」に遭遇する可能性があります。加害者は、被害者を脅迫したり嫌がらせをするためにディープフェイク素材を拡散すると脅し、より深刻な二次被害を引き起こします。

しかし、この鎌は私たちの頭上に掲げられる可能性もあります。詐欺集団がどこからともなくあなたの写真を入手し、それを下品なビデオに組み合わせ、テキストメッセージを送ってあなたを脅迫し、あなたがお金を送金しなければ暴露されると想像してください。インターネット上でどうやって自分を証明できるでしょうか？

陳鵬氏が勤務する瑞来知恵は、実際にこの種の個人的なビジネスに遭遇したことがありますが、相手はビデオで顔を変えられたと言いましたが、彼は罰せられるでしょうか？

もちろん、魔法対魔法、ai が ai を倒す方法もあります。

chen peng 氏は、ai 偽造には 2 つの主な技術的ルートがあると紹介しました。それは、アクティブな防御とパッシブな検出です。

まず、積極的な防御について話しましょう。写真を他の人に使用されたくないときにソーシャルメディアに投稿する場合、その写真に視覚的に認識できないノイズを埋め込むことができます。

他の人が私たちの写真を使用してモデルをトレーニングすると、この目に見えない干渉により ai が視覚的表現をうまく抽出できなくなり、最終結果が歪んだりぼやけたりする可能性があります。これは「敵対的サンプル攻撃」と呼ばれます。」

「準脆弱性ウォーターマーク」も積極的な防御方法です。透かしを追加した後、他の人が私たちの写真を編集すると、透かしは破壊され、画像が処理されており信頼できないことがわかります。

ウォーターマークは画像がディープフェイクであることを直接防ぐことはできませんが、画像の信頼性を検出して証明することはできます。

▲海外でも同様の検討が行われており、adobeは画像のソースを特定する方法としてメタデータパラメータを使用するc2pa標準を開始した。

もちろん、積極的な防御の敷居は高くなりますので、事前に予防策を講じたり、事前に写真を処理したりする必要があります。

もっと一般的な状況は、私たちが自分自身の「ヌード写真」を受け取ることを予測する方法がないということですが、それは私たちが自分自身を「率直に」語るのは初めてでもあります。現時点では、パッシブ検出を使用する必要があります。

realai intelligence には、生成 ai コンテンツ検出プラットフォーム deepreal、顔 ai セキュリティファイアウォール realguard など、偽造品の検出を担当する一連の ai 製品があります。

▲ディープリアル

aiによるaiの識別を簡単に言うと、まず大量の偽造特徴を抽出し、次にそれらのサンプルに基づいてモデル化してaiに偽造識別のルールを学習させます。

歪んだ色、不自然なテクスチャ、不自然な表現、同期していないオーディオとビデオ、不規則な虹彩の形状、2 人の生徒の一貫性のないハイライトはすべて ai の学習素材です。

その中でも、ビデオは一連の連続した画像で構成されており、異なる画像間にキャラクターが現れるなど、単一の画像よりも多くの情報を偽造に使用できるため、画像よりもビデオの偽造の精度が高い可能性があります。アクションの継続性。

本質的に、ai の偽造は人間の目を使って欠陥を見つけるのと似ており、ai モデル自体の欠陥も悪用します。

▲中国科学院の研究者がディープフェイク検出用のaiモデルを世界にオープンソース化

しかし、欠陥は確実に徐々に改善されるため、非常に重要な疑問が生じます。まず偽造があり、次に認証があるのでしょうか?もしそうなら、偽造は常に偽造の半歩遅れていることになるのではないでしょうか?

陳鵬氏は、生成された技術は偽造技術より若干進んでいるかもしれないが、社内に赤青攻撃防御研究所を設け、ディープフェイクを防御しながらディープフェイクをシミュレートし、ディープフェイクの検出能力を継続的に向上させていると答えた。

新しいディープフェイク技術が出てきたら、すぐに再現して検出製品で検証できるため、「新しい技術が出てきたら、たとえそれを見ていないとしても、ある程度は検出できる」という。

さらに、モデル自体もある程度の一般化能力を備えており、多くのディープフェイクコンテンツを確認しており、目に見えないコンテンツに遭遇した場合は、ある程度正確に識別して検出できます。

▲ bilibiliなどのプラットフォームはaiの顔を変えるエンターテイメントコンテンツにラベルを付ける

つまり、aiの偽造と偽造検出は、長期にわたる対立と相互競争の「いたちごっこ」である。

これが、chen peng 氏が ai 偽造アルゴリズムを研究している理由です。

ディープフェイク対策はあまりにも対立的であり、多くの ai 製品とは異なり、完了したら忘れることができます。

それにもかかわらず、同氏は依然として比較的楽観的である。「法律や規制を使って監督し、プラットフォームがコンテンツを管理し、業界がテクノロジーやツールを提供し、メディアがより多くの人々にリスクを認識させる。多面的なガバナンスが一定のレベルに達すれば、間違いなく緩和になるだろう。」

将来、インターネットをサーフィンするとき、私たちはこのようなやや不条理なシナリオに陥るかもしれません。検証コードによって「私は人間である」ことを証明でき、ディープフェイクによって「私は私ではない」ということが証明できるのです。

テクノロジーがすべての悪意を完全に検出することはできませんが、人間はディープフェイクの成功は最終結果にすぎませんが、ディープフェイクの阻止はいつでも開始できます。

chen peng 氏が述べたように、非常に単純な ai 製品であっても、非常に体系的なプロジェクトです。

私たちはより大きなシステムの一部であり、被害者に声をあげ、加害者を罰し、悪事を阻止するテクノロジーを介入させ、社会の概念を少しでも改善させて初めて、恐れられないテクノロジーを目指して協力することができるのです。未来の公正な利用。

ニュース

逆襲の韓国nルーム2.0！ aiによる変面に一般人が完全に敗北したとき、彼らは魔法を使って魔法を打ち破った。

導入

私の連絡先情報