ニュース

Miss A と Serge Belongie の会話: 偽造可能な「弾丸」をください | Jiazi Guangnian

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


反証可能性は天使と悪魔の両方であり、究極的には反証可能性は世界を一致させるための握手です。

著者|Zhang Yijia Sukhoi‍‍

10年前、ヨーロッパの学者が私にこう言いました。人工知能には 100 を下らない細分化されたトラックがあり、米国は 1 つまたは 2 つの人気のあるトラックを定義する予定です。 、その後、世界的な起業家や投資家がこの2つのトラックに追いつくために殺到しました。 」

その後の10年間で人工知能のトレンドは回転し、人工知能は非コンセンサスから小さなコンセンサスへ、小さなコンセンサスから大きなコンセンサスへと移行しましたが、この文章が飛び出すことはありませんでした。

Serge 氏とのこの会話は、2 年前に彼が共同執筆した論文のレビューから始まりました。「反証不可能な主張の構造を探る」の興味。この記事が今のところほとんど注目されていないのは残念です、Google Scholar引用されたのは2回のみ

これは驚くべきことです。

「Jiazi Guangnian」は次のように信じています。このエッセイひどく過小評価されている

理由 1: この記事が直面している問題は非常に重大です (ソーシャル メディアにおける改ざん不可能なデータの根底にある物語)。

理由 2 は、この記事が重要な理論的革新 (3 値アノテーション方法と SNaCK セット) を提供することです。

理由 3: この記事では、実践的なエンジニアリング結果 (データセットの構築と詳細な実験比較) を提供します。


論文の著者 Peter Ebert Christensen、Frederik Warburg、Menglin Jia、Serge Belongie、ARXIV2022

この文書を理解するのは難しくありません。反証可能性という概念が導入され始めます。

反証可能性は反証可能性とも呼ばれます。科学哲学ではしばしば厳密な用語が使用されます。改ざん方法理論が科学的かどうかを判断するには、つまり、「これらの結論により、論理に対する反例の存在

カール・ポパーは 1934 年に、理論や仮説が既存の技術の経験的テストによって論理的に矛盾する可能性がある場合、それは矛盾していると提案しました。改ざん可能の。そして、世界がコメントする余地がないほど非の打ちどころのない表現であれば、多くの場合、それは人々を遠ざけるだけであり、科学の進歩を促進するのには役に立ちません。

科学者が研究できる、あるいは研究すべき問題には、多かれ少なかれゲートが設定されており、他の人が攻撃したり、あるいはそれを覆したりする機会が与えられる必要があります。反証可能性の目的は、理論を予測可能にして検証可能にすることです。したがって実際に役立ちます

セルジュ氏の論文「反証不可能な主張の構造を探る」議論したソーシャルメディア上の反証不可能な主張を解釈することの複雑さ

この論文の主なアイデア:

ソーシャルメディアプラットフォームには投稿やコメントが溢れており、多くの主張は反証できません。しかし、不十分な事実確認ツール、ソーシャルネットワークでの議論の構造の欠如、物語を特定することの難しさ、公開討論の質の欠如など、大変ご迷惑をおかけしております。

論文では、ソーシャルメディア上のユーザーを特定し、理解する方法を検討しています反証不可能な主張、そしてこれらの主張を次のように要約します限られた数の物語、ソーシャルメディアでのディスカッションや議論をより促進するため。

興味深いことに、著者は次のようなツールを構築しました。ペーパー公衆トイレでの手の乾燥方法 (ペーパー タオルとエアドライヤー) に関する議論、600 の短いテキストの抜粋、31 の物語、およびオンライン ディスカッションで支配的な物語を理解し発見するための 4 つのスーパーカテゴリーを含むデータセット。

本稿では、既存のファクトチェック技術の能力を超えた新しいアプローチ、デジタル通信環境における反証不可能な主張の影響の管理と理解に重要な貢献を提供します。このプロセスを使用して支配的な物語を発見し、このプロセスが最近の大規模な変換モデルや最先端の​​教師なし主題モデルよりも優れていることを示しています。 。

実験を通じて、著者が見つけた現代文コンバータを使用する(T5モデルなど)最初の文の埋め込みが鍵です 。彼らはまた、特に高品質のエンベディングを生成するには、サンプリング戦略が重要であることも発見しました。「距離-Rnd」戦略最高のパフォーマンス。

実験結果は、人間による注釈を組み合わせることができることを示しています。三つ子コンプライアンスを明らかにできる結晶化した物語興味深いクラスタリング。

引用は2件のみ

「Jiazi Guangnian」は、この論文がこれまで業界で注目を集めなかった理由としては次のようなものが考えられますが、これらに限定されません。

(1) 理論的分析は比較的弱く、実験結果の分析は定性的なものにとどまっている (11 ページのテキストには数式が半ページしかない)。

(2) 比較に使用されるいくつかのアルゴリズムの紹介がほとんどありません。

(3) この分野の学術コミュニティにはまだ統一されたデータセットがない可能性があり、その結果、学術コミュニティ内で「仲間外れ」が発生することはありません。

(4) 著者は T5 の重要性を強調したが、そのアルゴリズムの優位性については明確に述べていない。


CVPR2024でのセルジュ・ベロンジーの学術的共有、出典:「Jiazi Guangnian」撮影

上記の論文はあまり知られていませんが、セルジュ氏自身はコンピューター ビジョンと機械学習の分野で非常に影響力のある科学者であり、主にオブジェクト認識と画像セグメンテーションを研究しています。彼のさまざまな論文は合計 17 億 8,971 万回引用されています。

Serge Belongie は、コペンハーゲン大学のコンピューター サイエンスの教授であり、デンマーク人工知能パイオニア センターの所長です。以前は、コーネル工科大学でコンピュータ サイエンスの副学部長、アンドリュー H. ティッシュおよびアン R. ティッシュ教授を務めていました。

最も紹介する価値があるのは、Serge は MSCOCO の主著者です

MSCOCO データセットは、コンピューター ビジョン用の最も有名な大規模データセットの 1 つです。2000 年、セルジュ・マリクとジテンドラ・マリク (現在はカリフォルニア大学バークレー校のコンピュータ サイエンスの教授であり、コンピュータ ビジョンの分野で有名な学者)「シェイプコンテキスト」という概念を共同で提案し、これは、コンピューター ビジョンや物体認識の分野で広く使用されている形状特徴記述方法です。

2004 年、セルジュは MIT テクノロジー レビューによって 35 歳以下の若手テクノロジー イノベーターに選ばれ、2007 年には彼とジテンドラ マリクがマー賞の佳作を受賞し、セルジュは主に著者に授与される ICCV ヘルムホルツ賞を受賞しました。コンピュータビジョンの分野で基本的な貢献をした論文のリスト。

Serge は、Digital ペルソナ (2014 年に CrossMatch と合併)、CarCode (Transport Data Systems に買収)、Anchovi Labs (2012 年に Dropbox に買収)、Orpix など、いくつかの企業の共同創設者でもあります。

現在、セルジュチームは、ソーシャル ネットワーク分析の新たな次元を切り開く——従来のファクトチェックには適さない、これまで注目されなかった些細な発言の数々を起点に、課題設定を分析し、物語の操作

これは現時点で特別に重要です。

世界反ファシスト戦争後、技術的な進歩やボトルネックが交互に起こっても、時間の経過とともに歴史的状況の浮き沈みを経験しました。時間と空間の座標系で展開される「清明節の川沿い」と同じように、古代と現代の生き物の何千ものシーンと外観が満載です。

以下はAさんとセルジュさんの会話です。

公開アカウント「Jiazi Guangnian」をフォローし、バックグラウンドで「改ざんされる可能性があります」と返信すると、記事に記載されている情報を入手できます「反証不可能な主張の構造を探る」そしてMSCOCO データセット紙が2枚。

1. 反証可能性が問われている

実際の研究者は、自分の好き嫌いの物語に影響されることがよくありますが、それは Instagram のトレンドトピックに似ています。

Aさん: 「反証できないものは科学的ではない」というのが科学界の共通認識となっている。しかし、多くの哲学者はこれに疑問を抱き、反証可能性の原則は終わりのない科学的議論を引き起こす可能性があると主張した。反証可能性は科学の進歩に必要な条件なのでしょうか?

サージ一般的な意見によれば、科学理論は反証可能でなければなりません。

Aさん:これは一般的な見解ですが、反証可能性が一般的なパラダイムなのでしょうか?

サージ:機械学習に関する文献は過去 15 年間で爆発的に増加し、毎日多数の論文が出版され引用されています。これらの論文では、関連する論文のセクションで他の文献が引用されることがよくありますが、その引用文献が必ずしもその論文に最も関連性の高い文献であるとは限りません。それは文献の量が膨大だからです。研究者たちは実際に、この分野で支配的な意見に反応しています。

私たちはしばしば、自分たちをカール・ポパーの伝統に従った、反証可能な主張のみに従う科学者であると考えています。ただし、敵対的生成ネットワークやトランスフォーマーなどのテクノロジーなど、科学研究のトレンドもあります。これらの論文は科学の伝統に従うことを目的としていますが、研究者は実際、自分の好きな物語や嫌いな物語に影響を受けることがよくあります。——Instagramのトレンドトピックのようなもの

Aさん:機械学習以来、科学者は反証可能性の基準から逸脱し始めているということですか?

サージ:科学者はしばしばこうした影響を受けず、自分たちは客観的であると主張しますが、結局のところ彼らも人間であり、こうした一般的な意見に左右されることはあります。これは非科学的であり、直感や意見に基づくものであると私たちは考えています。

Aさん:ソーシャルメディアにおける反証不可能な主張をどのように定義しますか?

サージ:まずファクトチェックに関する文献について議論する必要があります。たとえば、コペンハーゲン大学のイザベル・オーゲンシュタイン教授は、声明の検証価値を決定することから始める方法を開発しました。明細書を確認させていただきますので、検証値を0~1の範囲で決定します。

たとえば、カリフォルニアの首都はサクラメントであるというステートメントは、複数の構造化された知識ベースで見つけることができるため、文法および構文のチェックに最適です。 「カリフォルニアの首都はサクラメントである」のようなステートメントを調べて、おそらく 0.99 に近いテスト容易性スコアを与えることができます。次に、それを構造化された知識ベースに送信して、答えを確認します。この深層学習ベースのテスト容易性システムは、大量のクレームとトレーニング データを処理して、さまざまなクレームの検証値を評価します。

しかし、いくつかの発言では、たとえば、「カリフォルニアへの移民は悪い」などは、より個人的な意見が反映されており、事実確認には適していません。対照的に、「2020年以降、カリフォルニアの移民数は増加し続けている」などの記述は検証価値が高い。

それで検証が難しい主張には特に注意を払います——これらの主張を直接検証することはできませんが、ソーシャルメディア上で引き起こされた議論は重要です。複数のチェックを行うことで、より適切な判断ができる可能性があります。

Aさん:あなたの研究では、反証不可能な主張を特定し、分析するためにどのような具体的な技術やツールが使用されていますか?

サージ:当社では、自然言語処理 (NLP) 技術、クラスタリングおよびグループ化アルゴリズム、機械学習手法を使用しています。

私たちの目標はグローバルナラティブ情報ファシリティ (GNIF) の作成、ソーシャルメディアコンテンツを調査および整理するため

これらのテクノロジーとツールを組み合わせることで、大量の物語コンテンツをよりよく理解し、処理できるようになります。反証不可能な主張を特定するのに間接的に役立ちます

さまざまな形式のテキストを分析できます。ツイートでもRedditのコメントでもでは、NLP テクノロジーを使用して、このコンテンツの物語とテーマを抽出して理解します。

第二に、私たちが使用したのは、クラスタリングおよびグループ化アルゴリズム 。これらのアルゴリズムは、大量のソーシャル メディア コンテンツをさまざまなテーマや物語に整理するのに役立ちます。

例えば、数百万のツイートの中から、非常に類似したツイートを数千件見つけることができます。これは、それらがすべて同じ根底にある物語を扱っているためです。

合格ナラティブクラスタリングとアサーショングループ化 、大量のコンテンツを小さなクラスターに整理し、ファクトチェッカーが各項目を個別にチェックすることなく、より効率的に処理できるようにします。このようにして、反証不可能な主張であっても、クラスタリングとグループ化を通じて識別および分類できるため、さらなる分析と処理が容易になります。

私たちは 2 つの入力、たとえば 2 つのツイートを考慮し、さまざまな物語の側面に基づいてそれらの類似性を測定します。これらは、原子力対グリーンエネルギーの議論や、乳児用粉ミルク対牛乳の議論などのトピックをカバーする可能性があります。

オンラインでは多くの激しく議論されているトピックがあり、多くの場合、偽情報キャンペーンの結果です。これらのアクティビティは非常に曖昧になる場合があります。私たちが理解しようとしているのは、これらのさまざまなステートメントが、画像、テキスト、音声ステートメントなどを含む言語またはミームの形でどのように現れるかということです。全く別のコンテンツに見える 。ソーシャル メディア プラットフォーム上で、あるトピックについて何百万ものディスカッションを収集するかもしれませんが、すべてのデータは数十の意見しか表していない可能性があります。私たちは、大規模言語モデルや深層計量学習などのテクノロジーを通じて、これらの現象を理解しようとしています。


人間による注釈付きのペアの視覚化。サブ図 (a) は、ポジティブなペア、つまり、人間によって注釈が付けられた類似または一貫した物語のペアを示しています。サブ図 (b) は、ネガティブなペア、つまり、人間によってラベル付けされた、異なるまたは矛盾した物語のペアを示しています。出典:「反証不可能な主張の構造を探る」


2.「真と偽」を超えて

すべての主張が事実確認に値するわけではなく、すべての事実確認で真または偽の結果が得られるわけでもありません。

Aさん:作成した MSCOCO データセットは、最も有名な大規模コンピューター ビジョン データセットの 1 つです。どのようにして始まりましたか?

サージ:私たちは 15 年前に物体検出の研究を開始し、200 種を超える鳥類を含む小規模なデータセット CUB200 から始めました。 COCO データセットはもともと、Microsoft Research の私の博士課程の学生である Tsung-Yi Lin の夏のインターンシップ プロジェクトでした。当時の彼の指導者は、私のもう一人の博士課程の学生である Piotr Dollá でした。このプロジェクトは、学界と産業界の研究者によるコンソーシアムに発展しました。彼らは、自然環境における日常の物体の詳細を示し、それらの名前と空間的位置を正確に注釈するデータセットを作成したいと考えています。

Aさん:データセットに MSCOCO という名前を付けました。私は「ココ」が大好きで、英語名もCocoです。

サージ:はい、私たちはみんな「COCO」という名前が大好きです。楽しくて覚えやすい名前です。

Aさん:MSCOCO データセットの出現後、コンピューター ビジョンの分野はロケットに乗るような発展を遂げました。

サージ:COCO を中心にナレッジ コミュニティがますます組織され、COCO は何百万人もの人々に使用されています。私たちは小規模に始めましたが、最終的には大きな影響を与える研究分野を発展させました。

私が初めて参加したコンピューター ビジョン カンファレンスは、同じくシアトルで開催された CVPR 1994 でした。 30年前のことですが、参加者は300人ほどでした。現在、2024 年のシアトル CVPR には 12,000 人が参加します。

Aさん:30 年が経ちますが、コンピューター ビジョンと人工知能の研究に対する一貫した情熱の原動力は何ですか?

サージ:覚えている限り、私はパターンや物事の分類に興味がありました。中学校のとき、私はネジ、ボルト、その他の留め具を分類するという授業プロジェクトを行いました。大学在学中、私は音声パターン、特に鳥やクジラの鳴き声などの生物音響学に興味を持ちました。画像に関して言えば、私が惹かれたのは指紋と顔でした。

動画から唇を読み取る方法を調べてみました。オーディオとビジョンの融合、異なるスピーカー間の違い、計算上の課題など、この問題のあらゆる側面に私は興味を惹かれます。 1990 年代初頭、デジタル カメラが登場したばかりでしたが、まだいかなる形式の計算による理解もありませんでした。今では、ビューファインダーに顔検出フレームがあることや、家族全員の写真をインテリジェントに整理するフォト アルバム ソフトウェアがあることを当然のことと考えるかもしれませんが、当時はそんなものは存在しませんでした。

そのとき私は、この技術に対する需要は非常に大きいだろうと感じましたが、同時にテクノロジーの背後にある数学も好きです 。これらの分野で使用されるテクノロジーは好きでしたが、数学や物理学を専攻したいとは思いませんでした。サウンド、ビデオ、画像処理の問題を解決するために複雑な数学的手法を使用するなど。

このような仕事をすることが、この世界での私の使命であると常々感じています。

Aさん:今年の CVPR ではどのような学術的な共有を行いましたか?

サージ:私のチームはメインの CVPR カンファレンスに複数の論文を提出し、2 つのセミナーでも論文を共有しました。レポートの 1 つはコンピューター ビジョン研究の歴史に関するもので、主に若い学者が古典的なコンピューター ビジョン テクノロジ、つまり深層学習やトランスフォーマー以前のテクノロジを理解するのに役立ちます。また、2011 年の CUB200 データセットの拡張バージョンのリリースから始まった Visipedia プロジェクトについても紹介しました。現在、Visipedia の研究内容は数万の植物、動物、菌類にまで拡大しており、自然界における物体認識の重要な研究基盤を提供しています。

もう 1 つのレポートは、私が今日のインタビューで共有することに焦点を当てたいもので、特にソーシャル メディアの発展の文脈における、ナラティブ、世論、誤った情報に関連しています。

Aさん:あなたの仕事は現場にどのような革新をもたらしましたか?

セルジュ氏: 偽情報とソーシャルメディアの世界における古典的な問題は事実確認ですたとえば、コペンハーゲン大学では関連する研究が数多く行われています。一般的なアプローチは、検証が必要な特定の発言について、人工知能システムを使用して関連する事実を検索し、その事実に基づいて 0 から 1 の間の信頼性スコアを予測するというものです。

Aさん:このアプローチにはどのような課題がありますか?

サージ:この方法自体には大きな問題はありませんが、課題は問題自体から生じます。すべての主張が事実確認に値するわけではなく、すべての事実確認で真または偽の結果が得られるわけでもありません。たとえば、「パンダは中国の国宝である」という発言は、構造化された知識ベースと大量のデータを通じてモデルをトレーニングし、信頼性を検証するために使用できます。 「カリフォルニアに移動する」という文ではそうではありません。

Aさん:では、後者のような発言に研究の可能性があると考えているのですか?

セルジュ氏: この後者のタイプの発言は十分に研究されていませんが、同様に重要な問題です。これらの発言には真/偽の厳密な定義はありませんが、ソーシャル メディアで多くの議論を引き起こします。この課題は、ニュースメディアのみがファクトチェックを必要としていた時代には存在しませんでしたが、今日の高度に発達したソーシャルメディアでは、白熱した議論を引き起こしたり、科学的に特徴付けることが困難であったり、改ざんが不可能なタイプのトピックが非常に多くなりました。研究する価値がある。

Aさん:実際に影響を与えた、あるいは深刻な紛争を引き起こした事例を教えていただけますか?

サージ:この質問をしていただいてうれしいです。興味深い例を挙げましょう。公衆トイレで手を洗った後、手を乾かすには 2 つのオプションがあります。中国ではどのような方法が一般的か分かりませんが、ヨーロッパではペーパータオルを取り出すか、熱風乾燥機を使用することができます。

Aさん:これら 2 つの方法は中国でも最も一般的です。

サージ:乾燥機やペーパータオルのメーカーは、ホテルチェーンと契約を結ぶことで多額の利益を得ることができ、市場全体で数十億ドルの収益を生み出す可能性がある。しかし、ヨーロッパの多くの人々は現在、この 2 つの方法の違いについて非常に強い見解を持っています。多くの人は、これらの方法のいずれかが病気を蔓延させる可能性があると言う一方で、大量の電気を使用したり紙を製造したりすると木が無駄になり環境破壊を引き起こすと言う人もいます。こうした見解を持つ人のほとんどは公衆衛生や環境の専門家ではありません。

Aさん:主張自体は真実ですか?

セルジュ氏: ソーシャルメディア上の多くのトピックは厳密に証明したり改ざんしたりすることができないため、実際のところ、私たちは自分たちの発言の信頼性を気にしていません。しかし、この話題が取り上げられるのは、ある方法が別の方法よりも優れていることを少数の人々が大衆に納得させたいからです。彼らはおそらく何十万ものボット生成コンテンツを作成しました。最近、ソーシャル ネットワークでペーパー タオルとエアー ドライヤーに関する議論を検索すると、何百万ものコメントが見つかります。私たちの研究は、2 つのアプローチの長所と短所を厳密に比較し、事実確認の結果を提示することに焦点を当てていません。私たちは、これらの設計された問題を検出することに重点を置いています。

3. ソーシャルメディアに設定された「COCO」データ

性急な決断は避けてください。

Aさん:あなたの研究は別の次元を切り開きましたね。従来のファクトチェックは意味論の真実に焦点を当てていますが、あなたの研究は声明や主張の真実に焦点を当てています。クリア語用論——予測の目的は、それが正しいかどうかに限定されず、特定の目的を達成するためにソーシャル ネットワーク上で一部のユーザーや多数のロボットによって作成されたトピックの議論にまで及びます。この研究が何を意味するか知っていますか?

サージ:はい、私たちはまったく新しいものを作成しています。私たちが知っている関連研究のほとんどは、事実確認のみに焦点を当てています。しかし私たちは、トピック関連の自然言語テクノロジーを使用してソーシャル メディア上のディスカッションをグループ化およびクラスター化し、個人、企業、戦略立案者がソーシャル メディアで何が起こっているのかを理解できるようにしようとしています。これらのテーマや議論の内容について価値判断を行うのではなく、それぞれの問題がどのような形で提起されているかを客観的に示すだけです。

Aさん:この目標を達成するには、まずデータセットが必要です。このデータセットの構築は大きな課題となるはずです。コンピューター ビジョン研究の先駆けとなったとき、小鳥のデータセットから COCO まで拡張しました。今回はどのようにアプローチしましたか?

サージ:この種のソーシャル ネットワーキング行動は、多くの場合 1 つの特徴によって特徴付けられます。 1 つのトピックに関して 100 万件のツイートがあり、数千のアカウントがディスカッションに参加しているように見えます。しかし、分析を通じて、これらのツイートのうち 10 万件が実際にまったく同じ内容を投稿しており、非常に似た、あるいはまったく同じ内容であることが判明する可能性があります。ただし、これはこれらの議論が正しいか間違っているかを意味するものではないことに留意してください。ユーザーがさまざまなステートメントのクラスターやグループを確認できるようにすることで、ファクトチェッカーやソーシャル ネットワーク アナリストが、突然の何百万ものツイートの流入に対処することなく、大量のコンテンツを処理して理解することが容易になります。

Aさん:このシステムは、ソーシャル メディア上で物議を醸しているさまざまなトピックをリアルタイムで処理できますか?

サージ:私はそれができると思いますし、そう願っています。地中海でロシアとアメリカの二隻の船が出会ったとします。ソーシャルネットワーク上で議論が始まり、物語が生まれます。船長の声明や携帯電話の録音など、新しい情報が数時間ごとに表示されます。この場合、一部の物語や問題は注目を集めますが、他の物語や問題は無関係になる可能性があります。

Aさん:そう願っていますねリアルタイム問題を把握する

サージ:およびその他の情報。私たちはプロの外交官を支援するために、ダッシュボード(ダッシュボード)は、包括的な関連情報を提供し、これらのイベントを世界の文脈に位置づけます。このシステムでできることは、人々が性急な決断を下さないようにする 。強調したいのは、システム自体がどちらが正しいかを判断するものではなく、総合的に情報を整理するものであるということです。

Aさん:信頼性の高い機能を実現するには、どのような問題点に対処する必要がありますか?

セルジュ氏: 従来の課題と新しい課題の両方があります 。従来の課題には、言語、文化、感情的な偏見の影響が含まれます。

例えば、 「人魚姫」と「みにくいアヒルの子」はどちらもデンマークの作家による作品ですが、ディズニー映画版の物語はアメリカ文化に合わせて調整されています。ソーシャル ネットワーク上では、デンマークの物語よりもアメリカの物語の方が優勢であるため、アンデルセンの物語のオリジナル版は、他の多くの国のインターネット ユーザーの間でほとんど知られていません。

データのアノテーション、特にソーシャル ネットワーク データのアノテーションのプロセスでは、言語と文化の影響を受けます。別の例としては、センチメント分析がすでにファクトチェックの重要な部分となっており、センチメント予測モデル自体がトレーニング中に多くの偏見や固定観念を持っている可能性があります。AI モデルのトレーニングはガベージインとガベージアウトのプロセスであるため、トレーニングデータによって引き起こされる問題を解決するのは困難です。そのため、モデルがどのようなトレーニングデータを使用しているかを理解する必要があります。人間の関与を伴わないファクトチェックは存在しない(信頼できない)と言えます。

Aさん:新たな課題とは何でしょうか?

Serge: 言語モデルによって生成される偽のコンテンツは、私たちが直面する新たな課題です。以前の偽のソーシャル メディア アカウントには、従うべき非常に単純なパターンが多かったです。しかし、GPT と画像生成モデルを使用すると、偽アカウントの作成者は、より複雑で自然な偽のプロフィールを生成し、本物に見える偽のソーシャル メディア アカウントを生成できます。これらのアカウントは、従来の偽アカウント識別モデルでは簡単に見つけることができません。これらの生成 AI モデルは、従来のファクトチェック タスクにも同様の課題をもたらします。したがって、生成 AI は誤った情報を作成し、特定しますが、これはこの時代のいたちごっこになります。

4.AIの未来

彼ら(OpenAI)はまだ私たちの計画を知らないかもしれません。

Aさん:これらの課題はモデルだけで解決できるものではなく、AIと人間の連携という次元にまで到達する可能性があるようです。あなた思われる常に新しい次元で新しい問題を発見し、シンプルな視点から解決します。

サージ:はい。私たちの新しいアイデアはウィキペディアに例えることができます。かつて人々は、同じ Wikipedia ノードに必要なのは、同じセマンティクスを持つ異なる言語のページだけであると考えていました。実際には、異なるのは言語だけではありません。

言語、文化、価値観、伝統、すべての要素が同じエントリの異なるページに混在しています。たとえば、原子力と化石燃料は、言語や世界の地域によって、まったく異なる扱いを受けています。したがって、これは、私たちが構築しようとしている AI システムが純粋に自動化されたものではなく、スタンドアロン モデルでもないことを思い出させます。これは人間が関与するシステムです。つまり、データにラベルを付けて整理し、さまざまな部分すべてを説明するには、世界中のさまざまな人間のコミュニティが必要です。偏見は常に存在するため、これは大きくて深刻な問題です。

Aさん:したがって、MSCOCO と同様に、データをできるだけ包括的かつ公平に整理すること自体がこの研究の目標です。

サージ:これは、さまざまな種類のコミュニティを組織するプロセスです。世界のさまざまな地域で、さまざまな年齢の人々が文学、歴史、科学などのさまざまな専攻を勉強しており、それぞれの分野には独自の物語があります。私が説明する研究が成功するためには、さまざまなトピックを理解するための多くの注釈が必要ですによる彼らは専門家である必要はありませんが、物語や問題の類似点を知るには、原子力エネルギー、起業家精神、暗号通貨など、タグ付けされるコンテンツに関するある程度の知識が必要です。したがって、最大の課題は、基本的な AI コンピューティングおよびストレージ設備ではなく、コミュニティの組織化です。

Aさん:サム・アルトマンやヤン・レクンはあなたの考えについてコメントしましたか?

セルジュ: 彼らはまだ私たちの計画を知らないかもしれません。

Aさん:私はイニシアチブの最初の段階を目撃しているようです。より高い次元で問題を発見し、最も直接的な入口点を見つけます。

Serge: 多くのテクノロジーと同様に、このインフラストラクチャを問題検出のために開発すると、良くも悪くも使用される可能性があります。したがって、多くの商用 AI とは異なり、私たちは、オープンで透明性があり、監査可能な管理システムの開発に努めます 。したがって、完全に透過的なナレッジ ベースが得られ、ユーザーはデータがいつ含まれたのか、どのアノテーターによって注釈が付けられたのかなど、データの編集履歴を確認できるようになります。

Aさん:データの正確性と客観性を確保するにはどうすればよいでしょうか?

サージ:簡単な答えは次のとおりです。私たちは保証できません

しかし、私たちにできる最善のことは、さまざまな議論分野に興味を持つ何万人もの人々がシステムに注釈を付けることができるシステムを作成することです。できるだけ多くのアノテーターがいると、統計的な客観性をもたらすことができます。ウィキペディアには透明性と説明責任を目的としたメカニズムもあり、私たちも同様のことを行うつもりです。

Aさん:この研究は政策立案者、教育者、技術者にどのような影響を与えるでしょうか?

セルジュ: 私たちが行っていることは、論理的または事実に基づく推論を補完するものだと考えてください。

ある企業が多様性、公平性、包括性を向上させたいと考えているとします。そこで取締役会は会議を開き、より多くの女性や少数派の雇用について話し合った。この種の議論は多くの企業でよく行われており、たとえば、ある大学では電気工学を学ぶ女性が少ない可能性があり、同学部はそれを変えるための措置を講じたいと考えています。このような会議では、知識や情報に裏付けられていない議論が数多く行われることがあります。

女性は数学が苦手だという偏見のある意見を言う人もいます。必要とされているのは、こうした議論を主導する必要がある学部長、CEO、または教師を支援できるシステムであり、彼らはシステムから一連の物語を抽出して議論を構造化することができます。さらに、システムが動作を開始すると、ステートメントのインデックスを作成し、解析して既存の物語を作成します。このようにして、CEO、教師、または会議の進行役は、低品質または混乱を招く会話を回避し、議論を導き、冗長な会話を防ぐ効果的な構造と分類システムを備えることができます。

Aさん:将来のソーシャルメディアのナラティブと問題分析について、技術開発の潜在的な研究の方向性は何だと思いますか?

サージ:さまざまな分野には、それぞれ独自の課題があります。それらの中には、大量のデータの処理とそれらのラベルの付け方、バイアスの軽減方法などの古典的な問題もあります。しかし、視覚化に関しては大きな課題にも直面しています。

さまざまな言語や文化が直面する違いについて先ほど触れました。それぞれの特定のトピックには多くの異なる視点があり、異なるアノテーターは独自の偏見により異なるアノテーションを提供します。情報理論の観点から見ると、これらの多様なアカウントを圧縮しようとすると、情報の損失または破損が発生する可能性があります。この種の質問はプロジェクト全体を通じて発生し、頻繁に遭遇します。

Aさん: ビジュアル テクノロジーの最新の発展は、将来に大きな影響を与えると思いますか?

サージ:現在、ますます多くの研究者が、画像、テキスト、音声などの複数のデータ タイプを 1 つのモデルで同時に処理するマルチモーダル データに注目し始めています。この方法では、通常、複雑な実際的な問題を解決するために Transformer などのモデル アーキテクチャが使用されます。 。私はこの傾向は今後も続くと信じており、将来人工知能の分野に初めて参入する人は、自然言語処理やコンピューター ビジョンなど 1 つの分野だけを掘り下げるよりも、複数の専門スキルを同時に習得する方が自然であると考えるようになるでしょう。

個人的には、人工知能が医師に完全に取って代わると主張する人もいますが、これは言い過ぎだと思います。しかし、放射線学、皮膚科、病理組織学などの分野では、AI 支援システムが普及し、すべての人に恩恵をもたらすと私は確信しています。

自動運転車に関しては、ビジョン技術や人工知能の進歩により自動運転車が普及するだろうという予測が過去にありましたが、私はその可能性は低いと考えています。政府が従来型車の特定車線での走行を制限するか全面的に禁止する措置を講じない限り、米国で自動運転車が標準になる可能性は非常に低い。

Aさん : あなたの紙が好きです。私の考えも似ています。テクノロジーの発展は、同時に新しい認知的次元を解き放ちます。最も価値のある方法論は、最小限の入り口を持ちながら、全体的な状況を放射できる方法論です。

サージ:どのような方法論に最も興味がありますか?

Aさん:小さな例を挙げてみましょう。反証可能性の道に沿って、科学は否定の否定の反復的な道を歩み始めます...私たち全員がよく知っている科学革命の構造に戻ります。

※杭州氏もこの記事に寄稿しました。

この記事には学術的な議論が含まれているため、著者について簡単に紹介します。

  • Jiazi Guangnian の創設者である Zhang Yijia 氏は、2013 年に北京大学数理学部を卒業し、国立開発研究所で経済学の二重学位を取得し、中国数学オリンピックで金メダルを獲得し、数学オリンピックの出場者に選ばれました。国家トレーニングチームの一員であり、研究対象は金融数学とゲーム理論であり、北京大学数理学部の所長を兼任しています。

  • Jiazi Brain の責任者である Zhou Hang 氏は 2019 年に北京大学数理学部を卒業し、研究の方向性はスパース最適化と非凸最適化です。


※参考文献
  • 反証不可能な主張の構造の探求.pdf

  • 978-3-319-10602-1_48.pdf 「Microsoft COCO: Common Objects in Context」 MSCOCO データセット: Serge の最も引用された論文。

  • トーマス・サミュエル・クーン「科学革命の構造」


公開アカウント「Jiazi Guangnian」をフォローし、バックグラウンドで「改ざんされる可能性があります」と返信すると、記事に記載されている情報を入手できます「反証不可能な主張の構造を探る」そしてMSCOCO データセット紙が2枚。

|Aさんダイアログシリーズレビュー|