ニュース

AlphaGoに敗れたイ・セドルは崩壊した世界を再建するのに8年を費やした

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


AIに負けて、世界が崩壊したような気分です。

イ・セドルはニューヨーク・タイムズとの最近のインタビューでこう語った。


2016年、14回世界チャンピオンに輝いた韓国のチェスプレイヤーは人間の代表としてGoogleのAlphaGoと対戦し、最終的には1対4で敗れた。

招待を受けたとき、彼はそれが「楽しい」経験になるだろうと考えました。

楽しいの前提は勝てると思うこと。まさか負けるとは思わなかった。

これはおそらく、ChatGPT で AI テクノロジーがデビューする前の最も重要なハイライトの 1 つでした。

ChatGPT のリリースから 2 年も経たないうちに、私たちは多くの分野が AI の影響を受けるのを目の当たりにし、生活のより多くの側面が変化の予兆となっているように見えます。あい。

この文脈において、他の業界や分野よりも早く AI の影響を受けた囲碁の世界は、すでに起こっている可能性を知るのに役立ちます。

人間を倒した後、より強力なAIはさらに非人間化する


囲碁を楽しめなくなったので引退しました。

AlphaGoとの対戦から3年後、イ・セドルは正式に引退を発表した。

5歳から囲碁を学び始めたイ・セドルにとって、囲碁は単なる競争ではなく、プレイヤーの個性やスタイルの延長である芸術であるが、AI時代にはそれが「縮小」されてしまった。アルゴリズムによる効率化ゲーム。

この 3 年間に、実は別のことが起こりました。

2017 年、DeepMind は AlphaGo の新しいバージョンである AlphaGo Zero を発表しました。

AlphaGoは人間の達人による3000万手以上のニューラルネットワークの学習と自己練習から生まれましたが、AlphaGo Zeroは最初から「人間のタッチ」から切り離されており、トレーニング期間中は一切触れませんでした。人間のチェスの記録は、それ自身とそのチェスのトレーニングのみに依存していました。

わずか 3 日で、AlphaGo Zero はすでに AlphaGo に対して 100 対 0 で勝利しました。

アトランティック紙はこれを「人間から何も学ぶ必要のないAI」と呼んでいます。


囲碁には、一見単純で取るに足らないように見えても、長期的には致命的な脅威となり得る「幽霊」のような手法がある。

AlphaGoとAlphaGo Zeroの棋譜は、直接的には「異星文明が落とした謎の案内書」とみなされるほど難解である。

アメリカのプロチェスプレイヤー、マイケル・レドモンドは2017年、人間が囲碁を学ぶための重要な手段の一つはストーリーを構築することだと述べ、「それが私たちのコミュニケーション方法だ。それはとても人間らしいことだ」と語った。

これは、チェスをプレイするとき、チェスプレイヤーも人間としての自分の一部を見せるというイ・セドルの指摘と共鳴するかもしれない。

レドモンド氏は、自身の観察に基づいて、人間のチェスプレイヤーは初めて「AI風味の」チェスを見たとき「手を上げて降参する」可能性が高いと付け加えた。

AlphaGo のチェスのやり方は常に非常に「非人間的」に感じられ、そのようなチェス ゲームに直面すると、私たちが参加することさえ困難です。

最初に影響を受けた囲碁名人の一人として、イ・セドルは長い間手放すことができなかった。

彼はAIに夢中になりました。


引退後、イ・セドルは自身の囲碁アカデミーを開き、書籍を出版し、囲碁をベースにしたボードゲームを発売することに加えて、AIに関する講義も始めた。

私は非常に早くから AI の問題に直面し始めましたが、他の人も同様に経験するでしょう。それはハッピーエンドには繋がらないかもしれない。

彼にとって、AI の最も懸念される側面は、AI が人間の価値観を変える可能性があることです。

以前は、人々は創造性、独創性、革新性に畏敬の念を抱いていましたが、AI の出現以来、その多くは消え去りました。

誰もがこの声明に同意するわけではありません。

人と機械の共創の時代


AIは囲碁界の既存の秩序をすべて破壊し、それを再構築し始めた。

コーネル大学で人工知能を研究する囲碁愛好家、Jiuheng He氏はこう語る。

多くの囲碁アカデミーでは、AI を使用して囲碁を学習することは、ほぼすべてのプレイヤーが通過する必要があるプロセスです。

香港の囲碁アカデミーでは、Ng Chee Man 氏が AI を使用して囲碁を学ぶために生徒に iPad を提供しています。

生徒がチェスをプレイするたびに、AI は「最善手」の提案を表示します。同時に、システムは生徒がどの手をうまく打ったのか、どの手が良くなかったのかも記録します。


昨年、米国科学アカデミー紀要に発表された研究では、AIが囲碁界に参入して以来、人間のプレイヤーの判断能力が向上したと指摘されている。

AlphaGoがイ・セドルを破る前の2016年には、プライベートテストでAlphaGoと対戦したファン・ホイも同様の経験をしていた。

ファン・ホイさんは負けたものの、AlphaGoのおかげで囲碁を新たな視点で見ることができ、スキルも向上し、すぐに世界ランキングを上げることができたと語った。

2023年の調査は、580万手のデータを含む、1950年から2021年までに蓄積されたチェスの記録に基づいている。

研究者らは、AlphaGoがイ・セドルを破るまで、人間のチェスプレイヤーの判断の質は66年間安定しており、基本的に変化していなかったが、2016年から2017年にかけてチェスプレイヤーの判断の質が上昇し始めたことを発見した。

言い換えれば、人間のチェスプレイヤーはAIチェスプレイヤーに勝つことはできないかもしれないが、彼らの判断能力は確かに向上しているということだ。

人間のチェスプレイヤーがこれらの新しい手をいかに迅速に適応し、自分たちの手法に組み込むことができるかを見るのは、非常に刺激的です。 これらの結果は、人類がこれらの発見に適応し、それを基礎にして潜在能力を大幅に向上させることを示唆しています。

DeepMind の主任研究員であり、AlphaGo プロジェクトのリーダーである David Silver 氏は、この研究についてコメントしました。


2017年にAlphaGoに敗れた柯潔氏も、2023年には試合以外では本物の人間と練習することはほとんどなく、AIは囲碁における創造性の源にもなっていると信じていると語った。

創造性とは、単に何か違うことをするということではありません。今、囲碁における革新のほとんどは、これまでとは異なるゲームをプレイしたい場合、その可能性が高くなります。 AIが通るから負ける 実戦をたくさんして、今までとは違う考え方を思いつく、これが創造性です。

さらに、別のプロ棋士のパフォーマンスも特に興味深いものです。

韓国のチェスプレイヤー、シン・ジンジンは、2000年以降に世界選手権で優勝した最初のチェスプレイヤーであり、長期にわたるAIのトレーニングと研究で有名であるため、チェスファンからは「シェンゴン・インテリジェンス」とよく呼ばれています。


シン・ジンソクは今年2月、第25回農心杯で中国主将グ・ジハオを破り、単シーズン6連勝、シーズンを通じた16連勝を達成し、前任者のイ・チャンホを上回った。今年3月、彼はAIとの関係について次のように語った。

AIと私は友達になったような気がします。 自分より優れたAIと一緒に勉強しました。 AI と人間の思考はまったく異なります。AI は数学的アルゴリズムを通じて問題を解決します。私は AI の思考から多くの恩恵を受けました。

今後、中国、韓国、日本のプロ選手がAIを使ってトレーニングを行うようになる。

「AI味」の黙示録


生成 AI の時代と同様に、一部のデザイナーや作家は、長い間 AI と統合されてきた、いわゆる「AI の風味」が作品に含まれているため、複雑な自己認証を行う必要があります。また、「AIフレーバー」の出現にも様々な課題が生じています。

現在の囲碁ゲームでは、勝率を予測するためにAIが使用され、AIが最適な手を推奨することがよくあります。したがって、観客は試合を観戦する過程で一種の「主導権」を得ることができ、複数の視点を持つことができます。

2022年、中国の棋士、李玄豪は沈真真との対局中に、AIの最適な判断によって予測されたトップ3と一致する多くの決定を下したため、チームメイトの楊鼎新はAIによる不正行為の疑いを疑問視した。

1995 年生まれの李玄豪さんは、「一年中、9 時から 9 時まで働き、熱心に AI のトレーニングに取り組んでいます」。そのため、チェスゲームはいわゆる「機械風味」であると見なされることもあります。


この疑惑については、中国囲碁協会が調査を行った結果、最終的には告発に証拠がないと判断し、楊鼎新氏に罰則が科せられた。

しかし、AIを使った不正行為のケースは存在します。

2020年、韓国の13歳のプロチェスプレイヤー、キム・ウンチのオンライン対局での指し手とAIの推奨が92%重複していることが判明した。調査の結果、最終的に彼が不正行為を行ったことが判明し(本人もそれを認めた)、罰金と1年間の停職処分が科せられた。

2022年、中国の棋士、劉瑞之はAI不正行為で有罪判決を受け、AI不正行為で正式に処罰された中国初のプロ棋士となった。キム・ウンチと比較すると、劉瑞之は「AI風味」を避けることを学び、いくつかの重要なポイントでのみAIを使用しています。

これに応じて、さまざまな国の競技会が AI 不正行為対策メカニズムを絶えず改善しています。

一方で、AIを倒すために「AIフレーバー」を利用する人もいる。

2023年、アメリカのアマチュアチェスプレイヤー、ケリン・ペリンが囲碁AI KataGoを破った。

KataGo は最も強力なオープンソースの囲碁 AI の 1 つであり、韓国はこれを囲碁プレイヤーのトレーニングにも使用する予定です。

ペルリンは FAR AI と呼ばれるプログラムを使用して KataGo と 100 万以上の対局を行い、最終的に FAR AI は KataGo の弱点を発見し、それを人間対マシンの対決で実践し、勝利しました。

この戦略は決して子供っぽいわけではありませんが、習得するのが特に難しいわけでもありません。

次に、彼は同じ方法を使用して、別の比較的強力な囲碁 AI である Leela Zero を破りました。


戦略の鍵は、相手のチェス駒のグループを囲むように大きな「円」を作成し、突然駒を関係のない別の隅に移動して AI を妨害することです。

ペリーヌ氏は、もし人間のチェスプレイヤーだったら、円を見たときに間違いなく何かが間違っていることに気づくだろうが、AIはそれに気づかないだろうと述べました。

この弱点は少し「トリッキー」なように思えますが、AI にターゲットを絞ったトレーニングを実行させることで修正できるでしょうか。

Nature 誌の先週のレポートは、今年のプレプリント論文を引用し、特に AI の弱点を探すプログラムに直面して、モデルの脆弱性を修正するのは想像ほど簡単ではないと指摘しました。

今回「狙われた」のはKataGoだった。研究者らは、KataGo の反撃能力を高めるために 3 つの異なる戦略を使用しました。

  • KataGo にセルフプレイを通じて攻撃への対応方法を学習させます。
  • 反復トレーニングでは、攻撃プログラムを使用して KataGo を攻撃し、脆弱性を KataGo にフィードバックし、セルフプレイまたはその他の方法で対処方法を学習させ、その後、攻撃プログラムを使用して KataGo を攻撃するというサイクルを繰り返します。
  • 別のニューラル ネットワーク モデルを使用して、新しい Go AI システムを最初からトレーニングします。

これらのトレーニングは KataGo の防御能力をある程度向上させるのに役立ちましたが、攻撃プログラムは依然として抜け穴を見つけて、それぞれ 91%、81%、78% の勝率で KataGo を破ることができます。

これらの攻撃プログラム自体は優れた囲碁AIではなく、人間には簡単に倒されてしまいます。

もちろん、ここで重要なのは、人間とAIのどちらが優れているかを競うことではありません。

重要なのは、囲碁はAIによって「破壊」された分野であり、長年の応用と改善を経ても、そのAIには依然として多くの問題が残っているということだ。この論文の著者であるアダム・グリーブ氏は次のように述べています。

Go のような単一ドメインでこの問題を解決できない場合、短期的には ChatGPT のようなモデルでジェイルブレイクを修正できる可能性は低いと思われます。