ニュース

Google DeepMind が AI 数学的推論の上限を突破: 国際数学オリンピックの問題 6 問中 4 問を解決

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House は 7 月 26 日、Google DeepMind チームが昨日 (7 月 25 日)、開発した AlphaProof モデルと AlphaGeometry 2 モデルが数学の高度な推論問題を解決できると述べたブログ投稿を公開したと報告しました。国際数学オリンピックのパズルを解く際に銀メダル基準を達成。

AI モデルの概要

  • AlphaProof: 強化学習に基づく新しい数学的形式的推論システム。

  • AlphaGeometry 2: ジオメトリ問題解決システムの改良版。

DeepMind チームは 2 つの AI モデルを組み合わせ、今年の国際数学オリンピック (IMO) の 6 問中 4 問を協力して解決し、初めて大会の銀メダリストと同じ結果を達成しました。

得点チーム

DeepMind チームの 2 人の専門家が IMO 採点ルールに従って採点しました。2 人の専門家は次のとおりです。

  • サー・ティモシー・ガワーズ教授: 有名な数学者、IMO金メダリスト、フィールズメダリスト。

  • ジョセフ・マイヤーズ博士: 2度のIMO金メダリストであり、IMO 2024年問題選定委員会の委員長

AIモデル推論

AI は、IMO の 6 つの質問をモデルが理解できる数学言語に翻訳します。

AlphaProof は、答えを決定してその正しさを証明することによって、2 つの代数問題と 1 つの数論問題を解決しました。解決された問題のうち 1 つは、今年の IMO でわずか 5 人のプレーヤーによって解決された、コンテストで最も難しいものでした。


AlphaGeometry 2 はジオメトリの問題を示しますが、2 つの組み合わせ問題は解決しません。


AIモデルの結果

IMO のルールによれば、6 つの質問はそれぞれ 7 ポイントの価値があり、合計スコアの最高点は 42 ポイントです。

DeepMind システムは最終的に、すべての質問で満点の 28 ポイントを獲得しました。これは、シルバー グループの最高スコアに相当します。


2024年の金メダル基準は29点から始まり、公式大会では出場者609名中58名が金メダルを獲得した。

ITホームは参照アドレスを添付します