ニュース

中国の5連覇が終わり、アメリカがIMO王座に返り咲き! 最初の質問でAI IQは元の形に戻った

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


新しい知恵のレポート

編集者:Taoziはとても眠いです

【新しい知恵の紹介】 IMO 2024 の最終結果がついに発表されました。前例のないことに、4 年後、米国チームが再び優勝し、中国チームを 2 ポイントリードしました。 LLM の場合、最も単純な最初の質問 IMO、GPT-4o、Claude 3.5 Sonnet、およびその他のモデルはすべて回答できませんでした。

中国のIMOチャンピオンシップ5年連続優勝記録がアメリカチームに破られた!

第65回IMOはここ数日、最終優勝国チームを発表し、米国が192点で1位、中国が2点差で2位となった。

注目すべきはインドチームが初めて4位に躍り出たことだ。


中国とアメリカのIMOチームはともに金メダル5個、銀メダル1個を獲得した。

IMO は、世界中から優秀な若い数学者が集まる世界最高峰の高校数学コンテストです。

今年は108の国と地域から609名の学生が参加しました。


中国チームのハオジャ・シー選手は2回連続で個人スコア満点を獲得し、満点を獲得した史上7人目の選手となった。

アメリカの選手アレキサンダー・ワンとジェシカ・ワンは、個人ランキングでそれぞれ3位と5位にランクインした。


チームメンバーは6人で、そのうち4人は中国人です。


左から右:ジェシカ・ワン、アレキサンダー・ワン、タイガー・チャン、ジョーダン・レフコウィッツ、カール・シルドクラウト(副リーダー)、クリシュナ・ポタプラガダ、ライナス・タン

2024 年の米国 IMO チームのメンバーは次のとおりです。

- ジョーダン・レフコウィッツ、17歳(コネチカット州)

- クリシュナ ポタプラガダ、18 歳 (イリノイ州)

- ジェシカ・ワン、18 歳 (フロリダ州)

- アレキサンダー ワン、16 歳 (ニュージャージー州)

- チャオ (タイガー) チャン、16 歳 (カリフォルニア州)

- ライナス・タン、18 歳 (カリフォルニア州)


ジェシカ・ワンは、2007年以来米国IMOチームに加わった初の女性です。グランドスラムの個人成績はありませんが、それでも4つの満点を獲得しました。

それ以前は、彼女は数学でトップの生徒でした。

昨年、高校生のジェシカ・ワンさんは、MIT 主催の第 15 回女性のための数学 (MP4G) コンテストで 3 連覇を達成しました。


コンテストでは、ジェシカは 20 問中 17 問に正解し、この MP4G コンテストで最も成功した参加者になりました。

彼女はヨーロッパ女子数学オリンピック (EGMO) 大会にも 4 年連続で参加し、2 回優勝しました。


Alexander Wang は、ニュージャージー州ミルバーン スクールの新入生です。

彼にとって、数学は興味深く、きちんとした科目です。ワンさんは幼稚園の頃から数学に非常に興味を持っていました。

より多くの学生が数学を学び、数学の興味深い側面を発見できるようにするために、彼はアンジェリーナ ワンとビル サンと協力して非営利団体であるインパクト ラーナーを設立しました。

彼はIMO 2023アメリカチームのメンバーでもあることは言及する価値があります。彼は 2023 年のルーマニア数学マスターズで個人金メダルとチーム優勝を獲得し、MATHCOUNTS 全国大会にも 2 回選出されました。


ライナス・タンさんは、ネバダ州リノにあるデイビッドソン・アカデミーのオンライン授業に出席しています。 2021 年にはスタンフォード数学選手権の組合せ数学で優勝しました。

2022 年の春、彼は「ブルガリア ソリティア」と呼ばれるゲームの数学的原理を研究しました。

ライナス君はまだ 1 歳のとき、初めての数学賞「数学カンガルー」を受賞しました。彼は、子供の頃、ジグソーパズルをプレイして多くの時間を費やし、視覚化能力を鍛えたと言いました。


IMO指導者の交代から10年

特筆すべきは、今回のアメリカチームの勝利にはプロジェクトリーダーが関係しているということだ。

2014年以来、米国IMOチームは中国人数学者でCMU教授のポーシェン・ロー氏が率いており、彼は2015年、2016年、2018年、2019年に米国チームを率いてIMO金メダルを獲得した。


2019年には中国チームと米国チームが同率1位となったが、4年後は中国チームが首位となり、米国チームは世界2位となった。


今回、ジョン・バーマンが米国IMOチームの責任者に就任した。

彼は、2018 年に MIT で数学の学士号を取得し、バージニア大学で数学の博士号を取得しました。現在、彼は Geodemath オンライン コースの講師も務めています。


チームが勝利した後、バーマンは祝うメッセージを投稿した。


IMO 2024 テストの問題

この国際数学オリンピックには 6 問の問題があり、解答時間は 9 時間です。

以下は完全なテスト用紙の内容です。興味のある友達は試して挑戦してください。



最初の質問の分析: https://www.youtube.com/watch?v=50W_ntnPX0k

2 番目の質問の分析: https://www.youtube.com/watch?v=VXFG1t_ksfI

3 番目の質問の分析: https://www.youtube.com/watch?v=ASV1dZCuWGs

4 番目の質問の分析: https://www.youtube.com/watch?v=WnZv3fdpFXo

5 番目の質問の分析: https://www.youtube.com/watch?v=wfQkk9WktGE

質問 6 の分析: https://www.youtube.com/watch?v=7h3gJfWnDoc

IMOの最初の質問、大型モデルは惨めに失敗した

一部のネチズンは、IMOのテスト問題は最先端のモデルに適したテストセットを提供すると述べた。

一般的に、IMO テストの問題は高校数学の知識のみを必要とし、最初の問題が最も簡単で、人間のプレイヤーは通常 60 分以内に回答します。

それで、地表で最も強い LLM がどのようにしているか推測できますか?



いくつかのテストの結果は次のとおりです。

GPT-4: 失敗しました。間違いを指摘しても役に立ちません。 GPT-4o: 失敗しました。間違いを指摘しても役に立ちません。 クロード 3.5 ソネット: 失敗しました。間違いを指摘すると、モデルは一時的に正しい答えを与えるのに役立ちましたが、その後は間違った道を進み続けることになります。



大型モデルへの道のりはまだまだ遠いようです。


参考文献:

https://www.zhihu.com/question/662130364?utm_psn=1798276113539153920

https://x.com/sytelus/status/1815203518913085900