Новости

Пять чемпионатов Китая подряд завершаются, и США возвращаются на трон IMO! AI IQ был возвращен в исходную форму после первого вопроса

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Новый отчет мудрости

Редактор: Таози такой сонный.

[Введение в новую мудрость] Наконец-то стали известны окончательные результаты IMO 2024! Беспрецедентно, что четыре года спустя сборная США снова заняла первое место, опередив сборную Китая на два очка. Для LLM не удалось ответить на самый простой первый вопрос IMO, GPT-4o, Claude 3.5 Sonnet и другие модели.

Рекорд Китая по победе в чемпионате IMO пять лет подряд побит американской командой!

За последние несколько дней 65-я IMO объявила окончательную победившую сборную США заняла первое место с результатом в 192 очка, а второе место занял Китай с разницей в 2 очка.

Стоит отметить, что сборная Индии впервые вырвалась на четвертое место.


И китайская, и американская команды IMO завоевали 5 золотых и 1 серебряную медаль.

IMO — это крупнейшее в мире соревнование по математике среди школьников, привлекающее выдающихся молодых математиков со всего мира.

В этом году в нем приняли участие 609 студентов из 108 стран и регионов.


Хаоцзя Ши из сборной Китая дважды подряд получал отличные личные оценки, а также является седьмым игроком в истории, достигшим отличных результатов.

Американские игроки Александр Ванг и Джессика Ван заняли третье и пятое места соответственно в индивидуальном рейтинге.


В команде шесть членов, четверо из них китайцы.


В ролях: Джессика Ван, Александр Ван, Тайгер Чжан, Джордан Лефковиц, Карл Шильдкраут (заместитель руководителя), Кришна Потапрагада, Линус Тан

Членами команды ИМО США 2024 года являются:

- Джордан Лефковиц, 17 лет (Коннектикут)

- Кришна Потапрагада, 18 лет (Иллинойс)

- Джессика Ван, 18 лет (Флорида)

- Александр Ванг, 16 лет (Нью-Джерси)

- Цяо (Тигр) Чжан, 16 лет (Калифорния)

- Линус Тан, 18 лет (Калифорния)


Джессика Ван — первая женщина, присоединившаяся к команде IMO США с 2007 года. Хотя личных достижений Большого шлема нет, я все равно набрал 4 высших балла.

До этого она была лучшей ученицей по математике.

В прошлом году старшеклассница Джессика Ван выиграла три чемпионата подряд на 15-м соревновании по математике для женщин (MP4G), проводимом Массачусетским технологическим институтом.


В конкурсе Джессика правильно ответила на 17 из 20 вопросов, став самой успешной участницей этого конкурса MP4G.

Она также четыре года подряд участвовала в Европейской женской математической олимпиаде (EGMO), дважды выиграв.


Александр Ванг учится на первом курсе школы Милберн в Нью-Джерси.

Для него математика – интересный и полезный предмет. Ванга очень интересовалась математикой с детского сада.

Чтобы помочь большему количеству студентов изучать математику и открывать для себя интересные аспекты математики, он объединился с Анджелиной Ванг и Биллом Саном, чтобы создать некоммерческую организацию, оказывающую влияние на учащихся.

Стоит отметить, что он также является членом американской команды IMO 2023. Он выиграл индивидуальную золотую медаль и командный чемпионат на чемпионате Румынии по математике в 2023 году. Он также дважды был выбран для участия в национальных соревнованиях MATHCOUNTS.


Линус Танг посещает онлайн-классы в Академии Дэвидсона в Рино, штат Невада. В 2021 году он занял первое место по комбинаторной математике на Стэнфордском чемпионате по математике.

Весной 2022 года он изучал математические принципы игры «Болгарский пасьянс».

Когда Линусу был всего один год, он выиграл свою первую награду по математике — «Математический кенгуру». Он сказал, что в детстве много времени проводил, разгадывая головоломки, и тренировал свои способности к визуализации.


Десять лет замены лидера IMO

Стоит отметить, что победа американской команды на этот раз во многом связана с лидером проекта.

С 2014 года команду IMO США возглавляет По-Шен Ло, китайский математик и профессор КМУ. Он возглавлял команду США, завоевавшую золотые медали IMO в 2015, 2016, 2018 и 2019 годах.


В 2019 году сборная Китая и сборная США разделили первое место. Четыре года спустя сборная Китая возглавила список, а сборная США заняла второе место в мире.


На этот раз главой команды ИМО США стал Джон Берман.

Он получил степень бакалавра математики в Массачусетском технологическом институте и докторскую степень по математике в Университете Вирджинии в 2018 году. В настоящее время он также является преподавателем онлайн-курса Geodemath.


После победы команды Берман опубликовал сообщение, чтобы отпраздновать это событие.


Тестовые вопросы IMO 2024

В этой Международной математической олимпиаде 6 вопросов и 9 часов времени на ответы.

Ниже приводится полное содержание тестового задания. Заинтересованные друзья могут попробовать его и бросить вызов.



Разбор первого вопроса: https://www.youtube.com/watch?v=50W_ntnPX0k

Разбор второго вопроса: https://www.youtube.com/watch?v=VXFG1t_ksfI

Разбор третьего вопроса: https://www.youtube.com/watch?v=ASV1dZCuWGs

Разбор четвертого вопроса: https://www.youtube.com/watch?v=WnZv3fdpFXo

Разбор пятого вопроса: https://www.youtube.com/watch?v=wfQkk9WktGE

Анализ шестого вопроса: https://www.youtube.com/watch?v=7h3gJfWnDoc.

Имхо первый вопрос, большая модель с треском провалилась

Некоторые пользователи сети заявили, что тестовые вопросы IMO представляют собой хороший набор тестов для передовых моделей.

Вообще говоря, тестовые вопросы IMO требуют только школьных знаний математики, а первый вопрос самый простой, и игроки-люди обычно выполняют его в течение 60 минут.

Итак, можете ли вы угадать, как поживает самый сильный LLM на поверхности?



После некоторого тестирования результаты следующие:

GPT-4: не удалось. Даже указание на ошибку не поможет. GPT-4o: не удалось. Даже указание на ошибку не поможет. Клод 3.5 Сонет: Не удалось. Указание на ошибку помогло модели на короткое время дать правильный ответ, но затем продолжило идти по неправильному пути.



Похоже, что до больших моделей еще предстоит пройти долгий путь.


Использованная литература:

https://www.zhihu.com/question/662130364?utm_psn=1798276113539153920

https://x.com/sytelus/status/1815203518913085900