소식

중국의 5회 연속 우승이 끝나고 미국이 IMO 왕좌에 복귀했습니다! AI IQ는 첫 번째 질문으로 인해 원래 모습으로 돌아왔습니다.

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


새로운 지혜 보고서

편집자: 도자는 너무 졸려요

[새로운 지혜 소개] IMO 2024 최종 결과가 드디어 나왔습니다! 4년 만에 이례적으로 미국팀이 다시 1위를 차지하며 중국팀을 2점차로 앞섰다. LLM의 경우 가장 간단한 첫 번째 질문 IMO, GPT-4o, Claude 3.5 Sonnet 및 기타 모델이 모두 답변하지 못했습니다.

중국의 5년 연속 IMO 챔피언십 우승 기록이 이제 미국 팀에 의해 깨졌습니다!

지난 며칠간 제65차 IMO에서는 최종 우승 국가대표팀을 발표했는데, 미국이 192점으로 1위를 차지했고, 중국이 2점 차이로 2위를 차지했다.

인도팀이 처음으로 4위로 돌진했다는 점은 주목할 만하다.


중국과 미국 IMO 팀 모두 금메달 5개와 은메달 1개를 획득했습니다.

IMO는 전 세계의 뛰어난 젊은 수학자들이 모여드는 세계 최고의 고등학교 수학 경시대회입니다.

올해에는 108개 국가 및 지역에서 609명의 학생들이 참가했습니다.


중국 대표팀의 시 하오자(Haojia Shi)는 2회 연속 개인 만점을 기록하며 역대 7번째 만점 기록을 세웠다.

개인랭킹에서는 미국의 알렉산더 왕(Alexander Wang)과 제시카 완(Jessica Wan)이 각각 3위와 5위를 기록했다.


팀원은 6명이며 그 중 4명은 중국인입니다.


从左到右:Jessica Wan, Alexander Wang, Tiger Zhang, Jordan Lefkowitz, Carl Schildkraut (부리더), Krishna Pothapragada, Linus Tang

2024년 미국 IMO 팀 구성원은 다음과 같습니다.

- 조던 레프코비츠, 17세(코네티컷)

- 크리슈나 포타프라가다, 18세(일리노이주)

- 제시카 완, 18세(플로리다)

- 알렉산더 왕, 16세(뉴저지)

- Qiao (Tiger) Zhang, 16세 (캘리포니아)

- 리누스 탕, 18세(캘리포니아)


제시카 완은 2007년 이후 미국 IMO 팀에 합류한 최초의 여성이다. 비록 그랜드슬램 개인 달성은 없지만 그래도 4개의 만점을 기록했습니다.

그 전에 그녀는 수학에서 최고의 학생이었습니다.

지난해 MIT가 주최한 제15회 여자수학(MP4G) 대회에서 고등학생 제시카 완(Jessica Wan)이 3년 연속 우승을 차지했다.


이번 대회에서 제시카는 20개 질문 중 17개를 맞혀 이번 MP4G 대회에서 가장 성공적인 참가자가 됐다.

그녀는 또한 4년 연속 유럽 여자 수학 올림피아드(EGMO) 대회에 참가하여 두 번 우승했습니다.


Alexander Wang은 뉴저지 Millburn School의 신입생입니다.

그에게 수학은 흥미롭고 깔끔한 과목이다. Wang은 유치원 때부터 수학에 관심이 많았습니다.

더 많은 학생들이 수학을 배우고 수학의 흥미로운 측면을 발견할 수 있도록 돕기 위해 그는 Angelina Wang 및 Bill Sun과 팀을 이루어 비영리 단체인 임팩트 학습자를 설립했습니다.

그가 IMO 2023 미국 팀의 멤버이기도 하다는 점은 언급할 가치가 있습니다. 그는 2023 Romanian Mathematics Masters에서 개인 금메달과 팀 챔피언십을 획득했으며 MATHCOUNTS 전국 대회에도 두 번 선정되었습니다.


Linus Tang은 네바다 주 리노에 있는 Davidson Academy의 온라인 수업에 참석합니다. 2021년에는 스탠포드 수학 선수권 대회에서 조합 수학 부문 1위를 차지했습니다.

2022년 봄, 그는 "Bulgarian Solitaire"라는 게임의 수학적 원리를 연구했습니다.

Linus는 겨우 한 살이었을 때 첫 번째 수학 상인 Math Kangaroo를 수상했습니다. 그는 어렸을 때 직소 퍼즐을 하면서 많은 시간을 보냈고 시각화 능력을 발휘했다고 말했습니다.


IMO 리더 교체 10년

이번 미국 팀의 승리는 프로젝트 리더와 관련이 있다는 점은 언급할 가치가 있다.

2014년부터 미국 IMO 팀은 중국 수학자이자 CMU 교수인 포 센 로(Po-Shen Loh)가 이끌고 있으며, 그는 미국 팀을 이끌고 2015년, 2016년, 2018년, 2019년에 IMO 금메달을 획득했습니다.


2019년에는 중국팀과 미국팀이 공동 1위를 차지했고, 4년 만에 중국팀이 1위에 올랐고, 미국팀이 세계 2위를 차지했다.


이번에는 John Berman이 미국 IMO 팀의 수장이 되었습니다.

그는 2018년 MIT에서 수학 학사 학위를, 버지니아 대학교에서 수학 박사 학위를 받았습니다. 현재 그는 Geodemath 온라인 강좌의 강사이기도 합니다.


팀이 승리한 후 Berman은 축하 메시지를 게시했습니다.


IMO 2024 시험문제

이번 국제수학올림피아드에는 6개의 문제가 출제되며, 답변 시간은 9시간입니다.

다음은 전체 시험지 내용입니다. 관심 있는 친구들은 시험해보고 도전해 보세요.



첫 번째 질문 분석: https://www.youtube.com/watch?v=50W_ntnPX0k

두 번째 질문 분석: https://www.youtube.com/watch?v=VXFG1t_ksfI

세 번째 질문 분석: https://www.youtube.com/watch?v=ASV1dZCuWGs

네 번째 질문 분석: https://www.youtube.com/watch?v=WnZv3fdpFXo

다섯 번째 질문 분석: https://www.youtube.com/watch?v=wfQkk9WktGE

6번 질문 분석: https://www.youtube.com/watch?v=7h3gJfWnDoc

IMO 첫 번째 질문, 대형 모델이 비참하게 실패했습니다

일부 네티즌들은 IMO 시험 문제가 최첨단 모델에 대한 좋은 테스트 세트를 제공한다고 말했습니다.

일반적으로 IMO 시험 문제는 고등학교 수학 지식만 요구하며 첫 번째 문제가 가장 쉽고 인간 플레이어는 일반적으로 60분 이내에 완료합니다.

그렇다면 표면적으로 가장 강력한 LLM이 어떻게 지내고 있는지 짐작할 수 있습니까?



몇 가지 테스트를 거친 후 결과는 다음과 같습니다.

GPT-4: 실패했습니다. 오류를 지적해도 소용이 없습니다. GPT-4o: 실패했습니다. 오류를 지적해도 소용이 없습니다. 클로드 3.5 소네트: 실패했습니다. 오류를 지적하면 모델이 잠시 정답을 제시하는 데 도움이 되었지만 계속해서 잘못된 경로를 따라갑니다.



아직 대형 모델은 갈 길이 먼 것 같습니다.


참고자료:

https://www.zhihu.com/question/662130364?utm_psn=1798276113539153920

https://x.com/sytelus/status/1815203518913085900