소식

Google DeepMind, AI 수학적 추론의 상한선 깨기: 국제 수학 올림피아드 문제 6개 중 4개 해결

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House는 Google DeepMind 팀이 어제(7월 25일) 블로그 게시물을 게시하여 자사가 개발한 AlphaProof 및 AlphaGeometry 2 모델이 수학의 고급 추론 문제를 해결할 수 있다고 언급했다고 26일 보도했습니다.국제 수학 올림피아드 퍼즐 풀기 부문에서 은메달 기준을 획득했습니다.

AI 모델 소개

  • AlphaProof: 강화 학습을 기반으로 한 새로운 수학적 형식 추론 시스템입니다.

  • AlphaGeometry 2: 기하학 문제 해결 시스템의 개선된 버전입니다.

딥마인드 팀은 올해 국제수학올림피아드(IMO)에서 2개의 AI 모델을 결합하고 6개 문제 중 4개 문제를 공동으로 해결해 대회에서 처음으로 은메달리스트와 동일한 결과를 달성했습니다.

득점팀

IMO 채점 규칙에 따라 DeepMind 팀의 두 전문가가 점수를 매겼습니다.

  • Timothy Gowers 교수: 유명한 수학자, IMO 금메달리스트 및 필즈 메달리스트.

  • Joseph Myers 박사: 2회 IMO 금메달리스트이자 IMO 2024 이슈 선정 위원회 의장

AI 모델 추론

AI는 6가지 IMO 질문을 모델이 이해할 수 있는 수학적 언어로 번역합니다.

AlphaProof는 답을 결정하고 그 정확성을 증명함으로써 두 가지 대수 문제와 하나의 정수론 문제를 해결했으며, 해결된 문제 중 1개는 대회에서 가장 어려웠으며 올해 IMO에서는 단 5명의 플레이어가 해결했습니다.


AlphaGeometry 2는 기하학 문제를 보여주지만 두 가지 조합 문제는 해결하지 않습니다.


AI 모델 결과

IMO 규정에 따르면 6개 질문 각각은 7점으로 최대 총점은 42점입니다.

DeepMind 시스템은 최종적으로 28점을 얻었으며 모든 질문에서 만점을 얻었으며 이는 실버 그룹에서 가장 높은 점수에 해당합니다.


2024년 금메달 기준점은 29점부터 시작되며, 공식 대회에서는 참가자 609명 중 58명이 금메달을 획득했습니다.

IT Home에 참조 주소 첨부