notícias

O Google DeepMind quebra o limite superior do raciocínio matemático da IA: resolve 4 de 6 questões da Olimpíada Internacional de Matemática

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A IT House informou em 26 de julho que a equipe do Google DeepMind publicou uma postagem no blog ontem (25 de julho), afirmando que os modelos AlphaProof e AlphaGeometry 2 desenvolvidos por ela podem resolver problemas avançados de raciocínio em matemática.Alcançou o padrão Medalha de Prata na resolução de quebra-cabeças das Olimpíadas Internacionais de Matemática.

Introdução aos modelos de IA

  • AlphaProof: Um novo sistema de raciocínio matemático formal baseado em aprendizagem por reforço.

  • AlphaGeometry 2: Uma versão melhorada do sistema de resolução de problemas de geometria.

A equipe DeepMind combinou dois modelos de IA e colaborou para resolver 4 das 6 questões da Olimpíada Internacional de Matemática (IMO) deste ano, alcançando pela primeira vez os mesmos resultados dos medalhistas de prata na competição.

Equipe de pontuação

Dois especialistas da equipe DeepMind pontuaram de acordo com as regras de pontuação da IMO. Os dois especialistas são:

  • Professor Sir Timothy Gowers: famoso matemático, medalhista de ouro da IMO e medalhista Fields.

  • Dr. Joseph Myers: duas vezes medalhista de ouro da IMO e presidente do Comitê de Seleção de Questões da IMO 2024

Inferência de modelo de IA

A IA traduzirá as 6 questões da IMO para uma linguagem matemática que o modelo possa compreender.

AlphaProof resolveu dois problemas algébricos e um problema de teoria dos números determinando as respostas e provando sua correção, e um dos problemas resolvidos foi o mais difícil da competição, resolvido por apenas 5 jogadores no IMO deste ano.


AlphaGeometry 2 demonstra problemas de geometria e não resolve 2 problemas combinatórios.


Resultados do modelo de IA

De acordo com as regras da IMO, cada uma das 6 questões vale 7 pontos, com pontuação total máxima de 42 pontos.

O sistema DeepMind obteve 28 pontos, com pontuações perfeitas em todas as questões, equivalente à pontuação mais alta do grupo prata.


O limite da medalha de ouro para 2024 começa em 29 pontos e, na competição oficial, 58 dos 609 participantes conquistaram medalhas de ouro.

IT Home anexa endereço de referência