Modelo OpenIA alcança desempenho de medalha de ouro na Olimpíada de Matemática

Modelo OpenIA alcança desempenho de medalha de ouro na Olimpíada de Matemática
O protótipo de inteligência artificial respondeu a cinco dos seis problemas direcionados a estudantes pré-universitários.
▲ O desenvolvimento de sistemas conhecidos como grandes modelos de linguagem surpreendeu tanto os especialistas quanto os de fora, com os grandes avanços na capacidade de compreender, gerar e manipular a comunicação humana. Imagem gerada com um programa da Microsoft
Mônica Mateos
Jornal La Jornada, terça-feira, 22 de julho de 2025, p. 6
Assim que a 66ª Olimpíada Internacional de Matemática (IMO) foi concluída no último fim de semana na Austrália, o pesquisador Alexander Wei, da empresa americana OpenIA, anunciou com grande alarde em sua conta de mídia social X que um de seus modelos de inteligência artificial (IA) havia alcançado o grande desafio
de obter uma medalha de ouro ao responder corretamente a cinco dos seis problemas propostos pela competição voltada para estudantes pré-universitários.
Por que isso importa?
Wei, doutor em ciência da computação pela Universidade da Califórnia, Berkeley, perguntou, explicando: Primeiro, os problemas da OMI exigem um novo nível de pensamento criativo sustentado em comparação com os padrões anteriores. Segundo, o progresso nessa área exige ir além do paradigma da aprendizagem direta de recompensas claras e verificáveis. Dessa forma, obtivemos um modelo capaz de construir argumentos complexos e robustos, em pé de igualdade com os matemáticos humanos
.
A notícia surpreendeu a todos, especialmente porque não esperavam um progresso tão rápido no desenvolvimento de sistemas conhecidos como grandes modelos de linguagem (LLMs), que são treinados com grandes quantidades de dados de texto e código para compreender, gerar e manipular a linguagem humana. Um LLM pode realizar uma variedade de tarefas, como responder a perguntas, gerar texto, traduzir idiomas e muito mais.
No ano passado, a gigante inglesa Google DeepMind (GDM) anunciou que seus modelos AlphaProof e AlphaGeometry haviam conquistado medalhas de prata na competição matemática mais antiga e prestigiada do mundo, da qual participam jovens de mais de 100 países a cada verão. No entanto, a comunidade matemática da época sentia que a tecnologia ainda tinha um longo caminho a percorrer
para atingir os níveis de raciocínio, abstração e criatividade dos seres humanos ( La Jornada , 19/01/24).
Wei relatou que, para cada um dos cinco problemas resolvidos pelo LLM em Raciocínio Experimental da OpenAI, "três ex-medalhistas da Olimpíada Internacional de Matemática avaliaram independentemente a prova submetida, e as pontuações foram obtidas por consenso unânime. O modelo obteve 35 de um total de 42 pontos — bom o suficiente para ganhar o ouro! Avaliamos nossos modelos sob as mesmas regras dos competidores humanos na IMO 2025: duas sessões de exame de quatro horas e meia, sem ferramentas ou internet, lendo as declarações oficiais dos problemas e escrevendo provas em linguagem natural".
Pesquisa experimental
"Um enorme parabéns à equipe de Sheryl Hsu e Noam Brown, e a todos os grandes em quem confiamos para tornar este sonho incrível realidade! Tenho a sorte de trabalhar até tarde da noite e até de madrugada ao lado dos melhores"
, disse Wei.
No entanto, o pesquisador esclareceu que, embora a versão 5 do GPT Chat seja lançada em breve, a IA Olímpica Dourada "é um modelo de pesquisa experimental. Não planejamos lançar nada com esse nível de capacidade matemática por vários meses".
Ainda assim, isso ressalta a rapidez com que a IA avançou nos últimos anos. Em 2021, meu orientador de doutorado me pediu para prever o progresso da IA na matemática até julho de 2025. Previ 30% de sucesso; achei que todos os outros estavam otimistas demais. No entanto, agora temos uma medalha de ouro olímpica.
Um ex-competidor da IMO que participou do treinamento de modelos da OpenAI explicou que o problema 6 deste ano "foi em combinatória, uma área que geralmente exige mais criatividade. Em outras áreas da matemática, existem técnicas para transformar tudo em álgebra; por exemplo, em geometria, você converte tudo em coordenadas em um plano e resolve o problema usando álgebra, algo que a IA já faz. Em combinatória, você não pode fazer isso; não existem técnicas tão comuns e pode ser complicado. Neste caso, tivemos que 'inventar' uma maneira de atacar e resolver o problema."
Em sua conta X, Alexander Wei carregou as soluções do modelo para os cinco problemas da IMO para quem quiser dar uma olhada e reconheceu a presença na OpenAI de vários ex-atletas olímpicos que ajudam no treinamento dos modelos, eles são algumas das mentes jovens mais brilhantes do futuro
.
Ernest Ryu, professor de matemática aplicada na Universidade da Califórnia, Los Angeles (UCLA), foi direto ao afirmar: "Não acredito que os LLMs substituirão os matemáticos tão cedo. A pesquisa matemática se concentra na resolução de problemas que ninguém sabe como resolver ainda, e isso exige bastante criatividade, algo que, na minha opinião, falta notavelmente nas soluções da OpenAI."
Minha previsão é que, na próxima década, um número crescente de matemáticos aumentará sua produtividade usando LLMs para buscar partes conhecidas de um esquema de demonstração provisório. Matemáticos experientes podem lamentar isso, mas os mais jovens simplesmente continuarão a fazer um bom trabalho.
O que acontecerá depois disso, digamos, daqui a 30 anos? Não tenho ideia. Espero que os matemáticos (e o trabalho intelectual humano em geral) não sejam substituídos pela IA, mas ninguém sabe o que acontecerá. Minha carreira como matemático certamente não está ameaçada; na verdade, espero usar a IA para acelerar meu trabalho. No entanto, não tenho certeza se a geração do meu filho ainda será chamada de 'matemáticos'.
O Google DeepMind também atinge o tão esperado marco
Da equipe editorial
Jornal La Jornada, terça-feira, 22 de julho de 2025, p. 6
O Google DeepMind anunciou ontem que uma versão avançada do seu sistema de inteligência artificial (IA) Gemini Deep Think alcançou desempenho de nível de medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, na Austrália.
O sistema de IA resolveu perfeitamente cinco dos seis problemas, marcando 35 dos 42 pontos possíveis, alcançando o limiar da medalha de ouro. Isso representa uma melhoria significativa em relação à medalha de prata do ano passado, quando os sistemas combinados Google AlphaProof e AlphaGeometry 2 marcaram apenas 28 pontos.
O presidente da IMO, Gregor Dolinar, confirmou a conquista, afirmando: “O Google DeepMind atingiu o marco tão esperado, obtendo 35 de 42 pontos possíveis — uma medalha de ouro. Suas soluções foram surpreendentes em muitos aspectos. Os avaliadores da IMO as consideraram claras, precisas e muito fáceis de seguir.”
Diferentemente de tentativas anteriores de IA, que exigiam que especialistas traduzissem problemas para linguagens especializadas, esta versão do Gemini operava inteiramente em linguagem natural, produzindo provas matemáticas diretamente das declarações oficiais de problemas dentro do limite de tempo de quatro horas e meia da competição.
A inovação utilizou uma versão avançada do Gemini Deep Think com recursos de raciocínio aprimorados, incluindo pensamento paralelo
, que permite ao modelo explorar múltiplos caminhos de solução simultaneamente. O sistema foi treinado durante meses com novas técnicas de aprendizado por reforço e teve acesso a soluções de alta qualidade para problemas matemáticos.
No sábado, a OpenAI, sediada nos EUA, também anunciou que seu modelo de aprendizado profundo finalmente ganhou uma medalha de ouro na maior competição de matemática pré-universitária do mundo.
jornada