Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


O mercado das inteligências artificiais (IAs) está cada vez mais aquecido, e 2025 contou com lançamentos importantes de grandes empresas como Google, OpenAI, xAI e Anthropic. Mas, afinal, quais são as IAs mais inteligentes deste ano?
Esse tipo de análise é feito por meio dos famosos benchmarks, uma série de testes automatizados que têm o objetivo de avaliar o desempenho de cada IA. Essas avaliações contam com metodologias, regras e parâmetros próprios, servindo como uma métrica útil para entender e classificar o desempenho dos modelos em diferentes contextos de uso.
Dois dos principais benchmarks disponíveis atualmente são o Intelligence Index, desenvolvido pela Artificial Analysis, e o LMArena. Ambos analisam, de formas distintas, a eficiência e a inteligência dos LLMs (modelos de linguagem de grande porte que abastecem as plataformas de IA).
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
Em ambos os testes, o destaque em 2025 ficou por conta do Gemini 3 Pro. Lançado em novembro pelo Google, o modelo liderou em parâmetros como instruções difíceis, raciocínio, escrita criativa, programação e problemas matemáticos.
Outros modelos que também se destacaram foram o Grok 4.1 Thinking, que se mostrou bastante eficiente na geração de texto, e o Claude Opus 4.5 Thinking, com bom desempenho em IA Agêntica — conceito que se refere à capacidade do modelo de operar softwares e executar tarefas autônomas no computador.
Os resultados do Intelligence Index apresentam uma média geral de desempenho ao combinar notas de dez diferentes testes rigorosos aos quais as IAs são submetidas, como MMLU-Pro e o GPQA Diamond.
Sua metodologia tem como foco medir a capacidade técnica dos modelos em parâmetros como raciocínio, conhecimento, matemática e programação. Em 2025, o Top 5 do ranking foi:

O LMArena, por sua vez, classifica as IAs de acordo com a experiência dos próprios usuários. Em sua plataforma, a pessoa faz uma pergunta a duas IAs anônimas e vota na resposta que mais a agradou — tudo isso sem saber qual modelo gerou o texto.
A partir das preferências indicadas pelos usuários, o sistema (conhecido como Elo) organiza e atualiza o ranking com base na performance em instruções difíceis, codificação, matemática e escrita criativa. O Top 5 de 2025 de acordo com esse benchmark foi:

Leia também:
VÍDEO: ChatGPT, Perplexity, Claude, Gemini: QUAL escolher?
Leia a matéria no Canaltech.