IA especializada detecta 92% das explorações de DeFi no mundo real

Um agente de segurança de IA especialmente desenvolvido detectou vulnerabilidades em 92% dos contratos inteligentes DeFi explorados em um novo benchmark de código aberto.

O estudo, divulgado quinta-feira pela empresa de segurança de IA Cecuro, avaliou 90 contratos inteligentes do mundo real explorados entre outubro de 2024 e o início de 2026, representando US$ 228 milhões em perdas verificadas. O sistema especializado sinalizou vulnerabilidades vinculadas a US$ 96,8 milhões em valor de exploração, em comparação com apenas 34% de detecção e US$ 7,5 milhões em cobertura de um agente de codificação básico baseado em GPT-5.1.

Ambos os sistemas funcionaram no mesmo modelo de fronteira. A diferença, de acordo com o relatório, foi a camada de aplicação: metodologia específica de domínio, fases de revisão estruturadas e heurísticas de segurança focadas em DeFi colocadas em camadas sobre o modelo.

As descobertas chegam em meio à crescente preocupação de que a IA esteja acelerando o crime criptográfico. Separar pesquisar da Anthropic e OpenAI mostrou que os agentes de IA agora podem executar explorações de ponta a ponta na maioria dos contratos inteligentes vulneráveis conhecidos, com a capacidade de exploração supostamente dobrando aproximadamente a cada 1,3 mês. O custo médio de uma tentativa de exploração baseada em IA é de cerca de US$ 1,22 por contrato, reduzindo drasticamente a barreira para a verificação em grande escala.

Cobertura anterior do CoinDesk descreveu como atores mal-intencionados, como a Coreia do Norte, começaram a usar IA para escalar operações de hackers e automatizar partes do processo de exploração, ressaltando a lacuna cada vez maior entre as capacidades ofensivas e defensivas.

Cecuro argumenta que muitas equipes dependem de ferramentas de IA de uso geral ou auditorias únicas de segurança, uma abordagem que o benchmark sugere que pode deixar passar vulnerabilidades complexas e de alto valor. Vários contratos no conjunto de dados já haviam sido submetidos a auditorias profissionais antes de serem explorados.

O conjunto de dados de benchmark, a estrutura de avaliação e o agente de linha de base foram de código aberto no GitHub. A empresa disse que não divulgou seu agente de segurança completo devido a preocupações de que ferramentas semelhantes poderiam ser reaproveitadas para uso ofensivo.

Fonte