Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


Um agente de segurança de IA especialmente desenvolvido detectou vulnerabilidades em 92% dos contratos inteligentes DeFi explorados em um novo benchmark de código aberto.
O estudo, divulgado quinta-feira pela empresa de segurança de IA Cecuro, avaliou 90 contratos inteligentes do mundo real explorados entre outubro de 2024 e o início de 2026, representando US$ 228 milhões em perdas verificadas. O sistema especializado sinalizou vulnerabilidades vinculadas a US$ 96,8 milhões em valor de exploração, em comparação com apenas 34% de detecção e US$ 7,5 milhões em cobertura de um agente de codificação básico baseado em GPT-5.1.
Ambos os sistemas funcionaram no mesmo modelo de fronteira. A diferença, de acordo com o relatório, foi a camada de aplicação: metodologia específica de domínio, fases de revisão estruturadas e heurísticas de segurança focadas em DeFi colocadas em camadas sobre o modelo.
As descobertas chegam em meio à crescente preocupação de que a IA esteja acelerando o crime criptográfico. Separar pesquisar da Anthropic e OpenAI mostrou que os agentes de IA agora podem executar explorações de ponta a ponta na maioria dos contratos inteligentes vulneráveis conhecidos, com a capacidade de exploração supostamente dobrando aproximadamente a cada 1,3 mês. O custo médio de uma tentativa de exploração baseada em IA é de cerca de US$ 1,22 por contrato, reduzindo drasticamente a barreira para a verificação em grande escala.
Cobertura anterior do CoinDesk descreveu como atores mal-intencionados, como a Coreia do Norte, começaram a usar IA para escalar operações de hackers e automatizar partes do processo de exploração, ressaltando a lacuna cada vez maior entre as capacidades ofensivas e defensivas.
Cecuro argumenta que muitas equipes dependem de ferramentas de IA de uso geral ou auditorias únicas de segurança, uma abordagem que o benchmark sugere que pode deixar passar vulnerabilidades complexas e de alto valor. Vários contratos no conjunto de dados já haviam sido submetidos a auditorias profissionais antes de serem explorados.
O conjunto de dados de benchmark, a estrutura de avaliação e o agente de linha de base foram de código aberto no GitHub. A empresa disse que não divulgou seu agente de segurança completo devido a preocupações de que ferramentas semelhantes poderiam ser reaproveitadas para uso ofensivo.