HomeAIAnthropic关于智能合约安全性的研究表明,先进的AI可以揭示数百万美元的DeFi漏洞。

Anthropic关于智能合约安全性的研究表明,先进的AI可以揭示数百万美元的DeFi漏洞。

来自Anthropic的新研究强调了现代AI工具在智能合约安全方面的训练如何系统性地揭示去中心化金融应用中的高价值漏洞。

Anthropic基准测试显示AI代理可以可靠地利用DeFi合约

公司与MATS和Anthropic Fellows合作,评估了自主AI代理在SCONE-bench(智能合约利用)上的表现,该基准测试由405个在20202025年间成功被黑客攻击的真实智能合约构建而成。数据集仅包括具有链上漏洞记录的合约。

当研究人员在受控环境中运行10个领先模型时,AI代理成功利用了超过一半的合约。此外,被盗资金的模拟价值达到约5.501亿美元,这表明有能力的AI系统原则上可以对脆弱的DeFi协议造成的损害规模。

为了减少模型仅仅是从训练数据中回忆历史事件的可能性,团队将重点缩小到仅34个合约的子集。然而,这些合约有一个重要特性:每个合约仅在2025年3月1日之后被利用,这是评估系统的最新知识截止日期。

Opus 4.5和GPT-5揭示数百万的新漏洞价值

在这个更干净的后截止日期集合中,Claude Opus 4.5Claude Sonnet 4.5GPT-5仍然在19个合约上产生了有效的漏洞利用。这些攻击的综合模拟价值达到460万美元,表明代理正在发现可行的策略,而不是简单地重复已知的策略。

值得注意的是,仅Opus 4.5就占据了该总额的约450万美元。也就是说,结果因模型而异,突显了增量能力提升如何直接转化为对抗性环境中的更高漏洞利用收入。

Anthropic随后询问这些AI系统是否可以在生产风格代码中发现全新的弱点。2025年10月3日,研究人员再次在模拟中运行Sonnet 4.5和GPT-5,针对2,849个最近部署的币安智能链合约,这些合约在测试时没有已知漏洞。

在币安智能链合约中发现零日漏洞

在这组大量的新合约中,两个代理独立发现了两个先前未知的零日漏洞,并生成了相应的攻击策略。此外,这些攻击的模拟收益达到3,694美元,显示即使是新的部署也可以迅速成为自动化利用的可行目标。

运行的经济性也很有启发性。GPT-5以估计的API成本约为3,476美元实现了其结果。该成本结构说明了如何缩小搜索空间和改进推理可能已经在规模上倾斜了更高效的AI生成漏洞利用的平衡。

关键是,所有测试都在分叉的区块链和本地模拟器上进行,而不是在实时网络上进行,没有触及真实资金。Anthropic强调,目标是测量在安全条件下今天技术上可能实现的东西,而不是干扰生产DeFi系统或对不知情的协议进行压力测试。

SCONE-bench如何以美元衡量漏洞利用能力

智能合约是一个自然的测试平台,因为它们持有真实的金融价值并在链上确定性地执行。当合约行为不正确时,攻击者通常可以直接提取资产。此外,研究人员可以重放精确的攻击路径,并使用历史价格将被盗代币转换为美元等价物。

这种结构允许SCONE-bench以具体的术语量化结果。基准测试以美元价值而不是简单的是或否指标来评估成功。代理被放置在一个沙盒中,提供合约代码、部署上下文和交互工具,然后任务是识别漏洞、实施漏洞利用并端到端执行。

只有当代理的余额至少增加0.1 ETH0.1 BNB时,运行才算有效。然而,这个门槛是有意为之:它过滤掉了小故障或不可行的边缘情况,以便测量结果对应于有意义的攻击而不是噪音。

随着代币和计算成本的下降,攻击经济性改善

在过去一年中,Anthropic观察到2025年问题子集的潜在漏洞利用收入大约每1.3个月翻一番。同时,随着新一代模型的引入和改进,产生有效漏洞利用的代币成本急剧下降。

实际上,这一趋势意味着随着模型的改进,攻击者可以在相同的计算预算下获得更多有效的漏洞利用。此外,随着查询价格或计算开销的进一步下降,合约漏洞利用经济学可能对资源充足的对手或自动攻击代理变得更加有利。

尽管工作集中在DeFi协议上,Anthropic认为其基础能力在很大程度上是领域无关的。分析状态转换、推理边缘情况和串联多步骤漏洞利用所需的技能可以转移到传统软件目标,从暴露的公共API到从未设计为应对敌对机器推理的晦涩内部服务。

AI在DeFi中既是攻击者又是防御者

公司向加密开发者和协议团队传达的核心信息是明确的双重用途。能够探测DeFi智能合约漏洞利用的相同AI系统在由审计员和安全工程师负责任地使用时也可以加强代码库。

然而,Anthropic强调,构建者应更新其对攻击者的心理模型。能够自主推理智能合约行为、构建有效载荷并适应反馈的系统提高了有效的智能合约安全和操作防御实践的门槛。

展望未来,研究人员建议主动使用自主代理进行审计和监控可能成为标准的防御层。如果团队在模拟中持续使用强大的模型测试合约,他们可能会在恶意行为者使用相同技术发现关键漏洞之前捕获这些漏洞。

总之,Anthropic展示了先进的AI已经能够在规模上识别和利用现实世界的智能合约缺陷,同时也提供了一条更严格的自动化审计路径,帮助DeFi构建者在部署资本之前降低风险。

RELATED ARTICLES

Stay updated on all the news about cryptocurrencies and the entire world of blockchain.

LATEST