AI代理能提升以太坊的安全性吗?OpenAI和Paradigm创建了一个测试平台

ETH-0.84%

简要介绍

  • EVMbench 测试 AI 代理在 120 个真实世界的以太坊智能合约漏洞上表现。
  • 工具在检测、修补和利用三个不同模式下进行评估。
  • GPT-5.3-Codex 在利用模式测试中取得了72.2%的成功率。

ChatGPT的开发者OpenAI和专注于加密的投资公司Paradigm推出了EVMbench,这是一款旨在提升以太坊虚拟机智能合约安全性的工具。
EVMbench旨在评估AI代理检测、修补和利用以太坊虚拟机(EVM)智能合约中高严重性漏洞的能力。
智能合约是以太坊网络的核心,承载着从去中心化金融协议到代币发行的所有代码。据Token Terminal数据显示,2025年11月,以太坊部署的智能合约数量达到历史最高的170万,上周仅部署了66.95万。

EVMbench借鉴了40次审计中的120个精选漏洞,主要来源于Code4rena等公开审计竞赛,OpenAI在一篇博客中介绍。它还包括Tempo的安全审计场景,Tempo是Stripe专为高吞吐、低成本稳定币支付打造的Layer-1区块链。
支付巨头Stripe在12月推出了Tempo的公共测试网,并表示该项目在Visa、Shopify和OpenAI等的建议下开发。
其目标是以经济上有意义的真实代码为基础进行测试,特别是在AI驱动的稳定币支付不断扩展的背景下。

推出EVMbench——一项衡量AI代理检测、利用和修补高严重性智能合约漏洞能力的新基准。https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 2026年2月18日

EVMbench旨在通过三个模式评估AI模型:检测(Detect)、修补(Patch)和利用(Exploit)。在“检测”阶段,代理审计代码仓库,并根据其对真实漏洞的识别能力评分。在“修补”阶段,代理需在不破坏预期功能的前提下消除漏洞。最后,在“利用”阶段,代理在沙箱区块链环境中尝试端到端的资金转移攻击,评分通过确定性交易重放进行。

在利用模式中,运行OpenAI的Codex CLI的GPT-5.3-Codex取得了72.2%的分数,而六个月前发布的GPT-5仅为31.9%。在检测和修补任务中表现较弱,代理有时未能全面审计或难以保持完整的合约功能。

ChatGPT的开发者们警告称,EVMbench尚未完全反映现实世界的安全复杂性,但他们补充说,在经济相关环境中衡量AI性能至关重要,因为模型正成为攻击者和防御者的强大工具。

OpenAI的Sam Altman和以太坊联合创始人Vitalik Buterin此前在AI发展速度上存在分歧。
2025年1月,Altman表示公司“有信心按照传统理解的方式构建AGI”。但Buterin则主张AI系统应具备“软暂停”功能,以便在出现预警信号时暂时限制工业规模的AI操作。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

ETH 突破 $2,456 美元,主要 CEX 上大额清算将触及 13190亿美元

根据 Coinglass 数据,如果 ETH 突破 2,456 美元,主要 CEX 平台上的以太坊空单强平额将达 13190亿美元。相反,如果 ETH 跌破 2,226 美元,多单强平额将合计 8.93 亿美元。

GateNews1小时前

Sharplink 第一季度营收达到 1210 万美元,ETH 收益扩张之际

Sharplink 周一公布了 2026 年第一季度营收 1210 万美元,较去年同期的 74.2 万美元增长;据该公司称,主要驱动因素是其金库策略带来的质押收入。 截至 5 月 4 日,Sharplink 持有 872,984 ETH,按当前价格计值接近 24 亿美元,使其成为全球第二大上市 ETH 金库公司,仅次于 Bitmine Immersion,该公司持有超过 520 万 ETH。 财务业绩与估值影响 尽管营收实现增长,Sharplink 在该季度仍录得接近 6.86 亿美元的净亏损,主要来自与以太坊价格下跌相关的未实现损失。以太坊在 2026 年初交易在约 3,000 美元附近,随后大约下跌 40% 至 1,800 美元,并在季度末收于接近 2,000 美元。 Sharplink 股票(SBET)当日上涨近 3% 至 7.66 美元,年初至今下跌 2%。 向更复杂的收益策略转变 高管在周一的财报电话会议上概述了 Sharplink 如何从简单的质押业务扩展为一个更复杂的 ETH 部署平台,重点聚焦于“风险意识型”的收益策略。 “我们想要拿到一两分的小分和更大的分数,”CEO

Crypto Frontier1小时前

Sharplink Q1 营收超过 1210 万美元,因 ETH 金库公司扩展收益策略

据 The Block 称,Sharplink 于周一公布其 2026 年第一季度营收为 1210 万美元,高于去年同期的 74.2 万美元,主要由其资金策略中的质押收益带动。 截至 5 月 4 日,该公司持有 872,984 ETH,按当前价格约价值 24 亿美元。除营收外,Sharplink 还宣布计划与 Galaxy Digital 推出 Galaxy Sharplink Onchain Yield Fund。该 1.25 亿美元计划将把资金部署到去中心化金融和流动性机会中,目标是获得高于平均水平的以太坊质押回报。

GateNews1小时前

以太坊基金会推出 Glamsterdam 升级 Devnet,ePBS 在多个客户端中保持稳定

根据以太坊基金会,Glamsterdam 升级 devnet 已启动,核心执行层组件现在已在多个客户端中保持稳定。ePBS(外部提议者分离)正在 Glamsterdam-devnet 中稳定运行,而 EIP-8037 已完成最终规范,为状态操作建立了固定成本模型。 Hegotá 扩展正在并行推进,FOCIL 原型实现现已可用,并且账户抽象要求已被完整定义。下一阶段计划进行多客户端 testnet 验证,目前的开发工作主要专注于最终确定 Glamsterdam 部署,同时继续推进 Hegotá 设计。

GateNews3小时前

圣犹达儿童医院清算 ASTEROID Holdings,获得价值 676K 美元的 290+ ETH

据 ChainCatcher 称,圣裘德儿童研究医院(St. Jude Children's Research Hospital)已在过去两天内清算其 ASTEROID 代币持仓,累计获得超过 290 ETH,约合 676,000 美元。该院加密捐赠负责人 Marc 表示,大约两年前该机构收到了一笔相当于 ASTEROID 总供应量 0.5% 的捐赠,但当时缺少合规的赎回渠道。随着 ASTEROID 的市值从约 20,000 美元飙升至超过 1.5 亿美元,医院的持仓价值峰值预计在 50 万美元至 100 万美元之间。为尽量减少对社区流动性的影响,医院在监测市场状况的同时分 12 批执行出售。出售所得将用于支持圣裘德的儿科疾病治疗及研究项目。

GateNews3小时前

Bitmine 放缓 ETH 累积至低于每周 10 万的节奏

Bitmine Immersion Technologies(BMNR),由 Tom Lee 担任董事长,据周一一则公告称,截至目前持有 5,206,790 ETH,按当前价格计其价值约 121 亿美元。公司自 5 月 4 日更新以来已收购 26,659 ETH,使其加密资产与现金持有总额达到 134 亿美元。 放缓积累节奏 Bitmine 宣布,将其每周以太坊(Ethereum)积累速度从原先目标的每周超过 100,000 ETH 下调。“我们决定将每周积累速度从最初目标的 >100,000/周放慢,以在 2026 年末达到‘5% 的炼金术(alchemy of 5%)’目标。我们之前每周 >10 万的买入节奏将使我们在 7 月中旬达到 5%,”Lee 在公告中表示。 按当前价格计算,最新收购的 26,659 ETH 价值约 6,210 万美元。Bitmine 未披露此次收购的平均购买价格。 持有量与质押运营 截至 5 月 10 日,Bitmine 还持有 201 BTC(1,630 万美元)、对 Eightco 的 8,800 万美元持股,以及总现金 7.75 亿美元。根据 The

Crypto Frontier4小时前
评论
0/400
暂无评论