人工智慧代理可以提升以太坊安全嗎?OpenAI與Paradigm創建測試平台
關鍵要點
- OpenAI與加密投資公司Paradigm合作推出EVMbench,一款測試AI代理發現及修補智慧合約漏洞能力的工具。
- EVMbench專注於以太坊虛擬機(EVM)環境中檢測、修補及利用高風險漏洞。
- 每週以太坊網路上的智慧合約部署數創下新高,顯示市場對可靠合約驗證的需求。
- 測試平台使用的漏洞多從公開的審計競賽中取得,如Code4rena,並包含來自Stripe的Tempo區塊鏈的審計場景。
WEEX Crypto News, 2026-02-19 09:43:01
在迅速發展的區塊鏈技術領域中,安全性問題始終備受關注。作為全球第二大加密貨幣網絡,以太坊以其高度的智能合約應用而聞名。然而,伴隨智能合約部署不斷增加,如何確保其安全性成為業內關注的焦點。為應對這一挑戰,OpenAI和Paradigm攜手創建了EVMbench,一款專門測試AI代理發現在以太坊虛擬機(EVM)環境中智能合約高風險漏洞並加以修補和利用的工具。
OpenAI與Paradigm的合作
OpenAI是ChatGPT的開發商,而Paradigm則是一家專注於加密市場的投資公司。這次合作旨在結合AI技術與區塊鏈安全的需求,為智能合約的穩定運行提供保障。EVMbench正是這一合作的成果,它著重評估AI模型在檢測(Detect)、修補(Patch)和利用(Exploit)模式下的表現。
在“檢測”模式中,AI代理會對庫存進行審核並根據其識別出實際漏洞的準確性打分。“修補”模式則要求AI代理在不破壞合約預期功能的情況下消除漏洞。而在“利用”階段,代理則試圖在沙盒區塊鏈環境中完成端到端的攻擊行動,並通過確定性交易重演進行評分。
智能合約擴張需求
以太坊網絡以其龐大的去中心化金融協議及代幣發行功能而聞名,每周部署的智能合約數量屢創新高。根據Token Terminal的數據顯示,2025年11月,以太坊網絡上每周部署的智能合約數達到歷史新高的170萬件,而就在上周,又有超過66.95萬件合約被部署。這些數據顯示了市場對智慧合約驗證和更新的強烈需求。
EVMbench的技術詳解
EVMbench共採用了120個精選漏洞,來源於40次審計,其中大多數是來自於Code4rena等公開審計競賽。它還包含了Tempo,Stripe策劃的以高吞吐量、低成本穩定幣支付為重點的區塊鏈層-1項目的安全審計過程中的場景。這確保了測試基於經濟上有意義的真實世界場景,特別是隨著人工智慧驅動的穩定幣支付不斷擴展。
Stripe於十二月份發佈了Tempo的公開測試網,聲稱此項目是與Visa、Shopify和OpenAI等公司共同研發。其目標是確保測試建構於有經濟價值的現實代碼之中。
AI代理及EVMbench的性能
在EVMbench的“利用”模式中,OpenAI的GPT-5.3-Codex通過Codex CLI運行,成績達到72.2%,相較於六個月前發佈的GPT-5成績為31.9%。不過,在“檢測”和“修補”任務中,性能表現稍遜,研究者指出這是由於代理有時未能徹底審計或難以保持合約完整性。
儘管如此,OpenAI的研究者認為EVMbench並不能完全捕捉真實世界的安全複雜性。但他們強調,隨著模型成為對攻擊者和防禦者的重要工具,在市場經濟環境中衡量AI性能至關重要。
矛盾的技術發展觀
在2025年1月,OpenAI的創始人Sam Altman表示,他們公司有信心可建立如傳統所理解的人工通用智慧(AGI)。然而,以太坊的共同創始人Vitalik Buterin則主張AI系統應包含“軟暫停”功能,以便在出現警示信號時能暫時限制大規模工業級AI運行。
強調經濟上的關聯性和安全性需求,EVMbench的推出不僅是技術界的一次試驗,也是區塊鏈安全的進一步保障。隨著以太坊智能合約不斷擴張,保障其安全性能成為關鍵。未來,隨著AI技術的不斷成熟,我們預期EVMbench將在保障區塊鏈環境的安全性方面發揮更關鍵的角色。
常見問題
EVMbench如何促進以太坊智能合約的安全性?
EVMbench結合AI技術與現實代碼場景,對智能合約的安全性進行多層次測試,從而有效識別和修補漏洞,提高整體的安全性。
OpenAI和Paradigm的合作對行業有何影響?
這次合作展示了大數據智能技術與區塊鏈領域的交集,通過工具的突破,提高合約的安全水平,推動行業的進一步發展。
EVMbench是如何運行的?
EVMbench在三種模式——檢測、修補和利用——下評估AI的表現,涵蓋漏洞識別、功能保護及實戰演習等多個環節。
AI代理在智能合約安全中的角色如何?
AI代理有助於提高智能合約的自動化審計與漏洞修補水平,減少人為失誤,提升整體安全性。
這項技術的未來發展如何?
隨著AI技術的進步,像EVMbench這樣的工具將愈發重要,不僅能提升以太坊的安全性能,也將引領其他區塊鏈技術的安全升級。
猜你喜歡

美國大模型走向封閉,以安全之名

從白毛股神到百億基金大佬,做空英偉達的聰明人都在用同一個框架暴富

早報|CoinEx 成為伊朗規避制裁的關鍵樞紐,涉及資金逾 38 億美元;Kalshi 尋求新一輪融資,估值或升至 400 億美元

為什麼加密項目總喜歡換名字?

全球啟動:當預測成為AI時代最稀缺的資產,Manadia 正在定義下一代價值互聯網

誰在為 640 億美元的帳面狂歡買單?

萬萬沒想到,AI x Crypto 最先落地的是安全審計

如何看待幣安的競爭優勢?

ETH 已進入非共識階段,拐點將至!

空中雲匯轉向:從一年前鄙夷穩定幣,到如今高調資本入局

AscendEX 被爆提款異常背後,中小交易所的生存困局

早報|中國人民銀行法修訂草案擬明確數字人民幣的法律地位;韓國將約 40 家未註冊虛擬資產服務提供商移交執法部門

加密行業進入「Show Me」時代:僅靠願景已經不夠了

解讀以太坊基金會新架構:在機構化趨勢中重申自我主權

前 SpaceX 工程師用第一性原理重構金融執行體系

潮汐投資:AI 產業鏈我們仍然看好,但理由變了

渣打銀行再唱 50 倍狂想曲,為 AAVE“畫餅”劍指 3500 美元






