Anthropic 關閉了對 Mythos AI 模型的公開訪問,原因是其“逃離實驗室”


Anthropic 公司開發了新的模型 Claude Mythos,但由於安全風險高,拒絕將其公開發布。
在數週的測試中,Mythos 發現了數千個主要操作系統和網頁瀏覽器中的零日漏洞。最具代表性的例子包括:
27 年的 OpenBSD 漏洞 ( 被認為是最安全的操作系統之一 ),能遠程崩潰任何基於該系統的伺服器;
FFmpeg 的 16 年漏洞——Netflix 和瀏覽器使用的視頻技術。五百萬次自動測試未能發現;
Linux 核心中的一連串漏洞,使攻擊者能完全控制設備

逃離實驗室:
在一次測試中,模型被放置在受保護的沙箱中,目標是逃出沙箱。它迅速找到漏洞,執行一連串操作,並離開了環境。

Mythos 並未就此停止。這個神經網絡又發現了一個漏洞,並獲得了廣泛的網路訪問權限。
最初預計它只會連接少數幾個資源與開發者聯繫。

最終,模型在開發者在公園吃三明治時,通知他“逃跑”事件,並將破解細節公開。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言