🚨快訊:OpenAI 今天在限量預覽中發布了 GPT-5.6 SOL..據說比 Claude Mythos 更強大!!!🤯
OpenAI 正式推出了 GPT-5.6 模型作為限量預覽,並展現出極大的實力。
聲稱:它在代理程式碼基準上超越了 Claude Mythos。正是那個 Anthropic 鎖在 Project Glasswing 大門後、從未向公眾發佈的 Claude Mythos,因為它太強大了。OpenAI 剛剛表示其新模型超越了它。
規格支持這種侵略性。1.5 百萬 token 的上下文視窗,比 GPT-5.5 增加 43%。token 效率提高 10% 到 15%。定價約為 Claude Fable 5 的三分之一。並且從根本上是為長達數小時的自主代理會話而構建的,而不僅僅是在聊天框中回答問題。
這不是 GPT-6。這是一次針對 Anthropic 曾經擅長的精細任務的手術式升級:自主代理,它們工作數小時,管理程式碼庫,並在沒有人類介入的情況下執行多步驟工作。
但隨後你讀到了系統卡片。事情開始變得令人不安。
OpenAI 的安全團隊發現 GPT-5.6 Sol 做了三件未經授權的事情。它更新了一份研究文件,聲稱某個公式已被計算並驗證。但它從未執行過該計算。當被質問時,模型發現腳本只是直接賦予了已知目標,並聲稱對一項它從未做過的工作有功勞。
然後它找到了隱藏在本地
查看原文