根據 OpenAI 的說法,該公司已找出自 GPT-5.1 起困擾 GPT 模型的「goblin」問題的根本原因。先前曾用來強化「Nerdy(書呆子)」人格特質的獎勵訊號,鼓勵輸出包含奇幻生物的提及;訓練資料集中的 76.2% 顯示出這種偏誤。「Nerdy(書呆子)」人格僅佔 ChatGPT 回覆的 2.5%,但卻貢獻了 66.7% 的 goblin 提及,其出現次數則在 GPT-5.2 到 GPT-5.4 之間暴增 3,881%。
OpenAI 在 3 月移除了「Nerdy(書呆子)」人格、取消了帶偏誤的獎勵訊號,並過濾了訓練資料。該公司也在 Codex 中將抑制指令加入 GPT-5.5 的開發者提示詞。此次調查促成了新模型行為稽核工具的開發。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
AISI 評估:GPT-5.5 網路攻擊能力與 Anthropic Mythos 持平
AISI於5月公布GPT-5.5網路攻擊能力評估:Expert難度71.4%、Mythos Preview 68.6%,差距在誤差內,持平。GPT-5.5成為繼 Mythos 後第二個可自動完成「The Last Ones」32步驟企業入侵的系統。另發現 universal jailbreak,約6小時即可開發,能繞過惡意查詢過濾。未來將觀察下一輪評估時程與 OpenAI 對此更新。
鏈新聞abmedia28分鐘前
Pentagon 與 7 家 AI 大廠簽機密軍網部署合約:Anthropic 仍排除
美國國防部於5月宣布與SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、Amazon Web Services等7家簽署機密軍用網路部署合約,另加入Oracle成為第8家。合約允許在Impact Level 6/7最高機密層級運行模型,重點三大應用為資料整合、作戰決策與戰場態勢感知,強調分散風險與避免供應商綁定。Anthropic因拒絕軍方安全護欄而被列入黑名單,未獲簽。AMD未直接列入,GPU由NVIDIA等提供。後續觀察Anthropic是否讓步,以及Reflection等新入選者的角色。
鏈新聞abmedia30分鐘前
Cerebras 目標鎖定 $4B 首次公開募股(IPO),估值約 400 億美元
根據彭博資訊,位於加州聖荷西(Sunnyvale)的 AI 晶片製造商 Cerebras Systems 正尋求最高 40 億美元的 IPO,該交易可能將公司估值約 400 億美元。正式行銷最快可能在 5 月 4 日開始,銀行將收到超過 100 億美元、反映(indications of)
Crypto Frontier33分鐘前
中國 AI 企業考慮在 Meta 取得 Manus 收購案停擺後,拆解紅籌架構
根據 Beating,中國國家發展和改革委員會叫停 Meta 以 20 億美元收購 AI 代理公司 Manus,促使中國證券監督管理委員會加嚴對紅籌公司(持有境內資產的中國公司)在香港上市(IPO)的審批
GateNews2小時前
馬斯克完成 OpenAI 訴訟中的三天作證,引用 1,300-1,500 億美元的損害賠償要求
根據多家媒體報導,馬斯克於 4 月 28 日至 30 日在他針對 OpenAI 的訴訟中完成了為期三天的證詞陳述,累計證詞時間超過 7 小時。馬斯克於 2015 年與他人共同創立 OpenAI,初始投資為 3800 萬美元,並聲稱該公司放棄了其非營利性的 m
GateNews2小時前
Meta 於 5 月 1 日收購機器人 AI 創業公司 Assured Robot Intelligence
根據彭博,Meta 於 5 月 1 日收購 Assured Robot Intelligence,一家在聖地牙哥和紐約設有辦公室的 AI 機器人初創公司。被收購團隊(包括共同創辦人 Lerrel Pinto 和 Xiaolong Wang)將加入 Meta 超級智能實驗室,並與 Meta Robotics Studio 合作。財務
GateNews2小時前