Perplexity 共同創辦人認為 AI 權力集中會造成安全風險

Perplexity AI 共同創辦人 Andy Konwinski 本週發表一篇論文,主張 AI 權力集中會帶來安全風險,而非解決方案。該論文引用了 Anthropic 的 Claude Fable 5 爭議,並接續了 Konwinski 於 6 月 30 日在舊金山探索博物館召開的工作會議「Open Frontier」,該會議吸引了約 100 名研究人員。Anthropic 於 6 月 9 日推出 Claude Fable 5,其中包含一項功能,會對被懷疑訓練競爭對手 AI 系統的使用者降低回應品質,隨後在公眾反彈後於 48 小時內撤銷此決定。

Anthropic 撤銷 Claude Fable 5 回應降級政策

Anthropic 於 6 月 9 日推出 Claude Fable 5,在其 319 頁的系統卡中埋藏一項揭露,聲明該模型會對任何被懷疑訓練競爭對手 AI 的人悄悄降級自己的回應。研究人員發現這項揭露後,公眾反彈隨之而來。Anthropic 在 48 小時內撤銷了這項決定。

Konwinski 在論文中寫道,撤銷決定並未解決核心問題。「問題不在於 Anthropic 做出了糟糕的決定,」他寫道。「問題在於他們假設這個決定是他們有權做出的。」他的論文題為「AI 權力集中是風險,而非解決方案」,主張集中訪問權限會創造風險,而非消除風險。

Open Frontier 會議於 6 月 30 日吸引 100 名研究人員

Konwinski 透過他的非營利組織 Laude Institute,於 6 月 30 日在舊金山探索博物館召開 Open Frontier。約 100 名研究人員參加了這場工作會議。

加州大學柏克萊分校計算機、數據科學與社會學院院長 Jennifer Chayes 在一個資助小組會議上表示,柏克萊的研究人員「都在中國模型上進行開發,因為我們沒有西方的開放前沿模型。」Chayes 指出,OpenAI 和 Anthropic 在首次公開募股前的安全訊息傳遞相當於一場「非常有效的恐懼宣傳活動」。

Konwinski 的論點將 AI 定位為與鐵路、電力和網際網路同類的基礎設施。他提出的替代方案:一個擁有前沿規模計算資源的研究共享空間,讓頂尖研究人員無需獲得私人實驗室的許可即可觸及前沿。

Yann LeCun 將封閉式 AI 實驗室比作鄂圖曼帝國印刷禁令

Meta 前首席科學家 Yann LeCun 在 X 上回覆了 Konwinski 的論文。「我多年來一直在傳播類似的信息,」LeCun 寫道。「AI 權力集中與控制慾望是迄今為止 AI 最大的危險。」

LeCun 將當前的封閉實驗室 AI 時刻比作「類似鄂圖曼帝國禁止使用印刷機長達 200 年的中世紀蒙昧主義,部分原因是為了保持對教條的控制,同時也是為了保護書法家和抄寫員的行會。」

LeCun 於 2026 年 3 月以 10.3 億美元種子資金創立 AMI Labs

LeCun 於 2025 年底離開 Meta,並於 2026 年 3 月在巴黎創立 AMI Labs,獲得 10.3 億美元種子資金。該公司基於世界模型和他的 JEPA 架構運行,計劃開源其研究,並且預計多年內不會有商業產品。

常見問題

Andy Konwinski 本週在他的論文中提出了什麼論點?

Andy Konwinski 主張集中 AI 權力會帶來安全風險,而非防止傷害。他引用 Anthropic 的 Claude Fable 5 爭議作為證據,證明私人實驗室假設 AI 存取決策是他們的權限。他的論文題為「AI 權力集中是風險,而非解決方案」,接續了他於 6 月 30 日召開的 Open Frontier 會議。

Anthropic 在 6 月 9 日關於 Claude Fable 5 揭露了什麼?

Anthropic 在 6 月 9 日的 Claude Fable 5 的 319 頁系統卡中揭露,該模型會對任何被懷疑訓練競爭對手 AI 的人悄悄降級自己的回應。研究人員發現這項揭露後,公眾反彈隨之而來。Anthropic 在 48 小時內撤銷了這項決定。

Yann LeCun 何時創立了 AMI Labs?

Yann LeCun 於 2026 年 3 月在巴黎創立 AMI Labs,獲得 10.3 億美元種子資金。LeCun 於 2025 年底離開 Meta。AMI Labs 基於世界模型和他的 JEPA 架構運行,計劃開源其研究,並且預計多年內不會有商業產品。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆