OpenAI Researchers: AI Systems Could Handle Most Research Work Within Two Years

Gate News message, April 29 — OpenAI researchers Sébastien Bubeck and Ernest Ryu say AI systems could perform most human research work within two years, presenting mathematics as a clear measure of AI progress. Unlike vague performance tests, mathematical problems offer precise verification: answers are either correct or incorrect, leaving no room for ambiguity.

Bubeck noted that true AI thinking requires surviving long chains of reasoning. A single error in a multi-step argument collapses the entire proof, making error detection and correction mid-process the ultimate goal for advanced models. OpenAI’s internal labs have already generated more than ten completely new theorems publishable in top-tier combinatorics journals, demonstrating that AI now produces genuinely original, groundbreaking work beyond simply recombining existing papers.

However, sustained scientific breakthroughs demand steady focus across weeks of testing. Current systems still require strict human supervision to guide and verify each shift in direction. Bubeck uses “AGI time” to measure how long a model can independently mimic human thinking; current systems operate at roughly days to one week, with the industry target being weeks or months to enable autonomous work in fields like biology.

Long-term memory is critical to this future. Standard chat windows limit depth—complex mathematical proofs often exceed 50 pages—while code repositories demonstrate how extended work sessions enable deeper problem-solving. As AI gains independence and memory, human expertise becomes more valuable, not less. Workers must retain the deep foundational knowledge to challenge and verify machine answers, and organizations will need new automated filters and reputation systems to maintain trust amid a flood of AI-assisted research.

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

OpenClaw 於 2026.4.29 版本在 4 月 29 日發布,將記憶體升級為具備關係追蹤的個人化 Wiki

根據 Beating,開源 AI 助手 OpenClaw(GitHub 367K 星)於 4 月 29 日發布了 v2026.4.29,標誌著其在兩天內的第二次更新。其記憶系統已從單純的檢索式回憶演進為個人化維基,使代理能夠自動建立角色檔案並追蹤 r

GateNews46分鐘前

馬斯克作證稱 xAI 使用 OpenAI 模型來訓練 Grok

根據 TechCrunch 的報導,Elon Musk 週四在加州的聯邦法院作證表示,他的人工智慧公司 xAI 在訓練其 Grok 聊天機器人時,部分使用了 OpenAI 模型。此項承認代表了主要 AI 開發者對一種在不斷加劇

Crypto Frontier3小時前

谷歌執行長皮查伊透露利用 Gemini AI 洞悉人性建立更真誠的溝通

皮查伊表示在重要會議前,他用 Gemini 的觀點分析預測對方心理,藉此增進同理心與更真誠的溝通。AI 代理也能自動整理郵件、排程與摘要,使日常瑣事更高效。另以開放共創為核心的AI平台正在興起,Gemini 4 等開源技術降低門檻;同時強調建立 AI 治理框架,政界與社會需參與以解決網安、深偽與永續等挑戰。

鏈新聞abmedia3小時前

OpenAI 為 ChatGPT 推出進階帳戶安全功能

進階帳戶安全啟用 OpenAI 於週四推出「進階帳戶安全」:一項供 ChatGPT 使用者自行選擇啟用的新設定,適合希望獲得更強保護或面臨更高數位攻擊風險的使用者。該公司表示,新功能的推出是為了回應人們如何

Crypto Frontier4小時前

X (推特) 迎來 20 年最大廣告平台升級,xAI 介入,AI 語意投放成核心

X 宣布自2026年4月起推出20年來最大廣告平台改造,重建底層技術並結合 xAI。新平台以 AI 驅動成效優化、語意與情境廣告為核心,提升操作便利與投放控管,目標把廣告轉化為即時語境的商業信號,並配合 Everything App 策略成為 X 生態的商業引擎。

鏈新聞abmedia7小時前

OpenAI 支援的 1X 在加州開設 58,000 平方英尺工廠,第一年目標部署 10,000 台機器人

根據彭博社,1X Technologies 是一家挪威成立、獲 OpenAI 支援的機器人新創公司,已在美國加州海沃德(Hayward)開設了一座 58,000 平方英尺的製造工廠,目標是成為大規模生產消費級人形機器人的先驅。 預計該工廠將在其

GateNews10小時前
留言
0/400
暫無留言