OpenAI Engineer Clive Chan Challenges V4 Hardware Recommendations, Citing Errors and Vagueness vs. V3

Gate News message, April 24 — OpenAI engineer Clive Chan has raised detailed objections to the hardware recommendations chapter in the V4 technical report, calling it “surprisingly mediocre and error-prone” compared to the acclaimed V3 version. V3’s hardware guidance, which included Q&A sessions that became the most popular discussion topic at the ISCA academic conference, offered specific recommendations aligned with industry interconnect standards. V4, by contrast, is far more vague.

Chan systematically challenged three key recommendations. On power consumption, the report suggests that software optimization allows chips to run compute, storage, and communication at full capacity simultaneously, and recommends that chip manufacturers reserve additional power headroom. Chan argues this is counterproductive: total chip power is constrained by physical process limitations, so reserving more power margin only reduces operating frequency, ultimately decreasing computational performance. Regarding GPU-to-GPU data transfer, the report advocates a pull model—where GPUs actively fetch data—over a push model, citing high notification overhead in push operations. Chan disputes this, contending that pull is actually slower and that improved network adapter capabilities would be preferable. However, the two may be discussing different layers of the issue: the report addresses notification mechanism overhead, while Chan refers to transmission latency itself.

On activation functions, the report recommends replacing SwiGLU with simpler functions to reduce computational burden. Chan sees no merit in this, noting that Sonic MoE has already demonstrated optimal performance using SwiGLU. Chan suspects DeepSeek may have “deliberately weakened this section.”

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

OpenAI 為 ChatGPT 推出進階帳戶安全功能

進階帳戶安全啟用 OpenAI 於週四推出「進階帳戶安全」:一項供 ChatGPT 使用者自行選擇啟用的新設定,適合希望獲得更強保護或面臨更高數位攻擊風險的使用者。該公司表示,新功能的推出是為了回應人們如何

Crypto Frontier23分鐘前

X (推特) 迎來 20 年最大廣告平台升級,xAI 介入,AI 語意投放成核心

X 宣布自2026年4月起推出20年來最大廣告平台改造,重建底層技術並結合 xAI。新平台以 AI 驅動成效優化、語意與情境廣告為核心,提升操作便利與投放控管,目標把廣告轉化為即時語境的商業信號,並配合 Everything App 策略成為 X 生態的商業引擎。

鏈新聞abmedia3小時前

OpenAI 支援的 1X 在加州開設 58,000 平方英尺工廠,第一年目標部署 10,000 台機器人

根據彭博社,1X Technologies 是一家挪威成立、獲 OpenAI 支援的機器人新創公司,已在美國加州海沃德(Hayward)開設了一座 58,000 平方英尺的製造工廠,目標是成為大規模生產消費級人形機器人的先驅。 預計該工廠將在其

GateNews6小時前

白宮起草 AI 政策備忘錄,指示美國各機關於 4 月 30 日採用多家 AI 供應商

根據 PANews 在 4 月 30 日援引的消息來源,白宮官員正在起草一份廣泛的人工智慧政策備忘錄,指示美國政府機構採用多家 AI 服務供應商,並避免依賴單一供應商。該備忘錄也要求所有受僱於合約的 AI 公司

GateNews6小時前

中國網信辦於 4 月 30 日啟動為期 4 個月的行動,以遏制 AI 應用的混亂局面

根據 CCTV News,中國網信辦於 4 月 30 日啟動為期四個月的全國性行動,以解決 AI 應用混亂問題。該行動分兩個階段部署,目標針對包括模型註冊缺失、平台安全與審查能力不足等問題,

GateNews7小時前

Forefront Tech 完成 $100M IPO 定價,並在 Nasdaq 以代碼 FTHAU 上市

根據 ChainCatcher,特殊目的收購公司 Forefront Tech 已於 4 月 30 日完成 1 億美元 IPO 定價,並將以代號 FTHAU 在那斯達克上市。該公司計劃使用募資所得以追求區塊鏈、金融科技、人工智慧方面的併購機會

GateNews8小時前
留言
0/400
暫無留言