Google 推出第八代 TPU 晶片:效能與價格比提升,並分離訓練與推理

Gate News 訊息,4 月 22 日——Google Cloud 宣布於 4 月 22 日發布其第八代自研自建的 TPU (Tensor Processing Unit) 晶片。新版陣容包含 TPU 8t,專為 AI 訓練任務設計,以及 TPU 8i,針對 AI 推理工作負載進行最佳化。兩款晶片都將在今年稍後提供。Google 也推出用於建置 AI 代理的新工具,並宣布一項 $750 百萬級基金,以推動企業採用 AI。

TPU 8t 在相同價格點下,提供比 Google 先前世代 Ironwood TPU 高 2.8 倍的效能。TPU 8i 相較於前代提升 80% 的效能,並採用靜態隨機存取記憶體 (SRAM) 架構,以實現「具成本效益的大規模吞吐與低延遲,讓數百萬個代理能同時運行」,根據執行長 Sundar Pichai 的說法。相較於 Ironwood,TPU 8t 與 TPU 8i 均達成超過雙倍的每瓦效能效率,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。Google 在整個技術堆疊中最佳化電源效率,並整合動態電源管理系統,能根據即時需求調整用電量。

Google 的自家模型目前透過直接客戶 API 呼叫,每分鐘處理超過 1600 億個 tokens;相比上個季度的 1000 億增長。如今在 Google,AI 生成了 75% 的所有新增程式碼;而去年秋季為 50%。Google 的企業產品 Gemini Enterprise,在付費月活用戶方面按季成長 40%。該公司預期,到 2026 年,將把略超過其機器學習運算預算的一半投資於雲端服務,以更好地服務雲端客戶與合作夥伴。Google 也在擴大與 Broadcom 的合作,為未來世代開發並供應客製化 TPU 晶片,因為主要科技公司正尋求 NVIDIA 與 AMD 成本高且供應受限的 GPU 之替代方案。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

谷歌執行長皮查伊透露利用 Gemini AI 洞悉人性建立更真誠的溝通

皮查伊表示在重要會議前,他用 Gemini 的觀點分析預測對方心理,藉此增進同理心與更真誠的溝通。AI 代理也能自動整理郵件、排程與摘要,使日常瑣事更高效。另以開放共創為核心的AI平台正在興起,Gemini 4 等開源技術降低門檻;同時強調建立 AI 治理框架,政界與社會需參與以解決網安、深偽與永續等挑戰。

鏈新聞abmedia12分鐘前

OpenAI 為 ChatGPT 推出進階帳戶安全功能

進階帳戶安全啟用 OpenAI 於週四推出「進階帳戶安全」:一項供 ChatGPT 使用者自行選擇啟用的新設定,適合希望獲得更強保護或面臨更高數位攻擊風險的使用者。該公司表示,新功能的推出是為了回應人們如何

Crypto Frontier59分鐘前

X (推特) 迎來 20 年最大廣告平台升級,xAI 介入,AI 語意投放成核心

X 宣布自2026年4月起推出20年來最大廣告平台改造,重建底層技術並結合 xAI。新平台以 AI 驅動成效優化、語意與情境廣告為核心,提升操作便利與投放控管,目標把廣告轉化為即時語境的商業信號,並配合 Everything App 策略成為 X 生態的商業引擎。

鏈新聞abmedia4小時前

OpenAI 支援的 1X 在加州開設 58,000 平方英尺工廠,第一年目標部署 10,000 台機器人

根據彭博社,1X Technologies 是一家挪威成立、獲 OpenAI 支援的機器人新創公司,已在美國加州海沃德(Hayward)開設了一座 58,000 平方英尺的製造工廠,目標是成為大規模生產消費級人形機器人的先驅。 預計該工廠將在其

GateNews6小時前

白宮起草 AI 政策備忘錄,指示美國各機關於 4 月 30 日採用多家 AI 供應商

根據 PANews 在 4 月 30 日援引的消息來源,白宮官員正在起草一份廣泛的人工智慧政策備忘錄,指示美國政府機構採用多家 AI 服務供應商,並避免依賴單一供應商。該備忘錄也要求所有受僱於合約的 AI 公司

GateNews7小時前

中國網信辦於 4 月 30 日啟動為期 4 個月的行動,以遏制 AI 應用的混亂局面

根據 CCTV News,中國網信辦於 4 月 30 日啟動為期四個月的全國性行動,以解決 AI 應用混亂問題。該行動分兩個階段部署,目標針對包括模型註冊缺失、平台安全與審查能力不足等問題,

GateNews7小時前
留言
0/400
暫無留言