NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態

鏈新聞abmedia

根據 NVIDIA 官方部落格 4 月 28 日公告(作者 Kari Briski),NVIDIA 發表 Nemotron 3 Nano Omni — 開源多模態模型,把視覺、語音與語言能力整合進單一模型,目標是為 AI agent 系統提供更低延遲、更省成本的「感知層」。

核心規格:30B-A3B MoE、256K context、9 倍吞吐量、登 6 個排行榜首位

關鍵架構:

30B-A3B hybrid mixture-of-experts(總參數 30B、活化 3B)

整合 Conv3D 與 EVS 編碼

256K context 長度

輸入:文字、影像、音訊、影片、文件、圖表、GUI 螢幕

輸出:文字

性能訊號:較其他開源 omni 模型在同等互動性下達 9 倍吞吐量;於文件智慧、影片理解、音訊理解三大類共 6 個基準排行榜取得首位(NVIDIA 公告未列出具體分數,引導讀者前往開發者部落格查看詳細資料)。

NVIDIA 把 Nemotron 3 Nano Omni 定位為 agent 系統中的「眼睛與耳朵」,可與 Nemotron 3 Super(高頻執行)、Nemotron 3 Ultra(複雜規劃)等同家族模型分工,亦可與第三方雲端模型互通。三個典型 agent 應用場景:

電腦操作代理(Computer Use Agent):原生 1920×1080 解析度視覺推理

文件智慧:跨圖、表、截圖與混合媒體輸入推理

音訊/影片理解:把講話、畫面、紀錄整合為單一推理串

採用方陣容:鴻海、Palantir 入列、H Company CEO 具名表態

NVIDIA 公告中明確區分「生產採用」與「正在評估」:

已生產採用:Aible、Applied Scientific Intelligence(ASI)、Eka Care、鴻海(Foxconn)、H Company、Palantir、Pyler

正在評估:Amdocs、Dell、Docusign、Infosys、IQVIA、Lila、Oracle、Quantiphi、TCS、Zefr 等

H Company 執行長 Gautier Cloix 在公告中具名表態:「To build useful agents, you can’t wait seconds for a model to interpret a screen. By building on Nemotron 3 Nano Omni, our agents can rapidly interpret full HD screen recordings — something that wasn’t practical before.」翻譯:「打造實用代理時,你不能等模型秒級解讀螢幕。建立在 Nemotron 3 Nano Omni 之上,我們的代理可快速解讀完整 HD 螢幕錄影 — 這在之前並不實際可行。」

開源策略與布署:weights / datasets / 訓練方法全公開

NVIDIA 在發布同時公開:

模型權重

訓練資料集

訓練技術/方法論

布署管道涵蓋三層:

本地工作站:NVIDIA DGX Spark、DGX Station

NIM 微服務:build.nvidia.com

第三方平台:Hugging Face、OpenRouter,並透過 25 個以上 NVIDIA Cloud Partners、推理平台與雲端服務商提供

客製化工具則使用 NVIDIA NeMo。Nemotron 3 家族(Nano/Super/Ultra)過去一年在 Hugging Face 累積下載超過 5,000 萬次,本次 Omni 將該家族能力延伸至多模態與 agentic 領域。

這篇文章 NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

AWS、Coinbase、Stripe 為 AI 代理推出 USDC 付款服務

亞馬遜網路服務(Amazon Web Services)週四宣布推出「Amazon Bedrock AgentCore Payments」,這是一組新的功能,可讓 AI 代理在與 Coinbase 和 Stripe 合作的情況下,使用穩定幣來執行交易。該平台讓 AI 代理能立即存取並支付服務,包括網路 c

Crypto Frontier32分鐘前

CZ 表示 YZi Labs 在 Consensus Miami 2026 將 70% 分配給區塊鏈,20% 分配給 AI

根據 ChainCatcher 報導,在 Consensus Miami 2026 上,趙長鵬(CZ)表示 YZi Labs 將 70% 的資金投向區塊鏈、20% 投向 AI、10% 投向生物科技。CZ 進一步補充,BNB 應被定位為 AI 代理的原生貨幣,且所有區塊鏈都需要「AI ready」以支援

GateNews1小時前

Zypher Network 導入 AIDEN 以提升區塊鏈知識的可近性

根據 IQ AI 於 5 月 6 日的官方公告,Zypher Network 已整合由 IQ AI 開發的 AIDEN,這是一款人工智慧代理,以提升區塊鏈知識的可近性,並強化 AI 驅動生態系統中的可稽核性。此次合作推出了一個專屬的維基頁面

GateNews1小時前

Virtuals Protocol 推出 OpenGradient Titan 空投,今部分發 50 萬 OPG

根據 Virtuals Protocol 的官方公告,OpenGradient Titan Launch 空投已於 5 月 7 日正式上線。符合資格的用戶可直接從其 Virtuals 帳戶領取 OPG 代幣。今天將發放總計 500,000 OPG 代幣,以獎勵對 Virtuals 的貢獻者。

GateNews5小時前

NeoSoul 與 AllScale 今日宣布在代理信貸與穩定幣結算方面的策略合作

根據 ChainCatcher,AI Agent Economy 專案 NeoSoul 於今日(5 月 7 日)宣布與 AllScale 建立策略合作夥伴關係,藉此探索用於自主 Agent 協作的信用生成與穩定幣結算機制。該合作夥伴關係將聚焦於自動化 Agent 之間的付款流程——作為

GateNews6小時前

FIS 與 Anthropic 開發用於反洗錢的 AI 代理,並計畫在 2026 年下半年部署至 BMO 以及 Amalgamated Bank

FIS 和 Anthropic 正在開發用於自動化金融犯罪調查的 AI 代理程式,先從反洗錢作業開始。金融犯罪 AI 代理程式將從銀行系統提取資料,並將交易與已知手法進行比對評估,以協助調查人員審閱其相關內容

GateNews8小時前
留言
0/400
暫無留言