“龍蝦熱”席捲全球之際 黃仁勳攜開源模型炸場! 英偉達(NVDA.US)全棧野心托起“AI牛市敘事”
時間:2026-03-12 16:10:29
英偉達
美國超威
智通財經APP獲悉,隨着Anthropic推出的Claude Cowork,以及OpenClaw(即所謂的“龍蝦”)這類可自主執行任務的AI智能體風靡全球,“AI芯片超級霸主”英偉達(NVDA.US)欲緊抓這波AI代理超級大浪潮,該公司已推出其專爲超大規模AI智能體所打造的開源大模型“Nemotron 3 Super”,旨在以可擴展方式運行極度複雜的代理式AI智能系統。在Pinchbench基準測試層面,Nemotron 3 Super可謂一騎絕塵,穩坐開源第一。在OpenClaw任務成功率上,它拿下了85.6%的高分,性能直逼Claude Opus 4.6、GPT-5.4這兩大閉源模型。
英偉達最新此舉可謂大幅強化這家全球市值最高公司(約4.5萬億美元)從單純的AI芯片供應商向“模型—工具鏈—雲推理服務—AI生態系統”全棧平臺轉變趨勢,對於英偉達股價而言,可能不久後將再創歷史新高且帶動全球AI算力產業鏈邁向新一輪上行軌跡。英偉達官方在一份聲明中表示,這一模型結合了最先進的推理能力,能夠以高精度高效完成天量級AI任務,適用於企業級自主AI代理系統。
英偉達表示,這一全新的1200億參數開放模型採用混合專家模型(MoE)架構,融合了三項創新,與上一代Nemotron Super 模型相比,推理性能提升3倍有餘,吞吐量最高可提升至5倍,準確率最高可提升至2倍。
英偉達指出,AI搜索領軍者Perplexity開始向其用戶們提供Nemotron 3 Super,用於AI智能體驅動的系統性搜索,並作爲Computer中20個編排模型之一。提供高級軟件開發代理的科技公司,比如CodeRabbit、Factory以及Greptile,正在將該模型與其專有AI大模型一同集成到各自的 AI代理服務中,以在更低成本下實現更高準確率以及大幅提高企業經營效率。
據英偉達稱,Edison Scientific以及Lila Sciences 等生命科學與最前沿AI研究機構,將利用該旗艦開源模型爲其代理模式提供重大支持,用於深度文獻檢索、數據科學和分子理解等等複雜功能。
英偉達補充稱,Amdocs、美國AI+數據分析領軍者Palantir(PLTR.US)、EDA芯片設計軟件領軍者Cadence(CDNS.US),以及來自歐洲的達索系統與西門子這兩大老牌巨頭,正在積極部署並定製化英偉達該款模型,以實現電信、網絡安全、半導體設計和製造等領域工作流程的代理式自動化願景或者全方位更新迭代訂閱式產品。
從模型結構與部署參數看,Nemotron 3 Super不是簡單把參數堆到1200億參數,而是做成了一個更適合企業級agent代理式工作流的“高總參、低激活”體系:總參數120B,推理時僅激活12B,上下文窗口原生支持100萬tokens,最小部署門檻爲8×H100 80GB。其骨幹是 LatentMoE+Mamba-2+少量 Attention的混合架構,並加入2個共享權重的MTP(Multi-Token Prediction)層;在官方技術報告裏,這個基座模型共有88層、模型維度4096、32個Q heads、2個KV heads、每層512個experts、Top-k 激活22個experts、MoE Latent Size 1024。
因此,英偉達的這套革新式開源AI智能體模型設計的工程意義很明確:用MoE控制激活開銷,用Mamba拉長上下文和吞吐,用Attention保住精確檢索與推理穩定性,因此它更像是面向多智能體編排、長鏈條工具調用、長上下文記憶的“agent orchestration brain”(代理編排主腦),而不是單純追求單輪對話分數的大模型。
全球最大規模智能手機芯片公司高通(QCOM.US)的首席執行官克里斯蒂亞諾·阿蒙近日在巴塞羅那世界移動通信大會(MWC Barcelona)上表示,即將到來的“人工智能代理”(即AI Agent)超級大浪潮將改變更廣泛的數字生態系統。
阿蒙表示,2026年將是“AI代理之年”。“我們將從一個以移動智能手機爲中心、以應用程序爲中心的數字化生態系統,轉向一個以代理爲中心的跨時代生態系統,”阿蒙表示。“AI代理將成爲中心。它們不只是對你作出迴應。它們會觀察、會解讀、會行動。”
英偉達的野心:不僅要做芯片供應商,還是做“AI基礎設施總承包商”
從效率指標看,Nemotron 3 Super的絕對賣點不是絕對精度碾壓,而是“在相近精度下,把agent系統的推理吞吐和成本打下來”。NVIDIA 官方技術報告給出的口徑是:在 8k 輸入/64k 輸出設置下,Nemotron 3 Super 的推理吞吐可達GPT-OSS-120B的2.2倍、Qwen3.5-122B的7.5倍;官方博客還稱,它相對上一代Nemotron Super 可實現5倍以上級別的吞吐。
英偉達在模型聲明中指出,隨着全球企業對於AI應用驅動的經營需求逐步超越AI聊天機器人,積極邁向多代理應用,它們面臨兩項限制。
第一項限制是上下文爆炸。多代理工作流產生的token數量可高達標準聊天的至少15倍,因爲每一次交互都需要重新發送完整版歷史記錄,包括工具輸出和中間推理過程。第二項限制是思考稅。據該公司聲明稱,極度複雜的代理必須在每一步都進行推理,但若每個子任務都使用大模型參數,多代理應用就會變得成本過高且響應非常遲緩,企業實際經營中難以實際落地。
英偉達表示,Nemotron 3 Super具有100萬token級別的上下文窗口,使代理模式工作流能夠在內存中保留完整的工作流狀態,並防止目標漂移。該公司補充稱,其1200億參數中,推理時僅有120億參數處於激活狀態。
在多代理式AI智能體工作流中,AI推理任務通常是指運行一個訓練工作流徹底完成的AI大模型,以便對全新的、甚至此前未見過的海量數據產生預測或得出推導式結論的過程。
在英偉達的Blackwell平臺上,該模型以NVFP4精度運行。這也意味着英偉達將內存需求降至更低水平,並使推理速度最高可達到該公司 Hopper平臺FP8的足足4倍,且不會損失任何程度的準確率。

該公司指出,這一模型是基於使用前沿推理模型生成的合成數據進行深度訓練。Nemotron 3 Super可通過build.nvidia.com、Perplexity、OpenRouter和Hugging Face以完全開源方式獲取。
Nemotron 3 Super本身就是英偉達所釋放出的一個很典型的“全棧信號”:它不是單獨賣模型,而是把120B總參數 / 12B激活參數、100萬級別token 上下文、Blackwell優化、英偉達NIM微服務生態、NeMo微調生態、英偉達雲端算力體系與本地化部署合作伙伴放在同一個英偉達主導的軟硬件一體化AI生態產品體系裏,直接服務極度複雜的agent代理式工作流。英偉達正在把企業核心價值鏈從“賣AI算力加速卡”擴展到“定義 agent 模型、推理棧、部署路徑和企業工作流入口”,其角色越來越像 AI 基礎設施總承包商,而不只是芯片供應商。
英偉達表示,AI服務器製造巨頭戴爾科技(DELL.US)正將該模型引入Hugging Face平臺上的Dell Enterprise Hub,以便在Dell AI Factory 上進行完全本地化部署,從而推進企業多代理AI工作流。英偉達還表示,另一AI服務器領軍者慧與科技(HPE.US)也在將Nemotron引入其agents hub,以幫助確保代理式AI在企業中的可擴展落地。
英偉達於去年12月開始推出Nemotron 3系列開源模型。此外,這家美國科技巨頭定於下週3月16日至19日舉辦其全球AI超級大會——英偉達 GPU技術大會(即GTC)。該公司稱,從物理AI、AI工廠到代理式AI與推理,GTC 2026將展示正在重塑各個行業的突破式技術進展。
AI GPU+CUDA護城河愈發堅固,英偉達股價直指歷史新高?
英偉達在官方博客中稱,Nemotron 3 Super 在 PinchBench 全套測試中達到 85.6%,是其口徑下“同類最佳開源模型”,在OpenClaw任務成功率上,它更是拿下了85.6%的高分,整體性能直逼Claude Opus 4.6、GPT-5.4。因此,對於英偉達新推出的Nemotron 3 Super而言更準確的定位是:如果一家普通企業需要做複雜多步代理、長流程編排、代碼/終端/工具調用混合型工作負載,Nemotron 3 Super 不一定是單點最強,但很可能是當前開源+付費型閉源陣營裏最接近“可規模化部署的agent智能體主腦”之一。
就護城河而言,英偉達在創始人黃仁勳帶領下,英偉達憑藉AI GPU算力體系 + CUDA構築起來的“超級AI護城河”無疑是因Nemotron 3 Super 重磅問世而變得更堅實。正如上所述,其角色越來越像AI基礎設施總承包商,而不僅僅是AI芯片供應商。
根據英偉達官方博客聲明,Nemotron 3 Super不只是跑在英偉達GPU平臺上效率造,而是被官方明確做成了爲Blackwell推理效率和 agent 場景優化的大模型;官方稱其相對上一代 Nemotron Super吞吐最高提升5倍、準確率最高提升2倍,在 8k 輸入/ 64k輸出環境下,吞吐可達 GPT-OSS-120B 的2.2倍、Qwen3.5-122B的7.5倍,且在Blackwell上用NVFP4進行天量級別的推理任務時,相比Hopper FP8可快至 4 倍。這種“模型架構—量化格式—推理框架—旗艦GPU平臺”協同,會讓CUDA、TensorRT-LLM、NIM、DGX/Blackwell的聯動更難被任何變量單點替代。也在說明,英偉達正在把護城河從“單一GPU性能與CUDA壁壘”上移到“模型架構—推理棧—GPU 平臺—企業部署”的整套AI系統能力。
華爾街分析師們最近對英偉達的整體態度,隨着Nemotron 3 Super 重磅問世,可謂是在邊際上轉向更加積極看漲立場。Nemotron 3 Super 以及英偉達愈發轉向“全棧式AI平臺”的大趨勢,無疑將共同成爲英偉達股價突破此前在10月創下的歷史最高點位——即212.167美元的核心催化劑。截至週三美股收盤,英偉達股價收於186.03美元。
來自華爾街金融巨頭摩根士丹利的分析師團隊近日在英偉達股價經歷一段向下調整,且股價持續橫盤震盪之際,重申英偉達爲半導體板塊“首選”股票標的,並且維持“增持”評級與260美元目標價,強調當前乃最佳逢低買入時機。TIPRANKS彙編的華爾街分析師平均股價顯示,分析師們普遍看好英偉達股價衝至273美元,意味着在他們看來,英偉達未來12個月上行潛力高達驚人的47%。

大摩最新的渠道調查顯示,目前全球“AI算力供需缺口每日以個位數級別大幅擴大”,雲計算超級巨頭們(Hyperscalers)對AI工作負載的增長依然極其激進。大摩調研顯示,即便一部分Hyperscalers客戶(比如亞馬遜,與Meta)自研AI ASIC或採購 AMD AI GPU算力集羣,預計這些超級客戶們在2026年對英偉達產品的採購量仍將大幅增長80%以上。
大摩指出,即將到來的GTC 2026大會將展示該公司領先的技術路線圖,有效回擊市場對份額流失的疑慮;Vera Rubin架構與英偉達在物理AI(Physical AI)領域的最新佈局將開闢全新的市場總值(TAM)空間。

當模型規模、推理鏈路與多模態/代理式Agentic AI工作負載推動算力消耗呈指數型外擴時,科技巨頭們的資本開支主線更傾向於向AI算力基礎設施集中,全球投資者們更是將圍繞英偉達與AMD的新品迭代與AI算力集羣交付的“AI牛市敘事”,繼續錨定爲全球股市中最具確定性的景氣投資敘事之一,同時也意味着電力、液冷散熱系統、光互連供應鏈等與AI訓練/推理密切相關的投資主題將跟隨英偉達、AMD以及博通、臺積電、美光等AI算力領軍者們在中東地緣政治局勢面臨不確定性之際,仍繼續位列股票市場最火熱投資陣營。
根據機構彙編的最新分析師預期,亞馬遜連同谷歌母公司Alphabet、Facebook母公司Meta Platforms Inc.,以及甲骨文公司和微軟,預計將在2026年的累計人工智能相關資本支出達到大約6500億美元,還有一些分析師認爲整體支出可能超過7000億美元——意味着同比AI資本開支增幅可能超過70%。值得注意的是,上述的這五大美國超級科技巨頭,預計將在2023年至2026年間,爲打造無比龐大的AI算力基礎設施累計投入約1.5萬億美元;相比之下,這些科技巨頭們在2022年之前的整個歷史統計期間累計投資約6000億美元。
免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!


