Site logo

A推理狂潮來襲 英偉達(NVDA.US)全力迎戰TPU! 拿下Groq核心團隊後瞄準AI21 Labs

时间2025-12-31 07:48:04

英伟达

谷歌A

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

智通財經APP獲悉,有媒體援引知情人士透露的消息報道稱,“AI芯片超級霸主”兼全球最高市值公司英偉達(NVDA.US)在此前豪擲200億美元拿下Groq核心團隊後不久,正在就以20億美元至30億美元收購總部位於以色列的人工智能領軍者AI21 Labs進行深入收購談判。

英偉達此次欲拿下AI21 Labs,加之前不久與AI芯片初創公司Groq達成的200億美元非獨家授權合作協議,將其AI推理技術授權給英偉達,並且在交易完成後Groq創始人及核心研發團隊將加入英偉達,可謂共同凸顯出隨着“全球AI推理大浪潮”全面來襲,疊加谷歌TPU AI算力集羣帶來的越來越大競爭壓力,英偉達力爭通過“多架構AI算力+鞏固CUDA生態+引進更多AI芯片設計人才”來維持其在AI芯片領域高達80%市場份額的絕對主導權,並且英偉達欲以Groq+AI21連下關鍵兩子鎖住AI全棧話語權。

據瞭解,以色列AI初創公司AI21 Labs聚焦於開發大語言模型(即LLM),並使企業能夠快速構建類似ChatGPT的定製化企業級生成式AI應用,在企業AI生態具備重要地位。該公司於2017年由Amnon Shashua共同創立,Shashua同時也是自動駕駛領域主導者Mobileye(MBLY.US)的聯合創始人兼首席執行官。

據媒體報道稱,這家AI初創公司在2023年的一輪由英偉達(NVDA.US)和谷歌(GOOGL.US)領投的融資之後,經歷最近一次的融資後的整體估值約爲14億美元。該公司約有200名員工,其中許多人擁有高等理工科學位並在AI應用開發方面具備非常豐富的經驗。這意味着英偉達可能更看重AI21頂尖員工們的綜合AI技能組合,而不僅僅是該公司的技術本身。

黃仁勳越來越青睞以色列科技公司

過去幾年裏,英偉達一直在積極收購總部位於以色列的那些最頂級科技公司。比如在去年12月,英偉達正式完成對Run:ai的收購;Run:ai的獨家技術可大幅提升英偉達AI芯片綜合能效,並能大幅減少完成任務所需的具體GPU數量。交易條款從未披露,但此前有媒體報道稱英偉達爲該項收購支付了大約7億美元。

同一年,英偉達還收購了Deci,該公司對AI大模型進行基於獨家技術的深度改造以確保其以更低成本高效率運行。而在2019年,英偉達以69億美元收購了當時以色列最熱門科技公司Mellanox——一家端到端以太網與InfiniBand高速智能互連解決方案與網絡服務的領先綜合供應商,面向服務器與存儲,Mellanox的核心技術可謂是英偉達當前所主導的“InfiniBand + Spectrum-X/以太網”高性能網絡基礎架構的最基礎底座。

據媒體報道,英偉達當前正在Kiryat Tivon建設一座大型研發中心,該地位於以色列海法以南。曾有媒體報道稱,英偉達首席執行官兼聯合創始人黃仁勳曾將以色列稱爲其領導的這家芯片公司的“第二故鄉”。

英偉達曾表示,大型研發園區建成後,將包括高達160000平方米(大約170萬平方英尺)的辦公空間、公園和公共區域,佔地90德南(22英畝),其設計靈感來自英偉達位於加利福尼亞州聖克拉拉的全球總部。英偉達預計,該項目將於2027年開工,預計2031年投入使用。

AI推理大浪潮來襲,英偉達感受到谷歌TPU帶來的愈發強大競爭壓力

英偉達AI GPU幾乎壟斷的AI訓練側需要更加強大的AI算力集羣通用性以及整個算力體系的快速迭代能力,而AI推理側則在前沿AI技術規模化落地後更看重單位token成本、延遲與能效。谷歌明確把Ironwood定位爲“爲AI推理時代而生”的TPU代際,並強調性能/能效/算力集羣性價比與可擴展性。

當AI推理算力體系成爲全球科技企業長期現金成本中心,客戶們更願意在雲上選擇更划算更具性價比的AI ASIC加速器。有媒體曾報道OpenAI通過谷歌雲平臺Google Cloud大規模租用TPU(谷歌TPU屬於AI ASIC技術路線),核心動機之一就是降低AI推理成本——這是來自TPU競爭壓力上升的最典型案例。

根據Semianalysis測算數據,谷歌最新的TPU v7 (Ironwood) 展現出了驚人的代際跨越,TPU v7的BF16算力高達4614 TFLOPS,而上一代被廣泛使用的TPU v5p僅爲459 TFLOPS,這堪稱是整整一個數量級的提升。此外,TPU v7顯存直接對標英偉達Blackwell架構的 B200,針對特定AI應用場景,架構上更具性價比與能效比優勢的AI ASIC可以更容易地吃下主流推理端算力負載,比如TPU甚至能提供比英偉達Blackwell高出1.4倍的每美元性能。

過去TPU AI算力集羣的核心約束之一是開發者棧與工程慣性(CUDA/PyTorch),而當谷歌大舉推進TorchTPU並獲得關鍵生態參與者們紛紛協作時,谷歌TPU對外部開發者的可達性提高,TPU對於英偉達AI GPU算力體系/NVIDIA CUDA生態的競爭優勢就會在海量推理場景更快且更全面、深度地擴散與釋放。

全球AI推理浪潮把競爭焦點從“誰能訓練最強大的大語言模型”轉向“誰能以最低成本、最低延遲把AI大模型規模化部署”,而TPU在“推理專用硬件 + 雲交付 + 降低軟件摩擦”上正在同時發力;英偉達通過Groq(推理專用能力與人才)與AI21(模型/企業應用棧與人才)同步補強,正是對這條競爭主線的直接回應。

當前超大規模AI推理需求正呈現每六個月翻一番的極速增長趨勢,因此在AI推理大浪潮席捲而來以及谷歌TPU帶來的愈發強大競爭壓力的算力需求背景下,英偉達通過Groq拿到推理芯片思路與頂尖人才、並通過AI21補軟件與模型側能力,屬於典型的“硬件技術路線多元化 + AI應用生態端到端綁定”防守/反擊。

英偉達與AI芯片初創公司Groq的交易本質是非獨佔推理類AI芯片技術授權 + 吸納Groq創始人/CEO Jonathan Ross等高管與部分核心工程團隊,一些半導體行業分析師也強調Groq的獨家芯片技術專注推理並用片上SRAM等方式降低數據搬運瓶頸,可謂直指推理階段的成本/延遲痛點。

英偉達就20億美元至30億美元收購AI21 Labs進入深入談判,且媒體最新報道點明英偉達可能更看重其約200人的高端AI人才與企業級生成式AI能力;英偉達若成功將AI21 Labs的大模型開發與企業應用能力納入麾下,非常有利於英偉達在全球推理大爆發時期把客戶更深地鎖定在自家的“軟件/平臺/方案/NVIDIA生態系統”裏,而不是單純只做AI GPU供貨商,有望更深層次嵌入企業客戶們的“模型—應用—部署”AI生態鏈,進而能夠鞏固CUDA護城河以及大幅提升英偉達AI算力集羣的粘性與議價權(避免未來推理端算力被更多自研AI ASIC芯片或者類似TPU的替代算力分流)。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!