Site logo

AI軍備競賽不只拼GPU! Meta(META.US)攜手亞馬遜Graviton 衝擊x86霸權

时间2026-04-24 21:18:00

Meta Platforms Inc Class A

英伟达

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

智通財經APP獲悉,美國雲計算與電商巨頭亞馬遜(AMZN.US)與Facebook母公司Meta Platforms Inc.(META.US)已達成一項數十億美元的長期協議,這家社交媒體巨頭將租用數十萬顆亞馬遜自研推出的ARM架構通用數據中心服務器CPU芯片,用於其正在大規模新建的AI數據中心,以滿足Facebook以及Instagram等社交媒體用户們的天量級別人工智能推理端工作負載。

亞馬遜副總裁,同時也是該公司Annapurna Labs芯片部門聯合創始人Nafea Bshara在接受採訪時表示,這項多年期協議將讓Meta獲得Graviton系列數據中心服務器級別中央處理器的長期使用權。

能夠生成文本或進行天量級別推理的人工智能大語言模型,通常是使用英偉達主導的AI GPU或者谷歌TPU AI算力集羣來進行訓練構建或者完整運行推理端AI工作負載。但AI大模型開發者以及B端或者C端AI應用平台的用户們同樣迫切需要大型AI數據中心端Graviton這類通用中央處理器(即數據中心服務器CPU)來執行諸多調度與協調類型任務,其中重點包括在模型訓練完成後生成對查詢的迴應以及AI智能體代理式工作流進程,這一過程通常被稱為“AI推理”。“如果旁邊沒有CPU,GPU就毫無用處,”Bshara表示。

GPU/ASIC之外的AI軍備競賽:Meta牽手亞馬遜,CPU成為推理時代關鍵拼圖

近年來,亞馬遜在其數據中心部署的大多數CPU都是Graviton中央處理器;對於一家曾嚴重依賴英特爾(INTC.US)硬件體系的公司而言,這是一項巨大成就。Graviton是亞馬遜旗下AWS雲計算業務部門自研的ARM架構通用服務器CPU,主要承擔AI數據中心裏的通用計算、調度、數據預處理/後處理、服務編排,以及部分AI推理相關調度與協調工作。

亞馬遜首席執行官Andy Jassy最近表示,該公司的數據中心芯片業務部門正朝着一年內實現200億美元銷售額的方向堅定前進,並且高管們正在考慮積極出售這些亞馬遜自研的數據中心相關芯片,供像Meta以及CoreWeave這樣的其他科技公司在其雲計算服務器羣中長期租賃或者長期按需使用————迄今為止,這些芯片只存在於亞馬遜大型雲計算數據中心,。

週五宣佈的Meta與亞馬遜重磅交易,可謂是大型科技公司之間最新一宗長期且大規模合作;當前,全球科技行業正爭相確保獲得足夠多的AI算力相關的CPU/GPU/ASIC AI處理器設備集羣,以驅動新的和正在研發的未來AI大模型。OpenAI和Anthropic已表示,它們正在增加對亞馬遜自研Trainium AI芯片的使用;Trainium是亞馬遜AWS獨家研發的核心性能指標對標英偉達AI GPU算力體系的高性價比AI ASIC技術路線模式的替代型AI算力基礎設施方案,並且已開始向OpenAI和Anthropic以及Meta積極營銷該公司Trainium等一系列自研AI芯片算力系統。

Meta在為其愈發龐大的AI工作負載獲取芯片方面採取了廣泛佈局,並稱這樣做是為了實現合作伙伴多元化,以保持靈活性。該公司已與英偉達和AMD等芯片巨頭們簽署了一系列大型AI算力基礎設施供給協議。

Meta同意斥資數十億美元購買英偉達和AMD共同主導的AI GPU算力基礎設施解決方案。該公司最近還簽署了一項另外的數十億美元協議,將使用Alphabet Inc.旗下谷歌獨家打造的TPU AI算力集羣。

Meta也正在大舉投入開發自有AI芯片,以幫助降低成本,並減少對第三方芯片巨頭們的依賴。該公司目前正在為AI訓練/推理用途開發四個版本的MTIA AI芯片,並且最近宣佈擴大與博通的長期深度合作,由後者幫助Meta設計和製造這些AI芯片。

AI智能體時代到來,數據中心CPU需求爆表

AI數據中心建設進程如火如荼可謂推動英特爾數據中心CPU陷入供不應求態勢,英特爾部分需求最火熱的高性能服務器CPU交期最長拉到足足6個月之久,面向數據中心的這些高性能服務器級別CPU價格今年以來則普遍上漲10%。這也是為何股價萎靡1年半之久的芯片製造商英特爾股價能夠在今年暴漲超80%,且這家老牌芯片巨頭股價在上週一舉創下2000年以來最高股價點位的最底層看漲邏輯。北京時間週五晨間公佈全線超預期的業績之後,英特爾估計在週五美股盤前一度暴漲超30%。

早期大模型推理以“單次請求—單次生成”為主,CPU更多承擔數據搬運、請求路由與基礎調度,屬於典型的輔助控制面;但進入AI智能體與強化學習時代後,系統負載不再是單一前向推理,而是演變為包含任務規劃、工具調用、子代理協同、環境交互、狀態管理與結果驗證在內的複雜閉環。上述“編排層”(orchestration layer)本質上是強控制流、強分支判斷、強系統調用、強內存訪問的CPU密集型任務,無法被GPU高效替代,因此CPU正從過去的“配角”變成決定系統吞吐、時延與資源利用率的新瓶頸。

摩根士丹利最新預測數據顯示,智能體大爆發標誌着從計算到編排的結構性轉變,由此推導出到2030年新增325億美元至600億美元的CPU增量市場空間,並將服務器級別CPU總TAM大幅擴至825億至1100億美元量級。TrendForce的一項預測報告則顯示,在AI智能體時代,CPU:GPU配比可能會從傳統AI數據中心的1:4至1:8,向1:1至1:2大幅重估。

對Meta這種每天處理海量AI agent、推薦、廣告、內容生成和查詢響應的公司來説,很多任務並不需要昂貴GPU全程參與;大規模利用Graviton這類高密度ARM架構而非英特爾x86架構CPU承接推理服務外圍負載,可以降低單位請求成本、釋放GPU給更高價值的訓練/推理任務,並改善整體集羣TCO。Arm公司也強調,AI數據中心擴張正在讓低功耗、高效率的ARM架構CPU側的編排、數據處理和系統控制成為關鍵瓶頸,而AWS第五代Graviton把核心數提升到192核,反映的正是這種CPU密度需求上升。

Meta主導的這筆最新交易,也凸顯出AI算力基礎設施競爭正在從“GPU單一需求中心”走向GPU+自研AI ASIC+ Arm/x86數據中心級別CPU +數據中心高速光互連體系+軟件堆棧的異構體系。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!