加速殺入AI芯片戰場!亞馬遜(AMZN.US)推出新一代自研芯片Trainium 3:提速四倍、能耗降40%,主打性價比
時間:2025-12-03 09:11:10
亞馬遜
英偉達
智通財經APP獲悉,亞馬遜(AMZN.US)旗下雲計算部門AWS正加速將其最新一代人工智能(AI)芯片推向市場,力圖在硬件領域與英偉達(NVDA.US)和谷歌(GOOGL.US)的產品一較高下。
AWS副總裁Dave Brown在接受採訪時表示,這款名爲Trainium 3的加速器芯片已在部分數據中心完成部署,將於本週二正式向客戶開放。
“到明年初,我們將啓動極快速的規模化部署,”他說道。
推出自研芯片是亞馬遜在AI領域脫穎而出戰略的關鍵一環。AWS是雲計算和數據存儲服務的最大供應商,但在AI工具的主流開發者羣體中,該公司卻難以複製這種主導地位。部分企業更傾向於選擇與ChatGPT開發商OpenAI聯繫緊密的微軟(MSFT.US)合作,或是選用谷歌(GOOGL.US)的相關服務。
此舉將加劇AI芯片市場的競爭態勢。當前英偉達在該市場佔據主導地位,其在用於訓練ChatGPT等大語言模型的芯片市場上估計擁有80%至90%的份額。
就在上週,有消息稱Meta(META.US)將在數據中心採用谷歌AI芯片,引發行業震動。這預示着目前全球市值最高企業、AI投資熱潮風向標英偉達將迎來新的競爭。此前一個月,谷歌最新發布的AI模型正是使用其自研芯片而非英偉達硬件完成訓練。
亞馬遜試圖以高性價比吸引企業客戶。該公司稱,與英偉達佔據市場主導地位的GPU相比,Trainium系列芯片在支撐AI模型密集型計算任務時,具備更高的成本效益和運算效率。
AWS補充道,基於Trainium 3芯片的新款服務器每臺包含144顆芯片,計算性能較前代產品提升四倍以上,同時能耗降低40%。並且,相較於主要採用英偉達GPU的同等系統,其芯片可將AI模型訓練和運營成本降低高達50%。
“Trainium芯片在性價比方面的表現令人非常滿意,”Brown表示。
此次Trainium 3的推出距上一代加速器芯片發佈僅約一年時間,按芯片行業標準來看堪稱“極速迭代”。今年8月該芯片首次啓動測試時,一位AWS工程師打趣道:“我們現在最期待的,就是不要出現任何技術故障。”
這樣的快速更新節奏也與英偉達保持同步,後者承諾每年推出新款芯片。
但Trainium芯片存在一項關鍵短板:缺乏英偉達那樣豐富的軟件生態庫,而後者能幫助客戶快速實現GPU的部署與運行。Bedrock Robotics是一家利用AI模型實現建築設備自主運行的企業,其基礎設施搭建在AWS服務器上,但該公司首席技術官Kevin Peterson透露,在開發挖掘機導航模型時,Bedrock選擇了英偉達芯片。
“我們需要兼具高性能與易用性的解決方案,而這正是英偉達的優勢所在,”Peterson表示。
目前投入使用的Trainium芯片大多由Anthropic在印第安納州、密西西比州和賓夕法尼亞州的數據中心調配使用。AWS今年早些時候曾宣佈,已將50多萬顆Trainium芯片集羣化,用於支持這家AI初創公司的最新模型訓練,並計劃在年底前爲Anthropic專屬配置100萬顆該芯片。
亞馬遜寄望於Anthropic的成功案例及其自身AI服務生態,吸引更多企業客戶。亞馬遜表示,除了Anthropic,日本大模型公司Karakuri、SplashMusic及Decart等AWS客戶也已開始使用第三代芯片與系統,並顯著降低了推理成本。不過,該公司尚未披露其他主要芯片客戶信息,這也讓分析師難以評估Trainium的市場表現。
值得注意的是,Anthropic同時在使用谷歌的TPU,並於今年早些時候與谷歌達成協議,獲得價值數百億美元的算力支持。AWS首席執行官Matt Garman在接受採訪時強調,亞馬遜與Anthropic的合作關係“異常穩固”,並指出Anthropic對算力的需求極爲龐大,因此選擇了多家服務商。
兼容英偉達技術
與此同時,亞馬遜還透露,其已着手開發Trainium 4芯片,預計其在標準AI工作負載上的性能將達到Trainium3的三倍以上。
而值得注意的是,這款新一代芯片將兼容英偉達技術,實現與該公司服務器和硬件的協同工作。此舉表明,在競爭的同時,亞馬遜希望利用對手的優勢吸引主要AI客戶使用其服務。
AWS表示,Trainium 4將採用名爲“NVLink Fusion”的高速芯片互連技術,但未公佈具體發佈日期。據瞭解,NVLink技術能在不同芯片之間建立高速連接,是英偉達的核心技術之一。
英偉達一直在推動其他芯片公司採用其NVLink技術,目前英特爾(INTC.US)、高通(QCOM.US)以及AWS均已加入該技術陣營。該技術將幫助AWS構建更強大的AI服務器,實現更快速的識別與互通——這對於需要連接數千臺機器訓練大模型至關重要。作爲合作內容,客戶將能使用AWS推出的“AI工廠”,即部署在自有數據中心內的專用AI基礎設施,從而獲得更快的速度和響應能力。
英偉達首席執行官黃仁勳在一份聲明中表示:“英偉達與AWS正在共同打造AI工業革命的計算架構,將先進AI技術帶給每個國家、每家企業,加速世界邁向智能化的進程。”
AI模型系列Nova
此次芯片發佈是在亞馬遜年度用戶大會re:Invent上宣佈的。近年來,該大會已成爲亞馬遜AI服務的重要推廣平臺,吸引着尖端AI工具開發者及潛在付費企業客戶。
除芯片外,亞馬遜週二還發布了其主力AI模型系列Nova的更新版本。新一代Nova 2包含一款名爲Omni的多模態模型,可接收文本、圖像、語音或視頻輸入,並支持文本或圖像形式的輸出。
與芯片策略類似,亞馬遜在AI模型推廣中同樣主打“性價比”優勢。不過在標準化問答性能基準測試中,此前的Nova模型並未躋身行業頂尖行列。
“真正的衡量標準是實際應用效果,”亞馬遜AI模型研發及通用人工智能(AGI)團隊負責人Rohit Prasad在採訪中表示,並預計新模型將具備較強的市場競爭力。
亞馬遜還計劃允許客戶在定製模型時接入更多自有數據。新推出的Nova Forge工具面向專業用戶,支持其獲取尚未完成訓練的Nova模型版本,並通過自有數據進行定製化開發。
Garman指出:“這項服務能讓您打造深度理解企業信息的專屬模型,同時完整保留模型訓練的核心知識庫。”
社交平臺Reddit(RDDT.US)正利用Nova Forge開發一款模型,用於檢測平臺帖子是否違反安全政策。Reddit首席技術官Chris Slowe表示,部分AI客戶傾向於用最先進的通用模型解決所有問題,而非選擇具備特定專業能力的模型。
“通過定製化使其成爲我們專屬領域的專家,這纔是價值所在,”他在採訪中說道。
免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!


