Site logo

國泰海通:谷歌(GOOGL.US)Gemini 3實現斷層式領先 大模型競爭格局加速重構

时间2025-11-20 21:03:55

谷歌A

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

智通財經APP獲悉,國泰海通發佈研報稱,谷歌(GOOGL.US)Gemini 3的發佈標誌着大模型技術進入新一輪躍遷期,其在推理、多模態、代碼生成等核心能力上實現斷層式領先,並創新性地推出生成式UI與智能體平臺Antigravity。此次突破驗證了Scaling Law的持續有效性,將加速AI應用生態成熟。

國泰海通主要觀點如下:

北美時間週二,谷歌正式推出新一代大模型Gemini 3,實現多維度斷層式領先。新模型在覈心推理能力上取得顯著進步,在Humanity's Last Exam中得分從2.5 Pro的21.6%躍升至37.5%(無工具),在被稱爲“AI界圖靈測試”的ARC-AGI-2中更以31.1%的成績超越GPT-5.1(17.6%)近一倍,展現出接近人類的抽象推理能力;多模態理解方面,新模型在複雜科學圖表解析和動態視頻理解測試中均創下新高,其卓越的屏幕理解能力爲構建真正實用的AI代理奠定了堅實基礎;在數學推理領域,新模型從前代僅能處理基礎運算提升至可解決複雜建模與邏輯推演問題,爲工程計算與金融分析等高階應用提供了可靠的技術基礎。

Gemini 3在代碼生成與前端設計領域展現出革命性進步,不僅徹底扭轉了谷歌在編程競賽中的競爭態勢,更通過架構創新爲規模化商用鋪平道路。其在LiveCodeBench上取得顯著領先優勢,在Design Arena的網站、遊戲開發等四大賽區均位列第一。突破性的是,模型不僅能夠生成功能代碼,更具備"審美智能",能根據用戶意圖自動生成符合現代設計規範的交互界面,催生了"生成式UI"新範式。在技術架構方面,Gemini 3採用稀疏MoE的全新設計,支持百萬級token上下文長度,在長文檔理解和事實回憶測試中表現優異。儘管API定價處於行業高端,但通過提升token效率和首答準確率,實際任務完成成本增幅有限,這種性能與成本間的精細平衡爲模型在企業級市場的大規模應用提供了堅實支撐。

Gemini 3在智能體能力上實現質的飛躍,成爲首個在消費級產品中深度融合通用Agent能力的基礎模型。其工具使用能力較前代提升30%,在終端環境測試和長時間跨度的商業模擬中表現卓越,能夠自主規劃並執行復雜的端到端任務。配合全新推出的Antigravity智能體開發平臺,開發者可在更高抽象層級進行任務導向編程,將AI從輔助工具升級爲“積極合作伙伴”。此次突破驗證了Scaling Law的持續有效性,推動了AI應用生態的加速成熟,推動AI應用開發範式發生根本性變革。

風險提示:大模型迭代速度不及預期,算力供給不足,數據隱私合規風險。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!