Site logo

谷歌(GOOGL.US)更新Gemini API定價 按推理使用分檔計費

时间2026-04-03 14:13:05

谷歌A

下载霸财智赢APP,买卖点即市预警,炒家心水交流 >>

智通財經APP獲悉,谷歌(GOOGL.US)近日對Gemini API的計費檔位進行更新,優化方案與定價均基於實際推理使用需求制定。

本次新增的推理服務檔位包括:標準(Standard)、彈性(Flex)、優先(Priority)、批量(Batch)和緩存(Caching)版。

谷歌表示:“Gemini API提供多種優化機制,可根據具體業務負載需求,在運行速度、使用成本與服務穩定性之間實現平衡。無論是搭建實時對話機器人,還是運行大型離線數據處理流程,選擇合適的運行模式都能顯著降低成本或提升運行效率。”

其中,彈性推理檔位通過利用非高峯閒置算力資源,提供標準價格五折優惠,目標延遲為1至15分鐘,但不提供延遲保證。批量API檔位同樣提供標準費率五折優惠,延遲最長可達24小時。

緩存檔位計費依據緩存詞元(Token)數量與存儲時長,推薦用於搭載複雜系統指令的對話機器人、長視頻文件重複分析,以及大規模文檔集查詢等場景。

優先檔位定價則比標準價格高出75%至100%,延遲可控制在毫秒至秒級。谷歌建議該檔位用於實時客服聊天機器人、實時欺詐檢測及業務關鍵型智能助手等場景。

免责声明:本资讯不构成建议或操作邀约,市场有风险,投资需谨慎!