資訊

首頁/

資訊一覽/

美股資訊/

正文

對標亞馬遜、OpenAI，谷歌(GOOGL.US)連發AI利器：多模態模型Gemini Embedding 2正式上線

時間：2026-03-11 09:27:46

谷歌-A

下載霸財智贏APP，買賣點即市預警，炒家心水交流 >>

智通財經APP獲悉，谷歌(GOOGL.US)週二發佈其首個多模態人工智能(AI)模型Gemini Embedding 2，這是這家科技巨頭推出的最新模型，可將文本、圖像、視頻、音頻和文檔映射到一個統一的嵌入空間中。

谷歌在一篇博客文章中表示：“Gemini Embedding 2將文本、圖像、視頻、音頻和文檔映射到一個統一的嵌入空間，並能在100多種語言中捕捉語義意圖。” “這簡化了複雜的處理流程，並增強了多種多模態下游任務——從檢索增強生成(RAG)和語義搜索，到情感分析和數據聚類。”

作爲Gemini系列AI模型的最新成員，該模型支持最多8192個文本輸入token;每次請求可處理最多6張圖像，支持PNG和JPEG格式;可處理最長120秒的視頻，支持MP4和MOV格式;能夠直接攝取並嵌入音頻數據而無需轉錄;並且可以直接嵌入最長6頁的PDF文檔。

谷歌補充稱：“Gemini Embedding 2不僅僅是對傳統模型的改進。”在將其與亞馬遜(AMZN.US)、Voyage模型以及谷歌其他模型進行比較時，谷歌表示：“它爲多模態深度樹立了新的性能標準，引入了強大的語音能力，並在文本、圖像和視頻任務中超越領先模型。這種可衡量的性能提升以及獨特的多模態覆蓋能力，使開發者能夠獲得滿足其多樣化嵌入需求的一切工具。”

免責聲明：本資訊不構成建議或操作邀約，市場有風險，投資需謹慎！