Site logo

對標亞馬遜、OpenAI,谷歌(GOOGL.US)連發AI利器:多模態模型Gemini Embedding 2正式上線

時間2026-03-11 09:27:46

谷歌A

下載霸財智贏APP,買賣點即市預警,炒家心水交流 >>

智通財經APP獲悉,谷歌(GOOGL.US)週二發佈其首個多模態人工智能(AI)模型Gemini Embedding 2,這是這家科技巨頭推出的最新模型,可將文本、圖像、視頻、音頻和文檔映射到一個統一的嵌入空間中。

谷歌在一篇博客文章中表示:“Gemini Embedding 2將文本、圖像、視頻、音頻和文檔映射到一個統一的嵌入空間,並能在100多種語言中捕捉語義意圖。” “這簡化了複雜的處理流程,並增強了多種多模態下游任務——從檢索增強生成(RAG)和語義搜索,到情感分析和數據聚類。”

作爲Gemini系列AI模型的最新成員,該模型支持最多8192個文本輸入token;每次請求可處理最多6張圖像,支持PNG和JPEG格式;可處理最長120秒的視頻,支持MP4和MOV格式;能夠直接攝取並嵌入音頻數據而無需轉錄;並且可以直接嵌入最長6頁的PDF文檔。

谷歌補充稱:“Gemini Embedding 2不僅僅是對傳統模型的改進。”在將其與亞馬遜(AMZN.US)、Voyage模型以及谷歌其他模型進行比較時,谷歌表示:“它爲多模態深度樹立了新的性能標準,引入了強大的語音能力,並在文本、圖像和視頻任務中超越領先模型。這種可衡量的性能提升以及獨特的多模態覆蓋能力,使開發者能夠獲得滿足其多樣化嵌入需求的一切工具。”

免責聲明:本資訊不構成建議或操作邀約,市場有風險,投資需謹慎!