Google發布多項AI更新的Gemini 2.0系統


Google_logo-分鐘

谷歌發布了新模型Gemini 2.0,它比之前的模型更強大,並且具有多模態功能。 更新版本增加了用於推理的Deep Research 工具。 此外,還引入了Project Mariner AI 代理– 它能夠在電腦上而不是用戶上執行操作。 谷歌宣布對其人工智慧概述搜尋查詢系統進行改進。

12月11日,Google推出了「迄今為止最強大的人工智慧模型——Gemini 2.0」。

歡迎來到世界,Gemini 2.0 ✨ 我們迄今為止最強大的人工智慧模型。

我們首先發布2.0 Flash 的實驗版本⚡ 它具有更好的性能、新的多模式輸出、@Google 工具使用– 並為新的代理體驗鋪平了道路。 🧵 https://t.co/ywY2oZv76p pic.twitter.com/1Wgcr3m2Ip

— 谷歌DeepMind (@GoogleDeepMind) 2024 年12 月11 日

最初作為Flash 的實驗版本2.0 推出,它具有高性能、多模式功能,並「為新的代理體驗鋪平了道路」。

Gemini 2.0 Flash 在關鍵指標上優於1.5 Pro,速度是其兩倍。它能夠產生多種語言的圖像、文字和語音。據報道,該模型在程式設計和影像分析領域有顯著改進。

2.0 Flash 取代1.5 Pro 成為旗艦神經網路。新的神經網路可以使用第三方應用程式和服務,例如Google搜尋和外部API,這與上一代有所不同。

作為我們的主力型號,Gemini 2.0 Flash 在關鍵基準測試中的表現優於1.5 Pro,速度是1.5 Pro 的兩倍。

它可以產生與文字混合的圖像以及可自訂的文字到語音的多語言音訊。 2.0 Flash還可以呼叫@Google搜尋、程式碼執行和第三方等工具…pic.twitter.com/OVicGFnJdP

— 谷歌DeepMind (@GoogleDeepMind) 2024 年12 月11 日

Gemini 2.0 Flash 為所有人提供了聊天版本,開發人員可以透過Google AI Studio 和Vertex AI 中的Gemini API 來使用具有文字轉語音和影像轉換功能的實驗性多模態神經網路。未來幾個月,AI的改進版本將順利推廣到Android Studio、Chrome DevTools、Firebase、Gemini Code Assist等各種產品。

Google人工智慧代理

谷歌的人工智慧部門DeepMind 推出了首款可以在網路上獨立運作的人工智慧代理。

Project Mariner 基於Gemini 2.0,僅供有限的測試人員使用。它控制Chrome瀏覽器,在螢幕上移動遊標,按下按鈕,填寫表格,也就是說,它能夠導航網站並像人一樣行事。

設定AI代理後,瀏覽器右側會出現一個聊天視窗。在那裡,您可以向神經網路設定指令,例如,根據所附清單從雜貨店建立購物車。

Gemini 2.0:Google發布多項AI更新數據:Google。

指定所有參數後,代理商將訪問超市的網站,找到所需的產品並將其添加到虛擬購物車中。它的操作速度較慢,按下一個按鈕大約需要五秒鐘。

Project Mariner 無法填入信用卡號碼和其他付款資訊、接受cookie 或簽署服務協議。這樣做的目的是為了給使用者更多的控制權。

此代理商可用於搜尋航班、飯店、食譜、購買物品和其他任務。請求運行時您無法使用您的電腦。

Project Mariner 尚未對外開放,其公開發布日期未知。

其他人工智慧代理

除了Project Mariner 之外,Google還引入了許多其他人工智慧代理來執行更專業的任務:

深度研究可以透過建立多步驟學習計畫來幫助您探索複雜的主題。它不適用於解決數學或邏輯問題、編寫程式碼或分析數據; Jules 可以編碼,並整合到GitHub 工作流程中,預計2025 年到來; 另一種人工智慧專注於輔助視訊遊戲,其發布日期未知。

雙子座被教導要理性

Gemini 的更新版本具有深度研究功能,該功能使用「高級推理」和「長上下文功能」來產生有關研究的簡短摘錄。簡介可以匯出到Google 文件以進行進一步編輯。

谷歌的新深度研究功能感覺像是迄今為止最恰當的「谷歌式」人工智慧用途之一,而且令人印象深刻。

我已經訪問過一段時間,它對幾乎所有主題都做了非常好的初步報告。圍繞學術資源的付費牆設置了一些限制。 pic.twitter.com/dwSqr6aKGZ

— 伊森‧莫里克(@emollick) 2024 年12 月11 日

該服務可以分析有關使用互聯網的請求的信息,並充當一種研究助理。反思的結果以簡短摘要的形式呈現,並附有來源連結。程序如下:

用戶寫一個請求。 Deep Research 創建了「多階段研究設計」。 用戶確認分析開始。 Deep Research 在幾分鐘內進行研究並產生答案。

該服務可供付費版Gemini Advanced 的所有者使用。

人工智慧概述將變得智慧和多模式

谷歌宣布對其人工智慧概述搜尋查詢系統進行改進。據報道,該服務很快將能夠處理「更複雜的主題」、「多模式」和「多步驟」搜索,包括高級數學查詢和程式設計問題。

該功能的測試將於本週開始,並於明年初廣泛分發。

AI Overviews 的改進得益於Gemini 2.0 的推出。

讓我們回想一下,去年11 月,Google訓練Gemini 聊天機器人來記住有關用戶生活、興趣和偏好的上下文資訊。

發現文本中有錯誤?選擇它並按CTRL+ENTER

資訊來源:由0x資訊編譯自FORKLOG。版權所有,作者Владимир Слипер所有,未經許可,不得轉載


Total
0
Shares
Related Posts