谷歌全面反擊PaLM 2模型挑戰GPT-4,產品通通AI化


來源:澎湃新聞

記者邵文

·PaLM 2模型提供了不同規模的四個版本,其中輕量級的Gecko模型可以在移動設備上運行,速度非常快,不聯網也能在設備上運行。谷歌還推出了兩個專業領域大模型,其中,Med-PaLM 2能回答各種醫學問題,是首個在美國醫療執照考試中達到專家水平的大語言模型。

谷歌首席執行官桑達爾·皮查伊(Sundar Pichai) 在2023年I/O開發者大會上。

在ChatGPT推出之後,谷歌一度發佈內部“紅色警報”(red code),被媒體稱為遭遇“柯達時刻”(形容膠成交量被數碼照相替代)。久被唱衰之後,谷歌在北京時間5月11日的最新一屆I/O開發者大會上官宣大語言模型PaLM 2(Pathways Language Model 2),稱其在部分任務上超越GPT-4。

谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)在加州山景城海岸圓形劇場的演講中表示,PaLM 2是該公司最新的AI模型,同時谷歌的研究重心正在轉向開發更大的模型Gemini,這是一種多模態和高效的機器學習工具。

除此之外,谷歌也官宣會將Duet AI整合進谷歌辦公全家桶Workspace;聊天機器人Bard全面升級並向所有人開放;谷歌云將上線多個基礎大模型,為行業提供更進一步的生成式AI服務,等等。

在長達兩個小時的演講中,谷歌拋開以往的謹慎形象,從各個角度介紹了最新的大模型技術如何應用在了谷歌產品體系的幾乎所有方面。

皮查伊宣布PaLM 2。 (02:18)

PaLM 2部分結果超越GPT-4

實際上,這一波由ChatGPT帶來的AI熱潮,其背後關鍵技術即是2017年谷歌提出的transformer架構。 2022年4月,PaLM第一個版本的模型發布。而在微軟和OpenAI在大模型技術上先聲奪人之後,這一次PaLM 2的發布顯然被谷歌寄予厚望。

在I/O開發者大會上,皮查伊宣布推出PaLM 2預覽版本,利用谷歌最新的TPU算力基礎設施提升了訓練速度。由於它的構建方式是將計算、優化擴展、改進的數據集混合以及模型架構改進結合在一起,因此服務效率更高,同時整體表現更好。

PaLM 2模型提供了不同規模的四個版本,從小到大依次為“壁虎” (Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨角獸”,更易於針對各種用例進行部署。其中輕量級的Gecko模型可以在移動設備上運行,速度非常快,不聯網也能在設備上運行出色的交互式應用程序。

PaLM 2在超過100種語言的多語言文本上進行了訓練。

據介紹,PaLM 2在超過100種語言的多語言文本上進行了訓練,這使得它在語言理解、生成和翻譯上的能力更強,並且會更加擅長常識推理、數學邏輯分析。

PaLM 2的數據中心化有海量論文和網頁,其中包含非常多的數學表達式。在這些數據的訓練後,PaLM 2能輕鬆解決數學問題,甚至是製作K線走勢圖。

根據基準測試,對於具有思維鏈prompt(提示)或自洽性的M新高、GSM8K和MGSM基準評估,PaLM 2的部分結果超越了GPT-4。

根據基準測試,PaLM 2的部分結果超越了GPT-4。

PaLM 2 是在具有100+語言的語料庫上進行訓練的,因此它更擅長多語言任務,能夠理解、生成和翻譯比以往模型更細緻多樣化的文本。

PaLM 2 通過了“精通”(mastery)級別的高級語言能力考試。比起PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到了A級,而PaLM達到了F級。 PaLM 2的法語水平達到了C1級。在相關論文中,谷歌工程師聲稱PaLM 2的語言能力已經“足以教授這門語言”,原因是其訓練數據中的非英語文本更為普遍。

編程方面,PaLM 2現在支持20種編程語言,如Python、JavaScript等常用語言,以及Prolog、Fortran和Verilog等。

此外,基於PaLM 2,谷歌還推出了兩個專業領域大模型。一個是谷歌健康團隊打造的Med-PaLM 2,它能回答各種醫學問題,據介紹是首個在美國醫療執照考試中達到專家水平的大語言模型。

谷歌健康團隊打造的Med-PaLM 2。

目前谷歌正在嘗試讓它具備多模態能力,比如檢查X光片然後給出診斷。在今年夏天晚些時候,這個模型將對一小部分谷歌云用戶開放。

另一個專業大模型是面向網絡安全維護的Sec-PaLM 2,它使用人工智能來幫助分析和解釋潛在惡意腳本的行為,並在非常短的時間內檢測哪些腳本實際上對個人和組織構成威脅。

另外,在Google Brain和DeepMind合併之後,新的大模型也在研製過程當中。皮查伊表示現在谷歌的研究重心正在轉向Gemini——一種多模態和高效的機器學習工具。該模型是在今年才開始研發的,將具有像GPT-4一樣的萬億參數。目前,Gemini仍在訓練中,但已經展示出了以往模型中從未見過的多模態能力。

DeepMind副總裁祖賓·加赫拉馬尼(Zoubin Ghahramani)在介紹PaLM 2的博客中表示,他們發現模型並不總是越大越好。 “壁虎”非常輕巧甚至能在移動設備上離線運行,也就是說在手機也能運行交互式應用程序,同時保證速度(每秒可處理20個token)。這意味著微調PaLM 2會更加方便,由此它也能支持更多產品和應用。

英偉達AI研究員Jim Fan對這樣的嘗試表示贊同,“下一波LLM(大型語言模型)將是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成本,而且還為用戶體驗開闢了全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學習,並為你實現自動化。在小屏幕上節省的生產力,將比在大屏幕上多得多。”

PaLM 2技術報告。

當天,谷歌一同發布了PaLM 2技術報告(https://ai.google/static/documents/palm2techreport.pdf),整整91 頁。但是,PaLM 2論文遠沒初代PaLM有誠意,和GPT-4一樣,更像是技術報告。

谷歌研究副總裁Zoubin Ghahramani承認,在打擊AI產生的虛假信息方面,還有很長的路要走。谷歌特地介紹了開發AI技術的社會責任感,包括兩個判別AI生成內容的工具:嵌入水印和嵌入元數據。

谷歌全線產品接入PaLM 2大模型

目前谷歌的聊天機器人Bard以及超過25個AI產品和功能,都由PaLM 2作為底層技術支持。具體的表現之一是Duet AI,一個類似於微軟365 Copilot的產品、能夠內嵌在各種辦公軟件中的AI助手。

在發布會現場,谷歌展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。它可以根據提示補充郵件內容、生成PPT、根據提示生成圖片素材、一鍵生成表格等。同時,這個AI助手也能提供編程幫助,包括實時推薦、糾錯代碼塊,並且以對話方式解答編程問題,目前支持Go、JavaScript、Python和SQL。

Duet AI直接從幻燈片中的文本生成圖像。

自動生成遛狗業務的收費表。

用Bard起草郵件,並一鍵導入Gmail。

如果想試用這些新工具,需要註冊Workspace Labs,加入候補名單。現在,任何人都可以申請加入候補名單,不過尚不清楚用戶何時可以訪問。谷歌的說法是,將在未來幾週內將服務擴展到“更多的用戶和國家”。

為了與微軟必應競爭,谷歌推出了由PaLM 2驅動的全新搜索引擎。它能夠提供問題回答的摘要,比如問“為什麼酵母麵包仍然如此受歡迎?”谷歌搜索就給出幾段詳細描述酵母的味道、其益生元能力的優勢等。另外,在生成內容旁給出3個鏈接,以證明摘要中的內容,以減少AI在生成內容上出現“幻覺”問題。

在谷歌搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明了購買時應注意的事項:電池壽命、防水性、音質。右邊是3個購買指南的鏈接,下面是6個不錯選擇的購物鏈接,每個旁邊都有一個AI生成的摘要。

但是要是想要訪問這一功能,必須選擇Search Generative Experience(SGE)這一新功能。並非所有搜索都會有AI生成的答案。只有當谷歌的算法認為它比標準答案更有用時,AI內容才會出現,而像健康、財務等敏感主題就不會由AI生成。

發布會上,谷歌還宣布了一個重磅消息:聊天機器人Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。

這次,Bard有諸多升級並很快就會支持各種第三方擴展,例如AI可以自動根據你輸入的文本生成圖像。

谷歌在發布會上展示了一個案例。假如用戶問Bard,美國的新奧爾良有哪些必看的景點,那麼Bard就能圖文並茂地解答這個問題,就像用戶在谷歌搜圖中問同樣的問題一樣。

另一個功能是圖像提示系統,由Google Lens提供,它能夠識別圖片中的物體。比如說,上傳一張狗的照片,然後給一個prompt“為這兩隻狗寫一個有趣的標題”。 Google Lens就可以識別狗的品種,然後Bard就能寫下與狗特徵相關的內容。

用Bard為照片寫一個有趣的標題。

通過語言描述讓Bard生成代碼。

谷歌決定取消Bard的等候名單,其將在180個國家或地區提供服務。

發布文本生成音樂模型MusicLM

谷歌當天還發布了一種新的實驗性AI工具MusicLM,可以將文本描述轉化為音樂。 MusicLM可在網絡、Android或iOS上的AI Test Kitchen應用程序中使用,允許用戶輸入諸如“晚宴上的深情爵士樂”或“創造催眠的工業技術聲音”的提示,讓該工具創建多個版本的歌曲。

用戶可以在完善MusicLM生成的作品時指定“電子”或“古典”等風格,以及他們想要的“氛圍、情緒或情感”。

谷歌1月在一篇學術論文中預覽MusicLM時,表示“沒有立即計劃”發布它。論文的合著者指出,像MusicLM這樣的系統會帶來許多倫理挑戰,包括將訓練數據中受版權保護的材料整合到生成的歌曲中。

但在接下來的幾個月裡,谷歌表示它一直在與音樂人士合作並舉辦研討會,以“了解這項技術如何為創作過程賦能”。結果之一是,AI Test Kitchen中的MusicLM版本不會生成具有特定藝術家或人聲的音樂。

無論如何,圍繞生成音樂的更廣泛挑戰不太可能輕易解決。而“深度造假”音樂仍然站在模糊的法律基礎上。

在移動終端發力

相比微軟,谷歌的一點優勢是擁有包括智能手機、平板電腦及其操作系統在內的終端出口,這是它可以發力並必須抓住的部分。

I/O大會上,谷歌展示了下一代移動操作系統Android 14的新能力。其中,Magic Compose將於今年夏天在谷歌的默認短信應用Message中推出測試版,它是一種基於AI生成模型的工具,讓你在回短信的時候根據聊天內容獲得大量提示。它會學習你的說話方式,你也可以讓自己的回复內容看起來有不同的語氣,或者用莎士比亞的風格來寫。

谷歌還使用生成式AI來幫你製作獨一無二的手機壁紙,和AI畫圖一樣使用語言提示完成。

在大會上,谷歌還發布了AI筆記本——一個名叫Tailwind的項目,目標受眾定位為學生。該功能在大學校園內進行了廣泛的測試。

谷歌發布了AI筆記本項目Tailwind。

Tailwind就像一個真正的筆記本一樣,可以在裡面記筆記,而這些內容就是AI學習的對象。

用戶可以從谷歌云端硬盤中挑選文件,創建一個兼具個性化和私人屬性的AI模型。在示例演示中,Tailwind收集了一大堆學習筆記,然後生成了包括主題詞在內的很多內容,比如用戶可以為特定主題創建術語表。

Tailwind操作演示。

Tailwind不僅能為學生服務,對任何從不同來源獲取信息的人都有幫助。用戶目前可以註冊Project Tailwind進行測試。

隱藏在Tailwind背後的理念是,為什麼不能為每個用戶定制不同的AI語言模型呢?

三大基礎模型上線谷歌云、安卓開發小助手等

在宣布了AI方面的一系列更新後,谷歌也為自己的雲端機器學習平台Vertex AI推出了三款大模型:Codey(text-to-code,幫助程序員寫代碼)、Imagen(text-to-image,生成高質量圖像)、Chirp(speech-to-text,方便溝通)。

LLM模型需要大量的計算能力來訓練和運行。認識到這一點,谷歌云在谷歌I/O大會上宣布了一款新的A3超級計算機虛擬機。

谷歌在一份聲明中寫道:“A3 GPU VM專為當今的機器學習工作負載提供最高性能的訓練而設計,配備了現代CPU、改進的主機內存、下一代英偉達GPU和主要網絡升級。”

具體來說,該公司正在為這些機器配備英偉達的H100 GPU,並將其與專門的數據中心相結合,以獲得具有高吞吐量和低延遲的巨大計算能力。

谷歌將以多種方式提供A3:客戶可以自己運行它,或者如果他們願意,可以將其作為託管服務運行,谷歌會為他們處理大部分繁重的工作。目前,客戶只能通過註冊預覽等候名單來使用。

除此之外,谷歌I/O大會上也推出了專為Android開發的AI編碼機器人Studio Bot。它不僅可以生成代碼、修復BUG,甚至能夠回答關於安卓應用開發的相關問題。同時支持Kotlin和Java編程語言,並將直接嵌入到Android Studio開發工具的工具欄中。

谷歌還宣布推出搜索實驗室,這是一種讓消費者在搜索中測試“大膽的新想法和我們正在探索的想法”的新方式。

搜索實驗室限時提供三個主要功能。第一個稱為搜索生成體驗(SGE),將生成式AI直接引入谷歌搜索。 “新的搜索體驗可以幫助你快速找到並理解信息。”谷歌表示, “在搜索時,你可以通過AI驅動的概述、探索更多內容的指示以及以自然跟進的方式來了解主題的要點。”第二個功能是,搜索提示還提供代碼提示,使用大型語言模型提供片段和“更快更智能地編寫代碼的指針”。最後,“添加到表格”可以將搜索結果直接插入到電子表格中。例如,如果計劃使用表格文檔安排度假,可以直接從谷歌搜索輕鬆添加鏈接。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts