Google全新PaLM 2反超GPT-4,辦公全家桶炸裂升級,Bard史詩進化

谷歌I/O 2023大會,彷彿又給谷歌的支持者們打了一針強心劑。

來源&作者:新智元

導讀:新版PaLM 2超強進化,辦公全家桶Workspace全面升級,Bard全面增強、所有人可用……可以看出,這屆I/O大會,谷歌是真的憋出不少大招。

谷歌I/O 2023大會,彷彿又給谷歌的支持者們打了一針強心劑。

此前,因為微軟和OpenAI的優異表現,谷歌已經被唱衰了很久。

但是,畢竟是做出了眾多奠基性工作的AI老牌公司,谷歌這一輪的發力,讓我們精神一振——它只是慢了,並不是噶了。

對打GPT-4的PaLM 2登台、Duet AI整進谷歌辦公全家桶Workspace、Bard超強進化向所有人開放、谷歌搜索加入AI快照、AI新功能整合進Android 14、AI魔術編輯器加入谷歌相冊等等。

這屆I/O大會,可謂眼花繚亂,精彩紛呈。

PALM 2秀肌肉,手機也能跑

OpenAI的GPT-4,已經被全世界公認為最強大的語言模型。

怎麼對打GPT-4?谷歌的答案,就是PaLM 2。

恰在今天,谷歌一同發布了PaLM 2技術報告。

論文地址:https://ai.google/static/documents/palm2techreport.pdf

顯然,PaLM2被寄予了厚望,以縮小谷歌和微軟之間在AI方面的差距。

劈柴介紹說,因為廣泛的邏輯和推理訓練,PaLM 2模型在邏輯和推理方面更加強大。據說,PaLM 2在超過100多種語言的多語言文本上進行了訓練。

根據基準測試,對於具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估,PaLM 2的部分結果超越了GPT-4。

據谷歌高級研究主管Slav Petrov介紹,PaLM 2在推理、編碼和翻譯上都表現更好,與2022年4月發布的第一代PaLM相比,PaLM 2有了明顯的改進。

可以看到,PaLM 2的推理能力,得到了顯著的改進

修改代碼bug後,用韓語評論。

比如,PaLM 2能夠理解不同語言的成語。

比起PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到了A級,而PaLM達到了F級。 PaLM 2的法語水平達到了C1級。

德語「Ich verstehe nur Bahnhof」如果直譯,就是「我只理解火車站」,但如果你問它,你是不是理解錯誤了?

它馬上就會告訴你,沒錯,這個德語的意思是「你說的啥?我什麼都聽不懂」。

再比如,和波斯諺語「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文諺語是什麼?

在相關論文中,谷歌工程師聲稱PaLM 2的語言能力已經「足以教授這門語言」,原因是其訓練數據中的非英語文本更為普遍。

PaLM 2包含了4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn),並在特定領域的數據上進行了微調,為企業客戶執行某些任務。

這些微調就像給一個卡車底盤,加上一個新的發動機或前保險槓,以在某些特定任務上更好地工作。

這樣的優勢不言而喻,不用花費大量的時間和資源來創建,直接部署。

另外,PaLM2有一個基於健康數據訓練的版本Med-PaLM 2,可以輕鬆通過美國醫學執照考試,達到「專家」水平。

一個基於網絡安全數據訓練的版本Sec-PaLM 2,可以解釋潛在惡意腳本的行為,檢測到代碼中的威脅。這兩種模型都將通過谷歌云提供給特定客戶。

目前,PaLM 2已經應用在25種功能和產品中,包括辦公全家桶、聊天機器人Bard、搜索等等。

值得稱讚的是,PaLM 2最輕量版本Gecko小到可以在手機上運行,每秒可以處理20個token,大約每秒16或17個單詞。

不過,谷歌沒有提及具體用什麼硬件來測試這個模型,只是說在「最新的手機上」運行。

顯然,這次谷歌在大語言模型的小型化上,取得了非常重要的進步。在雲端運行這種AI,往往是很昂貴的,如果能在本地運行,無疑有著許多顯著優勢,比如隱私保護。

英偉達科學家Jim Fan對此大加讚許——

下一波LLM將是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成本,而且還為用戶體驗開闢了全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學習,並為你實現自動化。在小屏幕上節省的生產力,將比在大屏幕上多得多。

此前,谷歌一直被嘲在AI研究上已經落後於微軟,PaLM 2,無疑是谷歌的一次重大回擊。

但PaLM 2同樣也面臨著一些爭議,比如訓練語言模型的數據是否合法?

谷歌只是提到訓練語料庫來自「網絡文檔、書籍、代碼、數學和對話數據」,但並沒有進一步的細節。

而大語言模型的幻覺問題,同樣無法避免。谷歌研究副總裁Zoubin Ghahramani表示,PaLM 2是對早期模型的改進,谷歌「投入了大量精力,不斷改進基礎性和歸因指標」。

但他承認,在打擊AI產生的虛假信息方面,大家都還有很長的路要走。

除了PALM 2,谷歌還宣布了正在訓練的全新基礎模型Gemini。這是第一個多模態模型,同樣包含了參數大小不同的模型。

除了介紹模型,谷歌還特地介紹了開發AI 技術的社會責任感,包括兩個判別AI生成內容的工具:

– watermarking(嵌入水印)

– metadata(嵌入元數據)

Duet AI:辦公全家桶新升級

此前,微軟Copilot把GPT-4整進了全系辦公產品,掀起了震驚全世界的辦公軟件革命。

怎麼破?谷歌這次祭出了Duet AI,給谷歌辦公全家桶Workspace來了一個全新升級。

其實呢,這也就是新瓶裝舊酒,Duet AI就是Docs和Gmail等軟件中AI工具的新名字。

谷歌希望,生成式AI能讓Gmail、Docs、Sheets和Slides更有用,不過目前,大部分功能還在開發中。

Duet AI會涵蓋谷歌的各種辦公軟件,包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成、Meet的自動會議摘要等等。

在文檔中,只要點「Help me write」,Duet AI就能自動幫你生成招聘啟事。

好玩的是,你還可以規定任意文風,比如讓它古怪的調調寫出一個工作描述。

在Google Slids中,Duet AI能直接從幻燈片中的文本生成圖像。

簡單描述一下,合意的圖片立馬生成。

想做一個遛狗業務的收費表?描述一下,它就給你自動生成。

而I/O大會上一個真正的新事兒是,寫作輔助也會應用在移動端的Gmail上,這是對Smart Compose的升級。

現在,如果想試用這些新工具,需要註冊Workspace Labs,加入候補名單。

好消息是,現在任何人都可以申請加入候補名單了,不過目前尚不清楚用戶何時可以訪問。谷歌的說法是,將在未來幾週內將服務擴展到「更多的用戶和國家」。

目前唯一可靠的消息是,Gmail的移動程序上會出現「Help me write」AI助手,此前微軟也曾推出類似產品,將必應集成到iOS和Android的SwiftKey鍵盤中。

Bard又雙叒叕便強了

發布會上,谷歌還宣布了一個重磅消息。

那就是,Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。

這次,Bard上新了不少功能,比如支持了兩種新的語言——日語和韓語,用戶目前可以更簡便地把生成的文本導出到谷歌文檔和Gmail,可視化搜索,以及深色模式等等。

不過,最令用戶開心的,想必是谷歌決定取消Bard的等候名單——將在180個國家或地區提供服務。

此外,和Adobe的AI圖像生成功能,以及Instacart和OpenTable等第三方服務的功能整合也正在路上。

總的來看,這些上新是給老Bard注入的一針強心劑。

目前,谷歌正在使Bard變得更加可視化,讓Bard能夠分析圖像,並且能在查詢結果中提供圖像信息等等。

關於這一方面,谷歌在發布會上展示了一個案例。

假如用戶問Bard,美國的新奧爾良有哪些必看的景點,那麼Bard就能圖文並茂的解答這個問題。

就像用戶在谷歌搜圖中問同樣的問題一樣。

你還可以,用Bard起草郵件,並一鍵導入Gmail,還有文檔中。

而另一個更好玩兒的功能是用圖像提示系統。該功能由Google Lens提供,它能夠識別圖片中的物體。

比方說,上傳一張狗狗的照片,然後給一個prompt「為這兩隻狗寫編一個有趣的標題」。 Google Lens就可以識別狗狗的品種,然後Bard就能寫下與這兩隻狗狗特徵相關的內容。

該功能目前可能還不太完善,雖說潛力無限。未來如何取決於系統的整合程度。

雖說對Bard來講,這是一個相當重大的更新,但和OpenAI的ChatGPT,以及微軟的Bing之間的差距仍然是肉眼可見的。

要知道,微軟在3月就給Bing增加了由OpenAI的DALL-E系統支持的AI圖像生成功能。而OpenAI和微軟一直在探索如何將聊天機器人與更多種的網絡服務相結合。

不僅如此,OpenAI早些時候還宣布了ChatGPT將和OpenTable預訂餐廳,以及Instacart訂貨配送的功能相結合。

谷歌表示,這些功能自己之後也會有的。

代碼能力up

谷歌表示,升級後的Bard將會非常擅長處理有關代碼的問題,包括調試和解釋20多種語言的代碼。

因此,今天發布會上的一些升級主要集中在這個方面上。

包括新的深色模式,改進的代碼引用功能——不僅能提供來源,還能解釋代碼片段,以及一個新的導出功能。

用戶可以把代碼發送到谷歌的Colab平台,還能和另一個基於瀏覽器的IDE——Replit一起使用(從Python查詢開始)。

只要選中代碼,就可以一鍵導出到Colab或者Replit。

還支持20+種編程語言。基本涵蓋了碼農們所需的所有編程需要。

甚至還能直接詢問Bard怎麼用某一種語言實現某種功能。只要prompt到位,生成一串代碼也就是幾秒鐘的事。

寫完以後,還能就著某一行代碼進行解釋,以及完善。

如此看來,結合了PaLM2的Bard應該會在生成質量上有明顯的提升。當然,具體表現如何,還得再觀察。

對戰必應,谷歌AI搜索已來

此前,整合進GPT的必應勢如破竹,真正威脅到了谷歌的搜索市場。

為了與微軟必應競爭,谷歌同在今天推出了由PaLM 2驅動的全新搜索引擎。

它能夠提供問題回答的摘要,比如問「為什麼酵母麵包仍然如此受歡迎?」,谷歌搜索就給出幾段詳細描述酵母的味道、其益生元能力的優勢等等。

另外,在生成內容旁,給出了3個鏈接,以證明摘要中的內容。這樣以減少AI在生成內容上出現「幻覺」問題。

當你搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明了購買時應注意的事項:電池壽命、防水性、音質。

右邊是三個購買指南的鏈接,下面是6個不錯選擇的購物鏈接,每個旁邊都有一個AI 生成的摘要。

可以看到,這是谷歌搜索結果頁面的new look。把AI生成內容放在最開始。

比起重新設計的微軟必應,搜索結果頂部的AI框對谷歌來說更像是,一個小小的更新。

值得注意的是,要是想要訪問這一功能,你必須選擇Search Generative Experience(SGE)這一新功能。

並非所有搜索都會有AI生成的答案。只有當谷歌的算法認為它比標準答案更有用時,AI內容才會出現,而像健康、財務等敏感主題完全不會有AI生成。

谷歌表示,其改進後的搜索引擎能夠以對話方式跟踪原始搜索查詢的選項,無需重複已經提供的上下文或細節。

然而,谷歌搜索也不是無所不能,也存在從未完全解決過的問題——結構編排(orchestration of structure)。

因為大部分數據儲存在互聯網上,甚至谷歌內部,但將所有這些數據放在一起形成一個連貫的答案真的很難。

目前,已經開放候補名單僅限美國,谷歌表示,未來幾個月將考慮更廣泛地推出這一功能。

一鍵退款,智能P圖,沉浸導航

一鍵生成退款郵件?

谷歌行。

劈柴在發布會一開始就整了個小活。航班取消了得退款?不會寫申請退款的郵件?

gmail會。

只要在prompt欄裡輸入要求,gmail分分鐘生成了一篇有理有據有節的退款申請郵件。

另外,谷歌Map現在也有了沉浸式view,你想去哪,懟臉的實景導航來了。

你還能順便問問空氣質量、天氣、交通狀況,都能即時演示。

Magic Editor是谷歌最新公佈的照片處理功能,使用生成性AI,可以讓用戶在沒有專業工具的情況下對照片進行各種編輯。

不會p圖星人的福音來了?

發布會上,谷歌分享了幾個應用了這項新功能的案例,不得不說,效果酷炸了。

比如下面這張,Magic Editor一鍵把瀑布前的人像挪到了側面,還把背景中別的遊客p掉了。不僅如此,本來多雲的天氣硬是給p藍了。

再比如下面這張,Magic Editor一鍵將長凳上的小孩連著凳子一起移到了中間,自動補齊了多出來的椅子,還把原畫中缺失的氣球補齊了。

而且天也p藍了。

當然,這項功能還沒到最完美的地步。就比方說,仔細看看上面這張圖片,凳子挪動了,可是底下的影子沒動。

但總歸,這項功能對照片本身的理解是革命性的。

當然,咱現在還不用太擔心是不是有的圖片被Magic Editor處理過。因為谷歌說了,下半年才會推出這項功能。

AI筆記本Project Tailwind

學生黨福音來了。

不得不說,谷歌還真把學生們拿捏住了。

Project Tailwind從本質上講,就是個筆記本,但是加了AI的能力。

一下子就不一樣了。

用戶可以像問導師或者學習搭子一樣進行在Tailwind裡進行檢索。

雖說谷歌把這個功能其定位為學生服務的工具,但是對於日常需要處理大量文本的打工人來說,也是重大利好。

谷歌產品管理高級總監表示,Tailwind就像一個真正的筆記本一樣,你在裡面記東西,而這些內容就是AI學習的對象。

用戶可以簡便地從谷歌云端硬盤中挑選文件,有效創建了一個兼具個性化和私人屬性的AI模型。

目前,該功能在大學校園內進行了廣泛的測試。

在示例演示中,Tailwind收集了一大堆學習筆記,然後,生成了包括主題詞在內的很多內容,比如,用戶可以為特定主題創建術語表。

Tailwind不僅僅能為學生服務,它對任何從不同來源獲取信息的人都有幫助。

隱藏在Tailwind背後的理念是,為什麼我們不能為每個用戶定制不同的AI語言模型呢?

當然,這裡存在兩個問題。

一方面是成本問題。訓練語言模型所需的計算需求和微調成本都很高,誰來負擔這個成本?另一方面則是信息安全性。

畢竟,捏造信息這種事可一點都不稀奇,誰能保證個性化的筆記本不會出現同樣的問題呢。

不過,是騾子是馬還得拉出來遛遛。用戶目前可以註冊Project Tailwind進行測試。該功能也是AI Labs計劃的一部分。

安卓開發小助手

此外,谷歌I/O大會上還推出了專為Android開發的AI編碼機器人Studio Bot。

不僅可以生成代碼、修復BUG,甚至能夠回答關於安卓應用開發的相關問題。

同時支持Kotlin和Java編程語言,並將直接嵌入到Android Studio開發工具的工具欄中。

參考資料:

https://io.google/2023/intl/zh/

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts