文:VickyXiao
在試圖追上微軟和OpenAI在人工智能方面的先發優勢時,谷歌自己搞砸了。
在今天谷歌在巴黎召開的發布會上,谷歌再一次展示了Bard——這款為了對抗ChatGPT推出來的聊天機器人。按照谷歌的宣傳,Bard不僅要和ChatGPT一樣有問必答,還要更“負責任”——暗搓搓地指ChatGPT裡摻雜的虛假信息太多,不夠“負責”。
這一宣傳明顯提高了人們對於Bard的期望值。畢竟在最初的驚艷過後,ChatGPT“一本正經”的胡說八道,也就是回答裡夾雜的不少似是而非的偽信息,已經讓很多人對於使用它提高了警惕,裡面邏輯和數學上的錯誤更加驚人。
讓人沒想到的是,谷歌的Flag立得太早。 Bard剛一亮相,就出錯了——而且出了個大糗。
在谷歌短短的幾秒展示裡,Bard其實只被問了一個問題——“我可以告訴我9 歲的孩子關於詹姆斯·韋伯太空望遠鏡(James Webb Space Telescope ,簡稱JWST) 的哪些新發現?”
Bard的回答很精彩——有豐富的信息,而且很形象的比喻,確實深入淺出地給孩子解釋了JWST的發現。
然而,裡面有一個巨大的錯誤:回答裡提到“ JWST 拍攝到了太陽系外行星的第一張照片”,也就是下圖灰線部分。
然而,事實上,第一張系外行星照片是由歐洲南方天文台的Very Large Telescope (VLT) 在2004 年拍攝的。
圖源:谷歌
最先指出這個錯誤的是天體物理學家Grant Tremblay。
他在推特上寫道:“我不是要成為一個討厭鬼,我相信Bard 會令人印象深刻,但鄭重聲明:JWST 並沒有拍下’我們太陽系外行星的第一張圖片’。”
圖源:Twitter
在唯一的一次演示裡,就犯了這麼大的錯誤,谷歌可以說顏面盡失,不得不快速撤下了相關演示的YouTube視頻。不過不少官方宣傳推文裡的演示動圖還在。
AI犯錯不可怕,正如前文所說的,ChatGPT上同樣充斥著大量似是而非的虛假信息,而且比較來說,對於同樣一個問題,ChatGPT的回答並不好,它只能回答出來JWST能做一些什麼,而沒有辦法回答它的新發現,更不用說以一種小孩更能理解的通俗易懂的方式來解釋。
圖源:Twitter
但是在谷歌這麼關鍵的產品的首次公開亮相上,這樣明顯的事實錯誤,卻通過了層層審核,被批准放上了CEO的案頭、大幅宣傳——這一點,卻明顯讓人感覺到谷歌員工的麻痺大意。
有谷歌員工對矽星人表示,谷歌這兩年的各種活動往往追求市場宣傳效果,放放產品視頻就好,沒有上真產品的,就算上了真產品,也不用好好測試,不管到時候展示結果如何,哪怕實際產品越來越爛,只要PR做好了就好了。 “產品和運營都麻痺了,太缺乏實戰經驗了,總有一天要出糗。只是沒料到在跟微軟硬抗的時候掉鍊子。真是天意。”
而在ChatGPT的步步緊逼下,谷歌管理層也失去了方寸。正如矽星人此前所說的,這次Bard的發布有點趕,在內部算不上完全準備好,所以才以面向有限開發者的形式推出。這種情況下出現錯誤,也就情有可原了。
但這個錯誤的代價就是,投資人失去了信心。消息一傳出,谷歌股價大跌9%,一天就丟了1000億美元的市值。
1000億美元,可以說,這是AI到目前為止犯下的最昂貴的一個錯誤。有網友很悲觀地預計,“Bard會不會又是下一個Google+、Stadia、Wave等等等等?真是想不到,谷歌甚至沒有辦法對自己的宣傳材料進行事實核查。”
也有推特網友評價說,這也正是如今的AI研究和語言模型共有的問題:它們非常擅長生成*看起來*準確的,但其實並不准確的信息。概括來說,他們就是很牛的扯淡人。
在後續推文中,Tremblay 也補充道:“我非常喜歡並感謝地球上最強大的公司之一正在使用JWST 搜索來宣傳他們的LLM(大語言模型)。棒棒噠!但是ChatGPT 等等這些,雖然令人印象深刻,但通常*非常自信*地犯錯。 如果未來看到LLM 進行自我錯誤檢查將會很有趣。”
正如Tremblay 所指出的,ChatGPT 和Bard 等AI 聊天機器人的一個主要問題是它們傾向於自信地將不正確的信息陳述為事實。這些系統經常“產生幻覺”,即編造虛假信息,因為他們只是接受大量文本語料庫的訓練,但並不是查詢已經過驗證的事實的數據庫來回答問題。這導致一位著名的AI 教授將它們稱為“扯淡生成器”。
很明顯的一個例子就是,對於Bard犯錯的這個問題,其實Google搜索已經給出了正確答案。
如果你在Google上搜索“太陽系外行星的第一張圖片”,Google自己就給出了準確信息——它是在2004年由VLT第一次捕捉成像。
微軟已經預見到了這樣的事情發生。它昨天演示了集成了ChatGPT的人工智能Bing搜索引擎,就試圖通過把責任丟給用戶來避開同樣的這些問題。它在免責聲明里稱,“Bing 由AI 提供支持,因此可能會出現意外和錯誤。請確保進行事實核查並分享反饋,以便我們學習和改進!”
在周一官宣Bard發布的博文裡,CEO 皮柴特別強調,谷歌希望通過這一階段的測試,來提高Bard 的質量和速度,確保Bard 的回答達到高標準。
然而,在這個望遠鏡烏龍事件後,谷歌發言人不得不強行挽回一點顏面。他們告訴媒體稱:
“這凸顯了嚴格測試過程的重要性,我們本週將通過Trusted Tester 計劃啟動這一過程。我們會將外部反饋與我們自己的內部測試相結合,以確保Bard 的回應在質量、安全性和現實世界信息的基礎性方面達到高標準。”
注:封面圖來自於Pexels,版權屬於原作者。如果不同意使用,請盡快聯繫我們,我們會立即刪除。