ChatGPT真能取代搜索引擎嗎

想像一下,當你遇到問題時,有一個可以與你交談的搜索機器人,它可以讓你更容易找到答案(如果它不撒謊的話),這是多麼方便的一件事。微軟、谷歌、百度和其他公司都在致力於此。

JIANG CHEN(陳江,音譯),一位曾在谷歌工作過的機器學習專家,當他第一次嘗試ChatGPT 時就被迷住了,這個來自OpenAI 的聊天機器人使用起來非常連貫,看起來信息量很大,如今已經成為互聯網上的一個熱點。

但是,當陳試圖使用同樣的底層人工智能技術,為他聯合創辦的初創公司Moveworks 構建更好的搜索工具時,這項技術的影響力光環開始顯得暗淡了。 Moveworks 使用人工智能來幫助員工篩選信息,如技術支持文件和人力資源頁面。陳的新人工智能搜索工具在從這些文件中提取各種有用信息方面做得很好,包括提供地址和電話號碼,但其中一些不是真的。 “它的編造能力實在令人驚嘆。”陳說。

人們對ChatGPT 的狂熱興奮,以及普遍認為它可以重塑搜索引擎的說法是可以理解的。該聊天機器人可以通過綜合從網絡和其他來源抓取的數十億字節中的信息來訓練算法,為問題提供複雜而精密的答案。 ChatGPT 可以讓人體驗到一種更流暢的與機器互動的方式。

但這項技術的工作方式在某些方面與可靠檢索在線信息的搜索引擎的理念有著根本的不一致。網絡上已經有很多不准確的信息了,而ChatGPT 也很容易產生新的虛假信息。它的底層算法並不直接從事實或鏈接數據庫中提取信息,而是生成一串單詞,目的是在統計上與訓練數據中的單詞相似,而不考慮真相。

儘管面臨著這樣的挑戰,也許是受到ChatGPT 令人眼花繚亂的演示的影響,網絡搜索巨頭和幾家初創公司也都正在迎頭趕上。微軟已經向ChatGPT 的創造者OpenAI 投資了大約100 億美元,微軟也正在以某種方式將這種基礎技術添加到其排名第二的搜索引擎必應(Bing)中。

據報導,谷歌公司一段時間以來一直在開發類似的聊天機器人LaMDA,該公司也在匆忙之中對ChatGPT 做出了回應——發布了ChatGPT 的競爭者Bard。中國領先的搜索引擎百度也正在開發一款類似ChatGPT 的中文機器人。

在科技巨頭們準備應對ChatGPT 的同時,幾家初創公司已經推出了帶有類似聊天機器人聊天界面的搜索引擎。其中包括You.com、Perplexity AI 以及Neeva。

他們開發的工具說明了將ChatGPT 式的技術應用於搜索的潛力和挑戰。由語言和人工智能專家理查德·索切爾(Richard Socher)創立的You.com 可以通過聊天界面提供答案。而且這些回答還帶有引文,可以幫助用戶追踪某條信息的來源。

但該模型有時會將不屬於同一來源的信息結合起來。例如,詢問一個人的信息,可能會得到一個結合了多個同名同姓人員的履歷信息的答案。比如當被問及我的個人情況時,You Chat 準確地描述了我在《連線》雜誌的職位,但也認為我是特拉華大學的一名橄欖球隊跑衛和一名專業的創意人員。常規搜索可能會返回幾個威爾·耐特斯(Will Knights)的介紹頁面,而聊天機器人會將它們合併為一個人。

像ChatGPT 這樣的系統的另一個問題是,它的回答僅基於所訓練的數據。由於模型的規模和數據的規模,對整個模型進行再訓練可能要花費數百萬美元。當被問及最新的體育比分時,YouChat 會感到困惑,但卻知道紐約此刻的天氣如何。創立You.com 的索切爾不想透露最新信息是如何被整合進來的,他認為這是一種競爭優勢。

索切爾說:“我認為現在很多聊天界面在某些方面比搜索體驗要好得多,但在其他方面顯然還差得多。我們正在努力減少所有這些問題。”

搜索初創公司Perplexity AI 的創始人兼首席執行官阿拉溫德·斯里尼瓦斯(Aravind Srinivas)曾在OpenAI 工作過,他表示,用最新信息更新一個類似ChatGPT 的系統所面臨的挑戰,意味著它們需要與其他東西結合起來使用。他說:“單靠它們,永遠不可能成為優秀的搜索引擎。”

Greylock Partners 的風險投資人山姆·莫塔梅迪(Saam Motamedi)投資了人工智能搜索公司Neeva,他表示,目前還不清楚聊天式搜索界面的主要收入模式,其廣告的兼容性如何。谷歌和必應利用搜索查詢來植入廣告,這些廣告出現在返回鏈接列表的頂部。莫塔梅迪懷疑,為了讓聊天式搜索界面變得可行,可能需要出現新的廣告形式,但目前還不清楚這些形式會是什麼。而目前Neeva 對無限制無廣告搜索收取訂閱費。

以穀歌的規模運行ChatGPT 這樣的模型,其成本也可能被證明是個問題。 OctoML 是一家幫助企業降低部署機器學習算法成本的公司,其聯合創始人兼首席執行官路易斯·塞茲(Luis Ceze)估計,運行ChatGPT 搜索的成本可能是谷歌搜索的10 倍,因為每個答案都需要運行一個龐大而復雜的AI 模型。

眼下這股“ChatGPT 狂熱”的規模讓一些熟悉這種底層技術的程序員和人工智能研究人員都感到十分意外。該機器人的核心算法名為GPT,由OpenAI 於2018 年首次開發,更強大的版本GPT-2 於2019 年發布。這是一種機器學習模型,旨在接收文本,然後預測接下來的內容,OpenAI 表明,如果使用大量文本進行訓練,該模型的表現會非常好。自2020 年6 月以來,該技術的第一個商業版本GPT-3 已供開發人員使用,可以完成ChatGPT 最近受到讚賞的許多事情。

ChatGPT 使用了底層算法的改進版本,但其能力的最大飛躍來自於OpenAI 讓人類向系統提供反饋,告訴系統什麼是令人滿意的答案。但就像之前的文本生成系統一樣,ChatGPT 仍然傾向於從訓練數據中重現偏見,以及“編造”看似合理但不正確的結果。

紐約大學(New York University)名譽教授加里•馬庫斯(Gary Marcus)直言不諱地批評人工智能炒作,他認為ChatGPT 不適合搜索,因為它對自己所說的內容沒有真正理解。他補充說,像ChatGPT 這樣的工具可能會給搜索公司帶來其他問題,因為它們會讓互聯網充斥著人工智能生成的、搜索引擎優化的文本。 “所有的搜索引擎都會遇到問題,”他說。

亞歷克斯•拉特納(Alex Ratner)是華盛頓大學(University of Washington)的助理教授,也是致力於更有效地訓練人工智能模型的Snorkel AI 公司聯合創始人,他稱ChatGPT 標誌著軟件所能做的事的“合理拐點”。但他也表示,要想弄清楚如何防止像GPT 這樣的語言模型胡編亂造,可能還需要一段時間。他認為,要想找到一種方法讓這些語言模型與新信息保持同步,以保持搜索的實時性,很可能需要採用新的方法來訓練底層人工智能模型。

這些解決方案需要多長時間才能發明出來並得到驗證,目前尚不清楚。即使有其他用例出現,比如將其作為學習或編程夥伴,這項技術也可能還需要一段時間才能從根本上改變人們搜索答案的方式。 Moveworks 公司的陳說:“這很了不起,我告訴團隊,人們會看到ChatGPT 帶來的跨時代的變化,甚至會出現pre-ChatGPT 和post- ChatGPT 的說法。但它是否會取代搜索,則是另一個問題。”

來源:元宇宙之心

Total
0
Shares
Related Posts