來源:“深燃”(ID:shenrancaijing),作者:李秋涵,編輯:魏佳
原標題:《ChatGPT也漲不動了》
圖片來源:由無界AI工俱生成
你還在用ChatGPT嗎?
在全球掀起AI熱潮的ChatGPT,似乎進入了瓶頸期。
首先是關於ChatGPT的使用率,有不利的數據出現。 6月初,摩根士丹利發布的一項調查顯示,只有19%的受訪者表示他們之前使用過ChatGPT,只有4%的人表示依賴ChatGPT。調查表示,比例低的驚人。
這項調查在今年4月進行,涉及人數為2000人。不過,在全球78億人口面前,這樣的樣本量不算大,也一定程度上降低了其參考性。
還有一個基數更廣泛的數據值得關注,ChatGPT的增長已經明顯放緩。
根據網站數據分析工具SimilarWeb數據,前期ChatGPT的訪問量增長率驚人,1月份的環比增長率為131.6%,2月份為62.5%,3月份為55.8%,在4月份明顯放緩,環比增長率為12.6%,到了5月,這個數字已經變為了2.8%。
隨著ChatGPT普及,參考基數變大,增長率放緩是正常現象,不過,根據目前已有的趨勢來看,6月的環比增長率也有可能為負數。
今年年初,ChatGPT像一聲驚雷,讓全球見識到了生成式AI的威力,也讓背後的GPT(生成式預訓練Transfomer模型)大火,掀起大模型創業潮。它刷新了很多數字,最讓人印象深刻的,是史上用戶增長速度最快的消費級應用,在推出僅兩個月後,ChatGPT的月活用戶已經突破了1億。
但對它未來的發展,即便是創造者也很難給出明確答案。此前OpenAI董事會成員海倫·托勒就曾表示,“甚至創造它們的人也不知道它們能做什麼,不能做什麼。我預計,我們真正了解GPT-4能做和不能做的所有事情,可能還需要幾年時間。”
ChatGPT現在的天花板,不代表就是GPT的天花板,但作為目前最厲害的大語言模型支撐的產品,ChatGPT的走向,也能成為觀察GPT應用的一個窗口。關於AI的狂想還在繼續,時間已經過去了近半年,我們好奇的是,ChatGPT的使用情況到底如何?它被高估了嗎?
01ChatGPT真的很多人用嗎?
對於ChatGPT的使用體驗,不同行業、不同人答案不同。有人把它當玩具,使用了一兩次後就不再登錄;有人努力把它變為工具,在工作中以提高效率;也有人,在努力將ChatGPT變為工具的過程中失敗了,因為覺得它“不夠好用”。
夏楠屬於第三種。她從事外貿行業,會用ChatGPT寫工作郵件,也會讓它解答一些生活中的煩惱,為了能更好的使用ChatGPT,她都是用英文髮指令。
從2月開始使用ChatGPT,她的體驗分為了三個階段,最開始是好奇,很多問題都想拋給ChatGPT,看它怎麼回答,探索它。從5月開始,她感覺ChatGPT“變笨了”,之前能做到的,現在做不到了。現在,她對ChatGPT的評價是,“不好用”。
比如最近,他們公司接了一個炒菜機器人的ODM(原始設備製造)業務,她想讓ChatGPT提供這個市場的預測數據,在反复推拉後,ChatGPT還是沒有給她答案。而在寫工作郵件上,經過調教,ChatGPT也只給到她一個命令式的跟進郵件,文字官方式的長篇大論,也不是她想要的,她希望“它能寫出有禮貌的,信息表達很明確的郵件”。
她覺得,ChatGPT之所以做不到,短板在於“不懂得人情世故”。得不到想要的結果,她的使用頻次也降低了,從一個星期五六次變為了一周一次。
當然,之所以會有這樣的體驗,背後綜合影響因素很多,和使用者是否問到了ChatGPT擅長的領域有關,也要看使用者有沒有找到與ChatGPT合適的交易所方式。
正在澳大利亞生活的Lucy,從去年底ChatGPT一推出後就開始用英文使用它。現在,她日常用ChatGPT來整理學術研究上的思路、學習語言,是生活裡必不可少的工具。只是,準確性的問題一直讓她煩惱,文獻參考需要自己找,“如果我質疑它的回答,它就會順著我的思路回答”。
除了ChatGPT的使用體驗感受不一,從數據來看,ChatGPT的普及率,暫時也還沒有想像中的廣。
摩根士丹利相關報告截圖
除了摩根士丹利的報告,還有一些數據可以作為佐證。根據SimilarWeb數據,3月-5月,美國、日本是全球為ChatGPT貢獻流量份額最高的國家,分別位列第一、第三。不過,最近,美國的流量已經下滑了10.28%。
ChatGPT的全球流量分佈來源/ SimilarWeb數據
美國方面,在5月底,皮尤研究中心發布了一份調查,他們在今年3月中旬在1萬多名美國成年人當中展開調查,18%的人聽說過很多關於ChatGPT的事情,39%的人聽說過一點,42%的人根本沒有聽說過。
而在日本,根據日本ICT市場調查諮詢機構MM總研的最新調查報告,5月24日-31日期間,以日本及美國企業所屬的13814名員工(其中,日本13412人、美國402人)為對象,進行的網絡調查結果是,日本企業的ChatGPT使用率僅7%,與美國企業的51%使用率相比,兩者相差高達44個百分點。
日本企業中,近半數員工(46%)回答“不知道”ChatGPT,而即便知道ChatGPT,但回答“未使用”的比重也達42%。
這些都是最近的報告,樣本量在1萬人左右。不過ChatGPT大熱後,全球關於它的使用報告眾多,觀點不一,甚至有的得出的是相反結論。上述報告有一定參考性,但也因地域和人群的差別,不一定能完全反應真實情況。
還有更明確的值得參考的整體性數據,可以幫助我們認識ChatGPT的應用現狀。
根據SimilarWeb,ChatGPT增長明顯放緩,尤其到6月,截至6月20日,6月已經過去三分之二,訪問量比5月少了38%左右,粗略推算,到6月31日如果沒有特別新的刺激,6月的環比流量或將下跌。
ChatGPT近期流量變化來源/ SimilarWeb數據
同時,還可以參考的是,根據SimilarWeb,在5月,ChatGPT的跳出率是12.59%,低於谷歌、Youtube等,而在6月24日,跳出率已經上漲到37.37%。平均訪問持續時間也從8分32秒,下跌到7分48秒。
另一個數據是,接入GPT大模型後Bing的市場份額變化。
來源/ Statcounter
Bing的市場佔有率,在二三月份剛引入GPT時引發關注,根據網站通訊流量監測機構Statcounter,2023年3月Bing的市場份額是2.86%,5月是2.77%,不僅佔比沒有提高,甚至還有下跌趨勢。
02是什麼限制了ChatGPT?
關於ChatGPT應用上的問題,已經老生常談,不過這些問題對它應用普及上的影響,或許比想像中廣。
首先是“變笨”這件事。
6月初,“ChatGPT變笨了”的聲音引發過討論。不過OpenAI開發者推廣大使Logan Kilpatrick曾出面回應,表示自3月14日發布GPT-4以來,大模型的本體一直處於靜態,不存在大量外部數據污染模型的情況。同時他也承認,大模型本身存在不穩定性,因此對相通的提示詞,存在回答前後不一致的情況。
一位AI從業者告訴深燃,5月就有國外從業者在OpenAI論壇里分享論證GPT變笨的文章。最近,他用GPT-4的API做了測試,讓它做簡單的計算題。從結果準確度來看,GPT-4-0314取得了滿分,GPT-4取得了80分,GPT-4-0613,勉強可以拿50分。其中,0314、0613即指3月14號、6月13號的快照(指整個系統在某個時間點上的狀態)。這個結果,給他一種GPT-4在被削弱的感受。
根據監管機構NewsGuard的專家分析,OpenAI最新版本的GPT-4,在輸出信息方面,比GPT-3.5要糟糕。在今年3月份發布的報告中,NewsGuard提到,GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述,而且比GPT-3.5回答的內容更差。
在上述AI行業從業者看來,這樣變化的結果是,用戶需要變得更為具體和主動地引導GPT-4,才能獲得與過去相當的回答質量。
這也再度影響ChatGPT的使用門檻,而這與ChatGPT的初衷有所背離。
最開始ChatGPT爆火,就有業內人士對深燃分析,它帶來的影響是將通用人工智能放在了每個用戶面前,也把人機交互的門檻,打到了最低點。
但目前來看,門檻還是存在。從ChatGPT的用戶畫像,也能看出這個產品的普及情況。根據SimilarWeb數據,使用者主要分佈在計算機電子與技術行業,其中,編程和軟件開發佔比最大。其他行業裡,只有遊戲行業中的視頻遊戲機和配件的從業者佔比較多。
在使用ChatGPT的體驗上,一位工程師給深燃的反饋最為積極,表示一直在用,“能幫我解決小的程序上的問題”。
儘管都說,“淘汰你的不是AI,是會用AI的人”,如果普通人使用起來門檻越來越高,那也一定程度上脫離了ChatGPT的初衷。
還有兩個問題,是ChatGPT從最開始就面臨的質疑,即準確率和隱私保護。
根據上述日本相關機構的報告,在被問到今後若要繼續/擴大使用ChatGPT,需要解決什麼問題時,日本企業、美國企業分別有高達49%、45%的回答是“案件的精度”,其次為“個人資料等隱私(日企34%、美企35%)”,和“對問題的理解程度(日企33%、美企34%)”。
準確度方面,OpenAI的CEO山姆·奧特曼,也做出過解釋,這個程序會自信地宣稱一些東西是事實,但其實它是編造出來的,就像謊話連篇的政客一樣。他給這種現象起了個名字——“幻覺難題”。
總之,準確率要實現起來非常不容易。原因就是因為它不是靠記憶,而是憑藉演繹推理能力來工作。 “大語言模型靠的是推理的拼字遊戲,不可能像數據庫一樣完全準確,人也不能完全保證準確”,關注AI行業的工程師楊陽告訴深燃。
隱私方面,OpenAI至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃,公司特地發郵件通知,讓大家謹慎使用ChatGPT。
基於這些限制,ChatGPT的應用場景也受限制。
關注產業的投資人陳默默告訴深燃,它其實適合“生產力驅動”的內容生產,而不是“創意驅動”的內容生產,在前者上,能替代不少有重複經驗上漲的人力。
用戶洛洛從4月開始使用ChatGPT,她開了會員,主要用於寫腳本和文案,“只要能給它正確的公式,基本可以反饋給我任意思維的腳本,只是拿到手要改”。她表示,產出的腳本比較基礎,沒法做成爆款,但它邏輯沒有問題,“像公司日常的一些大量的視頻輸出,是可以支持的”,她現在的ChatGPT使用頻率,基本上一周3次以上。
現在夏楠調整了策略,只問它一些流程式的問題,比如開ebay網店的流程。儘管這類問題也可以問谷歌、百度,但“ChatGPT的回答更好”,她舉例,最近她去德國旅行,讓ChatGPT給她安排旅遊計劃,給出的答案有參考性,交通安排的也很清楚。
這些長期使用ChatGPT的用戶,不論對ChatGPT的使用體驗滿意與否,他們都提到,ChatGPT更像是一個升級了的谷歌、百度,帶來了一定助力。
03ChatGPT,象徵意義高過實質意義?
最近,OpenAI推出了類似於LLM版的App Store,加速生態的建設,還被曝光了一些功能上的優化。這背後也隱藏著一個信號,GPT4暫時已經到天花板,要加速生態建設,在GPT5出不來之前,先做一些體驗上的優化。
早在4月,山姆·奧特曼就表示,還沒有開始研究GPT-5,也沒有立即開始的打算,還曾表示,“大型模型時代已經到頭了。”
據OpenAI官網,GPT模型參數數量(可以理解為餵養模型的語言材料)在不斷提升。 GPT-1是1.17億,GPT-2有15億,到了GPT-3,飆升至1750億,GPT-4,根據國外媒體機構Semafor的一份報告,比GPT-3大六倍左右,具有1萬億個參數。
此前楊陽也對深燃表示,或許GPT-4就成長到頭了,語料是一個原因,“人類歷史上創造出的優秀資源就這些了”,模型本身的限制也是一個原因。在他看來,現在GPT-4被限制了,應該有能力沒有被完全開發出來。
近日,Facebook母公司Meta首席人工智能科學家Yann LeCun就指出,ChatGPT背後的生成式人工智能技術已進入了死胡同,擁有太多的局限性。
出於巨頭間的競爭關係,或許很難將這話作為客觀參考。但可以肯定的是,ChatGPT的確遇到了瓶頸。
要讓大語言模型有更好的應用,不少人把視線投向垂直領域的應用上。
AI行業從業者秦凱對深燃做了一個比喻,ChatGPT這類泛化型的人工智能,應用寬泛時,能力就像是高中生、大學生,和垂直場景結合時,fine-tuning(在自然語言處理中使用的技術,也叫微調)的數據足夠精確和貼合場景,能力就能變為碩士、博士,能解決更具體的需求。
楊陽也認同這一看法。他提到,目前的模型最多只能進行一倍左右的優化,“大家有一個基礎共識,GPT-5來了,也不會帶來顛覆性的進化”,短期內不可能達到AGI(通用人工智能)水平。
不過,他表示,現在做具體垂類應用,首先是費用高,訓練模型對公司來說依舊是不小的成本;其次是數據安全、數據隔離的問題,目前採用的辦法是,“在大模型基礎上套小模型”,但帶來的問題是,現在的底層技術還在變化,“沒有人知道下一個模型,更優秀的模型什麼時候出現”,這個中間階段讓大家很迷茫,“如果三五年後才出現,那現在基於大模型做垂類的產品是不虧的,場景落地後有機會回收資金。但如果很快就出現了,那大家現在做的外掛型垂類產品,是沒有多少意義的。”
投資人陳默默表示,這是一個“先有雞還是先有蛋”的問題,他們還是願意去看相關項目,在細分領域里切一個特定場景的應用,因為“哪怕未來的底層有變化,只要行業沒有變動,在應用層的行業理解上還是會有沉澱”。
但他們在看項目時遇到的問題是,很難有人可以明確告訴他們,產品能節省多少人力成本。 “看下來,還是得給機器配個人”,她舉例,關注賦能研發端論文篩選歸納相關的垂類產品,實際使用也還是需要一個人順著機器的結果,再做進一步驗真、開發和研究,實際上很難說效率有特別好的優化”,所以現在,一些投資人都會傾向於再觀望觀望。
在關注垂類領域的AI創業公司的產品時,她的感受是,“我們對技術帶來的產業升級機會保持謹慎Optimism,目前可能它的市場意義,高過實質意義”。
秦凱總結,人們對ChatGPT的期望過高,但有兩個瓶頸。首先,下一代大語言模型通過更大的參數規模和更強算力的收益邊際遞減,人們的期望可能無法很快滿足。其次,當前的大語言模型是泛化的,需要很長時間來解決特定、真實的問題。目前垂直領域的生成式AI,已經變成了針對具體企業做定制化需求和私有部署的體力活,“底層模型依靠transformer方式缺乏解決非常複雜問題的能力,現在的應用情況與預期的水平相距甚遠”。
應用還在繼續,技術還在發展,關於ChatGPT的應用及潛力還需要再觀望。即便是這樣,ChatGPT已經讓一些人的生產效率,有了一個數量級的提高,即便當下有瓶頸,“ChatGPT已經是很偉大的產品,這就夠了。”楊陽表示。
*應受訪者要求,文中夏楠、Lucy、楊陽、小虹、洛洛為化名。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載