原創:朱利明
來源:朱利明
圖片來源:由無界AI工俱生成
引言
這段時間參加了幾個國內人工智能領域的會議,聽到很多專業人士,包括一些知名互聯網企業技術負責人坦誠的反思為什麼沒有抓住ChatGPT 這波人工智能新範式。很大的原因在於ChatGPT 的核心—語言模型,不是一個新的技術,已經有百十來年的歷史了,而且大家一直在使用它。大家沒有想到,當這個司空見慣的模型參數量超過某個臨界值後會“湧現”出很多強大的功能。這也是這次中國人工智能領域落後的一個重要原因,越是人工智能領域特別是NLP 領域的專業人士,越容易犯這個“燈下黑”的錯誤。有一位專業人士自我剖析的更深刻,這是經驗主義錯誤。
我自己認識ChatGPT 也有一個從淺入深的過程,當我認識到這是一次前所未有的人工智能浪潮時,我希望通過系列文章的形式讓更多人了解一次新的而且是和每個人都相關人工智能革命來到了。
今天看到”學人Scholar”公眾號發表了一篇吳軍老師“ChatGPT 不算新技術革命,帶不來什麼新機會”的文章,非常吃驚。事關技術發展方向的重大判斷,以本文和吳軍老師商榷。
一駁標題
文章標題“ChatGPT 不算新技術革命,帶不來什麼新機會”就令人吃驚,初看以為是媒體博人眼球,看過文章內容後應該是吳軍老師對ChatGPT 的判斷。首先亮出觀點“ChatGPT 是科技發展史上的重大技術革命,將帶來無數新機遇,對很多行業將帶來顛覆式改變”。詳細可以看我寫的幾十篇關於ChatGPT 的文章,我認為這一觀點已經是越來越多人的共識。
當然,我是無名之輩,寫再多文章也沒有什麼公信力,我們列舉部分大咖對ChatGPT 的評價和行動來作例證(雖然從邏輯上並不嚴謹)。比爾蓋茨評價ChatGPT 是他有生以來第二次重大技術革命,上一次是1980 s 的圖形用戶界面(GUI)。馬斯克聯名一眾大咖呼籲暫停比GPT-4 更強的人工智能研發至少六個月。包括李開復、王慧文/王興、王小川等已經退出江湖,財富自由幾輩子的大咖紛紛出山重新創業。百度、華為、阿里、360 等紛紛發布大模型。是吳軍老師“ChatGPT 不算新技術革命,帶不來什麼新機會”對了,還是以上這些大咖都錯了,相信每個人都可以很容易得出結論。
二駁內容
文章內容我看了一遍,感受到了吳軍老師濃濃的仁愛情懷,伴隨著陰謀論和經驗主義氣息。吳軍老師的中心思想是認為ChatGPT 是炒作,而且群眾裡面有壞人,一批陰謀家和鐮刀已經磨刀霍霍了,大家要小心又被割韭菜。這種仁愛情懷我很贊同,任何領域都有可能被壞人利用,何止ChatGPT。吳軍老師順便舉了兩個例子:區塊鍊和元宇宙。 “就比如說區塊鏈,當時炒得那麼熱,但如今這個事已經很少有人討論了,對吧?這是第一個。第二個就是元宇宙,目前美國祇有Facebook 一家還在堅持做。”,我覺得吳軍老師肯定不在這兩個領域之中,“區塊鏈很少有人討論了”嚴重不符合區塊鏈領域的實際情況,我不久前參加的不論是CCF 還是BSN 舉辦的區塊鏈大會都是盛況空前。關於區塊鍊和元宇宙不是本文的重點,留給相關領域的專家和吳軍老師商榷。
本文反駁的是吳軍老師對ChatGPT 的認知存在方向性重大偏差,會誤人子弟。
吳軍老師提到,“最近ChatGPT 這事兒在中國很火,很多人在討論,但很有意思的是,其實這件事在美國,已經沒有太多人去談論這個話題了”,因此,ChatGPT 在中國是炒作。我認為這嚴重不符合事實,不知道吳軍老師是通過什麼調查途徑得出這個事實的,估計是調研的國外對ChatGPT 同樣不感興趣的人?繼2023 年3 月15 日OpenAI 發布GPT-4 後的短短一周之後,又發布ChatGPT 插件技術。 Google、Meta 等也不甘落後發布了Bard、LLaMA,大模型競爭不斷白熱化。不僅是在NLP 領域,Meta 剛剛發布“Segment Anything”的大模型,估計很快,“Detection Anything”、“Recognition Anything”等都會出來。如此如火如荼的發展被吳軍老師說在國外無人談論,是這一段時間閉關讀史沒有上網?
為了證明自己的論點,吳軍老師一下子把我們帶回了七百二十年前的1503 年,通過哥倫布掌握月食原理來和牙買加人鬥智斗勇的故事來鋪墊後面要懂得事物背後的原理,順便帶了一下自己給大家開《世界文明史》的價格的初衷。故事很有趣,“以史為鑑”也是中國古訓,但是和ChatGPT 沒什麼直接關聯。
Q2-Q6 是文章的主體,吳軍老師回顧了是他的導師在1972 年提出的語言模型這個技術,意思是我是本源和正宗,最有發言權。我們先不展開討論語言模型的發展歷史,考證其嚴謹性。其實語言模型可以追溯到一百多年前蘇聯數學家馬爾可夫。很遺憾,吳軍老師犯了和前言中提到的一些大咖同樣的錯誤:經驗主義錯誤,有些時候歷史不一定可以推演未來,走老路到不了新地方。
語言模型從被提出後一直被廣泛使用,不斷迭代創新發揮了越來越重要的作用。特別是當語言模型參數量超過某個臨界值後會“湧現”出很多強大的功能:例如多任務能力、小樣本和零樣本學習能力、思維鏈(COT)能力、指令學習能力、上下文學習能力等等,這些都帶來了不同以往的人工智能學習範式,不再是幾年前甚至幾十年前的樣子。
在吳軍老師的文章中,我們沒有看到任何對ChatGPT 的技術內容的使用和討論,全部都是建立在歷史經驗對現在的評測,我想請問一下吳軍老師,你看過ChatGPT 相關的論文嗎?你註冊賬號使用過ChatGPT 的產品嗎?
從OpenAI 發表的關於ChatGPT 一系列論文來看:“Improving language understanding by generative pre-training”,2018;GPT-2:“Language Models are Unsupervised Multitask Learners”,2019;GPT-3:“Language Models are Few-Shot Learners”,2020/5;InstructGPT:“Training language models to follow instructions with human feedback”,2022/3;ChatGPT is a sibling model to InstructGPT, 2022/11;GPT-4: large multimodal model、2023-04,持續在語言模型進行研究,堅持把模型做的更大,這個路徑其實並不被大多數人認可,但是OpenAI 堅持下來,終成正果。就算是語言模型的發明者也要向OpenAI 虛心請教。
擁抱變化
以ChatGPT 為代表的大模型技術是實實在在的人工智能技術革命,炒作不影響本質判斷。吳軍老師在文章中提到清楚原理就“不會恐慌”,我非常贊同,但可惜的是吳軍老師基於自己錯誤的結論給出的建議更是大錯特錯:“我就開玩笑地問他說,你的房貸還清了嗎?你要沒還清,你就好好回去工作,把工作做好,這才是對大家最有意義的事情,從歷史上看也是如此”。
實際的情況是,很多公司招聘設計師已經要求會使用人工智能工具,很多公司也在推進程序員使用智能編程工具,很多學生開始使用人工智能完成作業,很多人已經通過人工智能工具創建了新的工具和商業模式,更多的ChatX 開始湧現。人工智能可能不會取代你和你的公司,但是會使用人工智能工具的人會取代你和你的公司,積極擁抱變化才能無懼無謂。
另外,如何防止被人工智能炒作割韭菜很簡單,不看廣告,看療效。好不好,自己親自用用不就知道了,頂上聽專家紙上談兵一萬句。
總結
每個人發聲的影響力不同,例如我這樣的無名之輩,說話也沒有幾個人當回事,寫文章不過是個人愛好。但是知名專家學者,大咖發聲還是要慎重,首先互聯網是有記憶的,當年AlphaGO 大戰李世石時的評測還都在知乎上記著呢,可能影響自己的公信力。其次,專家影響力大,個人看了會影響其發展方向,地方政府的負責人看了甚至會影響一個地方的經濟發展。吳軍老師,經驗主義害死人。
推薦閱讀:
吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載