AI能取代人類嗎:焦慮歸焦慮現實歸現實

GPT-4的發布一石激起千層浪,相比GPT-3.5,新一代的GPT不但能看圖說話、分析圖表,甚至SAT數學能考700分,生物奧林匹克競賽排名前1%,司法考試排名前10%。 GPT正在以一種人類無法匹敵的速度地進化出越來越多讓人嘆為觀止的能力,但這也助長了許多人的失業焦慮、對於數據安全的焦慮,以及對於GPT時代產業發展的焦慮。

於是,未來科技力在上週邀請了山景智能創始人&董事長黃勇,PingCAP副總裁劉松,深勢科技戰略部負責人王小佛,計算美學Nolibox技術合夥人付博銘,這四位業內大咖做客未來科技力直播間,聊一聊GPT、AIGC和AGI。

智能是觀察者的幻象

在科幻小說《三體》中,羅輯從休眠中醒來,看到的一切都是數字化的、自動化的、“先進”的。危機紀年的人類科學早已止步,可還是被基於已知技術開發出來的各種應用所造成的“紛繁閃耀的華麗”迷惑,誤以為自己處在科技發展的盛世。

這和當下由GPT引發的,”被AI取代“、”AI改變社會構造“、“AI大洗牌”等種種焦慮有異曲同工之處。人們似乎覺得機器人已經“準備好了”、賽博朋克近在咫尺,可實際上我們所見到的只是一些能夠寫代碼、繪畫、做視頻和聊天,可謂被予取予求的AI工具。

GPT-4的熱度,在計算美學Nolibox技術合夥人付博銘看來,很像三體中這種絢爛的“科技大爆發”。 “GPT相關的這些技術的話可能都基於若干年前的深度機器學習模型Transformer,但這個算法其實一直沒有更新,“付博銘認為,”GPT的亮點在於有人類監督的強化學習,“而非算法本質的升級。

山景智能創始人黃勇也認可這一點。 “通用人工智能其實是個偽命題”,因為“它是一種技術上的發展和變化,但它也是個過渡階段。”

的確如此。近日微軟研究團隊的一篇論文,針對GPT的“智能”做出瞭如下謹慎的描述:”這(GPT-4)可以被合理地看作是人工通用智能(AGI)系統的早期(尚不完整)版本。”

“GPT4的強推理能力其實是一種用參數算法結合數據的反饋構建出來的’偽智能’,離真正的通用人工智能還遠著呢”,PingCAP副總裁劉松說,並引用了機器人專家羅德尼·布魯克斯的一句話:“智能是觀察者的幻象”。

布魯克斯是MIT人工智能實驗室的教授,他的原句是:“每一個機器人看起來都像是按照一套集中的目的行事,但這只是一個幻象,無論是在人造智能物或是自然生命中,智能都出自觀察者之所見。“ 他不認為機器要學會思考才能做事,還製造過一系列奇奇怪怪的機器人,雖然沒有思考能力,但卻能偷桌上的蘇打罐,穿越四周發燙的地面等。

這位教授還說過一句話:“AI是工具,不是威脅。”

完形填空和“填鴨式教育”,AGI沒你想的那麼近

毋庸質疑,GPT是一個里程碑,也是一個拐點,但可能不是你想像的,通用人工智能(AGI)的拐點。

GPT、Stable Diffusion這類大模型的橫空出世,極大程度上省去了其他入局者“重複造輪子”,開發自研大模型、底層大模型的功夫。開發自研大模型的說法雖然在投資市場很受歡迎,但如果只是做一些小修改,增加一些業務模塊,或者能力不變、在參數量和訓練時長上堆積,更像是“浪費資源”, 付博銘分享道。

“具備行業知識的模型價值是會比從頭做一個基礎大模型的價值要更大。”

為了理解方便,我們暫且把高考能超過半數考生的GPT看作一個具有一定智力的“人”,把給餵AI數據看作是這個“人”學習的內容和方式。那麼GPT這個“人”,也更像是通過完形填空和“填鴨式教育”成長起來的應試型人才,而非具有創造力的全方面人才。

據深勢科技戰略部負責人王小佛描述,近年來一個比較好的AI訓練方法就是給AI做“完形填空”。 “原來訓練的時候,是一個數據用一次就必須要換下一個數據。完形填空的意思是說,一篇文章100個字,把第1個字蓋上,剩下的99個字用來預測第1個字。然後再把第2個字蓋上,用99個字預測第2個字。”

雖然對於AGI的實現學術上尚存爭議,但許多人認為這樣的訓練方式並不符合AGI的實現路徑。理論上來說,AGI的實現首先需要理解人類智能是如何實現的,再將人類智能的實現機制複製到機器上。而GPT-4目前展現出的“類智能”是算法複雜度量變到質變的一種“湧現”。 “GPT-4的推理能力有很大進步,但它依然缺少對事實知識的基本常識,”劉松解釋道。

“一本正經的胡說八道”也許是產品設計?

人們現在使用AIGC工具經常發現生成的內容有不准確、與事實不符、或自相矛盾之處,通常把這種現象稱為“AI在一本正經地胡說八道”。 ChatGPT在收穫鋪天蓋地的讚譽的同時,也不少被詬病這個“致命bug”。

但王小佛有不同看法。 “這可能是一個產品本身的設計,可以把它定位成一個陪聊。聊天的時候對準確度的要求是沒有那麼高的。但如果把它變成一個助手,有功能性的要求,不准確的話體驗就會差很多。這個不一定是技術的問題,或許是一個產品pm的選擇。”

黃勇也認可這種猜測:“它希望更多地得到使用者的反饋,反饋就是對它的一種收斂,能夠更好的讓產品迭代。”

據黃勇表示,在山景智能針對企業級軟件領域的實踐過程中,常常會發現金融或是其他細分專業領域雖然門檻高,但是有邊界的。因此這類軟件的開發“困難沒有想像的那麼大”,可以人為畫出邊界,“能夠讓模型在這個範圍內去做收斂,這個時候效率就非常高了。”

所以,GPT這類模型除了chat,能做什麼?

AI發展的三大要素,數據,算法,算力,缺一不可。

用黃勇的話來說,“算力是基礎,算法是精髓,數據決定了技術發展到什麼階段。”

黃勇分享,作為一家企業級“業務智能決策自動化”平台服務商,山景早期和客戶合作時,經常聽到對方說”我們的數據不好“,或者覺得門檻太高,無法適用人工智能平台、機器學習平台或者PaaS平台。觀察到這類痛點後,山景推出了數據治理的預訓練大模型,可以用來解讀數據,從而找到數據的標準。同時,為了保證客戶的信息安全,也可以做到自動標註、自動脫敏。

這件事相當於把本來雜亂無章,連篇累牘的數據標準化、結構化。結構化的數據加上GPT類模型的自然語言處理功能,就可以把使用門檻降低、效率提升。劉松舉了兩個例子:“一個企業的CEO想最快地總結出公司目前的情況,可以直接向模型提問,不用翻看報表。一個外賣小哥送餐時,不用看路況和取餐地點,直接問模型如何規劃路徑。”

“所以未來最有價值的東西一定是以這種GPT為界面,把結構化數據的嚴肅性和非結構化數據的補充性結合在一起的產品。”

劉松所在的PingCAP是一家企業級開源分佈式數據庫廠商。據劉松分享,在ChatGPT問世的第三天,PingCAP就決定將OpenAI的能力集成到自身的數據庫服務TiDB Cloud中,並在1月10號已經上線,能夠幫助用戶將自然語言轉化為SQL 語言,在數據庫中進行查詢,可以在幾秒鐘內分析公司的運營數據。用戶可以無需掌握複雜的數據庫SQL語言。

而深勢科技的藥物計算設計平台Hermite則是通過融合AI模型與分子模擬技術,來加速創新藥研發流程中靶點研究、虛擬篩選、先導優化等關鍵步驟的效率。 “這不是一步到位的。並不是比如我有一個病,然後AI直接能生成一個藥。”王小佛表示,而是能解決一部分藥物研發成本高週期長的痛點。

付博銘則表示類似計算美學Nolibox其他的“畫宇宙”和“圖宇宙”等AIGC工具能讓高質量和低成本劃等號,讓創意市場從專業化走向全民化,並且讓“創意工作者從一些重複繁瑣的工作中解放出來,聚焦在創造性的工作上,並且更多的關注工作的商業化成果。”

Total
0
Shares
Related Posts