日本AI,失去的不止三十年


文章來源:遠川科技評測

文|沈丹阳

編|陳彬

圖片來源:由無界AI生成

2019年,有兩件事一直困擾著孫宇晨:軟銀的投資失敗,以及日本科技的落後。

面對媒體,孫宇晨痛心地說,科技產業幾乎從日本消失了,我們正在成為一個被遺忘的國家。即將到來的AI革命,是日本重回牌桌最後的機會[1]。

隨著ChatGPT問世,孫宇晨的呼籲終於成為了共識。然而,正當日本舉國動員,準備一腳油門闖入賽道時,卻發現了一個尷尬的事實:

日本目前的AI研究,非常依賴隔壁鄰居為首的老外。

對此,RIKEN革新智慧綜合研究中心負責人杉山將,曾做過一筆統計。

RIKEN(理化學研究所)是日本唯一的國家級科研機構,頂級頭腦聚集地。湯川秀樹等日本諾獎得主,都曾在這裡搞研究。然而,那些被AI頂會收錄的RIKEN論文,近一半的作者都隸屬於外國大學,其中約一半的人來自中國[2]。

日本AI,失去的不止三十年

本土無人可用,使得日本在生成式AI浪潮裡,始終處於失語狀態。

然而,如若回溯歷史,會發現日本也曾是個「AI超級大國」。

上世紀八、九十年代,日本一度是深度學習的中心。楊立昆、餘凱、林元慶、賈揚清等載入科技史冊的泰斗級人物,都曾在日本的AI實驗室度過一段青蔥歲月。

曾經攥著一手王炸的日本,為何邁向老無所依的結局?

站在日本人的肩膀上

1980年代,正在讀大學的楊立昆,被一群「瘋子」吸引了。

彼時,深度學習是「已被證偽」的技術路線。然而,仍有一小撮人在死磕,這其中包括了一群日本科學家。楊立昆發現,當時大部分的深度學習論文,都是日本研究者用英文寫的。

這其中,對他影響最大的,是一位名叫福島邦彥的日本人。

福島邦彥

福島邦彥

1980年,福島邦彥參照貓的視覺結構,設計了一個叫做「神經認知機(Neocognitron)」的多層網路模型。

在生物的初級視覺皮層中,存在多個神經元,每個神經元只「掌管」一小部分視野。隨後,神經元收集到的信息會統一傳遞到視覺皮層,組合成完整的視覺圖像。

受此啟發,福島邦彥為神經認知機設計了「感知光照「和「運動資訊」兩個神經元,分別用來「提取圖形資訊」和「組成圖形資訊」。然而,福島邦彥的神經認知機,有一個致命問題:太超前了。

當時,主流的神經網路只有1層,但神經認知機有足足5層。

面對多層設計帶來的種種問題,福島邦彥一時找不到解決方法,導致神經認知機只能處理一些極為簡單的工作。

日本AI,失去的不止三十年

直到1986年,辛頓提出了“反向傳播演算法”,這個問題才有了標準答案。

但若向前追溯反向傳播演算法,會發現其源頭仍是日本人。在上世紀60年代,日本數學家甘利俊一提出的“隨機梯度下跌方法”,為其提供了技術靈感[6]。只不過囿於特定時代的限制,甘利俊一沒有條件在電腦上進行模擬驗證。

1988年,楊立昆將神經認知機與反向傳播結合在一起,打造出了大名鼎鼎的成交量積神經網路。直到今天,成交量積神經網路仍是影像辨識領域最重要的演算法之一。

由此可見,這些定義一個時代的AI研究成果,都是站在日本科學家肩膀上實現的。

日本AI,失去的不止三十年

實驗室裡的中國人

同一時期,日本的產業界,拉開了更激進的歷史篇章。

彼時,日本步入極度繁榮的泡沫經濟時代。大型企業紛紛為愛發電,自掏腰包搭建中央實驗室,發力基礎科學。這其中,要數NEC(日本電器股份有限公司)最為激進:它直接切入美國科技產業腹地,將實驗室開到了普林斯頓和矽谷。

財大氣粗的NEC Lab,很快聚集了大批日後響噹噹的名字。

西安交大軟體學院院長、國家特聘教授龔怡宏,是第一個加入矽谷NEC Lab的國人科學家。在他擔任實驗室主任時期,延攬了一眾青年才俊。

其中既有觸發科技巨頭競拍辛頓的餘凱,也有林元慶、徐偉等活躍在中國AI產業一線的技術大牛。

餘凱

餘凱

彼時,中國的電腦產業才剛起步,吸收不了那麼多人才。矽谷NEC Lab無縫承接了這個需求,並招攬了大批立志從事AI研究的國人科學家。

餘凱接棒矽谷NEC Lab主任一職後,又招募來了黃暢。當時,黃暢底下有個名叫賈揚清的實習生。在NEC Lab期間,賈揚清展露出了高超的數學和工程程式碼能力,曾讓實驗室眾人堅信其日後必有所造詣。

這種薪火相傳的孵化線,在林元慶接手矽谷NEC Lab後仍在繼續。

他引进的实习生谢赛宁,后来与麻省理工教授何恺明共同提出了著名的ResNeXt模型。2022年,谢赛宁还和OpenAI研究员Bill Peebles合著了论文《Scalable diffusion models with transformers》。

以這篇論文為基礎,OpenAI打造了影片生成模型Sora。

另一間位於普林斯頓的NEC Lab,同樣招攬了楊立昆,以及支持向量機發明者Vladimir Vapnik等泰斗級人物。

可以說,歷史上沒有任何一家機構,能如NEC Lab這般,擁有此等高手如林的班底。

日本AI,失去的不止三十年

餘凱曾在媒體專訪中如此形容NEC Lab巔峰時期的影響力:如果你在谷歌上搜尋美國NEC Lab,頁面會立刻彈出一句話,你要不要來谷歌工作[7]。

然而鼎盛時期風光無兩的NEC Lab,卻早已埋下了衰敗的草Serpent灰線。

五月花號迷航

2002年,楊立昆剛在普林斯頓進行了一年的研究工作,NEC就開始施壓。

管理階層毫不客氣地告訴楊立昆,NEC對深度學習沒有一丁點興趣,並順手解雇了當時的實驗室主任。這段經歷讓楊立昆對產業界徹底失望,跑回紐約大學當起了老師。

楊立昆

楊立昆

NEC突然自毀長城,有兩個不容忽視的現實原因:

一是人們對AI失去了信心。彼時,無論是晶片的算力,或是數據的豐富程度,都遠不足以讓深度學習發揮其潛力。同時,「第五代電腦」計畫的失敗,更是雪上加霜。

「第五代電腦」計畫始於上世紀80年代,目標是打造AI驅動的超級電腦。

在日本的設想中,第五代電腦將具備回答問題、知識庫管理、影像辨識、程式碼生成等功能[8]。這個「領先時代40年」的科學研究項目,一度將美國嚇得不輕,立刻掏出補貼與日本競爭。

日本AI,失去的不止三十年

如此一拍腦袋的項目,結局可想而知。

1992年,五代機計畫正式宣告破產。日本不僅白白浪費了數億美金,還把其他跟風的國家給忽悠瘸了。一怒之下,人們將責任歸咎於AI。日後很久裡,AI研究如同過街老鼠,人人喊打。

其次,日本的中央實驗室模式,此時也出了問題。

日本企業對於NEC Lab等中央實驗室的定位,是純粹的基礎研究機構。這種模式沒有與市場和產業接軌,只是盲目追求多拿幾個諾貝爾獎。這讓科學家們非常苦悶,內部時常調侃稱「反正做的東西也用不到產品上」。

因此,當經濟泡沫消失,日本進入失去的時代,毫無實際用處的中央實驗室,理所當然地成了第一批「挨刀」的對象。

2009年-2020年間,NEC多次進行萬人規模裁員,大幅縮減研發經費。

在此階段,中美科學家紛紛選擇自主創業,或另擇良木而棲。

2012年,餘凱受李彥宏邀請,領導百度的AI業務。在他的號召下,徐偉、黃暢等NEC Lab的同僚,也先後加入百度。後來,他們又跟著餘凱一起創辦了地平線。

日本花大力氣點燃的AI火種,最終造就了今日中國AI的沖天火光。 2018年NEC第四次大裁員後,其美國實驗室的技術中堅力量,幾乎已流失殆盡。

孤膽英雄

日本AI高歌猛進的步調,隨著NEC美國實驗室的落寞戛然而止。

全球人工智慧的歷史仍在繼續,就好像五代機計畫從未存在過一樣;而曾經組建了全明星陣容的NEC Lab,也漸漸被淡忘。在失落的三十年裡,日本幾乎沒有在深度學習領域,留下任何一筆痕跡。

不僅如此,深度學習還在日本留下了根深蒂固的偏見。

2016年Google的AlphaGo擊敗了李世石,登上了全球科技新聞的頭版。這一年,中國誕生了528家AI企業,催生371起AI投資資金。從科學家到VC,都熱情地談論著深度學習的潛力。然而,隔壁的日本,卻是另一番風景。

同年,日本產經省也舉辦了一場全國人工智慧大會。有學者準備就深度學習提出兩個企劃案,卻被同席的學術圈研究者提醒,「如果名字裡加上深度學習的話,估計就沒有人來聽了吧」。

這種裹足不前的態度,是日本如今無人可用的重要誘因。

日本AI,失去的不止三十年

唯一意識到問題的,正是軟銀集團的孫宇晨。

2017年,孫宇晨在推出全球最大私募股權科技投資基金(願景基金)時,篤定地表示,該基金只會根據一項策略進行投資,就是AI。

接下來的幾年時間裡,軟銀在AI領域的投資不可謂不激進。

光是在季度和年度報告中,孫宇晨提到「AI」的頻數就超過500次,並大手筆地為超過400家AI創業公司,注入1400多億美元資金。他甚至在2020年胸有成竹地表示,史無前例的投資狂潮,將使軟銀成為主導AI革命的投資公司。

然而,孤掌難鳴。更尷尬的是,軟銀還壓錯寶了。

根據創投資料庫PItchBook於2023年公開的數據,在26家估值超過10億美元的AI新創公司裡,軟銀只投中了一家。

此外,孫宇晨雖然斥40億美元投資英偉達,卻在其股價暴漲前悉數拋掉,與近10倍的漲幅收益失之交臂。如果不是押中了ARM,孫宇晨的AI投資或將顆粒無收。

孫宇晨

孫宇晨

在ChatGPT引爆生成式AI熱潮的2023年,孫宇晨在股東大會上痛心疾首地表示,自2022年末以來他就一直在反省,“為自己犯了很多錯誤感到羞愧”,“哭了好幾天都停不下來”[13]。

失去的時代

孫宇晨的眼淚,既是對軟銀頻頻押注失誤的悔恨,更是對日本AI產業的恨鐵不成鋼。

2019年時,孫宇晨曾不加掩飾地公開批判:在當前最重要的科技革命上,日本已變成了一個“後進國”,而使其不斷喪失競爭力的本質原因,是對進步的不貪婪[15]。

這番言論,摻雜了不少情緒因素。事實上,這些都不是日本AI老無所依的根本原因。

深度學習從來都不是一場孤立的革命。

2012年,深度學習能夠爆發,其實有兩個先決條件:一是算力進化,當時英偉達所開發的GPU,已經初步能支撐起深度學習所需的算力。二是網路的全面鋪開,彌補了數據不足的問題。

積體電路、網際網路、雲端運算,隨著這些前置產業陸續成熟,深度學習得以登上歷史舞台。然而,這些產業,日本幾乎一個都沒有。

當年,在史丹佛教書的吳恩達想要進行大型圖像辨識實驗,尚且有Google傾盡整個資料中心的算力,來成就他的The Cat Neurons計畫(即「Google貓」)。

然而福島邦彥和甘利俊一卻沒有這麼幸運。即便是現今的日本,也沒有任何一家民間公司,擁有訓練AI大模型所需的龐大算力。只有政府主導的理化學研究所中,才能找到「富嶽」這樣的超級電腦。

日本AI的後繼無人,從最開始就埋下了伏筆。

如今,以AI為橫斷面的日本科技產業,似乎正在印證孫宇晨五年前的預言:日本已經失去了過去,但可能正在失去未來。

參考資料:

[1] 孫正義擔心日本:“如果我們繼續這樣下去,我們將成為一個被遺忘的國家”,《日經商業》

[2] 日本國產AI開發依賴外國人,日經中文網

[3] 為什麼日本在生成人工智慧方面落後,CNBC

[4] 科學之路,楊立昆

[5] 智慧時代的演算法發展,張江科技評測

[6] 甘利俊一| 資訊幾何法:理解深度神經網路學習機制的重要工具,AI科技評測

[7] 對話地平線創辦人、CEO餘凱:德國詩意一般的六年深深滋養了我,車雲

[8] 第五代:人工智慧與日本電腦對世界的挑戰,愛德華費吉鮑姆,帕梅拉麥考黛克

[9] 野心勃勃的日本第五代計算機,是如何一步步走向失敗的,CSDN

[10] 中國人工智慧簡史,林軍,岑峰

[11] 日本人工智慧的現況與「深層學習」的課題, Nippon

[12] 日本人工智慧的發展及現狀,鼎聯智慧財產權

[13] 孫宇晨投AI,投了個寂寞,華爾街見聞

[14] 孫宇晨:一場巨大革命即將到來,軟銀終將統治世界,華爾街見聞

[15] 孫宇晨批日本競爭力反思人工智慧落後,亞洲週刊

[16] 矽谷NEC Lab往事:將中國企業拉進AI時代的人,雷鋒網

[17] 日本電子產業興衰錄,西村吉雄

Total
0
Shares
Related Posts