一個遊戲少年如何擊敗院士拿下諾獎

來源:詩翰

今天我要講一個科學領域無比勵志的故事,一個聽起來都不可思議的事蹟:一個年輕遊戲玩家擊敗科學院士拿下諾貝爾獎的故事。

是的,之前我講過遊戲顯示卡是如何引發算力革命進而孵化出AI產業,但今天這個故事,比那個還要不可思議,還要峰迴路轉。

有這麼一個小夥,從小就被譽為天才,從小就熱愛遊戲,4歲的時候,就對國際象棋表現出濃厚的興趣,到了8歲,已經能在國際象棋的官方賽事裡拿冠軍了。他用這份獎金給自己買了一份重要的禮物,一台電腦~很快就愛上了電腦遊戲。

熟悉的操作,熟悉的劇情~

17歲那年,他選擇進入遊戲公司成為遊戲設計師。

畢竟,既然這麼熱愛遊戲,為什麼不試試自己做一個呢?他進入了當時大名鼎鼎的牛蛙公司。

進入公司後一年,他主導了爆款遊戲,那就是大名鼎鼎的《主題樂園》。

簡單來說,1994年的這款遊戲是如今許多主題樂園類和模擬經營類遊戲的始祖,甚至我認為海島大亨系列應該也受其影響。

幾年後,他創辦了自己的遊戲公司,並陸續開發了《共和國》和《邪惡天才》這兩款遊戲,都是模擬經營遊戲。

顯然,他非常喜歡模擬經營這個遊戲類型。

文明5,啟動!

到這裡,這個故事似乎和過往提到的象棋天才電腦神童故事類似,

從小熱愛遊戲,有像棋圍棋天賦,能自學計算機,最後進入遊戲公司成為超級程式設計師,做出名震業內的爆款產品。

但這位小哥離譜的地方,才剛開始。

做出爆款遊戲後,很快他就開始思考,電腦這個工具對於遊戲的作用,他開始試著在遊戲中加入AI功能。

很少媒體提到這一點,但我作為一個資深遊戲玩家,我覺得這很可能是前面幾款遊戲帶來的影響。

因為常玩模擬經營類的都能感覺到,在遊戲後期,大量NPC存在的情況下,電腦算力會有明顯短板,

文明5的後期,一回合經常卡爆電腦,

主題樂園,天際線,海島大亨等遊戲後期,不但畫面卡,而且市民的上下班路線非常不合理,哪怕你給他們建好了公交和地鐵,甚至把住宅區和工作區放一塊,他們都會四處亂跑把路堵死。

可能正是這些現象,激發了他對AI的思考,這些遊戲性問題,能否利用AI來優化遊戲呢?

2010年,他創立了一家新的公司,其目標是“解決智慧問題”,並嘗試著用學習演算法來掌握遊戲。

2013年,他們創建了一種名為Deep Q-Network(DQN)的演算法,可以以超越人類的程度玩電腦遊戲。

測試結果顯示,DQN在上手遊戲太空侵略者這款遊戲的30分鐘內,就成為了該遊戲內最優秀的玩家。

2016年,這家公司又發布了一款遊戲AI,並打敗了這個遊戲原本的世界冠軍。

——這次的AI,叫做AlphaGo。

是的,嚴格來說,你可以把圍棋這項運動理解為一個遊戲,把AlphaGo理解為一個遊戲AI,

只是圍棋這款遊戲比較特殊,因為近乎無窮的計算變量,一度被認為無法破解,AlphaGo也比那些簡單的電腦,瘋狂的電腦要智能很多~

許多人震驚於這兩年人工智慧的發展浪潮時,往往將其視為一個單一的,突然出現的事情。

其實不是的,這些年無數電子遊戲的誕生,催生出了天量的對遊戲AI的需求,很多玩家希望在遊戲中對戰更智能的AI,或者和更智能的NPC並肩作戰,這些需求逼迫著程式設計師們不斷加強AI演算法的探索。

從來不存在一個程式設計師異想天開說,我要不惜一切代價,研究一個更聰明的AI,不是的。

現實情況是,你設計出一個好的演算法,你的遊戲更好玩,大賺一個億,他的遊戲更智能,大賣兩個億。是沉甸甸的一份獎金,讓大家有無窮的積極性投入到AI開發上來。

火藥不是一開始就設計出來的,從來沒有一個科學家說今天我就要發明火藥,不存在的,是一堆希望長生的煉金術士為了長生不老這個需求,天天搗鼓煉丹,今天加一點這個,明天試一點那個,最後發現硫磺硝石和炭灰色混合一起居然會爆炸。

列文虎克一開始也沒想發現微生物屆,人家就是一個做鏡片的,天天打磨鏡片,結果突然有一天發現把鏡片打磨到極致後,能看見肉眼看不到的東西。

我們故事的主角也是一樣,一開始他想做遊戲,後來想研究更聰明的遊戲,最後研究出了無比智慧的遊戲AI。

然後他們突然開始思考一個問題,

既然AI擁有自我學習能力,能夠很快的掌握圍棋和電子遊戲規則,成為冠軍玩家,

那如果我們將某個領域的科學研究也理解為一個“遊戲”,AI能不能掌握呢?

2017年,在烏鎮圍棋高峰會上,AlphaGo以3:0的比分乾淨俐落擊敗世界圍棋冠軍柯潔後。

2018年,DeepMind又試著研發了一個可預測蛋白質結構的AI系統,AlphaFold。嘗試用AI來進行科研。

你一定覺得這不太可靠,讓一個原本為遊戲設計的AI去研究科學,這也太天方夜譚了。

不是你一個人這麼想,某位中科院士,也是這麼想的。

是的,就是咱們的老熟人,顏寧老師。

所以說世上的所有相遇,都是久別重逢,峰迴路轉咱們居然又碰上了~

常年以來,預測蛋白質結構主要三種方法,一是用X 光照蛋白質晶體,二是核磁共振光譜,第三種就是昂貴的冷凍電鏡拍照建模。

而顏寧團隊以第三種方法冷凍電鏡的熟練操作而著稱,別人拍照一次的時間,她的團隊可以拍五次,效率高非常多。

而DeepMind他們的想法是,這種重複性極高的工作能不能靠AI 解決呢?

如果咱們把冷凍電鏡拍照建模這個過程理解為一個遊戲,是不是能用AI去試著解決呢?

「他們不打算拍片子,而是選擇了AI :蛋白質既然由氨基酸構成,那隻要利用各處公開的已知蛋白質結構,把這些蛋白質中每一對氨基酸的距離,鏈接角度,匯總起來做成一張圖,再用神經網路消化完他們, AI 就能自己做出預測了”

最終結果是,AI的效率遠遠超過人工,一般團隊效率是1,顏寧團隊效率是5,AI則是十萬,而且還在高速成長。因為AI不需要休息,會不斷自我進化。自從他們取得突破以來,來自190 個國家的200 多萬人都用上了AlphaFold ,在他們的幫助下,科學家們不僅能夠更加深入了解抗生素的抗藥性,還設計出了可以消化塑膠的酵素類蛋白質。

如此顛覆的成果,後面的故事你們應該猜到了,這項技術拿到了諾貝爾獎。這位熱愛遊戲,最初從業遊戲設計師的小夥,就是今年的諾貝爾化學獎得主,哈薩比斯。

事實證明,時代的發展會公平的甩飛每一個,當你被AI發展驚的目瞪口呆的時候,頂尖科學家可能也會看走眼。

2022年我們討論AI的時候,AI對於顏寧他們的衝擊已經被許多人觀察到,從評論區來看,大家雖然都認可AI的發展,但大多認為取代頂尖科學家可能還要一定時間。 (有幾個小夥伴發言很有前瞻性,非常厲害)

顏寧自己可能也是這麼想的,2022年顏寧自己的結論就是,AI的預測水準只能達到她們2017年水準。

這劇情和圍棋業簡直一模一樣,

一開始AlphaGo出來的時候大家都覺得沒什麼,也就能擊敗世界冠軍而已,人類努力有機會贏回來。

但很快大家發現這觀點錯的離譜,因為人類學習是有老師有課本的,人類戰鬥力其實是站在前人經驗上,加上多年學習的結果,而AI接觸圍棋不到一年~入門一年就給你圍棋大師錘了,以後更不用看了。

2022年的時候顏寧覺得AI也就達到她們五年前水平,不足為慮。

問題是AlphaFold是2018年問世的,到2022年也就四年,一個四歲小孩就快追上你人類頂尖科學家了,這發展速度你還用常理去判斷一定會大錯特錯。

所以這個故事告訴我們什麼呢?

是科技發展,是AI革新,是人生際遇,還是生物就該轉碼農?

我覺得最大的啟發在於,熱愛。

回頭展望,2007年顏寧已經是清華大學教授,博士生導師,是卓有名氣的學術大師。

此時的戴密斯·哈薩比斯還是個遊戲設計師,別說學術大師了,他甚至不能算學術界一員。

這時候,你和他說你未來會擊敗科學院士拿到諾貝爾獎,他別說相信,甚至無法想像。

一個默默無名的科學從業者一鳴驚人拿到諾貝爾獎,雖然不可思議,但好歹能說得通。

我一個臭打遊戲的,怎麼可能拿諾貝爾獎?諾貝爾也沒有遊戲獎啊?

世界的驚奇之處就在於此。

你並不真的熱愛科研,可能是為了薪水,可能是為了穩定,可能是為了光鮮亮麗的燈光,你日復一日的干著類似的工作,並深感科研之不易。

他做的雖然只是遊戲,但他發自內心的熱愛遊戲,結果鑽研到極致,居然點出AI這條科技樹,一回頭居然是新時代的鑰匙。

你說這是他運氣好,可如果沒有對遊戲有極致的熱愛,如果不是從根本上思考遊戲的玩法,如果只是為了賺錢做些換皮遊戲,這個故事可能發生嗎?顯然不可能。

是對熱愛事物超越一切的熱愛與鑽研,幫助了他探破迷霧找到新的世界。

永遠不要忘記,熱愛你所熱愛的。

Total
0
Shares
Related Posts