國產AI大模型研發終於進入“罵街”階段


來源:互聯網白

作者:梁應傑

經過一段時間的沉寂,因為ChatGPT的出現,國內互聯網又恢復了往日的生機,連“激情互懟”的戲碼也搬了出來。

在闊別舞台中心一年半後,搜狗前CEO王小川吹響了進軍AI大模型的號角,成立百川智能,一口氣接受了包括36氪、品玩、甲子光年、騰訊《深網》等在內的多家頭部科技媒體的專訪,一頓強力輸出,不惜豪言“年底要做出國內最好的大語言模型”,把自己逼到了牆角。

熟悉王小川的人都知道,這位理工“直男”很喜歡表達,聊嗨了百無禁忌。他曾在《十三邀》裡點評高圓圓和湯唯,認為前者成績太差,後者成績雖然一般,但身上有很多閃光,並不介意娶她。

這事後來還引發了網友的“討伐”,最終以王小川解釋和道歉收場。

這次被王小川點名的不是女明星,而是老對手李彥宏。有媒體問:“如何看待李彥宏此前所透露的,百度文心一言和OpenAI的差距是2個月”這一觀點,他回复:“採訪的可能是平行世界的李彥宏,不是我們這個世界裡的。”

20年的恩怨

言下之意,李彥宏不僅吹牛,還吹大發了——按照王小川的計算和業界普遍的分析,中美大模型的差距在兩三年。這事王小川原本可以直說,甚至圓滑點,拿業界普遍觀點搪塞過去,但這就不是王小川了。

很快,百度集團副總裁、搜索平台負責人肖陽出來回應了一大段話,嘲笑了王小川脫離一線太久,對國內人工智能技術缺乏了解,順便還翻了舊賬:“當年搜狗也立志取代百度搜索,結果也是顯而易見的。所以很難評價,那我祝他成功吧。”

這一巴掌直接打出去20年。那會兒王小川剛畢業不久,被張朝陽招入了搜狐,佈置了個艱鉅的任務:“給你六個人頭,滅掉百度。”頗有李雲龍攻打平安縣城的氣勢。 11個月以後,名字取自電影《大腕》的“搜狗”搜索正式上線。

可惜張朝陽不是李雲龍,王小川手裡也沒有足夠的“意大利炮”,對準百度轟是轟了,造成不了實質性傷害。後來兜兜轉轉,搜狗下嫁給了阿里,最後賣給了騰訊,王小川隱退江湖。

對於自己一個清華高材生,為什麼沒能競爭過一個北大高材生,王小川曾有過總結:“我比李彥宏技術好,只是沒有他命好。”

連李彥宏本人都不怵,何況是手下人,針對肖陽的回复,王小川也不客氣:“什麼樣的平行Cosmos裡,才能做到讓一個脫離一線15年的人,去懟一個脫離一線1.5年的人。”

這其實算客氣的,當初他懟起來更狠,什麼“如果百度能和谷歌一樣有創新和遠見,搜狗就直接投降了”“如果自己身在百度,百度的情況應該會比當時好一丟丟”,句句直戳李彥宏的肺管子。

那麼,過去1.5年,王小川在幹嘛?

一路“成交量”過來的天之驕子

據王小川自己介紹,他回歸老本行,做數學研究了,希望用數學模型解決生命科學的難題。數學恐怕是王小川除了搜狗外的摯愛,這次復出,有媒體問他怎麼看待大模型的競爭,他還拿奧賽舉例。這位“天之驕子”也是一路成交量過來的。

1990年,12歲的王小川以入學考試第一名的成績進入成都七中的綜合數學實驗班,班級裡同學的數學成績沒有低於95分的。這些同學包括,B站CEO陳睿、騰訊COO任宇昕、前滴滴研究院院長何曉飛等。

和這幫學霸競爭,王小川絲毫不落下風。三年後,他憑藉全國數學聯賽一等獎再次被保送進成都七中高中部。一年後,他加入了中科院院士張景中的三人小組團隊,用吳文俊消元法,首次在微型機下完成初等幾何命題的全部證明。

這項工作讓他獲得了億利達青少年發明獎,有幸和諾貝爾獎得主楊振寧以及時任副總理的李嵐清見面。據說,李嵐清當時問了他一個問題:“你一分鐘能打多少字?”後來,互聯網江湖常拿這事調侃,認為王小川研發搜狗輸入法是冥冥之中的事。

王小川和楊振寧

李嵐清視察成都七中

輸入法也是搜狗和百度的另一場鏖戰,戰況剛好和搜索顛倒,王小川和團隊取得了壓倒性勝利,只不過和搜索的市場相比,輸入法市場的體量實在太小。

王小川對人工智能的探索也始於搜狗時期,他說現在搜狗就有12000塊GPU在為AI服務,70%做的是推理,無論是搜索還是輸入法,都建立在自然語言處理上,所以他和團隊做語言大模型有經驗和優勢。

拿到億利達青少年發明獎不是王小川的終點,不久他就和隊友拿下了國際信息學奧林匹克金牌和團隊第一。隊友中有個叫陳磊的,就是現任拼多多的CEO。這個獎項也直接讓王小川進入清華大學計算機系。

20世紀90年代末那會兒,互聯網方興未艾,計算機方面的人才緊缺。 1999年,王小川見到了“歸國三人組”陳一舟、周雲帆和楊寧,當時他們正在運行一個叫ChinaRen的社區項目,給還在上學的王小川開出了8000元一個月的薪資,那會兒差不多可以在北京買下3平方米。

之後ChinaRen被如日中天的搜狐收購,張朝陽一眼看中了王小川這個小兄弟,放話:“你上學多久我可以等你,你要多少錢我給你開。”事實證明,動不動就變“霸總”的查爾斯張看人比唱歌更準。

賣掉ChinaRen的陳一舟也沒閒著,一路創立了貓撲、人人網,成功收購了王興、王慧文他們創立的校內網。在王小川前,王慧文和他的“光年之外”是非大廠裡做大模型聲響最大的。

通用人工智能的時代到了

賣掉搜狗後,王小川曾在接受《中國企業家》採訪時感慨:“我的性格里有一面,是對世事變化懶得應對近乎遲鈍。”但看到ChatGPT橫空出世,他立刻表現出了“扶我起來試試”的決心。

在接受“甲子光年”採訪時,他表示,自己可能是第一個將ChatGPT定性為AGI的人,而不是業界謹慎判斷其是“AGI的曙光”。

AGI實際上就是AI中間加了個G,英文General(通用)的首字母,翻譯過來也就是“通用人工智能”。這個詞其實帶著點人類的無奈:AI本身就是人類希望機器有朝一日能像人一樣思考,但經過一段時間的研究,大夥發現一步到位太難了,只能讓機器在某個領域,像是視覺、自然語言等方面智能化,因此通用,也就是“啥都能會”的人工智能被視為AI研究皇冠上的明珠。

科幻電影《機械姬》劇照

說是明珠,也就是聽上去好聽,看上去很美,相當長時間裡,AGI有點像科幻概念,相信的人屈指可數,直到GPT-3.5的出現。

2016年,AlphaGo完成了對圍棋的挑戰。許多人覺得這就是機器比人更精於計算,是天經地義的,“再說了,下圍棋再厲害對我的工作有什麼影響?”但現在,AI能寫詩、寫論文、寫文案、算算數、畫畫、生成視頻,連人類具有難度的考試也不在話下,很多普通人第一次感受到被AI支配的恐懼。

很早就在研究自然語言的王小川也一激靈。他說人和動物的核心區別就是語言,哲學家維特根斯坦說過“語言的邊界就是世界的邊界”。

換句話說,在黑暗中摸索了那麼多年,AI突然就摸到人類世界了。閉關修煉中的王小川心頭一震,沉聲低語:“強人工智能的時代來了。”

都還沒站上起跑線

當然,無論是真的相信,還是隨大溜,大模型這座高峰底下現在已經擠滿了中國互聯網的精英們。對標ChatGPT,繼3月份百度的文心一言發出第一槍後,4月至今,阿里的通義千問、商湯科技的日日新、360的360智腦、崑崙萬維的天工3.5、知乎的知海圖AI等密集亮相。

這還不包括已經有明確消息還沒發布的,以及兩三年前就涉足大模型研發,至今還沒推出成熟產品的。不得不說,博大精深的中文給予了中國AI大模型起名極大的空間。

上述這些之外,還有達觀數據的“曹植”,用的是“七步成詩”的典故;網易下面還有“玉言”,很容易聯想到“金玉良言”;華為用的是“盤古”,瀾舟科技叫做“孟子”;騰訊的“混元”倒是契合大模型到一定規模後的“湧現”現象,類似的還有中科院的“紫東太初”,“太初”指的是天地未分前的那團混沌元氣,算是“混元”的祖宗……

推廣蒐狗輸入法時,王小川沒少跟網址導航打交道,最初是一個叫hao123的,後來被百度收購,還有就是取自“不管三七二十一”的3721,後來賣給了雅虎,創始人就是周鴻禕。

周鴻禕和王小川也有一段不太美好的交集。當時張朝陽有意出售搜狗,正在吭哧吭哧挖百度牆角,轟轟烈烈進軍搜索行業的周鴻禕是最熱情的買家。結果王小川不認同周鴻禕的經營理念,兩次出手攪和,一次成全了阿里最後賣給了騰訊,氣得周鴻禕給張朝陽甩下一句話:“搜狐姓王不姓張”。

最近這些年,360和周鴻禕也成了被拍在沙灘上的前浪,越來越力不從心,嘗試多元化,又是元宇宙又是造車,都沒什麼水花,去年迎來上市以來的首次虧損,超過24億。看到ChatGPT,老周的眼睛又亮了。

在3月29日的“2023數字安全與發展高峰論壇”上,他就把自家的大模型拉出來遛了一下,倒很謙虛,“’剛出生的孩子’抱出來給大家看看。”

另一邊的股民也很熱情地隨了大筆份子錢,帶著三六零的股價直衝20元。過去兩個月,搭上ChatGPT,三六零暴漲了200%以上。但股民也沒想到,隨禮隨出了個“父母離異”,4月4日,周鴻禕突然和恩愛多年的妻子胡歡離婚。

中國大模型暫時沒追上美國,但中國概念股在漲幅和“狗血劇”上還是狠狠扳回了一城。這也屬於中國互聯網創新的一大特色和常備劇情。

回到王小川和李彥宏(百度)的口水仗,中國大模型能不能在一兩個月內追上美國,這是和尚頭上的蝨子。但王小川想爭的可不是這個,他代表的是中國一批試圖成為和挑戰OpenAI的非大廠創業公司,當然也是後者給了他們勇氣,在AGI時代挑戰那些不可一世的巨無霸。

有意思的是,之前李彥宏被問到“中國創業公司裡會不會再出一個OpenAI?”時,他的回答是“基本不會了”,還強調“沒有必要再重新發明一遍輪子。”周鴻禕也曾勸小公司不要淌這趟渾水,在他眼裡,360還在大廠序列裡。

可偏就有王小川、王慧文、李開復這些不信邪的,輪子不僅要造,還得轟轟烈烈。實際上在國外,挑戰OpenAI的也創業公司有人在,其中就包括由OpenAI離職人員創立的Anthropic,被視為OpenAI的最大挑戰者。最新消息顯示,最早投資OpenAI的馬斯克也創立了AI公司X.AI。 GPT-4.0也遠不是人類終局。

關於這點,曠視科技聯合創始人印奇說得比較實在,未來得看一家公司,無論大小,先把性能對標GPT-3.5的大模型真的做出來,這是所有事情的起點。

所以,別看這兩個月國內科技公司恢復了久違的激情,熱鬧了半天,小臉通紅、一身臭汗,最後發現彼此都還沒站在起跑線上。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts