清華系17人,撐起中國大模型創業半壁江山


原創:程茜

來源:智東西

智東西8月23日報導,過去三個月,生成式AI浪潮變數叢生,國內AI大模型產業也連爆大事:

6月29日美團宣布完成對AI大模型獨角獸企業光年之外的收購,搜狗創始人王小川創立的AI大模型創企百川智能連發3款開源大模型;此前被光年之外收購的AI大模型創企OneFlow(一流科技)的創始人袁進輝也於本週證實,一流科技團隊將瞄準大模型推理成本問題重新創業。

有趣的是,這些處於國內AI大模型競賽焦點的主人公們——美團創始人王興、光年之外創始人王慧文、搜狗&百川智能創始人王小川、一流科技創始人袁進輝——都是清華學子。

在如火如荼開展的AI大模型競賽中,清華學子可謂“搶盡”了風頭,除了王慧文、王小川等互聯網“老炮”高調入場外,還有多位清華學院派教授、清華畢業生躬身入局。據智東西不完全統計,近期活躍的AI大模型創企中,擁有清華背景的創始人至少有17位,涉及11家企業。清華系創業團隊儼然正撐起國內AI大模型創業浪潮的半壁江山。

▲近期活躍在國內大模型浪潮中的清華系創企(整理自公開信息)

大佬創業:90年代清華師兄弟,互聯網“老炮”高調入局

很多年後,人們回憶起國內這場盛況空前的AI大模型創業潮時刻:有兩個人的名字一定會率先浮現在眼前,那就是王慧文和王小川。就在今年2月和4月,這兩位互聯網老炮接連官宣創業,劍指大模型。

除了這些共同點外,王小川和王慧文這對師兄弟曾於1996、1997年先後畢業於清華大學。

1、王慧文:2個月成獨角獸,沒產品成最大隱患

最先官宣創業的是王慧文。 2月中旬,王慧文6天連發5條朋友圈,從表明態度到“500萬美元帶資進組求組隊”、發“AI英雄榜”,最終AI大模型創企光年之外成型。

王慧文的創業之路總能看到美團創始人王興的身影。 1997年,王慧文考進清華大學電子工程系,因緣際會與王興成為上下舖兄弟。戲謔的是,他們二人形影不離的原因是,成績優異的王慧文進入清華大學後發現在眾多佼佼者中自己只能算個“學渣”,因而與成績相近的王興惺惺相惜。

▲王慧文(右一)和王興(中間)

畢業後兩人幾經波折,最終在美團“勝利會師”。讀研期間,王慧文和王興雙雙退學瞄準了彼時在美國興起的社交網絡,打造出風靡大學生群體的校內網後陷入商業化困境,隨後選擇出售校內網實現財富自由,兩人分開創業。 2010年,王慧文加入美團,再次與王興聯手。 2020年,42歲、身價120億人民幣的王慧文選擇從美團退休。

這次,王慧文又出山,入局AI大模型。官宣創業後,頂尖人才、高額融資紛至沓來。前有北京智源人工智能研究院副院長劉江、被稱為“搜狗輸入法之父”的馬占凱等加入,後有王興、快手創始人宿華掏錢投資。成立兩個月後,光年之後迅速躍升獨角獸,估值達10億美元。

這背後,不是技術出身的王慧文開始緊鑼密鼓地召集人才,4月,光年之外完成收購同為清華系創企一流科技。這家創企的創始人是師從中國人工智能奠基者張鈸院士的袁進輝。

在此之後,手持豐厚資本、技術的光年之外業務佈局即將走上正軌,成為AI大模型創業焦點的王慧文,6月底之際卻被曝出已經因病離崗,隨後,王興入局,光年之外被美團全權收購。

目前來看,王慧文的AI大模型創業之路已經畫上了終局,此後他是否會重返“戰場”仍是個未知數,但成立半年之久的光年之後在產品端尚無進展官宣的當下,就幾經波折,這或許已經成為這家頭頂數道光環的大模型創企的最大風險。

2、王小川:百余天官宣3個大模型,投資陣容豪華

反觀與王慧文受關注度幾乎持平的王小川,4個月時間就拿出三款大模型,並開啟了大模型商業化的探索。

鼎鼎有名的清華大學計算機系的96級畢業生,是國內互聯網產業第一波弄潮兒,他們參與並見證了中國互聯網發展的每一個時刻,堪稱“互聯網夢之隊”。王小川就是其中之一。

▲百川智能創始人兼CEO王小川

1996年,因獲得國際奧林匹克信息學競賽金牌的王小川被點招入清華大學計算機系,這一待就是七年。從計算機專業到生物方向,從國內青年社區平台ChinaRen到搜狐,王小川的技術才華施展的範圍逐漸擴大,但他的物理空間卻幾乎沒有離開過五道口,王小川也被稱為“清華東門守門員”。

王小川也把百川智能安家到了五道口。今年4月,王小川聯手前搜狗COO茹立云成立百川智能,官宣入場大模型創業,更有多位搜狗團隊老員工主動申請帶資加入,據王小川在第三個大模型發佈時透露,目前百川智能中前搜狗員工的比例占到30-40%。

成立一個月後,百川智能就拿到了來自騰訊、小米、金山、清華大學資產管理有限公司、好未來等十餘家機構的聯合投資,這樣的豪華投資陣容鮮有先例。

四個月時間,百川智能已經發布參數量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及其INT4/INT8兩個量化版本、530億參數規模的Baichuan-53B,覆蓋開源到閉源。下一步,王小川要在大模型開源的基礎上,以搜狗曾經的超級應用經驗為基礎,找到大模型的超級應用以及比肩GPT能力的大模型。

▲百川大模型演示案例

王慧文、王小川都是曾經締造中國互聯網的清華學子,隱退多年後,又在大模型浪潮下躬身入局。除了這兩位互聯網老炮外,還有眾多清華系教授、學生在這場硝煙瀰漫的大模型賽道中格外扎眼。

02.學院派:五位教授領銜,孵化多個大模型創企

清華大學當之無愧是國內AI大模型賽道的人才寶地,現有的學術力量風頭正盛,五位教授領銜的AI大模型創業浪潮正在徐徐拉開帷幕。

在人工智能領域,不得不提的就是智源研究院這一響噹噹的名頭。 2018年,智源研究院正式成立,將北京大學、清華大學、中國科學院、百度、字節跳動等人工智能產業的頭部院校、企業的頂尖人才聚集到一起。

當OpenAI的GPT-3發布後,智源研究院率先發起大模型項目,唐杰、劉知遠、黃民烈、楊植麟……等清華大學知名AI學者紛紛投身其中,他們共同構成了後來悟道大模型的研發團隊。

這些AI大牛也成為了這波大模型創業浪潮中的核心力量。

1、唐杰:核心成員曾參與知名大模型研發,融資拿到手軟

智譜AI、智源研究院、月之暗面、循環智能,這些身處大模型熱潮中心的公司,都與清華大學計算機系教授唐杰關係匪淺。

唐杰教授光環加身,他既是清華大學計算機系知識工程實驗室(KEG)帶頭人,同時是智源研究院學術副院長、悟道項目負責人。

▲唐杰(圖源:清華大學)

事實上,最開始唐杰並不相信機器智能會超越人,他的主要研究方向是數據挖礦和知識工程,而大規模預訓練模型的出現,讓他看到了機器智能超越人的可能性。

2020年OpenAI甩出GPT-3,攪動了整個人工智能產業。隨後,2020年10月,智源研究院率先確定了大模型研究戰略方向,時任智源副院長的唐杰帶領團隊在2021年發布了悟道1.0和2.0模型。同時,悟道2.0憑藉萬億級參數規模創下中國首個、全球最大的世界紀錄。

與此同時,KEG實驗室孵化的智譜AI,其核心團隊也多為悟道大模型的研發人員,今年7月,剛剛收購光年之外的美團獨家投資了智譜AI,融資金額達數億人民幣。目前,智譜AI中英雙語開源模型ChatGLM、代碼生成模型CodeGeeX等大模型及應用產品矩陣。

除唐杰本人外,他鼎鼎大名的得意門生楊植麟也入局大模型,從清華畢業的楊植麟在美國卡內基梅隆大學師從蘋果和谷歌的AI大牛。 6月12日,楊植麟劍指大模型的新創企月之暗面亮相,剛成立就迅速拿到紅杉、真格機構投資,市場估值達3億美元。不過,楊植麟頭頂的光環遠不止於此,早在2016年,楊植麟就創立了專注於自然語言理解的循環智能,還曾參與華為盤古大模型研發。

月之暗面其他三位聯合創始人中張宇韜和周昕宇也畢業於清華,張宇韜與楊植麟同為唐杰的學生。

2、孫茂松:從信息處理到法律大模型,創企數量、涉足種類都處前列

清華大學人工智能研究院教授孫茂松是自然語言處理與社會人文計算實驗室(THUNLP)的負責人,劉知遠師承孫茂松。相比於唐杰教授,孫茂松和劉知遠團隊的創業公司更多,並且涉足的應用領域也更豐富。

▲孫茂松(左)劉知遠(右)

深言科技基於預訓練模型打造中文信息處理引擎、面壁智能聚焦於基礎大模型的核心技術、冪律智能則要將自然語言處理應用於法律。此前,王慧文還曾傳出要收購深言科技和麵壁智能,但這些收購傳聞最後都不了了之。

2021年,一款名叫WantWords的反向詞典突然在社交平台上爆火,兩三週時間吸引了約30萬用戶。這一應用的研發人員就是後來深言科技的創始團隊。 WantWords基於深度學習能幫助人們根據語義描述查找詞語,這一產品也幫助豈凡超打響名號。

▲WantWords反向詞典主頁

早有創業想法的豈凡超,2022年畢業成立了深言科技,孫茂松擔任首席科學家,並且深言科技的核心團隊均為清華碩博士背景。成立至今,深言科技已完成三輪融資,最新一輪融資中騰訊、好未來在列。儘管具體的融資金額尚未披露,但據傳其估值在第二輪融資完成後已達1億美元。

另一家被傳收購的面壁智能,創始人曾國洋是劉知遠的學生,同時劉知遠擔任聯合創始人,面壁智能已經完成近千萬元的種子輪融資,此前推出了CPM-Live百億中文大模型直播訓練項目。

今年4月,知乎宣布與面壁智能共同開發了“知海圖AI”,並為其註資數千萬人民幣,這也一舉打破了面壁智能曾被收購的傳言。技術、人才、資本、應用、數據等多重因素的加持,使得面壁智能的大模型已經在知乎的應用實現大規模應用。

除了這兩家創企,還有清華大學計算機係人工智能所博士塗存超成立的冪律智能,這家公司關注的是自然語言處理技術與法律領域的結合。今年6月,冪律智能聯合智譜AI發布了基於中文千億大模型的法律垂直大模型PowerLawGLM。

3、黃民烈:瞄準心理諮詢具體場景,要做中國版Character AI

同樣參與悟道大模型研發的清華大學計算機科學與技術係長聘教授黃民烈,在創業初期就瞄準了具體的應用落地場景。

2021年,黃民烈教授創立了聆心智能,其創始團隊多來自於清華大學、北京大學、北京師範大學等高校科研院所,截至目前,聆心智能已經完成三輪融資,投資機構包括清華系的智譜華章等,其中披露具體融資金融的為去年12月完成的數千萬元天使+輪融資。

▲清華大學計算機科學與技術係長聘教授黃民烈(圖源:清華大學人工智能研究院)

創立初期,黃民烈教授就專注於讓人工智能能為心理亞健康患者提供病情診斷、個性化干預的方案。這一創業目標的想法來源於黃民烈教授與其身患抑鬱症學生的故事。

今年7月,聆心智能發布了超擬人大模型CharacterGLM,提供千人千面的AI形象來陪伴用戶、與用戶聊天等,基於這一大模型,聆心智能還正在內測用戶興趣互動社區新產品AiU。

與這波大模型浪潮中瞄準OpenAI的創企不同,聆心智能此前曾透露,他們要做的是“中國的Character AI”,Character AI的最大特點就是讓用戶創建個性化的AI角色來進行交互。

4、朱軍:主攻多模態大模型,拿到螞蟻、百度風投投資

清華大學計算機系教授、清華大學人工智能研究院基礎理論研究中心主任朱軍也是最新入局的一位清華系教授。生數科技成立於今年3月,其核心團隊大多來自清華大學人工智能研究院,主要打造多模態通用大模型。

▲清華大學計算機系教授、清華大學人工智能研究院基礎理論研究中心主任朱軍(圖源:北京智源大會官網)

朱軍教授第一次創業可以追溯至2018年,彼時專注於提升人工智能安全性的瑞萊智慧RealAI成立,專注於提升人工智能的安全性。

生數科技正是由瑞萊智慧孵化而來,成立至今拿到兩輪投資,今年6月拿到螞蟻集團、BV百度風投等的近億元人民幣融資,今年8月拿到錦秋基金獨家投資的數千萬人民幣。

生數科技聯合創始人兼CEO唐家渝還是孫茂松教授的學生,他此前在接受采訪時談道,生數科技當前所訓練的大模型圖像生成效果已經超過Stable Diffusion,預計將於年內赶超Midjourmy。

5、周伯文:面向消費者業務,自研百億級垂直大模型

最後一位與上述幾位教授的情況略有不同,清華大學惠妍講席教授、清華大學電子工程係長聘教授、清華大學電子系協同交互智能研究中心主任周伯文,是AI大牛重返學界的典型代表。

從IBM到京東,周伯文從事人工智能基礎理論和核心技術研究已達20年。自從2003加入IBM,他連任多個大型項目重要技術、管理職位,還作為IBM Watson集團首席科學家領隊開發了IBM Watson集團人工智能平台。 2017年加入京東後,又成為推動京東人工智能、京東雲發展的重要人物。

▲清華大學惠妍講席教授、清華大學電子工程係長聘教授、清華大學電子系協同交互智能研究中心主任周伯文(圖源:啟明創投)

2021年,他從京東離職後,2022年中旬,清華大學官宣聘任周伯文。

除了重返學界外,周伯文也瞄準了AI創業這條路。 2021年,銜遠科技成立,這家公司的核心產品瞄準的是消費行業,提供基於商品供應鏈大模型的企業級多輪對話平台ProductGPT。並且,該公司的信息顯示,這一AI大模型是其自研,參數規模為數百億級,能讓大模型在具備通用能力的基礎上更擅長理解人與商品。

清華大學的學術力量已經站上大模型創業的擂台,既有清華教授下場創業,又有師生搭檔入局。事實上,在國內的創業大潮中,清華幫已經不止一次撐起產業的半壁江山,而這都離不開上個世紀清華大學在人工智能領域的前瞻佈局。

03.從0開始迎頭趕上,清華大學撐起大模型創業半壁江山

清華大學,這一所匯聚了國內眾多頂尖人才的高校,也是中國人工智能技術萌芽誕生的地方。

相比當下的火熱程度,40多年前“人工智能”這個詞彙在國內的專業人士眼裡也很陌生。 1978年,人工智能第一次出現在了清華大學內部,自動控制系更名為計算機技術與應用系,內部人工智能與智能控制教研組成立,拉開了人工智能領域的教學序幕。

清華大學也創下了全國人工智能領域的多個第一,1978年招收第一批碩士生;1983年成立首個智能機器人實驗室;1983年在國際人工智能大會(IJCAI)上發表我國第一篇學術論文;1984年獲得人工智能領域的第一個國際重要獎項;1987年第一位人工智能領域的博士生畢業;1990年成立全國第一個有關人工智能的國家重點實驗室“智能技術與系統”;2005年“清華大學計算機科學實驗室”成立,也就是當今人工智能領域無人不知的“姚班”;2018年成立跨系交叉研究機構“清華大學人工智能研究院”……

我國逐漸在人工智能領域裡赶超世界領先水平,並佔據一席之地。

然而,寥寥數語始終無法完全概括清華大學從一片空白到如今碩果累累的不易。上個世紀七十年代,中國人工智能領域生物控制和模式識別等方向的研究已開始起步,但受政治環境等影響,人工智能的研究一定程度上來說處於停滯狀態。

國內求學無門的研究人員為了更全面系統地認識人工智能領域,改革開放後赴美求學,40多歲的張鈸就是這批留學生中的一位,他作為訪問學者前往美國伊利諾伊大學香檳分校進修學習,國內NLP研究奠基人黃昌寧在耶魯大學進行了為期一年的訪問。而他們都成為了我國人工智能產業的重要奠基人和推動者。

▲張鈸院士在計算機系建立六十週年致辭(圖源:清華大學)

總的來看,我國人工智能研究起步比國外晚了20多年,經歷了從無到有、從弱到強的發展歷程。如今,國內人工智能產業的發展已經與其他國家幾乎處於同一起跑線,清華系的創業者作為這一波大模型浪潮中的中堅力量,憑藉前人在人工智能領域的奠基、自身過硬的技術增持以及對前沿技術的探索、求真精神,正在從象牙塔走向練兵場並迅速成長。

04.結語:清華創業幫蓄勢待發

清華大學可以稱得上國內人工智能研究的起源地之一,在這一波人工智能新浪潮下,清華係無疑被寄予厚望。

除創業勢頭迅猛外,資本市場也選擇重金押注清華創業團隊,4月,深言科技新一輪融資完成後最新估值達1億美元,6月生數科技完成近億元天使輪融資,騰訊被曝今年6月向光年之外投資5000萬美元……

如今,大模型創業浪潮已經漸趨冷靜,眾多清華系創企已經競相官宣大模型成果,並投身到大模型應用落地中。中國大模型創業者們的新一輪競賽已經開始,並且愈發激烈。

如今,清華大學的優勢逐漸凸顯,不僅成為大模型領域的人才軍備庫,同時佔據了國內大模型創業浪潮的半壁江山。

參考資料:計算機系建立六十週年致辭《與計算機系共同成長》

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts