誰是中國最具競爭力的大模型創業夢之隊?
誰是中國最具競爭力的大模型創業夢之隊?
零一萬物。
沒錯,至少從今天開始,這個名字將開啟被關注、被討論、被追踪的新階段。
原因無他——這就是李開復博士“擼起袖子”親自帶隊,塔尖孵化的AI2.0公司。今年3月下旬,創新工場董事長兼CEO李開復正式宣布以Project AI2.0之名入局大模型……而零一萬物,正是這家創業公司的正式公司名,官網01.AI也在今日一併上線。
量子位獲悉,在近3個月的籌辦後,零一萬物也有了一系列進展,包括:
公司:總部註冊於北京,但面向全球招募頂尖人才。
路線:自研大模型。自建平台,構建數千卡GPU集群進行訓練、調優和推理,提高數據有效參數量,以及使用的高質量數據的密度,以構建連續、可控、科學化的訓練能力。
進展:三個月內已經實現百億參數規模的模型內測,正往300到700億參數規模擴大。
據悉,短短3個月內,零一萬物已經聚集起了數十名核心成員的團隊,集中在大模型技術、人工智能算法、自然語言處理、系統架構、算力架構、數據安全、產品研發等領域。其中已加入的聯創團隊成員包含前阿里巴巴副總裁、前百度副總裁、前滴滴/百度首席算法負責人、前谷歌中國高管、前微軟/SAP/Cisco/副總裁,算法和產品團隊背景均來自國內外大廠。
從25年前回國創辦微軟亞洲研究院開始,開復老師就成為中國計算機產業裡最知名的導師和伯樂,客觀上助推了中國互聯網和AI的發展歷程。
現如今,站在大模型洶湧關口、AI2.0潮頭,曾經的學生、舊部和仰慕者再次追隨集結。
零一萬物是李開復創辦的創新工場AI工程院塔尖孵化的第七家公司。這種特殊打法將用基金投資和塔尖孵化兩個途徑結合,加速打造AI 2.0的全新創業生態。
零一萬物,自研通用大模型
公開工商資料顯示,北京零一萬物科技有限公司(以下簡稱零一萬物)於5月16日成立,彼時距離李開復朋友圈官宣親自入局大模型創業,恰是2個月時間。
“零一萬物”作何解釋?
零一不難理解,計算機的底層規則二進制,01就是工程師的母語。但量子位進一步聽聞,在開復看來,零一——01還代表的是整個數字世界,從零到一,乃至宇宙萬物,所謂道生一……生萬物,寓意“零一智能,萬物賦能” 的雄心。
工商信息還顯示,零一萬物的經營範圍涵蓋人工智能雙創服務平台、人工智能基礎資源與技術平台、工程和技術研究和試驗發展、數據處理服務等。
這個範圍也與開復關於AI2.0的思考判斷一以貫之,在ChatGPT帶動大模型熱潮之後,李開復就公開表示過,以基座大模型為突破的AI 2.0時代,將掀起技術、平台到應用多個層面的革命。如同Windows帶動了PC普及,Android催生了移動互聯網的生態,AI2.0將誕生比移動互聯網大十倍的平台機會,將把既有的軟件、使用界面和應用重寫一次,也將誕生新一批AI-first的應用,並催生由AI主導的商業模式。
更多零一萬物的業務細節也對外披露:
理念就是AI-first,驅動力是技術願景,背靠卓越的中國工程底蘊,突破點是基座大模型,覆蓋範圍包含技術、平台到應用多個層面。
更具體的,零一萬物選擇的大模型創業路線,是自研大模型。
並且已經拉開序幕——這家公司已經開始搭建實驗平台,構建了個數千卡GPU集群,進行訓練、調優和推理。在數據方面,主打一個提高有效參數量和使用的高質量數據密度。
從喊話到露面,這3個月裡,零一萬物已經實現了百億參數規模的模型內測,正往300-700億參數規模擴大,未來還計劃推出開源的模型版本。
據悉,通用大模型後,零一萬物的下一步是推出結合圖片、視頻、3D的多模態模型。
入口級的Super App也是計劃中的一部分,平台中間件和開發者工具也將逐步對外發布。
同時曝出的,還有零一萬物在AI 2.0時代的“七大模塊技術路線”。
簡而言之,零一萬物認為要做出大模型平台,需要招募七大方向的頂級科學家和工程師,分別是:
- 定義模型能力天花板的預訓練框架(Pre-train)技術
- 精進模型實現能力的Post-train技術
- 支撐模型高效訓練的AI Infra技術
- 更多元化多介質的多模態模型技術
- 實踐訓練規模化技術
- 平台中間件及工具鏈技術
- 推理和服務部署技術
基於這7個技術模塊,零一萬物針對性招募了技術團隊。
量子位獲悉,該團隊目前已經有數十名核心成員就位,算法和產品團隊背景均來自國內外大廠,集中在大模型技術、人工智能算法、自然語言處理、系統架構、算力架構、數據安全、產品研發等領域。
有精兵也有強將,從已確認加入的聯創團隊陣容來看,頗有“AI 2.0夢之隊”的味道:
前阿里巴巴副總裁、前百度副總裁、前滴滴/百度首席算法負責人、前谷歌中國高管、前微軟/SAP/Cisco/副總裁……
可以說,核心團隊深度參與過世界最大幾家軟件平台的構建。
中國大模型演進分3階段,塔尖視野才能人盡其用
自開啟零一萬物的塔尖孵化後,開復老師也開啟了緊鑼密鼓的籌備模式,十足忙碌,也十足低調。
但量子位也獲知了其對於大模型演進的最新思考判斷。在李開復看來,中國大語言模型的演進不會一步到位,而是會經歷L1到L3三個階段。
現階段,中國大多數公司處於L1階段,下一步需要跨越“湧現”門檻,成為L2級主流大語言模型,最後追趕L3全球一線公司,成為強大的AI 2.0“技術基礎設施”,實現高質量、高性能的目標。
而零一萬物之所以選擇自研大模型之路,核心原因還在於開源模型和小模型的技術實現,絕對無法達到與海外大廠自研模型的性能。
從現階段實際體驗看,許多聲稱效果類似ChatGPT 的開源模型,都只局限於簡單對話,在長文本生成和推理等任務上受到模型本身結構和大小的限制,無法適應稍微泛化或複雜的任務。
此外在零一萬物內部,還認定從中長期發展看,過度依賴模型意味著只能知道結果,不掌握過程,“知其然不知其所以然”。自身能力天花板和邊界被他人定義,很快會碰到實現多種多樣任務的能力天花板。海內外國情、文化、用戶習慣、法律法規也不盡相同,海外開源技術隨時有關停、切換高額收費或限制地區訪問等風險。
只有充分結合中文語言數據,才能實現AI2.0發展自主可控。
不過,零一萬物方面也透露,未來也計劃推出開源的模型版本,吸引優秀人才共同提升模型,推動全球AI 2.0的開發者生態。因此,大模型創業公司應該擁抱開源,但不能過度依賴於開源模型。只有盡快建立自己的技術優勢,構建起強大的生態護城河,才能真正抓住AI2.0的歷史機遇。
李開復認為,大模型公司的多元化,會催生一波從AI 2.0模型、AI 2.0基礎設施、到AI 2.0全新應用的創新生態,“我們預測一旦中國有了真正原生、高質量的大模型推出,高質量和有創意的應用會百花齊放——就宛如移動互聯網和AI 1.0時代一樣。”
全球市場上將出現少數幾家具有豐沛資源支撐算力需求的大模型公司,帶動各種下游應用的繁榮發展,逐步完善中國AI 2.0的全新生態,探索嶄新的商業模式,進而創造巨大的經濟價值及社會價值。 “如果市場風平浪靜或只有少數玩家,那我們才真的需要擔心落於人後。”
李開復還認為,AI2.0市場規模巨大,容納得下巨頭、中小企業、初創公司在三個層級的公司賽馬。
但“大模型的技術門檻很高,非常需要整合一個兼具科研能力和開發實力的高效團隊,制定貫徹公司的技術和產品戰略,從上到下一致執行。”
客觀來看,中國現在研發突破也許落後幾年,但擅長技術迭代且具極其優異的工程能力和執行速度,未來可期。和大廠相比,技術頂尖、能專注掌握大模型打法的創業公司有著集中資源、策略靈活、能打硬仗、落地執行力強等優點,反而更有機會領跑行業,正如ChatGPT背後的OpenAI公司一樣。
而這或許也是李開復選擇親自入局、塔尖孵化零一萬物的最核心原因——自研大模型底座的創業,不僅需要技術、人才,更需要塔尖資源整合和塔尖認知視野。
也只有李開復本人躬身入局,零一萬物才顯得如此不同。在眾多的創新梯隊中,零一萬物具有顯著優勢和競爭特色。李開復擁有逾40年國際AI經驗,親自牽頭籌組,全球範圍的頂級AI專家陸續加入,目前組成的核心團隊深度參與過世界最大幾家軟件平台的構建,深度理解平台成功的方法論。
“AI是對人類學習歷程的闡釋,對人類思維過程的量化,對人類行為的澄清,以及對人類智能的理解… AI是人類認識並理解自己的最後一里路,我希望加入到這個全新綻放、充滿前景的未來科學領域”。
這是1983年李開復攻讀卡內基梅隆大學博士學位的申請信。作為人工智能領域的先驅者之一,40年來,他始終活躍在人工智能科研和產業一線。
1998年,李開復創立微軟中國研究院(微軟亞研MSRA前身),已成為中國培養人工智能人才最多、輸出人才質量最高的“AI學府”。當時的青年才俊們,如今仍在人工智能大潮中熠熠生輝。
也正是這種經歷時間檢驗的成績,讓李開復博士逐漸成為了口口相傳的AI先導,也正是這種經歷時間檢驗的成績,讓更多對AI 2.0和AGI充滿信仰的年輕工程師響應號召,在技術時代浪潮中抓住機遇,改變世界。
展開全文打開碳鏈價值APP 查看更多精彩資訊