原文來源:AI鯨選社
圖片來源:由無界AI 生成
2023 年,知名投資機構老虎基金募資不成的消息,悄然傳遍整個互聯網。
在習慣了風口創業的過去10年中,“投資人寒冬”似乎還是第一次出現。這與新消費、直播帶貨、元宇宙幾個風口悄然落幕,併購和中概股等退出渠道的大門半遮半掩,種種不利因素都息息相關,創投市場似乎要真正冷清下來。
創業公司融資艱難,大佬的二次創業也不好找方向。從美團退休的王慧文,研究了好一陣的Web3和元宇宙。被騰訊收購公司後離開的王小川,試水了AI醫療。但一切轉變在2022年末,ChatGPT 3.5發布,迅速讓市場形成共識,AGI(通用人工智能)時代來了,全行業開始跑步入局大模型。
據了解,當時在低調創業的王小川,已經成立了公司做智能硬件。意圖幫助睡眠障礙的上億人,打造一款治療打鼾的智能枕頭。當3月份大模型熱潮興起後,王小川用了2個週時間做了決定,放下這個創業項目,佈局大模型。
王小川找來原搜狗CTO楊洪濤幫忙超越醫療項目,原搜狗COO茹立雲在這家公司的股份,也兌給了楊洪濤,追隨王小川的大模型創業。王小川共拿出5000萬美元成立“百川智能”,並邀請了Soul 的技術人才來做算法負責人,加速去做大模型。而王慧文的故事,大家就十分熟悉了,酒桌上發布英雄招募貼,成立光年之外公司做大模型。
在互聯網大廠中,大模型也帶來了翻天覆地的影響。有大模型的項目負責人,年前因為升職不成的問題,從而提出離職。年後3個月時間後,該集團CEO就成為大模型的總負責人,舉公司之力All in大模型。
沒有人想錯過這波AGI 時代的浪潮,大家都相信AI在經過三起三落的發展後,通用人工智能的奇點正在來臨。畢竟在AI 熱潮下,類似ChatGPT和Midjourney等幾十人規模公司,創造40億美金左右的估值,美股“七巨頭”總市值一年飆至11萬億美元,大漲60%。這些激動人心的爆發式增長的故事,再一次攪動了國內科技商業市場。
國內互聯網大廠中,李彥宏、張勇、張一鳴、王興等大佬都已經親自掛帥,可以說除了拼多多,已經全部入局大模型。正如7月19日,微軟和英偉達的市值增加了1750億美元,馬斯克在評價相關推文時驚嘆:“瘋狂的時代。”
即將沉寂的科技商業市場,突然迎來了AI這一興奮劑,也讓互聯網進入了最後一次的狂歡。
1.低谷中燃起的新曙光
李明是家創業公司的CEO,團隊規模在100多人。 2023年是他最為融資發愁的一年。
最開始創業的過程十分順利,早期拿到知名天使投資機構的天使和A輪融資。 “那時候工業互聯網還是個熱門賽道,也不像很多AI項目那麼浮誇。”李明告訴AI鯨選社,但2023年中,他在啟動的新一輪融資中,慢慢發現了行情不對。
投資機構不僅看數據和故事,還要看營收了。此前執著產品化的李明,根本還沒意識到,投資風向的變化。用梅花創投創始合夥人吳世春的講話,就是現在投資項目“既要(技術),又要(數據),還要(營收)”。沒辦法,他開始找FA機構幫助融資,而且融資輪次也退步,求個A++。
“FA幫找了30多家投資機構,都不了了之了。”融資的不順利,讓李明有些洩氣。但在6月份,他感受到大模型的威力,於是內部上馬了基於ChatGPT的產業化業務。 “現在也還沒融到資,不過投資人會主動找來交易所,對方明顯感興趣了。”
而對於袁進輝的一流科技來說,大模型也是個救命稻草。 2022年,這家做AI深度學習框架的公司,已經到了融資不順,不得不裁員生存的地步。此前公司3次瀕臨資金鍊斷裂,都是找天使投資人,也是當時快手CEO的宿華借錢。
“做的事情和百度的飛槳、華為昇思差不多,最重要的是那時候市場大模型訓練的業務還沒起來。”一流科技員工告訴AI鯨選社,公司屬於有錢的時候(2021年)沒業務,有業務的時候(2023年)沒錢了。
就在袁進輝感覺前途無望的時候,2023年公司還迎來了收購的機會。 2023年4月份,在清華科技園的一流科技公司內,迎來了一位貴賓,他就是剛剛宣布進軍大模型的美團聯合創始人王慧文。
最終的收購價格還可以,一位被裁員的一流科技的員工告訴AI鯨選社,“能與上一輪高瓴資本投資的估值相當,自己的期權也有找落了。”
而成為光年之外聯合創始人的袁進輝,終於再也不用為融資發愁。王慧文的融資能力,在當下創投圈無出其右。根據後來的美團收購協議顯示,光年之外在沒有大模型產品的情況下,就融資了20億元。
當然,這波行動中更早佈局的投資人,已經成功狩獵到獨角獸。
Minimax是在2021年11月成立,在2022年1月獲得天使輪投資,2023年初公司估值就達到獨角獸級別。最早4家投資機構中,還有上海遊戲公司米哈遊,據悉是因為兩家創始高管中有家人關係。而據鯨選社了解,智譜最近也在以100億人民幣的估值融資。
這兩家公司的成立時間都不到2年,卻都已經成為獨角獸,大模型賽道的發展速度驚人。
而AGI熱潮,對於那些老牌AI公司也是一次救贖。此前,出門問問的IoT上市故事,已經歷經幾次無功而返。伴隨著大模型“序列猴子”和4款AIGC產品的故事推出,儘管其大模型還小心翼翼不對外公開測評,但也讓出門問問終於有了新故事可講,目前已經提交港股上市申請。
更多的大模型和AIGC創業者走在了路上,甚至在一家創業營上,60%的項目都和AI相關,擁有輕資產、高壁壘、天花板高的優點,AGI徹底成為當下最火的賽道。
2.將AGI的夢想做到最巔峰
如果說2023年是大模型創業“元年”。那麼互聯網大廠最早入局大模型的“源年”,則可以追溯到2019年。
阿里是2019年9月開始佈局大模型,2021年4月發布PLUG大模型。而早在ChaTGPT 3.0面世之前,國內就已經有多家萬億參數的大模型,他們分別是達摩院的M6和華為雲的盤古大模型以及智源的悟道2.0。和ChaTGPT相比,儘管模型參數超越了,但數據豐度不一樣,效果還沒法比較,在達摩院的張聰看來,國內大模型起大早趕晚集,最重要的是沒做兩件事。
第一件事是沒做對齊。那時候阿里有很多大小模型,主要沒有做訓練結果對齊。 “你看現在ChatGPT能做詩會聊天,很像人的智力,實際上就是與人的價值觀對齊。”張聰講道,這些都需要對推理結果進行人為調整,而不是用機器的邏輯去做。
第二沒有去做高質量的數據集,ChatGPT早期利用菲律賓的大學教授進行數據標註,國內是利用中專生做標註,語料的問題也十分影響結果。在張聰看來,7月19日公佈的Llama 2的精調Chat 模型,就是在100 萬人類標記數據上訓練的,訓練token 總數增加了40%,相比Llama 的提升是全方位的。 “所以大模型並不是大力出奇蹟的發明,而是精心設計的工程創造”。
並且反觀國內AI產業,也會面臨很多其他因素干擾。當時,達摩院主要有兩個團隊做大模型,一個是金榕領導的機器智能團隊,司羅負責的是AliciMind;一個是周靖人領導的自然語言實驗室,其中楊紅霞負責的是大模型M6。
在2022年末的測評中,M6大模型的成果稍具優勢,二者最終整合成現在的通義大模型。 “實際上,達摩院大模型團隊只有二三十人,主要他的預訓練,都放在阿里雲。”張聰告訴AI鯨選社,不過現在通義是集團的重要項目,涉及到的人員有600多人,現在很多資源都傾斜給大模型,集團CEO每2週過問一次技術進展。
而對於百度來說,這波AGI熱潮,可是自己從2016年就預言來臨的AI時代,自然也不會錯過。
今年2月7號在內部正式立項,3月16號正式發布。這期間直接上漲到百度集團優先級最高的項目, 李彥宏親自督戰,CTO王海峰博士直接掛帥,那時候百度陽泉超算中心就專門為大模型訓練。
百度算法工程師趙輝告訴AI鯨選社,百度自然語言處理部一直就在研究NLP等技術,首席科學家吳華也一直是領導,這個部門就有幾百人。百度的ERNIE2.0後轉成文心大模型,“以前就在做百度大腦,現在都說是大模型文心麼。”
做的事情有相似,當然也有區別。趙輝提到,以前百度會做很多垂直搜索的Rank,就是為了根據人為的點擊,重新排序搜索的結果。大模型出現後,這些能力都會被沉澱在大模型的算法中,也有利於給出的回答更精準。
對於百度來說,大模型推動下一代搜索質變,已經寫進了李彥宏的OKR。不過,對於生態來說,百度的文心大模型是基於bert模式,“包括智源的GLM都是獨立的技術路線,和國際的GPT並不一樣。”一位百度雲的人員告訴AI鯨選社,這點其實倒也不用擔心,文心千帆什麼類型的模型都有,GPT2、3、4也非常不同。
而說回從阿里離職的楊紅霞, 她在去往海外後,也被字節跳動挖去做北美大模型的研發負責人。張一鳴一直在研究大模型會開源還是閉源,所以也沒要求中心化力量趕工。 “年底前會有真正意義上的突破。”楊紅霞對AI鯨選社說道。
綜合來看,字節跳動應該是繼百度之後,在業務上與大模型更匹配的公司。有獵頭告訴AI鯨選社,雖然大模型不著急,但在AIGC領域還是挺激進。比如Tiktok在做廣告創意業務AIGC,總監職務給出預算100-150W,要求是88後帶隊。
至此,互聯網大廠除了拼多多,已經全部入局大模型。大廠入局的熱情,甚至比當年的O2O和直播還有過之而無不及。
3.分水嶺突然出現的那一夜
6月份,在北京搜狐大廈,光年之外這家融資最多的大模型企業,正熱火朝天的創業。
原一流科技的Oneflow深度學習框架還尋思繼續做,但被大模型業務抽調了很多人。可就在6月23日,突然有人在社交媒體上透露王慧文病了,當時公司還有人去求證,得到的是沒有這回事的消息。可是在25日晚,美團突然宣布聯合創始人王慧文因為抑鬱症住院,辭去公司董事一事,其創業的光年之外公司面臨出手的新聞。
一時間,光年之外做不下去,王慧文提前跑路的新聞,成為一些人的猜測。鯨選從投資人圈得到的消息,是王慧文的病情確實很嚴重。最後王慧文睡在上舖的兄弟,美團創始人王興幫助接盤了光年之外。
大模型真的不行了嗎?大家萌生出此疑問。那期間,正好知名投資人朱嘯虎和獵豹創始人傅盛也在朋友圈爭論,大模型行業是否有泡沫。朱嘯虎極度看衰市場一擁而上,做通用大模型的現狀,認為絕大多數都會在年底死掉。
光年之外的主動變動,也是否印證了朱嘯虎的言論?
從AI鯨選社獲得信息看,收購了光年之外的美團,目前並沒有停止大模型的腳步。不僅獨家投資了智譜AI數億元,當下還在招聘大模型的項目總監,給出的年薪高達300萬元,甚至還在美國成立技術研究院。賺辛苦錢的美團,也並不想在這波科技大潮中落後,尤其在餓了麼明確要接入通義大模型,有業務競爭的攜程,也已經推出了大模型之後。
但對於國內市場來說,通用大模型確實已經太多。不完全統計,短短不到8個月時間,已經有超過85家大模型發布,其中很多成了上市公司的套現概念。
Wind數據顯示,2023年24家“AIGC概念股”已經合計發生67筆減持,大股東的離婚潮也令人驚嘆。 2023年初至今,近十家AI板塊公司大股東家庭被曝離婚。備受關注的是,A股AI企業崑崙萬維,最近就發生佔股11%的李瓊女士(創始人周亞輝的前妻),計劃減持3%的股份(大概13億元),然後有息借給公司。據了解內情的人向鯨選社介紹,感受到了AGI紅利的崑崙萬維,不僅做了大模型,最近還在密集組建團隊,全力以赴做對標微軟的Copilot。
上市公司利用AGI 抓緊炒概念,套現離場。大模型創業公司則在內捲到死。
一位在近期成立了AIGC基金的投資人張陽告訴AI鯨選社,伴隨著開源免費且強大的Llama 2襲來之際,下半年很多大模型企業勢必會面臨融資難的問題。
如今一切已經有端倪,在7月11日,百川智能推出了百億級別參數的大模型Baichuan-13B,不僅宣布開源,同樣還是免費可商用。雖然Baichuan-13B的參數規模不大,但是基於精準的中文語料訓練,在百億規模參數的大模型中,百川經常排名頭部。
Baichuan-13B的免費策略,大大衝擊了國內大模型付費行情。目前,智源AI就在14日宣布,企業登記獲得授權,允許免費商業使用ChatGLM-6B 和ChatGLM2-6B。
越來越多的大模型開源免費後,大模型的死亡淘汰賽正式開啟。一位基於大模型創業公司的CTO對AI鯨選社表示,智源的大模型從最開始的私域部署要2000萬元,到年初的調用價格為180萬到30萬選包,再到現在的免費,行業變化非常之快。傅盛認為這是市場從大模型參數之爭,進入生態規模之爭。
互聯網大廠並不愁生態建設,由於內部模型非常多,也有免費和付費之分,最主要的大模型目前還是閉源和付費形態。創業公司要建立生態就比較困難,很多初創企業做大模型已花光了力氣,做生態就難免力有不逮。據了解目前MiniMax是創業公司中,為數不多堅持公有云,做MaaS模式的大模型企業。
丁香園CTO范凱形容這波開源免費潮,就像把自來水廠(大模型)免費接到用戶家裡,讓每家人手一個水龍頭,那些閉源的自來水廠,最好你的水無敵好喝,大家才願意付費去你那。
4.AGI發展進入分岔路口
分水嶺出現後,前京東集團技術委員會主席,現銜遠科技的創始人告訴AI鯨選社,當下創業競爭已經和發展了3派。
一派是堅持全自研大模型,這一派都是實力選手。這一派主要是百度、阿里、字節等互聯網大廠以及智譜、MiniMAX、銜遠等創業企業。但這些實力選手也被劃分成兩類企業。
第一類是堅持做自研的通用大模型,對標ChatGPT,不斷追趕ChatGPT的迭代速度。
在雲啟資本董事合夥人陳昱看來,通用大模型是必經之路,垂直大模型發展受限。 “因為對於通用大模型而言,垂直領域並不需要重新訓練,通用大模型可以通過向量數據庫做行業深化,垂直大模型卻很難智能湧現。”
從目前看,有夢想的肯定還要做通用大模型,畢竟做成了可以成為下一個互聯網大廠。 ChatGPT 在協同辦公、電商、代碼生成、輔助設計等領域已經展現出了這種顛覆性潛質。
第二類是認清現實聚焦落地,堅持做垂直大模型,這一派包括最後達成觀點統一的朱嘯虎和傅盛,二者都認為垂直大模型將更有產業適用性。
通用大模型一般是在千億參數以上,而垂直大模型則在百億或者70億規模左右。類似銜遠科技的大模型產品ProductGPT和達觀數據的大模型產品曹植,參數就都在數百億規模之間。
銜遠科技不是大模型的參數派,“我們具備通用大模型的基礎能力,但認為技術算法到模型迭代、場景閉環都具備更關鍵。”
相比銜遠更重註場景,達觀更注重數據。
據達觀數據的CEO陳運文告訴AI鯨選社,“曹植”大模型採用混合訓練數據方案,分別是50%的通用混合語料+ 50% 垂直專業語料。 “我們在金融、政務等領域做文本智能很多年,很多數據是獨有的,客戶也要求我們做私有化訓練。”陳運文告訴AI鯨選社,“以前四五個人做用一個星期做一份報告,現在AI半天做好了。”
放棄成為下一個ChatGPT的夢想,才能在商業場景中儘早落地,這是很多垂直大模型的清醒認知。
在行業看來看來,通往AGI聖殿的第二條路線,是基於別人的模型(如GPT),然後結合自己的行業Know-how去做訓練。 “對於第二類能不能成功,我覺得需要時間去驗證,現在還不明確。原因在於大家還不知道如何把行業Know-how去和大模型做融合的有效路徑,如何在有護城河的同時又有可持續的商業模式,這仍是個未知數。”
“尤其很多大模型,本身就有套殼的嫌疑,”投資人張陽告訴AI鯨選社,結合行業做商業化的時候,就會面臨很多問題。據悉,兩個知名同姓創業者的大模型,是基於Faceboook的開源Llama;某遊戲和防護公司用的是智源大模型的基礎框架。
更強的開源大模型正在來襲,Meta 近期發布免費可商用版本Llama 2,傅盛對此就在朋友圈表示:“這一下不知道多少公司笑醒在深夜,多少公司哭暈在廁所….”朱嘯虎對此也評論說:很多人要笑醒了吧,大家都可以Take free ride(搭便車)了。
傅盛的“笑醒”所指,和朱嘯虎略有不同。傅盛笑醒指的是使用開源大模型開發AIGC應用的企業,也能做出更好的產品,朱嘯虎笑醒是指那些那些號稱自研實則套殼的大模型企業,最近也要宣布升級了。大家所指的哭暈內容相同,都是那些號稱自研的大模型企業,國外大模型最強之一Llama 2 宣布開源免費,大家都基於相同的開源大模型,怎麼在行業中做出特色能力?
AGI的第三條路線是純粹做應用,是將模型拿來直接使用,這種的壁壘會較低。朱嘯虎也不看好這類模式,認為如果90%的能力是ChatGPT 提供,那麼AIGC應用就沒有什麼投資價值。
在OpenAI的生態中,山姆奧特曼承諾盡量避免做應用層,和生態開發者競爭,因此效仿Google做了ChatGPT Plugin,從目前看,國內還沒有誰做出這種承諾。
文心一言和通義千問,已經有了上百個功能更新,這些功能也覆蓋了一些開發者的工作。雖然文心一言也有插件,但目前就兩個,一個是百度搜索,另一個是ChatFile(長文檔的分析處理能力)。百度千帆和阿里魔搭的生態發展如何協調,還是個有挑戰的命題工作。
堅定看好AGI的朱嘯虎,認為通用大模型的創業和投資窗口期已過,不絕對依賴某家大模型能力的AIGC,才是AGI時代低垂的果實。比如,近期朋友圈突然躥火的“妙鴨相機”,算是國內AIGC第一個爆火的產品,國外也曾火過類似的產品“lensa”,月收入曾達到800萬美元。
時代的浪潮襲來之際,投資人吳世春就曾打趣問道朱嘯虎:“投AI賺的錢把投SaaS虧的錢,彌補回來了嗎?”朱嘯虎回答,還沒,但是AI的前景無限。
目前,創投圈也都認可朱嘯虎表達的道理,但很多人並不期待朱嘯虎說出實話,諸如“ChatGPT對創業公司很不友好,未來兩三年內請大家放棄融資幻想”這些帶有寒意的話。
“大模型就是互聯網的房地產,就算有泡沫也是美麗的泡沫,”一位剛下場做AI職業教育培訓的創業者說道,雷軍曾在2013年互聯網紅利消失之際疾呼,要相信互聯網的力量,今天我們也要相信AGI,無論他有沒有泡沫。
注:本文中李明、張聰、趙輝等為化名。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載