8.23 中國大模型「頂流群聊」筆記


阿里雲與中國大模型「半壁江山」的閉門交易所裡,聊了什麼?

文| 張鵬

國內的科技創新歷史上,從沒有哪一次像大模型技術這樣,短短幾個月就建立了「科技圈共識」。

我1998 年入行科技圈,見證了PC 時代、互聯網時代、移動互聯網時代這幾個時代變遷,從來沒見過這麼迅猛的「共識達成速度」。就拿極客公園的創業者社區Founder Park 來說,因為比較早關注到大模型領域的技術變化,在短短4 個月時間就新增了15 萬關注者,社區成員已經擴充到七八千人之多。

就在昨天,首批國產大模型通過備案,又點燃了人們的熱情。備案製管理,意味著對大模型發展的政策上的寬鬆,這也意味著大模型在國內的商用和產業化將真正開啟。

只不過「共識」達成的太快也會有讓人擔心的地方,因為這個技術還在早期發展階段,也還做不到「水銀瀉地」般落地到廣泛領域。

客觀地說,如果相信大模型技術帶來了AGI 的曙光,那麼就要坦誠看到其真正產品化,並成為生產力,現在才算開始探索。那些在一線的創業公司經歷的KnowHow 和問題,恰恰是最值得被匯聚起來的星星之火。

基於這個想法,阿里雲聯合Founder Park 邀請了20 多位中國大模型領域模型層、工具層、應用層的優秀創業者,到杭州西溪濕地做了一場面對面的閉門交易所。

阿里雲董事長張勇還給這場閉門會取了一個很好的名字——「西溪論道」。這場長達五個小時的閉門會,張勇就坐在我旁邊,全程參與到創業者的群聊,我看他筆記就寫滿了好幾頁紙。

8 月23 號,西溪論道參會者合影

看得出來,阿里云作為算力基礎設施層應該如何與這幾個層面連接與共創,如何支持各個層面的創業者做好大模型用好大模型,這是張勇最關心的話題。這顯示了阿里雲跟國內其他公司完全不同的姿態,如何促進大模型生態繁榮才是阿里雲最關心的事情。

這些堪稱國內大模型領域最積極最活躍的力量,從下午兩點一直聊到了晚上九點,從產業的多個層面,立體地做了交易所碰撞,也從各自的最新實踐中聊出了很多有洞見的觀點。按照他們的說法,在這裡一起討論,聽到了很多真話,很多「真情實感」。

我整理了一部分印象深刻的要點,用這篇文章也分享給大家。

01 關注大模型,更需要關注infra

現在全球任何一個地方,做大模型,最稀缺的資源除了人才,就是GPU。

百川智能創始人&CEO 王小川分享他去矽谷和朋友聊到,英偉達一年的GPU 出貨量在100 萬顆,但OpenAI 說要設計1000 萬顆GPU 連在一塊的超算。

所以GPU 到底多少算夠,有限的算力有解嗎?

創新工場董事長、零一萬物創始人李開復表示,儘管千萬張GPU 是天方夜譚,但是「大力出奇蹟」的暴力美學是有背景的。強化學習之父Richard Sutton 在《The Bitter Lesson》(《痛苦的教訓》)中指出:過去七十年,想在AI 裡放一點知識進去,想要增加一點能力,想調一調模型架構,最後發現基本沒有價值。唯一推動過去七十年AI 進步的力量,就是一個通用且可擴張的計算能力。計算能力增強了,相應地帶動算法、帶動數據的進步,這是大力出奇蹟的背景。

因此,在這波大模型浪潮中跑出來的公司首先要有算力,幾個人、幾十張卡的「禀賦」,還是去選擇調用中心化的大模型可能更務實。

「當有了相對足夠的算力,在這個前提下好好利用算力,可以做出很多今天只用開源、只調Llama2(Meta 的大語言模型)做不出來的東西」。前有OpenAI 不計成本地設立模型新標杆,後有Meta 開源為所有人鋪平道路,在風雲詭譎、高度不確定的大模型創業環境中,這是李開復對大模型公司新目標和新實踐的思考。

這個打法是什麼?怎麼讓一塊GPU 發揮兩塊、甚至三塊的能力?這個問題可能要在團隊構成上更加講究。李開復認為,Infra(硬件底層)團隊必須比Modelling(模型)團隊還要強大。他說很快大家就會發現,做過大模型Infra 的人比做大模型的人還要貴、更稀缺;而會做Scaling Law(擴展定律,模型能力隨著訓練計算量增加而提升)的人比會做大模型Infra 的人更稀缺。

因為優秀的Scaling 團隊可以規避徒勞無功的訓練,當做訓練的時候,大概率會成功,一旦不成功,也有能力馬上叫停,有足夠的數學能力來做這件事情。除此之外還有很多微妙的細節和經驗,比如,讀通論文也會少走很多彎路,因為有些論文是故意把不奏效的東西寫出來,不會讀很容易被帶偏。

其實客觀來看,GPU 短缺這個問題,不只是中國創業者的問題,全球創業者都要面對。所以怎麼把有限的算力做好,會成為大模型公司角逐的關鍵。

李開復就提到一個明確的觀點:大模型團隊每一個位置都要有人才,Pre Train(預訓練)、Post Train(訓練後)、Multi-Modal(多模態),Scaling Up(可擴展性) ,Inference(推理)等等都有其重要性。其中,Infra 團隊這部分人才更稀缺,更應該被重視。

其實除了創業者自己對大模型要精進更深入的理解,也需要更多維度的技術創新,比如現場一位infra 層的創業者,墨芯創始人&CEO 王維就分享了一個計算上的解決方案——稀疏計算。讓我看到了雲端和終端AI 芯片加速方案通過優化計算模式,能將神經網絡開發全面稀疏化,提供超高算力、超低功耗的通用AI 計算平台的可能性。

02 ChatGPT 點燃熱情,Llama2 讓人腳踏實地

如果說ChatGPT 點燃了很多創業者的熱情,那麼Meta 開源的LLaMA和LIama2,就讓絕大部分創業者在基礎模型的起跑線上「眾生平等」了。但未來朝著什麼方向發展,創業者根據自己的資源禀賦、能力結構,顯然會有不同的使命和願景。

對於仍選擇做基座大模型的創業者而言,開源的底座只是起點。李開復就指出,儘管在跟GPT-3、GPT3.5 等SOTA(state of the art,先進)模型的各種評比中,Llama2 的差距不大。但實際上用起來,今天Llama2 的能力跟GPT-4,以及Bard(谷歌的大語言模型)的下一個版本,差別巨大。

圖片來源:Meta

這看起來也給了做大模型的企業一些騰挪空間,在未來,「真有錢」、「真有本事」的大模型創業者,有機會切換到一個New Bard 或者New GPT-4 的打法。

另一方面,不少創業者表示,Meta 開源帶給業界的觸動很大,「今天xxx 可能還是中國最好的模型,但明天它可能就被超越了。甚至突然有一天會發現你原來練的那些模型基本都沒啥用,當技術換代或者更強的開源模型出來,過去的投入可能完全「打水漂」,比如開源模型在預訓練上看了一萬億的英文代幣,你自己的模型非要再看一遍,可能毫無意義。 」出門問問創始人&CEO 李志飛認為,要充分看到開源帶來的深遠影響。

「大家雖然都有偉大的理想和抱負,但取決於是否有足夠多的經費來支撐到那一天。所以要腳踏實地得看到那,活著可能比什麼都重要。」瀾舟科技CEO 周明也認為,很多原先想做「最好大模型」的企業,其實需要重新思考創業的生態位,選擇擁抱開源,在開源的底座上做「為我所用」的東西。比如英文開源的模型在中文能力上較弱,也沒有在行業場景、數據中打磨過,這恰好是創業團隊的機會。

在這一點上,瀾舟科技把開源模型當L0 底座,在這之上,做L1 語言模型、L2 行業模型、L3 場景模型。周明認為,這樣一層一層做好,跟客戶通過AI Agents(代理)來互動得到反饋,模型一點點迭代,會逐漸建立壁壘。即便未來有更好的開源模型出現,也有辦法在它的基礎上再重新訓練或繼續迭代。 「開源模型『水漲船高』,你隨著比你厲害的人的成長而成長。」

用好開源模型,也是一種壁壘和門檻。這可能和很多人想像的不太一樣。甚至有人會問,基於開源模型做,還算做大模型嗎?另一邊,很多企業自身也避談使用了開源模型這一話題。

其實,基於開源模型做,後續的投入門檻並不低,能力要求也不低,用開源只是有效降低了冷啟動的成本,對創業者這並不丟人。比如李志飛分析認為,一個開源模型可能看過1 萬億代幣的數據,幫你省了幾百萬美金,模型廠商需要接著再往下訓模型。最終要把模型做到State of the art(SOTA,特指領先水平的大模型)的水平,數據清洗、預訓練、微調、強化學習,各個步驟都不能少,每年算力可能千萬美元起,並不見得一下子門檻就沒了,更不是使用開源模型就不用繼續投入了。

從這個角度來看,開源模型是更務實的選擇,優化、訓練出實用的模型反而也是真本事。基於開源,有機會做出很好的大模型,核心是能夠擁有相對領先的認知,有持續迭代模型的能力。

03 大模型ToB 現狀和實踐

模型能力的提升是一方面,落到客戶場景,又是另一回事。

從客戶的角度來看,大模型,「大」並不是唯一的追求,甚至完全不一定是客戶想要的。

有創業者就分享了特別現實的客戶場景:真正去跟B 端客戶談,客戶只需要語言理解、多輪對話和一定的推理能力,其他的AGI(通用人工智能)能力一概不要。

客戶向他反映說,其他功能反倒帶來了麻煩,「幻象」(Hallucination)問題解決不了,而且客戶原本有很多AI 1.0 的模型,本來用得好好的,為什麼要扔掉不用,AI2.0 並不需要覆蓋1.0 的能力,能合理調用就挺好。這也解釋為何在國內外RPA 領域是引入大模型最積極的。來也科技聯合創始人&CEO 汪冠春今年在國內市場也驗證了客戶有這方面的明確需求。

這種情況下,只要把自然語言理解清楚了,把參數傳過來調用AI 1.0 的模型以及外部數據庫,結果是可靠的,成本也比較低,最後再用大模型把結果組裝起來,形成一個報告。模型在這裡起到了任務分發的作用:分成子任務、每個子任務調用什麼。在子任務裡,有些大模型支撐的,有些是原來的統計模型,有些甚至都不是自己的,而是某個第三方的模型,客戶最後要的,只要能完成任務就行。

嘗試找到這樣的PMF(Product Market Fit,產品市場匹配)後,如果只做這種To B,其模型能力包含語言理解、多輪對話和少量的推理,這個模型並不需要很大,100 億到1000 億的模型,就相對夠了。相應地,需要在幾百張卡的基礎上,把語言理解、多輪對話做好,並且有一定的推理能力,再加上AI Agents,基本上能完成客戶在很多場景下的需求了。

一個通用的大模型,並不意味著可以解決所有問題。 B 端客戶的很多場景,通用大模型放上去並不奏效。這意味著模型需要越來越多,有越來越可收斂的場景,也意味著需要更多力量參與進來幫助技術和場景的對齊,而不是一個萬能的技術去適配所有場景。

瀾舟科技CEO 周明認為,必須要把用戶數據、行業數據,甚至圖譜或者規則,放到模型裡繼續訓練,這是行業大模型存在的必要性。在通用大模型不能覆蓋到的局部行業,加入這樣的數據,能把行業問題解決得很好,而且還能克服很多幻象問題。

我記得李志飛也補充了這一視角,他認為,通用大模型與垂直大模型,各盡其用,魚與熊市掌不可兼得。模型特別大,就意味著推理成本非常高。而且,一個做芯片設計的大模型,去回答電影、明星等娛樂內容,也沒有意義。他認為,To B 更多是要垂直和可靠,而通用在於智商,有很強的推理能力、邏輯能力,很豐富的知識。這不一定是To B 目前階段需要的。

與此同時,國內各行各業對於在業務中加入大模型的需求,是非常強烈的。藍湖創始人&CEO 任洋輝,和Moka 聯合創始人&CEO 李國興,這兩家SaaS 公司產品接入大模型後,已經得到了客戶的認可,真正收到了錢。

通過對這兩位創業者從2、3 月份到7、8 月份的狀態變化的觀察,我發現SaaS 領域中越早看到大模型帶來的技術變化是「重新定義軟件」級別的,敢於拿出「向死而生」的思維來實踐這個「重新定義」的進程,基本上幾個月就會破除焦慮,並且讓人看到希望。

所以,手裡拿著客戶和場景的創業者,搞不好會是那些大模型創業者的更早獲得技術紅利的受益者。

因為落到具體場景下,大模型其實就會有不一樣的追求。比如華深智藥創始人&CEO 彭健表示,大模型帶來的幻象(Hallucination)對藥物設計這樣的AI for Science 領域可能是有益的,某種程度上,所謂幻覺在某些領域就是智能的意義所在,因為這可以幫助設計出人想不到的蛋白質組合方案。

就像智譜AI 作為國內大模型落地案例跑得最多最快的一家,其CSO 張闊在實踐中就認為,對未來大模型的價值來說,「20% 可能是中心化的,80% 會是非中心化的」,也就是說用更豐富的、更多種類的大模型具體到客戶場景裡去產生價值,而不只是一個大模型無限泛化能力去解決所有問題,這是一種必然的趨勢。而這也得到了一起交易所的很多創業者的認同。

04 AGI 值得獻身,但也不要「玩命」

大模型是AI 的一個分水嶺。過去,人工智能是在封閉的系統追求確定的目標,比如人臉識別系統追求百分之百準確,但現在,大模型帶來的「湧現」是一種開放的智能,產生各種各樣的可能性,超出設計者預料之外,這是智能真正的特點,也是人工智能六七十年來最大的一個變化。

出現這樣一種新的智能係統之後,未來大家都能很便利地、低成本地地獲得智力,就像電力革命一樣。

智源人工智能研究院院長黃鐵軍認為,這次技術變革向下傳遞得很快,從大廠到創業公司迅速共識:這是一個新時代的開始。在這個時代不干點啥,好像對不起這個時代,對不起技術的發展。

而4 月份下場的百川智能算是目前國內做大模型最「成交量」的一家,保持平均28 天發一個模型的節奏,百川智能創始人&CEO 王小川雖然不承認自己在「成交量」,但他分享了快速落地的法門:比如搜索技術有增持的團隊,對數據處理問題上是有很大幫助的。而且通過引入搜索增強、強化學習,以及其他配套性的全棧技術,確實可以來幫助模型做得更好。 「如果看一下現在場內技術公司的高層背景,你會發現很多技術做的不錯的都有搜索背景,這裡面體現了一些技術的邏輯正在逐漸被看清楚。」

不過黃鐵軍認為,從科研角度來說,我們依舊只是進入一個偉大時代的早期,如果類比電力時代,今天這樣一個智力時代,其實就是當年法拉第搞發電機,一旋轉,電流產生了;現在是用大數據訓模型把智力訓練出來了,這是一個階段。後邊我們還需要一個人——麥克斯韋,因為後邊電磁學的確立,才是電力在人類社會開始靠譜可用、並推動工業革命的前提。

今天的大模型還有很多東西是黑匣子,一方面大模型的「上限」還有巨大提升空間,AIGC 很多時候能帶來巨大驚喜,但另一方面大模型的「下限」卻還不能保持足夠穩定,這個時候理解技術的邊界,合理的設定目標和要解決的問題,是很有必要的。有人要解決上限的探索,有人要解決下限的穩定。

對創業者們來說,AGI(通用人工智能)曙光已經出現,這是一件值得投身的事業,但也不要「玩命」。

另一邊,除了等待大模型技術更進一步,很多中間層的創業者在改進讓大模型落地到應用的環境。

BentoML 亞太區負責人劉聰稱,和之前傳統機器學習相比,海外客戶基本都能拿到一些預算來做大模型相關的產品原型或者Demo。但現在還沒有進入生產環境,去為公司產生商業價值,而很多做中間層的創業者看到了這個機會。

Dify.ai 創始人&CEO 張路宇的創業洞察也正源於此,他說,在開發者視角,拿到模型是不夠的。他分享了一個數據,在對六萬多個應用的樣本做分析後,發現現在投產或者接近投產的,這個比例差不多是5%。有對模型技術不是很滿意的,也有團隊工作流還沒有適應AI 應用開發的。相應地,張路宇團隊針對現在投產可能性更高的應用,去做一些專項能力。比如他們有一個指標叫消費者摩擦度的改進,看AI 在這件事上能提供多大的價值,提供相應的能力。

Zilliz 創始人&CEO 星爵補充了這一視角,他認為一個極度簡單的開發棧,是AI民主化的一個前提,基於這個判斷,他提出了CVP(大模型+向量數據庫+提示詞工程)這樣的開發棧。

05 如何通向AI native?

什麼是AI 時代的的Killer App(殺手級應用),在今年3 月微軟發布Copilot 之際,很多人的好奇被瞬間點燃。但在這次閉門會上,李開復提出了一個不同的視角,Copilot 不算是all in 大模型的產品。

他認為,從移動互聯網最成功的產品之一微信來看,放棄compatibility(兼容性)很重要。做得最早的是MSN、QQ,但是勝出的是微信,因為張小龍做了一個決策,既然是移動互聯網的時代,就不要PC 了,微信在早期專注在移動互聯網的特質上,百分百押注到新的技術平台上。

從這個視角看,AI native(AI 原生)的應用可能有這樣的特徵:如果大模型拿掉了,應用就崩盤了,它是一個完全依靠大模型能力的應用。但拿掉Copilot,Office 軟件還是Office,AI 只是錦上添花。

這一觀點得到了現場創業者最多的認同,也引發了大家帶著這個定義,對AI native 應用的探討。

前段時間爆火的產品妙鴨,其產品負責人張月光認為,沒有大模型,就沒有妙鴨,這跟李開復對AI first,AI native 的思考一致。

他認為,妙鴨作為率先出圈的應用,最重要的是解決了可控性。妙鴨團隊一開始沒有想做底層模型的工作,更關注怎麼才能用現存生態上開源愛好者開發的各種插件和小模型做可控性。錨定了最重要的事情是可控性,妙鴨把照片質量做到平均分90 分以上,也迎來了快速成功。

「我們在應用層特別關注怎麼才能讓模型更可控,就發現在圖像賽道上,已經有一些相對可控的技術了。可能語言賽道上,如果出現這樣的東西,會對上層應用創業者是一個質變時刻」。張月光的實踐給了做大模型應用的公司一些啟發,可控性可能是AI native 應用誕生的條件。 Stability. AI China Lead 鄭屹州也觀察到了這樣的趨勢,開源社區貢獻者解決可控性後,大量應用冒出來了。

在探索新一代應用上,元石科技創始人李岩指出,大模型帶來的推理能力,是新一代產品的本質不同。

而社交+Agent 是被看好的一個機會,並且一定會是最早一批AI native 的產品,但這很可能需要創業者俱備從大模型到產品的「端到端」的構建能力。比如,李志飛分享了和Character.ai 探討為什麼後者要做自己的大模型時,對方表示,因為用OpenAI或者谷歌這樣的中心化大模型,不會回答「調情」的問題。這是Character.ai 找到的獨特空間,也是可以逐漸增持的壁壘。

同一領域的聆心智能,在做社交大模型的應用上,發現了獨特場景。聆心智能CEO 張逸嘉分享了他們看到的與預想的不同,現在大模型可以落地的社交場景不是陪伴,人們接受虛擬形象的陪伴需要時間。現在落地的社交場景是角色扮演,用戶畫像是網文小說愛好者,角色扮演是網文小說的新形式。

至於現在最新的AI Agent 方向,是不是大模型「全村的希望」,甚至最終帶來交互革命、終端革命、商業模式革命,很可能要取決於多模態能力的發展。

心識Cosmos創始人&CEO 陶芳波解釋說,一開始大家對Agent 的期待很高,但在現有技術條件下發現,Agent 怎麼樣比ChatGPT 解決了更多問題,很難被講清楚。他認為,如果真的要把Agent 發揮作用,並不是把那麼多軟件的API 給接進來,因為接軟件的API 本質上是在做兼容,是新瓶裝舊酒。

Agent 有沒有一些更加Native 的形態去完成最後一公里。有很多很多要做的事情,數字栩生創始人&CEO 宋震說的空間感知能力和多模態能力。在這些條件成熟之後,可能就會出現Killer Case。

李志飛堅定地認為,現在看來,多模態是C 位,不是花瓶。因為Agent 輸入輸出都依賴於多模態的能力,沒有多模態就沒有Agent,只不過今天的Agent 更多是通過語言模型,通過文本來反饋,但是最終Agent 會是一個多模態的觀察、感知、行動。他預判,跨模態知識的遷移,再過兩、三年看,反而是大語言模型最大的一個貢獻。

06 大模型時代,服務大B 還是小 B

幾個月前,我在舊金山正好趕上數據公司Databricks 的開發者大會。這是一家專門做「數據湖」的數據平台公司,可以說是長在雲計算平台上的「中間層」公司。就是這樣一個公司,幾年時間估值已經達到幾百億美元,並且還在持續增長。 Databricks 的客戶既有大企業,也有小創業公司,大小通吃。

今年,這家公司迅速接入大模型,還收購了大模型公司Mosaic ML,開始幫助客戶落地大模型進入業務,這個風口讓它眼看一路狂奔千億美元價值而去了。

我當時非常好奇的一點是,為什麼國內好像沒能長出這樣一個基於雲計算的「中間層」公司,而這一波AI 技術進步的變量,是否在中國能催生出這樣一批在把雲的算力變成業務競爭力,帶給更多行業數字化進步的「中間層」的優秀企業?

阿里雲董事長張勇認為,「中間層」公司的出現,一定是有可能的,也是雲計算企業樂見其成的。但這些公司要解決的還是一個核心問題——定義清楚要解決誰的什麼問題,定義越清晰,能力越到位,做的東西就能真正「收斂」,真正有商業「穿透力」。

這也引發了參會創業者們的探討,比如大模型技術剛剛開始進入行業,但企業服務「不收斂」、項目化的問題就開始出現了。比如給B 端用戶做大模型訓練,但由於數據是對方的,所以最終合作完,自己的團隊很難「閉環」——數據沒有飛輪,收入毛利也低,一不小心就做成了「高科技施工隊」,是技術企業面對B 端的一個通病。甚至有創業者都開始懷疑,大模型To B 可能天生缺乏土壤。

但加入創業者群聊一直在做筆記的張勇,恰恰在這裡很體系化地說了一個不同的見解:「To B 其實還有另一種可能,就是「小B」,也就是那些中小微企業,它們看起來不起眼,但是數量眾多,單單服務它們,就能夠造就現在的互聯網巨頭。 」

例如,阿里早期的「黃頁」,讓中小賣家能被外國買家看見,帶來了跨境貿易的繁榮;淘寶則是解決了信息和物流的流通問題,就成就了電商這一大品類。

而且,相對於大型公司,這些小B 公司並不關心技術和願景,誰能幫牠們解決增長問題,就會因此付錢。

當前大公司的數據化,最主要的一個目的就是要「降本增效」,說白了就是「節流」。但效率優化空間總有盡頭,可是增長和發展的「開源」空間,卻相對無限。張勇認為,企業服務裡「開源」遠比「節流」重要,人們永遠願意為了發展而付費。

他甚至認為,過去數字化企業服務過於看重「降本增效」可能是個誤區,因為願意為提升百分之幾的效率付錢的往往是大公司,他們體量大,這種提升符合投入產出比。然後也讓大家都圍著大公司做項目。但反過來,小公司很難靠「降本增效」去啟動需求,它們要的是成長和發展的能力。

其實,小B 客戶還有一種雙重性,即如果採用「訂閱」的方式,那它其實就可以被看成是一個「C 端用戶」。

在這一點上張勇的觀點也得到了參會創業者的認同,比如出門問問的李志飛曾經在語音識別領域做過To B 的業務,被同行成交量得非常痛苦。而後來他做的AI 配音工具「魔音工坊」,服務的就是一個個內容創作者,收斂到一個真正解決小B 們普遍問題的產品,這些「小B」反而讓他真正把AI 技術變成了健康成長的業務。

張勇還建議創業公司需要一開始就確定自己要服務的客戶,是C 還是B,是小B 還是大B,必須定義好。張勇甚至覺得,做AI 的公司,如果既做To 大B 又做To 小B 甚至To C 是行不通的。

雖然AI 技術的發展帶來了很多變化,會越來越有通用的能力,但是在技術層面之外,還有組織的「DNA 問題」,「你一個公司裡做大客戶的和做互聯網用戶的團隊,上班的著裝、說話的方式可能都是不一樣的。」張勇覺得要定義清楚自己服務誰,解決什麼問題,而不是哪有單子往哪裡走。

07 大模型對雲意味著什麼?

幾年前上一波AI 浪潮中,很多創業公司一樣獲得了大量融資,出現了很多知名公司和創業者,但是幾年下來,依舊做得很辛苦。我和很多那一波創業者一直保持交易所,好多次約出來聊天,看到他們一臉疲憊沙啞著嗓子,一問往往是前一天陪某個大客戶喝了大酒還沒緩過來。

這次的很多創業者也目睹了那個時代,技術最終因為無法形成標準化產品,變成只能接項目的「高級人力外包」、「高科技施工隊」。他們都覺得,一定不能再重蹈覆轍。

與此同時,大家也很關心阿里雲這樣的雲計算平台在大模型時代會面對什麼變化。大家也問張勇,在大模型時代,他覺得云本身到底是技術,還是產品?

張勇的回應倒是很直接,「雲本身應該是產品,並且不是一個,而是一系列的產品。」在大模型和AI 浪潮推動下,有一個事情是確定的,就是行業和客戶對算力提出了全新的要求。如何滿足客戶對算力的進一步需求,就成了阿里雲的基本出發點。張勇覺得這裡面一定有技術要解決的問題,但阿里雲也一樣要思考如何「收斂」到真正解決產業生態問題的產品,而不只是輸出算力本身。

有意思的是,這次交易所活動雖然是FounderPark 社區和阿里雲聯合邀請,但卻沒有安排任何關於「通義千問」的分享。創業者們當然也很關心雲平台自己做大模型的目的。張勇的觀點是:這個容易出現Hyper Scaler(超大規模玩家)的跨技術時代,肯定沒有人敢掉隊,不可能不去觸摸技術本身。但他覺得,阿里雲在這樣一個巨變時代,要把握的還是更核心的角色,就是Cloud Service Provider(雲計算服務提供者)。

「而要做好這個角色,不懂大模型一定是不行的。」張勇說:「我們如果不做通義千問,可能都搞不清楚該如何幫助今天參會的各位創業者們。」

其實讓張勇比較興奮的,是他非常確定未來人類社會對於對算力的需求是無限的,對於其效率的要求也會越來越高。所以張勇說,阿里雲肯定是希望「模型越多越好,場景越多越好」,二者越多,對算力的需求和技術要求就更高,這就意味著云有了新的要去面對和解決的問題。而唯有持續不斷值得解決的「難問題」,才能驅動雲的價值有更大的成長空間。

「雲計算平台前所未有需要一個生態,而不是什麼都自己搞。目前,還沒有一家公司能把芯片、雲計算、數據平台、機器學習框架和大模型,全部用自己家的,形成所謂的「閉環」,這幾乎在物理上是不可能的。 」

張勇覺得,AI 技術的發展,讓生態有了新的可能。他有個遺憾,過去十年是中國雲計算突飛猛進的時期,但中國的SaaS 行業,並沒有因為基建的快速發展而有了本質性的提升。而美國的SaaS 公司,目前都在探索將AI 嵌入到平台中升級,走了一條和國內公司不同的路徑。

他認為,在AI 時代,中國可能會出現新一代的SaaS,會是一種全新的智能服務,和以前SaaS 流程驅動不同,這種新的服務會通過數據和智能驅動,可能也不叫SaaS。

面壁智能董事&CEO 李大海指出,國內To B 市場非常碎片化,這是SaaS 服務起不來的原因。但是現在有了大模型這樣一個技術變量,能不能夠形成一些變化,這是比較值得期待的事情。同時他也期待阿里雲這樣的雲廠商,能在這裡有一些好的方案和底座,帶著大家一起把這個事兒趟得更平。

在張勇看來,中國過去不少SaaS 公司,到現在也不能安全算是Cloud Native(雲原生),而對於一個天然生長在雲上,或者是intelligent native(智能原生)的新型服務,有機會「平替」之前非原生的上個時代產品。

很多時候我們感嘆,上一個十年中國的SaaS 行業成長不盡人意,但大模型如今給創業公司提供了新的機會,在一個全新的數字化生態裡塑造新的格局的可能性。張勇的結論是:這樣的機會和挑戰,對阿里雲,對所有創業者,都是相通的,都要面向未來找到自己的位置,共同形成生態夥伴關係,共同創造價值。

好了,以上是我在長達7 小時交易所中節選的一些筆記。我最強烈的感覺是,今天大模型技術帶來的時代變化,才剛剛拉開帷幕。經過前半年的極度興奮和「過度想像」,一個可能長達10 年的技術革命,現在才真正開啟「萬里長征」。狂熱期之後真正進入拓荒期,這裡面經過足夠時間磨練和付出堅實代價才能獲得的「共識」,才是真共識。

希望創業者之間,產業生態之間,能有更多的帶著「開源精神」的坦誠交易所和思考碰撞。其實張勇給這次交易所起的「西溪論道」這個名字就挺好的。坐而論道,更要起而行之。

我想,這個「道」應該就是AGI 時代從技術到產品,從vision 到價值的那個「創新之道」吧。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts