AI創業「贏家通吃」法則消失了?或許你能幹個翻身仗


來源:適道

圖片來源:由無界AI生成

美國矽谷著名投資人,國際知名支付工具PayPal的創辦人彼得‧蒂爾(Peter Thiel)曾說:「競爭是留給輸家的。如果你想創造和獲得持久的價值,那就建立一個壟斷企業。”

這句話是對「贏家通吃」(Winner Takes All)的極致表述。 「贏家通吃」指產品或服務只要比競爭對手好一點點(例如1%),那麼在該類別的產品或服務中,你就會獲得不成比例的巨大收入(例如90-100%) ,將競爭對手遠遠拋在身後。

這個現像在許多行業都有所體現,尤其是科技業。從全球範圍來看,IBM 在運算領域佔據主導地位數十年;微軟主導個人電腦市場;亞馬遜至今仍在單槍匹馬地統治電子商務領域。很顯然,網路時代的一大特徵就是「贏家通吃,敗者恆弱」。

要弄清楚這個問題很重要,因為這將會改變我們的投資邏輯:如果傳統網路「燒錢補貼——幹掉第二名——壟斷市場——發揮網路效應」的做法不再行得通,那麼經歷過「千團大戰」時代的投資人,或許也需要一套新的投資方法論。

為了得到答案,適道投研團隊參考了幾篇外網文章,作者包括A16Z合夥人Benedict Evans、美國光速創投(Lightspeed Venture Partners)合夥人Guru Chahal等人,試圖梳理出一些相近或相悖的觀點,供大家思考。

會得獎者通吃:代表方吳恩達

整體來看,吳恩達 (Andrew Ng) 介紹的人工智慧的良性循環模式為「贏家通吃」提供了底層邏輯。

最初,人工智慧產品由有限的數據建構。隨後,在與使用者接觸過程中,產品每天會收集越來越多的資料。而機器學習的基礎是數據——大量的數據。

更多數據=更精確的模型=更好的產品=更多用戶=更多數據

這個良性循環公式被認為是人工智慧贏家通吃市場的重要因素。大數據和機器學習結合,放大了網路效應和規模回報,再次強化了科技市場領導者的主導地位,意味著那些已經很大並且擁有大量數據的公司會變得更強大。

就國內情況來看,資料壁壘也是擺在新興公司面前的一面牆。高品質的中文語料數據對新創公司來說是個很大的挑戰,而數據的增持則需要時間和經驗。對於百度這樣常年累月透過搜尋等多個網路、物聯網應用程式增持起數據的公司來說,一開始就領先了至少幾個身位。

不會贏家通吃:代表方A16Z

數據至關重要,但關於數據在實際工作中產生的作用,A16Z合夥人,著名分析師Benedict EvansDoes提出了不同的觀點。

EvansDoes在文章《AI make strong tech companies stronger?》中指出,雖然機器學習需要大量的數據,但是你使用的數據要非常適合你試圖解決的問題。

通用電氣有大量來自燃氣渦輪機的遙測數據,Google有大量搜尋數據,美國運通有大量信用卡詐欺數據。但你不能用渦輪機資料來訓練模型,去發現詐騙交易,也不能用網路搜尋資料訓練模型去發現即將失效的燃氣渦輪機。

你訓練的每一個模型只能做一件事。

這與之前的自動化浪潮非常相似:就像洗衣機只能洗衣服,不能洗碗做飯,象棋程式不能繳稅一樣,機器學習翻譯系統也無法辨識貓。

你建立的應用程式和你需要的資料集,都與你試圖解決的任務強相關。 (儘管這是一個不斷變化的目標,有研究試圖發現如何讓機器學習模型,在不同的資料集之間更容易遷移)。

這意味著谷歌會越來越擅長成為谷歌,但不代表它在其他方面也做得越來越好。

有的行業會,有的行業不會:需要看具體的垂直領域

那麼,在垂直領域,頭部企業能否憑藉遙遙領先的數據優勢,搶佔全部市場?

EvansDoes認為,情況會變得更加複雜。

例如誰擁有數據,數據有多獨特,數據在什麼層面上是獨一無二的,以及聚合和分析數據的正確位置在哪裡。這些問題對於不同的業務部門、不同的行業和不同的用例,答案會有所不同。

我們假設一個場景,如果你正在創建一家公司來用機器學習解決現實世界的問題,那麼你會面臨兩個基本的數據問題:

1.你如何獲得第一批資料來訓練你的模型去獲得第一個客戶?

2、你需要多少數據?

第二個問題可以分解成許多問題:

你要用較少且容易取得的數據來解決問題? (但許多競爭對手可以獲得) 。

還是你需要更多的、難以取得的數據去解決問題?

如果是這樣的話,是否存在一種網路效應可以從中受益?由一個贏家將獲得所有的數據?

產品是隨著更多的數據無限期地變得更好,還是存在一個S曲線?

這些都要看情況。

有些數據,是企業或產品獨有的,或具有強大的專有優勢,例如通用公司的渦輪機遙測技術。但這對分析勞斯萊斯的渦輪機,可能也沒有太大用處。

而一些數據,可以用於許多公司甚至許多行業中的用例。許多新創公司也由此誕生,來解決許多公司或不同產業的共通性問題,而這裡的數據具有網路效應。

但也有這樣的情況,就是在某個時間點之後,供應商甚至不需要更多的數據了,因為產品已經能夠運作了。

EvansDoes認為,這種情況已經在許多新創公司上演。例如, A16Z的投資的公司Everlaw開發了一個法律軟體。該軟體能夠對一百萬封電子郵件進行情緒分析,就不需要以客戶的特定訴訟資料作為原料再進行訓練了。

更極端的情況是,一家大型車輛製造商正在透過模型訓練,開發更精確的爆胎偵測器。這是基於大量輪胎的資料訓練出來的模型。但很顯然,這些數據的獲取難度並不高。

也就是說,機器學習的普及並不意味著Google變得更強大,而是意味著各種各樣的新創公司,能夠比以前更快地利用這項前沿技術來建立一個應用,解決一個問題。

未來不會出現更多「人工智慧」的新創公司,它們將是工業流程分析公司、法律平台公司或銷售優化公司。

EvansDoes將機器學習與SQL(Structured Query Language)進行了類比。

在以前,如果你不使用SQL,你就會落後。例如沃爾瑪成功的一大因素,就是使用SQL更有效管理股票和物流。

但在今天,當你創辦了一家零售公司,並說“…我們將使用SQL”,這不會讓公司看起來更有價值,因為SQL已經成為了一切的一部分,然後它就在話語體系中消失了。

機器學習的未來也會如此。 ‍

「大模型」時代怎麼投?至少網路邏輯確實行不通了

適道投研團隊認為,不管會不會“贏家通吃”,至少網路時代的投資邏輯在人工智慧時代不再行得通。

核心邏輯在於,網路時代,「流量」是免費的,這才有「網路效應」的概念:也就是說,在總的營運成本不變的情況下,使用者越多,網路的價值就越大。這就是所謂的“所有行業都適合用互聯網思維重做一遍。”

但是,大模型時代不一樣的點在於,算力是有成本的。那麼每多增加一個用戶,是要實打實地付出算力,並不會產生網路效應,這就導致補貼沒有任何意義,你的新用戶越多,反而越賺不到錢。

另外,目前的大模型有使用成本高、推理延遲較大、資料外洩、專業任務上不夠準確等問題。與之相比,一些更小型、專業化(調整+精煉)的長尾模型的優點也顯現了出來。

因此,即便絕大多數技術都能起到財富聚集的作用,人工智慧巨頭也確實能聚集大量財富,但因為算力成本,以及不能佔有整個市場,財富總量也會變得有限。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts