生成式AI淘金熱,誰能從中賺錢?


圖片來源:由無界AI工俱生成

編者按:生成式人工智能(GenAI)的勢頭十分迅猛,似乎所有白領行業的市場都可以用GenAI 重新做一遍。人人都對這場淘金熱摩拳擦掌,但是你最好先冷靜一下,想想看自己能不能真的淘到金子。或者也許你的確淘到了金子,結果卻發現換來的還不夠買鎬和鏟的錢。本文對此進行了全面盤點。文章來自編譯。

生成式AI 淘金熱的狂飆開始了,你係好安全帶了麼?科技巨頭會拿起自己的鎬和鏟子統治這個市場嗎?哪些初創企業會發財致富? “X 的copilot”會成為找到富礦的商業策略嗎?創業公司該如何豎起高牆來阻止其他的探礦者?美國能再次擁有儲量最豐富的金礦嗎?

生成式AI 的淘金熱正在進行得如火如荼。生成式人工智能(GenAI) 現在已經能夠創作各種內容——如文字、圖像、視頻和音頻——而且質量往往與人類創作的內容已經沒有區別。寫作、視覺設計、編碼、營銷、遊戲製作、音樂創作和產品設計只是GenAI 迅速影響的人類創造力的其中幾個領域。隨著創意服務集成到Microsoft Office 365、Slack、Discord、Salesforce Cloud 和Gmail 等產品之中,在我們不知不覺間,GenAI 就將讓數十億人的生產力提高到新的層次。我們很快就會用GenAI 來創建我們的初稿。

那麼誰能靠GenAI 賺錢呢?我向OpenAI 的Dall-E-2 文本生成圖像服務提出了這個問題,它為我生成了下面這張圖像。還不錯。

給Dall-E-2 的提示:“誰將從生成式AI 中賺錢?”

2018 年,我寫過一篇討論人工智能領域誰能賺錢的熱門博文。本篇是我在GenAI 吸引了數十億美元投資、有了成千上萬個新用例之後的後續文章。從本質上來說,在這場淘金熱中有可能捕捉到價值的可分為五個“層”:

基礎設施層——提供芯片和雲基礎設施的公司會運行大量底層的GenAI 計算機模型。基礎模型——公司開發出文本、圖像、音頻等生成式創意輸出的大模型。應用——正在開發創造性應用的大小公司,那些應用將被消費者、企業和政府所使用。行業和組織——作為自身創造性活動的一部分,會有各個行業、組織從GenAI 應用、工具和平台之中析取價值。國家——在國內及跨國界建立、出口和部署GenAI 技術的國家。

©生成式AI 價值捕獲的五個層面

那麼這5 層分別會有哪些贏家呢?

1、GenAI 基礎設施

憑藉著自身的雲服務與硬件芯片,科技巨頭已經在GenAI 基礎設施層佔據主導地位。

將提供GenAI 基礎設施的科技巨頭及芯片公司的例子

微軟和谷歌在美國的雲計算市場處於有利地位,而百度和阿里巴巴在中國處於有利地位。其龐大的超級計算機雲計算基礎設施可以運行GenAI 那些複雜、昂貴的文本、視覺與音頻大模型。已經有很多開發者使用他們的雲AI API 服務及工具來開發應用,隨著創業者一擁而上,去解決幾乎無限的GenAI 用例,這種趨勢預計會加速。亞馬遜對基礎模型的態度一直保持沉默,所以他們會如何做出回應將是一個大問題。

GenAI 要使用大量算力來生成創意輸出。 OpenAICEO Sam Altman 表示:

沒辦法,到了一定時候我們得將 [ChatGPT 和 Dall-Ee] 貨幣化;計算機的成本太高了。 ”

有傳言稱,Open AI 訓練GPT-3 光是電耗就花了1200 萬美元。所以毫不奇怪,2023 年初,OpenAI 從微軟那裡又拿到了100 億美元的投資,其中大部分將以Microsoft Azure 超級計算基礎設施訪問積分的形式出現。

芯片製造商對超級計算機能力的需求垂涎三尺。 NVIDIA(納斯達克股票代碼:NVDA)的市值已超過5000 億美元,股價已從2018 年的60 美元上漲至2023 年初的240 美元。科技巨頭也在投資自己的專為AI 優化的芯片。美國最近禁止向中國出口先進人工智能芯片,這將加速中國對半導體行業的國家援助和國內投資。考慮到所需要的投資金額,這個領域的贏家將是那些大玩家或得到大玩家支持的人。

科技巨頭的規模與業務範圍賦予了他們在開發GenAI 基礎模型方面的競爭優勢。這些模型利用了科技巨頭龐大的計算資源,並且有大量數據可供訓練。比方說,OpenAI 的GPT-3 文本模型,也就是所謂的大型語言模型(LLM),是基於約45 TB 的文本數據進行訓練的,這些文本數據代表了從大部分英語互聯網“吸走”的5000 億個單詞。同樣地,OpenAI 的Dall-E-2 文本生成圖像模型利用了6.5 億個圖像-標題對進行訓練。

2、基礎模型

由於未能抓住這些基礎模型的數十億最終用戶在未來產生的巨大收入流,從而失去了在雲服務領域的領導地位——科技巨頭可不希望這樣的事情發生。微軟已經與OpenAI 進行深度合作,谷歌最近則推出了Bard 語言聊天機器人,這個模型補充了谷歌的Imagen 模型,可以用來根據輸入文本創建逼真的圖像。

中國的科技巨頭也沒有停滯不前。阿里巴巴正在測試一項內部聊天服務。百度已經提供了ERNIE-ViLG,一種文本生成圖像的參數模型,而且目前正在測試一種新的聊天機器人服務。科技巨頭的規模為其提供了一些創業公司難以復制的優勢。

文本、圖像、視頻、音頻以及工具和服務的基礎模型提供者示例

科技巨頭具有可解決基礎模型的真實性、偏見以及毒性問題的規模優勢

科技巨頭也可能是唯一能夠應對GenAI 陰暗面的參與者。儘管GenAI 仍處於起步階段,但基礎模型的問題正在變得越來越明顯。這些問題包括真實性(GenAI 生成的內容完全是錯誤的)、偏見(對特定群體的偏見)以及毒性(比如種族主義、厭女或仇恨言論)。 2023 年初,由於金融市場對谷歌Bard 聊天機器人服務給出的錯誤及冒犯性的答案感到恐懼,令Alphabet 的市值縮水了1000 億美元。微軟的限製版的Bing 聊天機器人也表明,AI 會對用戶越出保護措施的提問做出令人不安的(甚至是種族主義的)回應,雖然微軟的股價並沒有因此受到重挫。還有一種叫做提示注入(prompt injections)的新型網絡攻擊,這種攻擊可以通過注入惡意指令來繞過護欄。

開發這些基礎模型的人面臨的挑戰是確保輸出既可靠又準確。基礎模型不能簡單地複述從廣泛的互聯網蒐集到的有偏見和有毒的內容。這些模型也會有“幻覺”。這意味著它們可以自信地為可能與事實不符的問題提供結構合理、貌似頭頭是道的答案。正如Character.AI 的聯合創始人Noam Shazeer 在《紐約時報》上所說的那樣:

“……這些系統不是為真實性而設計的。它們是為似是而非的對話而設計的。”

或者換句話說,他們是自信的廢話藝術家。

科技巨頭無法承受模型失敗可能帶來的聲譽、財務和戰略風險。他們正在建立包括護欄和模型調整在內的監管監督系統。為了建立起用戶對自己的信任,同時滿足可能的監管要求,科技巨頭需要為模型透明度、可解釋性以及來源引用設計解決方案。基於人類反饋的強化學習(RLFH) 需要一支真正的人類隊伍來審查和評估模型對問題的回答。這些不是可以大規模解決的簡單問題。在這一點上,處在有利地位的依舊是科技巨頭,因為無論是資金、工程人才、數據集,還是數十億用戶所帶來的這個人類反饋循環的規模,別人都沒法跟他們相提並論。

科技巨頭的模型未必適合所有情況

儘管規模龐大,但科技巨頭也無法壟斷完基礎模型這一層所有的市場。他們的模型大體上屬於橫向,非常適合回答你能想到的任何消費者型問題,雖然未必能回答正確。但是,這些模型未必總能很好地滿足那些垂直型任務的企業需求。為什麼?因為科技巨頭的橫向模型(1) 在執行專業任務上未必總是表現良好,(2) 往往不能保護企業的專有數據,(3) 沒有接受過非英語語言的訓練,(4) 缺乏透明度和可解釋性,(5) 不太適合在邊緣設備和本地使用,(6) 在他們的雲端運行的話可能很昂貴,並且(7) 導致公司對科技巨頭形成依賴。

一些資金極其充足的初創企業正在提供科技巨頭基礎模型的替代方案

科技巨頭的基礎模型並不適合所有人。這為部分資金極其充足的初創企業留下了空間。這些初創公司已經籌集了不少資金,如果不是數十億美元的話,也有數億美元了。

Anthropic 成立於2021 年,專注於更可靠、可解釋及可指導的大規模語言模型。目前公司並已籌集超過10 億美元的資金,其中最近有3 億美元的投資來自谷歌。 AI21labs 為其Jurassic-1 文本模型籌集了1.19 億美元。 Jurassic-1 的參數量超過1780 億,規模與GPT-3 相似。 Cohere 已為大規模語言模型(LLM)以及自然語言處理(NLP) 即服務籌集了1.65 億美元。 BLOOM 這個LLM項目獲得了私營公司Hugging Face 以及歐洲研究機構的支持,其目標是建立一個具備1760 億個參數的開源LLM。它接受了46 種人類語言的訓練,其中包括20 種在大多數LLM 中代表性不足的非洲語言。總部位於英國的Stability AI 最近為其開源圖像生成服務Stable Diffusion 籌集了高達1 億美元的資金,公司估值已超過10 億美元。

科技巨頭意識到了他們模型的局限性。尤其是微軟,這家公司最近宣布,企業可以在不必擔心自己的專有數據被共享的情況下“微調”他們的模型,從而讓“為所有人開發出更好的模型”成為可能。

不過,這些舉措沒法令所有人滿意。德國初創企業Adelph Alpha 最近就籌集了3100 萬美元,它正在通過自己面向“歐洲”的模型來應對企業對科技巨頭基礎模型的擔憂。但是,他們能不能跟那些科技巨頭掰手腕上尚不得而知。

科技巨頭將會贏得橫向型基礎模型的競爭,為少數資本十分充足的初創公司留下了一點空間。或許像BLOOM 和Stable Diffusion 這樣的開源模型將贏得部分規模市場,或者至少能找到一個利基市場。按照慣例,將會有一些工具和服務提供商通過提高這些基礎模型的易用性來獲利。但總的來說:

科技巨頭的市場主導地位只會越來越鞏固,因為憑藉著從基礎雲服務中賺取的大部分資金,他們有能力免費贈送基礎模型。

3、生成式AI應用

雖然GenAI 淘金熱的鎬和鏟子會被科技巨頭搶走,但應用層的競爭環境似乎更加公平。既有的企業軟件公司、“全棧”型初創公司以及由這些基礎模型支持的數千家初創公司將會提供新的GenAI 應用。

傳統的企業軟件公司,比如Salesforce 與微軟等,會通過有機的或吸收思想的方式將GenAI 功能帶給他們的數十億用戶。微軟還會把GenAI 聊天機器人服務整合到自己的Bing 搜索應用之中,直接挑戰谷歌在搜索領域的霸權地位。

少數資金雄厚的初創公司將提供專門的“全棧”應用。在對專門數據、序列以及計算有要求的領域,這些公司會開發出自己的底層基礎模型。比方說,通過利用應用建立自己的模型,GenAI 可以徹底變革藥物發現和材料科學。投資者會被這些初創公司所吸引,因為這樣的公司可以帶來豐厚的經濟回報,並且面對競爭具備強大的防禦能力。

比方說,Adept AI 已經籌集了6500 萬美元用於開發基於LLM 的、擁有自然語言界面的下一代機器人流程自動化(RPA)。尚未公開的Inflection.ai 也在做類似的事情。 Character.AI ,一個利用角色的聲音和知識的聊天機器人,已經以約10 億美元的估值籌集了2 億美元至2.5 億美元的資金,用於專業LLM 的全棧實現,從而為實時的客服代表企業應用提供支持。

GenAI 的採用速度會非常迅速。就算AI 生成的營銷文案的初稿不完美,編輯起來也很簡單。 ChatGPT 是史上增長最快的消費者app,在推出後僅兩個多月的時間內,其月活用戶就超過了1 億。這意味著對數量幾乎無限的GenAI 創意應用的爭奪將十分激烈,且瞬息萬變。

提供應用來解決主要GenAI 用例的主要初創公司示例

你能想像到的每一個用例都會有一個“Copilot”GenAI 應用

將GenAI 投入使用之後,你會看到世界各地的消費者、企業和組織用上由建立在這些基礎模型之上的初創公司開發的應用。許多GenAI 初創公司將利用“Copilot for X”商業模式來幫助用戶完成“創造性”的任務,如寫作或編碼,以及重複性的任務,如數據輸入或表格填寫。以下是部分在各種垂直用例中競相賺錢的初創公司。

聚焦一般文本寫作的初創企業正在實時協助用戶完成日常寫作任務,比方說撰寫電子郵件、創作文檔,以及填寫文本表單。 AI21labs 的Wordtune 將“像專業撰稿人一樣重寫你的文字。”寫作助理之王是Grammarly,這款app 已經賺了超過4 億美元。寫作初創企業的名單很長,包括Lex、HyperWrite、Compose AI 以及Rytr。聚焦銷售和營銷的初創公司包括已籌集1.45 億美元,儼然已成龐然大物的Jasper.ai。 Anyword 也已融資超過4500 萬美元,提供“用於實現銷售高轉化率的文本內容”。面向語言生成的Persado 籌集了超過6600 萬美元的資金,“在96% 的情況下生成的文字表現優於你最好的文案。”初創公司越來越聚焦於特定任務,比方說撰寫產品營銷說明。圖像生成初創企業要靠Open AI 的DALL-E-2、Stability AI 的Stable Diffusion 以及Midjourney 的文本生成圖像基礎模型提供的支持。這方面的初創企業有幫助用戶創建拼貼畫的Art Breeder 等。臉部與頭像生成的消費者型初創公司包括Lightricks 的Facetune 應用。這款app 可幫助創建“完美的”Instagram 圖像。此外,Lightricks 也已融資3.5 億美元。非常受歡迎的Lensa AI app 的用戶可以用它來創建個人的“魔法頭像”。可讓用戶將他們的臉換成不同設置的Reface 已經籌集了550 萬美元的資金。產品設計初創公司包括Botika,他們正在“重塑時尚攝影”,可以創作出在各種環境下穿著優質服裝的超逼真模特圖像。在Maket 的協助下,“從文本提示生成建築計劃只需要幾分鐘,而不是幾個月。” 對於希望翻新的房主來說,Tailorbird 加快了平面圖的出圖速度。 Swapp 則籌集了700 萬美元來幫助實現項目施工文件的自動化。面向房地產設計的TestFit 已經籌集了2200 萬美元。聚焦視頻的初創公司則提供視頻構思、生成、編輯與員工協作的工具。其中Runway 是資金最充裕的,他們存進銀行的錢還有近1 億美元。 Magnifi 已籌集了超過6000 萬美元用於視頻編輯,而InVideo 已籌集了超過5300 萬美元。包括融資2600 萬美元的Hour One 在內,有好幾家初創公司都是做文本生成視頻服務的。總部位於倫敦的Synthesia 是一家頭像視頻創作平台,目前已融資超過6700 萬美元。總體而言,NFX 追踪到有54 家初創企業從事視頻生成業務,總共已籌集了5 億美元的資金。音頻方面的GenAI 初創企業包括音樂創作公司Soundraw、Boomy 與Aiva。 Splash 已經籌集了2300 萬美元的資金,他們的工具可讓用戶創作原創音樂,還能根據任意旋律演唱歌詞。語音服務DupDub 的融資額超過了2.5 億美元,且已擁有100 萬用戶。 Descript 已籌集了超過1 億美元的資金,可為音頻轉錄、播客、屏幕錄製、音頻及視頻編輯提供語音克隆。 Deepgram 的演講文本服務可以與科技巨頭以及OpenAI 的Whisper 一爭高下,目前已獲得超過8700 萬美元的資金。遊戲生成初創企業有望為製作工作室節省1 億美元的製作成本。可幫助創建2D 到3D 模型的Masterpiece Studio 籌集了600 萬美元。專注於為遊戲、電影和meta-verse 開發AI 配音演員的Replica 已經籌集了500 萬美元。遊戲工作室Latitude/AI Dungeon 已為基於文本的遊戲生成籌集了400 萬美元。 VoiceMod 已經籌集了超過700 萬美元,用於在《堡壘之夜》(Fortnite) 等遊戲以及Skype 等app 提供實時語音轉換。另外還有做創建3D 表面紋理的初創公司Ponzu,創建非玩家創建(NPC) 虛擬角色的初創公司Charisma AI 等。初創企業Inworld 的方向是做“創建沉浸式現實、虛擬角色和虛擬空間”的AI 開發平台,目前已籌集了7000 萬美元的資金。總體而言,A16Z 目前追踪到50 多家遊戲行業的初創公司。 Chatbot 及對話式AI 初創公司包括已融資1.9 億美元的垂直健康症狀檢查工具ada,以及已籌集約7000 萬美元的英國初創企業Healthily。鑑於人工智能每年可以為呼叫中心業務節省800 億美元,初創公司在這個領域也在瘋狂融資。 Cresta AI 已經籌集了超過1.5 億美元的資金,總部位於倫敦的PolyAI 也已為其“超人語音助手”籌集了6800 萬美元。編碼助理類初創公司紛紛效仿微軟的GitHub Copilot,聲稱可以自動生成高達40% 的代碼。 Warp 是一家將自然語言轉換為計算機命令的公司,已融資7000 萬美元。 Tabnine 也已經籌集了3000 萬美元的資金。知識管理、摘要和企業搜索類初創公司包括融資1.68 億美元的Primer AI 以及融資6300 萬美元的Otter。總部位於斯德哥爾摩的初創公司Sana Labs 已籌集了5460 萬美元,用於促進組織內信息的發現、共享與再利用。

那麼哪些初創公司會勝出呢?

流入到GenAI 應用類初創公司的資金並不短缺。全棧型初創公司將在藥物發現等垂直領域籌集大量資金,他們將在這些領域開發出高度專業化的模型和應用。在更廣泛的B2B 領域,競爭將滲透到橫向和縱向,而商業模式則以copilot 為中心。一方面,橫向創業公司會提供跨行業的服務,比如Jasper 的銷售和營銷助理。另一方面,初創企業的關注點會越來越垂直化,專門瞄準某個行業、功能以及任務。

獲勝者將通過採取以下措施實現規模化與可防禦性:

高投資回報率——對於所處理的用例具備很高的ROI,並且在短時間內能證明價值。專有及定制的基礎模型——利用本地化、專業化以及專有的公司數據針對特定受眾進行“微調”。工作流——證明可用性,同時與客戶流程深度集成,使得一旦安裝進去就很難移除。反饋循環——比方說,利用人類反饋的強化學習(RLFH),從而改進模型與用戶意圖的一致性。形成飛輪——RLFH 與其他的反饋越多,通過“微調”得到的模型性能就越好,使用量越大,因此勢頭就越猛。投資的規模和速度——由於IP 掌握在基礎模型所有者手上,因此利潤率較低,這場遊戲完全就是拼規模。那些能夠快速建立自己的品牌並吸引大量用戶和客戶,從而推動飛輪旋轉的將成為品類的領導者。

在B2C GenAI 消費者領域,行動迅速、消費者獲取預算充裕的橫向玩家很可能會贏得比賽。

總部位於英國的AutogenAI 就是有能力贏得投標管理助手類B2B 初創企業的例子之一。過去兩年,他們已經開發出了一款應用,可幫助企業節省時間和金錢,同時提高投標、招標以及建議書的質量。他們利用企業網站的內容、中標與未中標的情況、營銷文案以及年度報告等樣例對OpenAI LLM 進行了“微調”。它們還提供人機監督用戶界面,協助審查生成內容與事實的來源和準確性。這種做法實現了一個關鍵的人類強化學習循環,增加了使用率。客戶正在逐漸加大對他們的應用的使用,把它當作自己的下一代知識管理和搜索工具,從而令其更具粘性。

部分GenAI 初創公司將會被收購,成為大型企業和消費者app 的特色功能。比方說,擁有數百萬用戶的大型社交媒體公司將會收購最新的面部與頭像創建初創企業。現有的圖形設計軟件公司將收購最有前途的圖像和視頻編輯初創公司。比方說,作為CRM 及ERP 應用的一部分,微軟現在就提供了原生的GenAI “Microsoft Dynamics 365 Copilot”。

簡而言之,如果某些Brave又幸運的初創公司能夠為他們的copilot 用例快速建立起規模和飛輪的話,則他們將獲得豐厚的回報。同樣地,部分全棧初創企業將在藥物發現等專業用例場景下蓬勃發展。由於融資規模龐大、市場統一,且個人、企業以及政府對創新的採用迅速,美國初創企業將佔據主導地位。但是,大多數的初創企業將空手而歸,因為在這場淘金熱當中,到頭來他們只能給鎬和鏟這些工具的供應商(主要是美國的科技巨頭)的利潤做貢獻。

譯者:boxi。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts