太捲了關於大模型和AIGC的36條筆記和真話

來源：i黑馬

9月12日下午，創業黑馬北京總部迎來一波“AI新勢力”。

華為雲、APUS、拓爾思、商湯、快手、360集團、清博智能、黑馬天啟、MiniMax、創新工場、奇績創壇、中國信通院……有上市公司，有龍頭企業，有獨角獸企業，還有AI領域領先的投資機構和科研院所。

參會嘉賓們直奔主題——

“大模型目前的行業現狀？企業如何更好地進行商業化？有哪些值得關注的新趨勢和新機會？”

很榮幸，參與了本次AI閉門會，38條筆記和真話，分享給大家。

行業到底有多成交量？

最新統計，中國已有130多個大模型問世，在網信辦備案的算法模型也超過70多家。 BAT等互聯網巨頭悉數下場發布AI大模型，僅2023年就有超60家創業公司拿到融資，產品更是佈滿了基礎層、模型層和應用層。新一代生成式AI，可能要回頭看看上一代AI趟過的坑，不要行業自嗨，避免上一個冬天的輪迴。在這個領域的從業者，更要清晰地看到行業的內捲和客戶的痛點，別被大佬的雞湯迷了眼。

1、現在有客戶找到我們，說有20個場景，一個場景X萬塊？然後挨家詢價，華為做不做？阿里做不做？百度做不做？要這麼成交量下去，最後都沒有錢賺。

2、大家融到的錢，80%-90%給到了算力，這是現狀。要知道，現在還只是訓練，訓練的成本是可控的，推理的成本是不可控的。

3、我們GPU有30000塊，算力6000p，年底爭取算力超12000p。數據方面，每個月有2萬億token清洗和標註完，年底會有10萬億的token。

4、目前看，行業還是缺少一些顛覆式的殺手級的應用，從而難以實現商業化的變現。

5、怎麼能夠在成本和效果之間，找到一個平衡點，這是比較難的地方。都用大模型，成本太高了。

6、再過一段時間，大家要比拼的是基礎設施的優化能力。比如，網絡優化能力，別人斷時你不斷，就能比別人多訓練幾次。

7、在算力緊張的情況下，我們在做一些前瞻性的技術嘗試。大家可能都想不到，在我們大模型公司，做基礎架構的同學，比做模型的同學要多。他們普遍的價格都還挺貴，也很難招。

8、大模型現在很尷尬，自身賣不上價格，最後都是賣雲賣卡賣算力的賺錢了。

9、剛開始覺得模型還挺值錢的，現在又陷入到內捲了。前段時間碰到一個客戶，BAT等都報價了。剛開始報價，還挺貴，1000多萬。大家知道最後的成單價是多少？太捲了。

10、百億參數的大模型，在某些特殊客戶的認知裡面，就是免費的。

來自一線的聲音

人工智能領域的企業，耳根子應該時刻記得毛主席說的話，“從實踐中來到實踐中去”。脫下長袍馬褂，走到田間地頭，在客戶身邊才能得到最真實地反饋。現在AI領域的偽專家太多了，不如多聽聽來自一線的聲音。

11、我們大概聊了150個客戶。對於大模型本身的需求主要分為兩類。一類是大模型本身文字上的需求，客戶對大語言模型的要求是100%準確。另一種，是AI agent，函數調用、代碼顯示器、調用第三方工具。

12、我們在合作過程中，出現了一個衝突矛盾。客戶會覺得，在內部決定部署之前，是不能把數據拿出來給你的。但如果沒有這個數據，我們又怎麼能訓練出適合客戶需求的模型呢？

13、我們在做項目的時候發現，用戶是不願意為大模型去買單的，他還是為你的應用去買單。有的客戶會直接問，有了大模型，以前的一些智能中台、知識圖譜就不需要了嗎？最後發現，場景才是最核心的。

14、我們要找到一些性感的場景。有幾個標準。第一，小切口。第二，跟大模型的優勢相匹配。第三，讓買單的決策用戶有強感知。比如以前獲取一些數據、結論或者服務，需要不同的流程，現在通過大模型，決策者在移動設備就能快速獲取和完成。

15、大模型想做成功需要三件事：1）能不能拿到足夠多的錢去買算力。 2）能不能拿到足夠多的數據。 3）人才密度是不是夠厚，不在數量多，而是有沒有足夠多的高質量的科學家。

16、現在我們遇到三類客戶。一類是焦慮的客戶，比如金融的客戶因為競對都在搞，於是也想搞，但他並不清楚自己的需求是什麼？一類是希望降本的客戶，客戶的管理層認為，這主要是降本節流的問題，但模型到底節流了多少，不好評判具體的價值。最後一類是希望部署模型開源賺錢的客戶，他是靠這個模型來創收的，這類客戶付費是最爽快的。

ToC 還是ToB？

據了解，GPT-4訓練一次的成本約為6300萬美元，需要1.8萬億巨量參數。中國目前發布的一些大模型，ToC方向還是互聯網的免費模式。但從業者都清楚，大模型的開發和運行都需要消耗大量的成本，從而ToB的商業模式更容易良性運轉。在商業化探索上，ToB還是ToC，一直是行業關注的問題。在閉門會中，我們反复聽到了兩個關鍵詞：1）基因2）越界。 “你無法成為你所不是的”。

17、我們認為機會還是在tob垂直模型，核心點在數據和場景本身，這是最核心的。

18、我們自己也在思考，人工智能如何跟互聯網、數字化等結合起來，怎麼更好地將原來的場景做得更智能。

19、ToC還是ToB，坦率講這跟大家的基因有關。我們做不到，不代表別人做不到。比如一些ToC的應用，都是一些00後10後的小朋友在玩，超出了我們年齡的認知。

20、Toc和Tob還是很不一樣的。 ToC對容錯率相對較高。 TOB則相反。舉個例子，智能問答。準確率如何保證？像政府，都是有紅線的。如何避免模型的幻覺，目前大家都在做相應的探索。

21、我們反而認為ToC賺錢比較容易。 ToB有個問題，一個項目的歷程時間比較長。客戶批預算，再到立項，再到實施，錢的周期是很長的。

22、我覺得現在是機會太多，不要把資源分到你所不是的地方，做戰略選擇，這個很重要。

ToB 和ToG 也很苦

23、B端最大的bug在於，最後做成了高級的人力外包。

24、所有的項目都是有周期的，所有的付款也是根據周期的節點來走的。不可能我無限制地幫你訓練和優化一個模型。

25、AIGC創作這種，包容性比較強，可以有些錯誤。但到一些企業生產製造，對準確性的要求就很高了。往往我們從模型中挑一兩個比較好case是比較容易的，但要它維持在較高的水平里面，沒有比較差的case，這個還是蠻難的。

26、我們在一個經濟發達的省份去做智能數字化政府項目的時候，我們推了超過5個場景，最後客戶就認可了3個場景。接著，就對安全、對數據、對底層刨根問底。接著還會問，你們跟其他大模型的差異和優勢是什麼？最後，多方要坐下來，出一個評測體系。評測體系過了還要評性能。

用項目孵化產品和方案

27、用項目孵化產品，做完幾個項目後，抽離出相應的技術方案。這套方案，大概率不是一個模型，而是大模型+小模型，最後是多個模型形成的綜合解決方案。

28、最近一兩年，可能是做創新、做產品的過程，現金的回收週期會相對長一些。

Agent

想像一下人工智能模仿人類的日常任務來處理大量人類的複雜社會行為。斯坦福大學的一篇名為《Generative Agents: Interactive Simulacra of Human Behavior,titled》的論文深入研究了記憶、反應和計劃的AI Agent。 AI Agent 被認為是OpenAI 發力的下一個方向。 OpenAI 聯合創始人在近期的活動上也說：“相比模型訓練方法，OpenAI內部目前更關注Agent領域的變化，每當有新的AI Agents 論文出來的時候，內部都會很興奮並且認真地討論” 。

29、我們總會把大模型想像成萬能的，它能解決各種各樣的問題？事實是這樣的麼？大模型只是大模型。

30、我們內部管AI，叫隱形的AI。在用戶面前，我們不會強調是什麼模型，參數有多少。我們對AI的定義，就是人的輔助。

31、繞開模型，繞開算力，可能接下來的機會就是Agent。

32、目前影響客戶使用的最大的問題：投入產出比。一旦跟客戶聊到最後，談到項目預算的時候，如果只是純文字相關，投入大幾百萬小幾百萬，客戶就不太滿意。另外，如果大模型使用AI agent 嵌入到實際的生產環境中，解決實際的問題，客戶會非常願意買單。

33、在大模型基礎上，AI Agent具備記憶、規劃和執行等能力，能力加強。我們這期投了60多個初創項目，其中20多個都是Agent。

34、中國和國外，ToC的產品，付費形態和產品形態，差別也特別大。近期，我們投了一些Agent的公司。

35、但是，現階段AI Agent只是處於新的嘗試階段，距離通用智能還有一定差距。未來還需要解決單個AI Agent綜合能力之外，多個AI Agent之間協作及情感(Emotion)等方面能力表現的突破。

36、大模型玩家，要保證自己能留在牌桌上，才有機會看到下半場新的東西出來。

(完)

資訊來源：由0x資訊編譯自8BTC。版權歸作者所有，未經許可，不得轉載

太捲了關於大模型和AIGC的36條筆記和真話

機構資金流向何方？揭示本輪潛在「山寨季」的五大黃金賽道

種植花園的寧靜與突變效應

Cardano還是Nexchain？ Nexchain在Wewake準備加密貨幣預售時通過空投活動展示實力

樂觀（OP）突破$0.70阻力，XP救贖上線後瞄準新高點

Avalanche吸引了投資者的關注，Lightchain AI在7月的發布悄然引人注目

rlusd被評為最安全的穩定幣，力壓USDT

加密貨幣市場的亮點：盈利最高的參與者、趨勢與關鍵事件分析

以太坊3600美元：潛藏的清算遊戲與市場波動的博弈

太捲了關於大模型和AIGC的36條筆記和真話

Related Posts