原文來源:字母榜
作者:趙晉傑
圖片來源:由無界AI生成
從事大模型開發的國內創業家李鵬,最近切身感受了一把AI晶片產業的瘋狂。
今年4月份,李鵬以單一近8萬元的價格,下單了上千英偉達A800晶片,10月中旬收到貨後,隨即迎來美國對高性能AI晶片的進一步限制。國內A800晶片價格應聲上漲,至10月20日,其單一價格已漲至約30萬元。這意味著,李鵬手裡這批A800晶片,浮盈已經破億元。
英偉達晶片價格暴漲的背後,離不開美國商務部工業與安全局(BIS)推出的AI晶片出口管制新規定。美東時間10月17日,BIS在去年10月對AI晶片頻寬速度做出限制的基礎上,正式公佈了將性能密度作為限制新標準的相關要求,並提供了30天緩衝期。
在新規影響下,英偉達原本針對中國市場推出的A100/H100的定製版晶片A800/H800,因為超標也將被全面禁售。
除此之外,BIS也希望藉助晶片效能密度的新限制,防止中國廠商透過Chiplet封裝技術進行多個晶片的拼接,以達到提升晶片整體效能的目的。華為在Mate 60 Pro上回歸的5G晶片,曾一度被外界揣測為是透過Chiplet封裝技術實現了媲美7nm的製程性能。
根據美國商務部長雷蒙多的說法,AI晶片的出口管制規定將至少每年更新一次,以便盡可能封鎖中國取得先進AI晶片的漏洞。
在李鵬見證A800晶片價格暴漲之際,英偉達針對遊戲市場發行的RTX 4090顯示卡,也走上了身價暴漲之路。
作為全球消費級產品界配置最高、性能最強大的顯示卡,RTX 4090因為性能密度超標而被列入禁售名單。受此消息影響,從10月18日開始,國內電商通路的RTX 4090顯示卡一度顯示缺貨,價格更是從原本的15,000元左右,快速飆升至3萬-5萬元。
不過,在美國繼續執行「小院高牆(small yard, high fence)」方針之下,BIS將限制鎖定在了有限範圍內,仍然允許出口用於筆記本、智慧型手機、遊戲應用等消費性應用的晶片,但對於少量高階遊戲晶片則制定了許可通知要求。
英偉達能否順利申請到RTX 4090顯示卡的出口許可,眼下仍有變數。字母榜就此向英偉達在國內的合作商之一七彩虹求證,後者表示暫時還不清楚後續能否繼續售賣RTX 4090顯示卡產品。
但市場已經率先給了Optimism回饋。到10月20日,國內電商通路RTX 4090顯示卡已經很少顯示缺貨狀態,價格也回落到2萬-3萬元。
相比有可能「虛驚一場」的RTX 4090顯示卡被禁風波,英偉達A800/H800晶片被禁,幾乎已是板上釘釘的事實。
在回應美國升級對中國AI晶片監管措施的影響時,英偉達在公告中提到,“考慮到全球對英偉達產品需求強勁,預計不會對財務業績產生短期有意義的影響。”
但長期來看,中國市場的缺失,將對英偉達造成無可避免的衝擊。在今年第二季財報會上,英偉達CEO黃仁勳就曾對此表態,認為一旦長期向中國銷售資料中心GPU的禁令實施,將導致英偉達產業失去在全球最大市場之一競爭和領先的機會。
將要遭遇長期陣痛的不只英偉達。對一眾國內大模型廠商而言,英偉達晶片的斷供,或將成為其追趕ChatGPT乃至GPT-4的最大阻力。
儘管有部分聲音認為巨型人工智慧模型的時代正在走向終結,但在OpenAI CEO奧特曼看來,模型性能的縮放法則(scaling laws)仍然有效,增加模型的大小將繼續提高性能,奧特曼甚至提出了晶片需求每三、四個月就要翻倍的大模型時代「摩爾定律」。
根據DeepMind共同創辦人、現Inflection AI CEO穆斯塔法・蘇萊曼爆料,OpenAI正在秘密訓練的GPT-5,其所需英偉達晶片數量預估在30000—50000個H100。
即使國內大廠如阿里、騰訊、百度等都表態稱在新規出台之前,已經提前採購了一批晶片且部署到位,但面對仍在大模型技術上持續迭代中的OpenAI,不想在大模型競爭中落後的國內大廠,其晶片儲備是否足夠應付未來的競爭,仍是個問題。
8月份,百度、騰訊、阿里、位元組被爆出向英偉達下了一筆累計達10億美元的交付訂單,總共採購約10萬個A800晶片,明年交付的AI晶片價值更是達到40億美元。明年的訂單大機率已經沒有指望,即便年內的10萬個A800晶片順利交付,分攤下來每家大廠的份額也只有2.5萬個,遠不足以支撐它們跟上GPT-5的腳步。
而從BIS預留給英偉達的30天緩衝期來看,也切斷了國內大廠趕在禁令生效前搶購一波的幻想。
根據CoreWeave聯合創辦人兼CTO Brian Venturo說法,今年一季度,取得英偉達GPU還相對容易,但從4月開始,市場忽然變得異常緊張,交貨時間已經需要排到2024年第一季甚至第二季。
字母榜向李鵬求證,上述交貨時間得到驗證,據其透露,向英偉達發出訂單需求後,要等待六七個月才能拿到貨。
更糟糕的情況還在於,英偉達也將繼續在「黃氏定律」指導下,每六個月推出一款新AI晶片,屆時,連定製版都無法取得的國內大廠,在硬體配置上與美國競爭對手的差距可能越拉越大。
一旦英偉達晶片全面斷供成真,留給大廠的替代方案或許只剩下更換國產GPU廠商這一條路。
近期三季財報發表會上,科大訊飛副總裁江濤就對此表示,訊飛星火大模型不受英偉達晶片斷供影響,其採用的華為昇騰910B能力已經基本做到可對標英偉達A100。
但頭部雲廠商大模型研發工程師吳偉告訴字母榜,從單一晶片來看,部分國內GPU晶片或許已經可以媲美A800乃至A100,但在多卡串聯的平行運算環節,仍然存在較大差距。
微軟大中華區Azure事業部總經理陶然同樣秉持這樣的觀點,認為很多廠商沒有能力去實現多卡連接,但多卡並行運算卻直接決定著大模型訓練所需花費的時間成本,「同樣的一套模型,如果訓練一次需要花費一周成本為100萬美元,但如果頻寬太小最終耗時兩週,那麼成本就將乘以2。”
在崇尚效率的大模型賽道,時間有時比金錢更重要。使用大廠自研晶片,同樣有類似的費效比問題。
在實際應用中,根據吳偉介紹,大廠自研晶片更多被用來執行推理任務,即在由英偉達晶片訓練好的大模型上,大廠借助自研芯片,保證大模型的日常運作。
即便是在更換國產GPU的過程中,大廠眼下也面臨無法使用更先進製程製程晶片的挑戰。 BIS已經將壁仞、摩爾線程等國產GPU公司列入實體清單,這意味著在沒有獲得許可情況下,它們既不能進口含有美國公司的任何技術或產品,也不能透過台積電等代工廠生產14nm以下的先進晶片。
另一個不容忽視的影響是,更先進晶片往往還會透過不斷的技術迭代,幫助降低大模型的運作成本。黃仁勳就曾表示,“H100可以將大語言模型的處理成本降低一個數量級。”
一旦大模型訓練成本變得更低,客戶呼叫大模型API介面的價格也將變得更便宜。屆時,國內大廠不僅要面對晶片效能落後的現實,還將承擔起比海外競爭對手更高昂的大模型運作成本。
國內大廠並非英偉達晶片斷供風波中受影響最大的一方。相較於大廠借助充沛資金提前儲備晶片的舉措,國內大模型創業家所要迎接的震盪,將更為劇烈。其中,又以研發通用大模型的創業者受衝擊更重。
近期,部分立志做通用大模型的創業公司,紛紛宣布融資消息:百川智能宣布完成3億美元新融資;智譜AI宣布完成超25億元累計融資。但眼下,這些原本可能用來購買英偉達晶片的融資款,一時間沒了用武之地。
即便是那些盯著垂直領域研發產業大模型的新創公司,也同樣會受到波及。根據李鵬介紹,部分參數量維持在數十億等級的產業大模型,理論上購買大廠雲資源就足以滿足需求。但對於想做出極致體驗的新創公司來說,穩定的算力仍是不可或缺的條件。購買大廠雲端資源,很可能遭遇公司算力需求擴大而對方無法及時支援的情況。
但相較於大廠,大模型新創公司在更換到國產GPU的過程中,除了需要付出更多時間成本的代價外,還可能因為在演算法方面的短板,人為製造出更大的追趕差距。
在人工智慧專家丁磊博士看來,相比耗時一個月還是三個月訓練好大模型,更大的挑戰在於當前部分大模型創業公司「還不是那麼會訓練大模型……如果訓練方法錯的話,你有再多的GPU也沒用。”
在模型層創業之外,基於大模型的應用層創業也可能因為美國政府新的製裁措施,影響業務發展。
根據媒體爆料,美國政府也考慮限制向中國AI公司出租雲端服務,以堵住這些公司透過租賃微軟雲端的方式,從而規避先進製程晶片的出口禁令。
在國內一眾大模型廠商業務遭遇衝擊或挑戰之際,作為風暴中心的英偉達,同樣難逃損失。
在美國政府傳出將對半導體技術實施新的出口限制,進一步限制中國市場獲取A800和H800時,黃仁勳曾在7月接受採訪中表示,「如果我們被剝奪了中國市場,我們沒有應急措施。因為世界上沒有其他中國,只有一個中國。”
2022年,中國市場的營收占到英偉達的約四成。美國半導體產業協會數據更是顯示,2022年,中國半導體採購額為1,800億美元,佔全球半導體採購總額5,559億美元的三分之一以上,是最大的全球單一市場。
為了盡可能挽回損失,黃仁勳一度嘗試遊說美國政府改變策略。今年7月份,黃仁勳曾連同英特爾CEO基辛格、高通CEO阿蒙與美國政府官員在華盛頓舉行會談。這些晶片巨頭們希望美國政府應該進一步評估「限制對華半導體出口」的影響,認為出口管制將有損於美國在半導體產業的領導地位,希望停止實施新的對華限制。
黃仁勳更直言,「限制英偉達在華晶片銷售,只會給其他品牌提供機會。」在黃仁勳看來,中國佔據了美國科技產業約三分之一的市場,令其作為半導體零件來源地和產品終端市場的地位無可取代,退出中國市場不是可行選項。
儘管這場遊說活動在某種程度上推遲了美國政府對華晶片出口新規的出台時間,但最終卻未能徹底讓美國政府改變心意。
待30天公告期結束,留給黃仁勳的挑戰之一,將是如何解決晶片重回中國市場的問題。
考慮到去年10月美國政府頒佈出口禁令後,英偉達迅速調整了晶片頻寬速度,及時發布了符合禁令規定的定製版晶片A800。 Spear Invest創辦人Ivana Delevska認為:「隨著時間的推移,會出現某種與此類似的解決方案,而不是完全禁止它們。」即英偉達或許會再次透過微調其晶片來滿足新的禁令要求,從而緩和這項AI晶片禁令帶來的營收下滑等一系列影響。
受新規影響,英偉達股價已從10月17日的446美元,一路下跌至10月20日的414美元,總市值三天內暴跌769億美元(約合人民幣5,600億元)。
不過,一旦在A800/H800的基礎上再次進行性能閹割,屆時英偉達推出的AI芯片,在中國市場是否還具備相當程度的競爭力,就要看“皮衣刀客”黃仁勳的刀法,這次精不精準了。
資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載