原文來源:腦極體
圖片來源:由無界AI生成
10月17日,美國加強了面向中國市場的AI晶片禁令。其中明確將性能、密度作為出口管制標準,將單晶片超過300teraflops算力,以及性能密度超過每平方毫米370gigaflops的晶片都納入了禁止出口行列。
雖然在這項禁令下,AMD、英特爾等公司提供的高階AI晶片也受到影響。但由於英偉達在全球AI晶片領域一家獨大,本次禁令涉及A100、H100等主流AI訓練用英偉達GPU,因此這次的晶片禁令也被稱為「英偉達禁令」。
消息一出,立刻引起了AI產業的熱議。但討論多中心化在禁令何時施行,是否有緩衝地帶,具體涉及哪些GPU型號,禁令期限是多久等。這就導致一個顯而易見的宏觀背景被忽略了:自貿易摩擦發生以來,中美經貿關係雖然時有波動,但面向中國的晶片管控卻始終有增無減。尤其是高階AI晶片禁令,在許多爭議中依舊被堅定推行。
至此,AI產業似乎已經必須形成一個基本的共識:拋棄幻想,準備鬥爭。
與其斤斤計較哪些GPU被禁,是否有解禁可能。不如重新審視在晶片鐵幕時代下,中國AI計算究竟何去何從?
本文希望從目前的產業局面出發,和大家一起思考AI計算的前進之路。
目前的局面
首先我們必須了解一個問題,那就是為什麼這次英偉達禁令出台之後,大眾輿論與AI行業的反應都沒有18、19年晶片封鎖剛開始時嚴重。似乎只有在消費級顯示卡RTX 4090是否被禁問題上,引發了遊戲玩家和相關商家的一些爭論。
這背後的宏觀邏輯在於,業界是非常不願意看到高階AI晶片被禁售的,但其實也對這種局面早有預料。一方面是美國對華晶片封鎖推動多年,先前英偉達部分高階GPU已經被禁,產業界的回饋早就從驚愕調整為了泰然處之。加上ChatGPT爆火之後今年全球高階GPU行情陡然看漲,隨之而來的是美國方面屢次表態要推動對華整體性的高階AI晶片禁售。虛虛實實幾個月之後,最後落下一錘也不外如是。
為了因應這次可預見的禁令,同時也有大模型發展的客觀推動,去年年底到今年上半年大量中國科技、金融、汽車等領域的企業中心化囤貨英偉達高端GPU,已經造成了市面上一卡難求的局面。換句話說,對於許多中國中小型科技企業、AI新創公司來說,高階GPU本來就買不到,禁售之後也沒有太多改變。
另一個真實情況是,高階AI晶片並非無法國產化。早在18、19年貿易摩擦開始後,國內AI晶片產業加速發展。這就導致在AI訓練需求上,英偉達高階GPU雖然很難被取代,但並非不可取代。
加上AI晶片並不像手機晶片那樣事關大眾消費者,華為已經在手機晶片上完成了突破。種種跡象合在一起,導致無論是大眾還是行業,都對這次禁令產生了一種坦然,甚至有點見怪不怪的心態。
但必須客觀看到的是,這次禁令絕非對中國AI產業沒有傷害。一方面短期內更換英偉達GPU,無論在晶片產能、生態相容性等議題上都非常困難。且禁令也將直接在AI伺服器等領域,造成大規模使用英偉達產品的廠商傷害。
而更關鍵的問題在於未來,如果禁令長期存在,中國AI運算將逐漸與全球高階晶片脫鉤,那麼可能帶來的長期負面影響是非常複雜的,比如說:
1.英偉達高階GPU代表的AI晶片在更新迭代之後,是否會造成中國AI算力的發展脫節?
2.底層算力出現發展分歧後,中國AI產業是否會在大模型等軟體技術發展中落後?
3.本次AI晶片禁令,已經呈現出大規模封鎖的特徵。這種科技封鎖真的只會停留在AI晶片領域嗎?通用算力、儲存、基礎軟體等數位化基礎能力是否將成為接下來的打擊目標?
總而言之,這次的AI晶片禁令,對中國來說是個有準備的博弈,而非一場奇襲。想要成功度過這一關,也需要將手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長期發展的勝率。
而就目前來看,中國AI計算有三項必須同時發力的「突圍方案」。
方案1:用好「買家」身份
有個簡單的道理,商業市場的行為邏輯是由供需決定的。但在以晶片為代表的中美科技貿易中,我們經常陷入一個思維迷思:認為絕大部分遊戲規則是由美國政府和企業制定的,他們想賣我們就買,他們不想買我們就無奈。
作為全球晶片市場的最大“買家”,中國企業卻沒有話語權,這是非常荒謬的。
事實上,針對中國市場的AI晶片禁令,最直接傷害的就是以英偉達為代表的美國科技巨頭。目前,英偉達AI晶片方面最大市場需求來自中國。先前英偉達CEO黃仁勳就明確表示,「如果被剝奪了中國市場,我們是沒有應急措施的,世界上沒有另一個中國」。
在這種情況下,我們能看到追求商業利益的美國科技公司,與追求政治利益的美國政府之間有著鮮明的矛盾。美國科技企業總是想辦法尋求反對禁令和繞過禁令,例如英偉達就從去年開始推出了應對禁運政策的中國特供版GPU。
中國市場,消化了美國科技企業約三分之一的產能,二者之間的供需紐帶是無法長期割裂的。面對美國愈發明顯的整體性科技封禁,中國市場也應該積極用好「買家」身份,讓自身的行為更具鮮明立場與可預測性。
避免造成一種「賣了就歡迎,不賣只能無奈」的表現和印象。
「買家身分」應該是一種有立場、有力量且會憤怒的身分。
方案2:以雲代卡,算力中心化
在可見的較長時間裡,美國對中國的AI晶片封禁恐怕都只會加強,而這個時機恰好對應上AI大模型發展的關鍵階段。很多業內人士認為,大模型發展雖快,但沒有呈現出先前其他科技風口的快速局面,投資缺錢,計算缺卡是主要原因。
那麼如何解決中國AI產業在禁令之下的算力缺口問題呢?首先的應急方案就是企業加大雲端AI算力的配置與投入,推進以雲端代卡。
事實上,在高階AI晶片可能被禁的大趨勢下,中國幾大公有雲廠商都做出了加強囤積英偉達高階GPU的動作。這一方面是因為雲廠商本身要加大模型投入,開啟MaaS市場,所以對AI算力有直接需求。另一方面也是因為GPU轉化為雲端資源礦池之後可以長期重複使用,對於雲端廠商來說是一個進可攻,退可守的局面。因此,今年上半年一度出現了市面上高階AI晶片全都流向雲端廠商,中小企業一卡難求的局面。
客觀來看,這種高階AI晶片中心化向雲的舉動,對整個中國市場統籌應對AI晶片禁令是有利的,也符合東數西算的戰略思路。
另一個利好雲端AI算力的趨勢在於,隨著大模型參數和使用資料量的不斷加大。在地化的卡礦池訓練已經愈發吃緊。必須在雲端發生的千卡、萬卡訓練成為未來主要的發展方向,因此企業用戶自然會更積極走向雲端。
同時,雲端AI算力不會只停留在囤積英偉達GPU的層面。接下來,國產的自主AI算力駛入雲端是大勢所趨。在相關政策的推動下,雲廠商正在加大自主AI晶片的採購力道。根據IDC數據,2023年上半年中國AI伺服器已經使用了50萬塊自主開發的AI加速器晶片。在自主AI算力的服務化方面,華為雲端已經推出了昇騰AI雲端服務。雲端化與自主化結合的AI算力,將在AI晶片禁令背景下大幅發展。
加上近幾年在東數西算大背景下,各地陸續建立了大量採用自主AI算力的AI運算中心,整體來看中國的雲端AI算力是供給穩定、保障可靠的。
而許多企業依舊傾向於採購本地AI算力。這一方面是因為英偉達GPU市場緊缺,保值性特別好,甚至能作為企業的核心資產。另一方面是因為雲端AI算力往往會有排隊、當機、軟體服務缺失等問題。
如何進一步提升開發者的雲端AI算力使用體驗,是公有雲廠商接下來需要發力的方向。
方案3:讓國產AI算力爆發式成長
面對新一輪AI晶片禁令,中國AI產業最大的底氣是什麼?是多年後的習以為常,還是大量屯卡之後的家有餘糧?都不是。最關鍵的節點在於經過多年發展,中國AI晶片產業已經得到了巨大發展。英偉達的高階GPU確實依舊重要,但已經不是毫無替代選項可言。
根據IDC先前發布的數據,2022年中國AI加速卡出貨量約為109萬張,其中英偉達市場份額達到了85%,華為昇騰實市場佔有率10%,百度崑崙為2%,寒武紀和燧原科技均為1%。
從中可以看出,國產AI算力已經實現了一定程度的市場佔比,而不僅僅是概念與理論中的「紙上談兵」。同時也應該看到,國產AI晶片在核心效能、軟體生態以及出貨能力上依舊不理想,還有很長的路要走。在英偉達禁令的客觀條件倒逼下,國產AI算力必須在短期內跨越這些困難,加速自身的成長與成熟週期。
為了實現這個目標,有幾件事非常重要:
1.形成產業共識,避免概念混淆。
提起AI晶片,我們常說它有非常多的實現方式,有很多自主品牌參與這個市場,看起來一片繁榮。例如AI晶片有GPU、FPGA、ASIC、存算一體和類腦晶片等,國產AI加速晶片廠商有阿里、百度、華為、寒武紀、海光資訊、燧原科技、天數智芯、壁仞科技、摩爾線程、龍芯中科等。
這種「繁榮」的表述,不僅在大眾輿論與投資市場上具有迷惑性,也常出現在一些產業報告與政策分析當中。但其中蘊藏的問題在於,普遍過度拓展了AI晶片的定義。比如說,類腦晶片在可見的未來都只是技術暢想,如果每次討論國產AI晶片都把類腦加上,那隻會浪費時間,去中心化精力。再比如,有些AI晶片廠商只能做自用晶片,無法面向市場出貨。有些廠商目前還不具備商業化能力,處在早期建設階段,他們短期內對於AI計算自主化的貢獻也就非常小。
為了因應英偉達高階GPU禁售問題,我們需要把目光中心化在可行、有效的GPU替代品上,而不是進行過多聯想和發散。只有形成了這項產業共識,才能聚集力量解決問題。
2.走向規模化商用,避免PPT造芯。
事實上,無論從AI加速晶片或伺服器整機來看,國內目前能夠出貨的AI晶片廠商都寥寥無幾。主要中心化在華為、百度兩家,燧原科技、海光資訊也有一定的出貨。而大量半導體廠商與AI企業,更多仍停留在打造晶片的計畫與願景。這導致大量受到政策支持與投資市場期待的國產AI晶片停滯不前,甚至有停留在這一階段享受金融市場紅利的嫌疑。
接下來的產業導向,應該從AI晶片的立項走向出貨,幫助AI晶片廠商獲得直接的商業回饋,產品與產能接受市場檢驗,逐步塑造正向的現金流。
3.加強軟體生態,強化遷移能力。
英偉達GPU之所以重要,不僅在於硬體效能,更在以CUDA、PyTorch為核心的軟體生態能力,因此發展國產AI晶片絕不能低估軟體的能力。在強化自主軟體生態建置的同時,也要重視基於英偉達生態打造AI模式的遷移能力與遷移成本。
為此,已經有大量廠商進行了探索,例如海光資訊的DCU,就在生態、程式環境等方面與CUDA高度相似,CUDA用戶可以以較低代價快速遷移至海光的ROCm平台。而在此前,PyTorch2.1 版本宣布支援華為昇騰。可見國產AI晶片已經具備了一定的規模化影響力,可以更融入全球軟體生態當中。
未來想要實現國產AI計算的爆發,是無法離開國產AI基礎軟體生態爆發的。
4.加大對「主品牌」支持,形成規模化效應。
對於美國AI晶片,除了英偉達GPU,你還知道哪些?這個問題即使是問一些AI開發者,答案也很大程度是不清楚,或是沒試過。從中可見,AI計算就像通用計算、圖形計算一樣,極大機率是會最終出現一到兩個「主品牌」的。這屬於客觀的市場規律,沒有必要以揠苗助長的方式實現「百花齊放」的局面。
甚至就目前中國AI運算必須加速成熟,完成自主化替代的目標來說,盡快實現超多強的局面是件好事。這可以避免生態割裂,避免產業在搖擺形成大量IT投資浪費。這個過程理應交給市場選擇,慢慢成形。但在晶片禁令的大背景下,國產AI運算崛起已經時不時待,與其讓100種AI晶片慢慢成熟,慢慢洗牌,例如加速形成「主品牌」快速替代的局面。
而從目前局面來看,昇騰是最有可能成為國產AI算力主品牌的一股力量。科大訊飛創辦人、董事長劉慶峰先前表示,華為GPU已經對標英偉達A100。根據數據顯示,昇騰310整數精度算力達到了16TOPS,昇騰910整數精度算力達到640TOPS。這意味著昇騰910性能已經接近英偉達A100。
同時,昇騰也是目前唯一穩定佔據市場份額的國產AI算力,並且在軟體上孵化了類似英偉達CUDA的異構運算架構CANN和AI運算架構MindSpore。在核心效能、軟體生態與市場佔有率三項指標來看,昇騰都已經具備了可以加速成長,實現AI算力大規模國產化替代的可行性。
規範產業標準,強化軟體建設,提升自主品牌支持,是短期內推動國產AI算力快速成長的主要途徑。
英偉達禁令,是一個中國AI產業普遍不願意看到,盡量避免,甚至到今天也有些諱莫如深的問題。但情勢比人強,在不斷加速的逆全球化進程與AI競賽中,類似禁令未來大機率只多不少。
逃避、迂迴、噤若寒蟬,都無法解決問題,只有坦然應對,奮力自強,才能從根本上解決受制於人的問題。
禁令之下,中國AI計算何去何從?
答案是我們已別無選擇,所以要給世界第二個選擇。
資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載