來源:澎湃新聞
作者:賀梨萍
原標題:《特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當“鍊主”》
2022年1月24日,商湯科技在上海自貿區臨港新片區佈局的人工智能計算中心AIDC正式啟動運營。當時這家人工智能公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。
“今天,我們的臨港AIDC已經有接近3萬塊的GPU(圖形處理器),我們目前的算力已經達到5000 PetaFLOPS(1 PetaFLOPS等於每秒1千萬億次浮點運算),在這之上我們相信未來可以有更好的開發者效率,並且都能夠支持更多千億規模的大模型算力訓練。”在6月2日的“AI引領時代,算力驅動未來”——臨港新片區智算大會上,商湯科技董事長兼CEO 徐立如是表示。
據澎湃新聞(www.thepaper.cn)記者從商湯方面了解,“目前還有大量的需求在路上排著隊”。而在商湯科技聯合創始人、大裝置事業群總裁楊帆看來,人工智能對於更大數據、更大規模、更大算力的追求並不是“始於今天”,“整個人工智能技術迭代、進步的歷史,我們可以把它看成是一個對於’暴力美學’的追求,以及算法、算力、數據三要素由量變產生質變的一個技術迭代的過程。”
聚焦前沿產業的臨港新片區對這種新的熱潮迅速做出了響應。 6月2日當天,臨港新片區黨工委副書記吳曉華在上述大會上發布了《臨港新片區加快構建算力產業生態行動方案》。該《方案》的藍圖之下,至2025年,臨港將成為具有全國影響力的算力產業集聚區,含相關硬件、軟件、應用、服務等的算力產業總體規模將突破100億元。
臨港新片區黨工委副書記吳曉華髮布《臨港新片區加快構建算力產業生態行動方案》。
“我們看到AI大爆發的時代已經來臨了,AI進入到我們生產和生活的各個領域,那麼隨著AI應用的大爆發,它其實也驅動了算力需求的大爆發。”對於上述《方案》的出台,臨港新片區管委會高科處處長陸瑜對澎湃新聞(www.thepaper.cn)在內的媒體表示,臨港前期已具備了很好的優勢,“就是我們的算力資源非常豐富。”
更為重要的是,在人工智能公司選擇是否落地臨港時,算力資源已經成為尤為重要的決策因素。
算力是新時代的能源,而成功又不僅僅在於“暴力美學”
何謂算力?徐立認為,算力其實是整個模型能力的表達,“算力等於算法或者說大模型的參數,去乘上它所處理的數據量。大模型時代參數越大,乘上的數據量越大,所需要的算力就越大。”算力已然成為新時代的能源,“某種程度上,算力決定了市場的競爭力。”
楊帆也談到,從去年到今年整個人工智能領域非常火的一個概念叫內容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種“暴力美學”,例如,GPT-3模型使用了超過1750億個參數,需要高性能的處理器來支持訓練,使用V100訓練耗卡量為10000張卡訓練14.8天,整體算力需求約625 PetaFLOPS。
楊帆認為,這種“暴力美學”也可以理解為量變產生質變,“其實人工智能從它誕生的第一天起到今天,一直都在追求通過規模化帶來更強的智能化。”他提到,實際上就人工智能領域來說,在過去的5-6年時間裡,業內最頂級的人工智能模型對算力的消耗量,“每4-6個月就要翻一番,也就是說過去的這幾年時間裡翻了近30萬倍。”
當然,“暴力”和“智能”並不是完全成正比,“擁有更大的資源、更大的規模,它僅僅是一個必要而非充分的條件。”楊帆強調,真正在“暴力美學”背後支撐產生重大的技術創新和成果的,恰恰又是在於對每一個環節的持續性的優化和改進。
以數據為例,“GPT-4所用的數據其實只是OpenAI收集到的所有數據的1%,因為他發現當把更多的數據去灌給機器人的時候,有可能反而不那麼聰明,應該把更加有效、更加高價值的數據提供給這個算法,然後才能去創造出一個更加智能大腦。”
其認為,至少在今天,數據的有效性遠比數據的總量更加重要。而如何定義有效的數據,“這其實就需要數據科學家大量的努力,OpenAI其實讓他們最優秀的科學家去做數據了,並非大家覺得的去搞算法了。”
這種每個環節的優化同樣包括算力,在英偉達缺貨的情況下,為什麼沒人在用國產芯片做商業化的大規模訓練?為什麼最新這波浪潮到來後,第一時間錢都被英偉達掙走了?這些問句背後的解釋是,“並不是我們把算力量堆到一個數值就能夠產生最終的價值,1000張卡100台服務器放在一起跑同一個任務,這中間還需要大量的配套軟件、通信網絡,它是一系列軟硬件聯合調優的過程,這樣的工作增持我們過去沒有做,我們今天就需要去補課。”
順勢而為,臨港加快形成多元算力供給體系
據吳曉華介紹,臨港新片區算力產業已在上游軟硬件、中游的數據中心、調度平台,下游應用進行了相應佈局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等於每秒1百億億次浮點運算),其中智能算力佔比近80%,總算力規模約佔上海市近20%。
前述《方案》提出,目標到2025年,新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力佔比達到80%,算力產業總體規模(含相關硬件、軟件、應用、服務等)突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,建設一批算力示範應用標杆場景。
“智能算力也就是當下最為火熱的AI企業所需要的,我們也發現,AI企業落地到臨港來,他們不再是僅僅關注給他他多少政策支持,給他多少補貼,他會關注落地在這邊,能不能解決他的算力需求,因為現在市場上算力是非常緊缺的。”陸瑜提到了這一顯著變化。
據商湯方面介紹,截至今年5月,商湯大裝置已累計服務超40個核心客戶。 “特別是在大模型的浪潮之下,我們現在支撐了10家以上的單位機構在臨港的智能計算中心中去訓練他們的大模型。”楊帆也提及。
成立於2018年的深勢科技是算力需求方之一。該公司核心團隊由中國科學院院士鄂維南等人領銜,是“AI+Science”科學研究範式的先行者,其首創的“多尺度建模+機器學習+高性能計算”範式,突破性地實現了多尺度分子模擬中精度與效率的統一。
據澎湃新聞(www.thepaper.cn)記者此前報導,深勢科技已推出Lebesgue科學計算平台、Hermite藥物設計平台以及Bohrium微觀計算與設計平台等。例如在醫藥領域,深勢科技與多家客戶攜手,將物理建模+AI的計算範式與臨床前藥物研發更廣泛的結合,通過Hermite Uni-FEP、Uni-Fold、RiD等模塊,將自由能微擾理論、分子動力學、增強採樣算法與高性能計算相結合,精準預測蛋白質結構及構象變化,並以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。
去年12月29日,總部位於北京的深勢科技在臨港註冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務副總裁劉會師在接受澎湃新聞(www.thepaper.cn)記者採訪時表示,公司在臨港佈局新一代分子模擬算法研發中心和AI輔助藥物設計業務中心,主要也是因為看到臨港正在大力發展算力,“我們在訓練模型過程中,對算力是有需求的,另外臨港尤其是要大力發展國產化算力,我們也想為這方面添磚加瓦。”
從業務層面來說,“我們在臨港主要是佈局我們的藥物研發業務,包括我們自有管線的研發。”劉會師提到,深勢科技的業務和臨港甚至上海的人工智能、生物醫藥這樣的先導產業有正相關的直接合作關係,“我們願意把我們的研發以及產品納入到臨港的大的生態圈裡來。”
上述《方案》同時提及,臨港新片區也制定了一系列保障措施,包括加強人才保障、完善支持政策、推動開放合作等。據陸瑜介紹,如果AI企業到臨港來,將優先提供臨港的智能算力,同時通過發放算力券等形式,讓企業優惠使用算力,“甚至對重點的AI企業,政府對它的算力成本直接可以給予不超過30%的補貼,這些政策我們都會出來。”
值得關注的是,在此次大會現場,中國電信臨港公共智算服務平台暨國產GPU聯合創新基地也正式發布。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區建設,並將分批次投放4萬個適用於智算、超算的高功率機架。
上海市經濟和信息化委員會副主任湯文侃當天表示,當前,以“網絡為基礎、數據為核心、算力為關鍵、安全為總結”的新一代信息基礎設施已成為建設現代化產業的重要基礎支撐。上海已提出構建“2+(3+6)+(4+5)”的現代化產業架構,這對以算力為代表的新型信息基礎設施建設提出了更高需求。
而就在5月16日,上海市經濟和信息化委員會公佈了通過《上海市數據中心建設導則》符合性評估的數據中心項目名單,共支持了16個項目,其中位於臨港的項目有2個。 “截至目前,我委共支持新片區包括,商湯AIDC、有孚網絡、信息飛魚等8個項目,合計2.8萬個6kW標準機櫃,佔全市已批機櫃數量近1/5。”
湯文侃同時提出建議之一,即利用臨港充沛算力資源構建公共算力服務。 “目前,臨港的商湯AIDC已經接入了公共算力服務平台。在此也希望今天參會的各單位,特別是電信運營商,結合臨港的網絡特點,積極在臨港建設極速算力承載網,助力實現網絡無所不達、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務。”
成立智算產業聯盟,商湯當產業鍊鍊主
基於現有優勢及未來需求,臨港希望構建的是一個上中下游一體化的算力產業聯盟,進行協同式、體系化發展。
陸瑜將臨港的算力供給視作整條產業鏈的“中間一段”,一端為落地到臨港的AI企業提供算力保障,另一端則涉及到對算力來說極為關鍵的“芯片、軟件、系統”,“我們希望有了需求端,也有了這樣一個平台端,那麼我們把計算的芯片企業、軟件企業、系統企業集聚在這裡,讓他們深度地參與到這樣一個系統的建設過程當中。”
楊帆也強調,“今天看到的大模型所有的成績的發展,它既是暴力出奇蹟,通過人工智能三要素的持續規模上漲帶來的技術價值的提升,同時也是基礎的研發能力和系統的工程化能力之間的深度結合,算法優化、數據的整理和選取、平台性算力的優化提供,這三者往往是互相連通的,很難把它變成割裂的環節獨自去做。”
他表示,智能算力產業鏈的重要價值在於,“只有鏈上有更多的企業,大家去促進彼此的交易所思考,更深度地去進行一些合作,才能夠在這樣新的關鍵性的重大技術浪潮中,去做到更好的技術進步和支持。”
大會現場,新片區智算產業聯盟也正式成立,聯通作為聯盟首任輪值理事長單位。據悉,未來聯通將在新片區成立長三角創新研究院,進一步助力新片區智算產業發展。
新片區智算產業聯盟成員代表由智算算力、基礎算力和超算算力中心等算力提供企業,GPU、FPGA、ASIC等算力芯片企業,以及大模型、AI for science等算力需求企業,共計25家企業,以及中國信通院華東分院、西安電子科技大學、電子科技大學共計3所高校與科研院所共同組成,後續將開展資源共享、技術交易所和項目合作。商湯科技則被授予“新片區智算產業鍊鍊主”。
GPU芯片廠商沐曦當天即表示,分別滿足AI推理計算、AI訓練/通用計算、高性能渲染功能的三類GPU產品,應用於AI推理、AI訓練、數據中心、元宇宙、雲遊戲等領域,將賦能各領域轉型發展。
湯文侃也對臨港新片區此次智算產業聯盟的成立寄予厚望,“依托商湯科技這樣的鍊主企業,結合自身優勢,探索產業鏈上下游全要素協同,形成數字經濟新的爆發點。”
在當天的大會現場,有12家企業共同簽署了新片區智算產業上下游企業協同採購協議。陸瑜提到,新片區也將出台協同採購正面清單,“如果企業在建設國產化算力平台的過程當中,購買國產GPU等上游產品,我們就會給予補貼,這樣也是鼓勵上下游企業去更好地合作。”
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載