中國10億參數規模以上大模型已發布79個,中心化在北京和廣東


來源:澎湃新聞

記者張靜

·據不完全統計,目前中國10億參數規模以上的大模型已發布79個,14個省市/地區都在開展大模型研發,主要中心化在北京和廣東,其中北京38個大模型,廣東20個大模型。中國大模型中,已有半數以上大模型開源,高校/科研機構是開源主力。

·北京、江蘇、廣東、上海等是大模型人才相對較多的地區,為大模型研發提供關鍵智力要素支撐。但人才總量仍然稀缺,大模型具有較高門檻,需要高素質AI人才,目前各地大模型人才數量均不充足。

圖片來源:由無界AI工俱生成

中國10億參數規模以上的大模型已發布79個,主要中心化在北京和廣東。

5月28日,在2023中關村論壇平行論壇之一的人工智能大模型發展論壇上,中國科學技術信息研究所所長趙志耘發布《中國人工智能大模型地圖研究報告》,目前中國10億參數規模以上的大模型已發布79個,主要中心化在北京和廣東,其中北京38個大模型,廣東20個大模型。中國大模型中,已有半數以上大模型開源,高校/科研機構是開源主力。

2017年谷歌發布的Transformer網絡結構是大模型發展的源頭技術,自此以後大模型技術在自然語言理解、計算機視覺、智能語音等方面都取得了標誌性的技術突破,在模型精度、通用性和泛化能力等方面都實現了跨越式發展。 ChatGPT又進一步激發了語言大模型爆發式湧現,也吸引了大量研發團隊投入到通用視覺、多模態等更多大模型研發方向。趙志耘表示,僅用5年多時間,大模型技術已形成龐大技術群,衍生出涵蓋各種參數規模、各種技術架構、各種模態、各種場景的大模型家族。

從全球大模型發展態勢來看,美國谷歌、OpenAI等機構不斷引領大模型技術前沿,歐洲、俄羅斯、以色列等越來越多的研發團隊也在投入到大模型的研發中。從全球已發布的大模型分佈來看,中國和美國大幅領先,超過全球總數的80%,美國在大模型數量方面始終居全球最高,中國從2020年進入大模型快速發展期,目前與美國保持同步增長態勢。

在中國大模型的發展態勢中,趙志耘表示,據不完全統計,到目前為止中國10億參數規模以上的大模型已發布79個,14個省市/地區都在開展大模型研發,主要中心化在北京和廣東,其中北京38個大模型,廣東20個大模型。在模型領域分佈上,自然語言處理仍是目前大模型研發最活躍的重點領域,其次是多模態領域,在計算機視覺和智能語音等領域的大模型還較少。在研發主體分佈上,大學、科研機構、企業等不同創新主體都在參與大模型研發,學術界和產業界之間的聯合研發仍不足。 “今年以來大模型有著快速發展的態勢,但我們同時也觀察到了合作收縮的趨勢,接下來需要注意。”

與此同時,算力-模型匹配度高,公共算力發展迅速。北京、廣東、浙江、上海等地的大模型數量最多,這四個地方也是近三年人工智能服務器採購數量最高的地區。各地也在通過提供公共算力方式補充快速增長的人工智能算力需求,為大模型研發提供更多算力支持。

人才也是人工智能的重要支柱。北京、江蘇、廣東、上海等是大模型人才相對較多的地區,為大模型研發提供關鍵智力要素支撐。但人才總量仍然稀缺,大模型具有較高門檻,需要高素質AI人才,目前各地大模型人才數量均不充足。

“通過大模型的論文發布,我們可以看到中國大模型的學術影響力正在逐步形成。從區域影響力來看,北京、廣東、上海三地無論是論文數量還是論文引用量都在國內最高。”趙志耘表示,清華大學與阿里和百度聯合開發的CogView模型論文引用數最高。但與國外領先大模型的學術影響力相比差距仍然較大。

從開源創新生態上看,中國大模型中,已有半數以上大模型開源,北京、廣東、上海三地開源數量和開源影響力均居國內前三。高校/科研機構是開源主力,“清華大學的ChatGLM-6B、復旦大學的MOSS以及百度的文心系列大模型開源影響力最高。”趙志耘表示。

中國大模型的產業化應用沿著兩條路徑發展,第一種是通用類大模型持續拓展應用領域,文心一言、通義千問、紫東太初、星火認知等中國一批通用化大模型正在快速發展,打造跨行業通用化人工智能能力平台,其應用行業正在從辦公、生活、娛樂向醫療、工業、教育等加速滲透。第二種是垂直領域專業類大模型不斷深化落地,一批針對生物醫藥、遙感氣象等垂直領域的專業大模型發揮其領域縱深優勢,提供針對特定業務場景的高質量專業化解決方案。

倡導加強資源和研發力量的統籌,促進大模型有序發展。

針對大模型發展的不足,趙志耘提出4點建議與展望:

一是加強資源和研發力量的統籌,促進大模型有序發展。通過加強智算中心、超算中心、雲計算中心等計算資源的統籌,制定公共數據共享目錄和共享規則,推動數據分級分類有序開放。

二是加快基礎研究和技術創新,提升學術和開源影響力。大模型技術仍處於發展初期,潛在的基礎理論和技術創新空間巨大。通過蒸餾、量化等小型化技術實現模型“瘦身”,為大模型小型化、綠色化發展提供技術支撐。進一步加強產學研合作,鼓勵大模型開源開放,也將加速大模型技術進步。

三是強化大模型發展中的場景牽引作用,打造大模型標杆項目。以行業專有訓練數據集為基礎,打造金融、醫療、電力等領域的專業大模型,在特定業務場景實現高質量應用突破,也希望通過應用場景和應用數據反向促進大模型技術迭代升級。

四是強化國際合作,積極參與全球人工智能治理。以負責任的態度共同推動大模型的治理,希望人工智能的治理原則和倫理規範能夠進一步在大模型的全鏈條中落地生根。同時在增進共識的基礎上加強人工智能治理的全球合作。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts