誰是中國AI第一城?不要只盯著“大模型”,這兩項能力也很關鍵


來源:城市戰爭

作者:孫不熟團隊

01、誰是中國AI第一城?北京說第二,沒人敢說第一

致力於“換道超車”的中國經濟,AI是一個無法迴避、不容丟失的賽道。在這樣一個新賽道,需要有先行者帶路。

從經濟史來看,中心城市是歷次產業革命的發起者與引領者。

正如北京孕育了中國的互聯網產業,廣深引領了中國消費電子的爆發,杭州推動了中國電子商務的普及,上海開啟了中國半導體發展的序幕。

而今,隨著AI時代的臨近,誰又會成最醒目的引領者呢?

我最看好的無疑是北京,而且是獨占鰲頭的領先地位。

首先是人才優勢,北京是中國學歷最高的城市,匯聚全國最頂級的大學,共有90多所知名高校、1000多家科研院所、120個國家重點實驗室。

數據還顯示,全國60%的人工智能人才聚集在北京。

人工智能是典型的知識經濟,人才是第一生產要素,背靠如此巨大的人才礦池,這是北京建設“中國AI第一城”的最大底氣。

其次是產業鏈優勢。

根據近日發布的《北京人工智能產業發展白皮書》,全國4000多家人工智能企業中,北京一個城市佔了1070家,佔比26%;全國獲得風險投資的人工智能公司合計1237家,北京佔比35%。

全國范圍內,獲批建設新一代人工智能開放創新平台的企業一共有24家,其中有10家在北京;人工智能專利授權數全球前100名的機構,其中又有30家,總部也在北京。

可見,中國AI產業,幾乎半壁在北京。

在此背景下,有志於在AI時代分一杯羹的科技大廠們,紛紛把精銳力量押注在北京。

僅在大模型領域,就有百度文心、京東言犀、阿里通義、360智腦、網易玉言等一連串星光熠熠的大廠,扎堆在北京佈局。

北京的大模型有多厲害?

根據科技部發布的《中國人工智能大模型地圖研究報告》,目前中國10億參數規模以上的大模型已發布79個,主要中心化在北京、廣東兩地,其中北京獨占38個。

02、搞AI,僅靠大模型是不夠的

當然,搞AI,僅靠成交量大模型是不夠的

對AI來說,大模型像是冰山浮在水面上的部分,很直觀,很可感。但其實,冰山在水下的部分可能更加重要。

AI的本質,是算法、算力和數據。大模型其實是一種算法,沒有好的數據、沒有強大的算力,就不可能支撐優秀的算法。而隨著越來越多對AI的攻擊,乃至新起的AI詐騙,人們也日益意識到,安全能力也成為AI應用必須解決的問題。

歸根結底,大模型本身並不是AI算法發展的唯一路徑,只是隨著ChatGPT的火爆,通用大模型突然出現重大進展,才成為AI算法的新主流。但在通用大模型之外,那些支撐AI的基礎能力,對AI產業的發展同樣關鍵。

現在,社會對“算力”的認知已經很充分,無論從硬件層面的半導體芯片,還是從系統層面的雲計算,都在AI興起之後受到了更大程度的社會關注。

外界比較容易忽略的是數據和安全,但其實,這兩項能力同樣很關鍵。

AI本質上是由數據驅動的,大模型可以說是數據“餵養”出來的。沒有優質數據,就不可能有好用的大模型。例如,ChatGPT在中文能力上就有著明顯的短板,一個重要原因就是缺少充足的中文數據。

無論什麼AI,最底層的東西都是數據,而對數據的存儲、搜索、增減,所有這些操作,都離不開數據庫。

現實社會的每個角落、每時每刻,都會產生海量數據,小到購物車裡的選品與消費記錄,大到金融機構的存款記錄與資金運轉,都需要一個強大、可靠的數據庫來支撐。

如果數據庫掉鍊子,後果不堪設想。但是這個領域,中國長期是被別人“卡脖子”的。

如果把操作系統比喻成人類大腦的“控制系統”,那數據庫就相當於人類大腦中的記憶系統,如果沒有“記憶系統”,人類文明將不復存在。

在PC時代,全世界最好的數據庫系統曾經是美國的甲骨文(Oracle)。這家企業曾在中國的市場佔用率極高,相當長的一段時間裡,包括各大金融機構使用的數據庫,都來自Oracle。

彼時,大型企業的IT系統標配叫“IOE”,指的就是是IBM生產的小型機,以及EMC生產的存儲硬件。

長期以來,“IOE”就像是懸掛在中國企業尤其是金融行業頭上的一把達摩克利斯之劍,讓人憂心忡忡。

尤其是在全球貿易摩擦的新時期,“科技脫鉤”的情況時有發生,國內企業對數據庫自主可控的要求越來越高。

這些年來,大量中國企業都在致力於解決國產數據庫卡脖子的問題。而北京,正是數據庫產業的重鎮,在實現數據庫國產替代的過程中發揮了關鍵作用。

2020年,螞蟻集團旗下的國產分佈式數據庫OceanBase總部落地北京,正是北京數據庫產業發展的一個縮影。

OceanBase有多厲害? 2019年,在被譽為“數據庫世界杯”的TPC-C基準測試中,OceanBase便打破了由美國企業Oracle保持了9年之久的世界記錄,成為首個登頂該榜單的中國數據庫產品。

OceanBase的誕生,最初是源於淘寶和支付寶的需求。彼時,隨著阿里電商業務的發展,傳統的IOE系統,越來越難以滿足阿里超大規模的數據處理需求。在此背景下,阿里率先喊出“去IOE”,開始發展雲計算,建設自研的分佈式數據庫。

從2010年開始,阿里和螞蟻的數據庫需求開始逐漸遷移到自研數據庫OceanBase上。最終,OceanBase完全替代了Oracle的數據庫,並經受住了“雙11”等最嚴苛場景的檢驗。

2019年,OceanBase打破數據庫基準性能測試的世界記錄,成績是前世界記錄保持者、老牌巨頭甲骨文(Oracle)的兩倍。
從2017年開始,OceanBase對外部客戶開放。基於它在高效能和安全性等方面的良好表現,OceanBase贏得了大量客戶的青睞。

OceanBase特別的吸引力還在於:它是100%自主研發的企業級原生分佈式數據庫,不基於任何開源數據庫軟件進行二次盤點和研發,真正做到100%自主研發,對每一行代碼可控,這一點對金融機構的吸引力巨大。

數據顯示,全國TOP200的頭部金融機構中,有1/4都將OceanBase作為核心系統升級的首選。

在金融機構之外,OceanBase還深入到各行各業,為海底撈、理想等企業提供數據庫服務。目前,來自非金融類客戶的營收佔比已達到OceanBase總營收的35%。在金融級場景裡形成的數據庫能力,正在加速應用到更多領域。

可以說,因為OceanBase等國產數據庫的努力,中國不僅解決了數據庫被“卡脖子”的問題,還開拓出數據庫等數據技術服務實體經濟的嶄新空間。

在這一進程中,北京丰富的創新資源、豐厚的人才儲備,無疑在前沿科技攻堅中具有重大戰略意義。 OceanBase的母公司螞蟻,總部在杭州,但OceanBase最終卻選擇落地北京,就表明北京對創新資源的集聚效應。

03、AI應用,還需要哪些前提?安全與隱私保護

大模型讓人們看到了AI的強大能力,但AI要真正成為生產力工具,還需要走進千行百業,進入到更多的垂直場景。

實際上,AI的行業應用是有門檻的,它需要解決許多問題,比如安全性。

譬如,近年來隨著語音識別、計算機視覺等技術的普及,AI類詐騙案件越來越多,引起社會公眾的警惕。

一些“AI騙子”可能騙不過人工,但卻可能騙過AI。所以進入產業級應用的AI產品,必須解決這個問題。而相應的解決方案,業內稱之為“可信AI”。

“可信AI”技術是怎麼發展起來的呢,其實也需要海量的應用場景。從2017年開始,支付寶就已全面啟動人工智能風控防禦策略。目前,螞蟻集團的可信AI技術已在反欺詐、反洗錢、反博彩、企業聯合風控、數據隱私保護在內的多個風控場景下落地。

根據2023年6月全球專利權威機構IPR Daily發布的報告,螞蟻集團目前擁有全球範圍內數量最多的“AI安全可信關鍵技術”專利。在這個基礎上,可信AI不再是理論和暢想,螞蟻集團已逐步完善和落地了以“IMAGE”命名的下一代風控體系,並正式上線部署。

螞蟻集團的安全科技團隊,也在北京有佈局。事實上,因為螞蟻等公司在可信AI領域的投入,北京已經成為這一產業的重鎮。

AI的產業應用,還需要解決隱私保護的問題。

比如要用大模型來做智慧醫療有關的計算,就需要病人的病歷數據。但病歷數據本質上是個人隱私,不能洩露,這就需要“隱私計算”技術。在這種技術的應用場景裡,數據可用但不可見。而在螞蟻內部,隱私計算的團隊也有很多人在北京,北京在這一細分技術領域的實力同樣不可小覷。

8月24日,北京海淀區和螞蟻集團簽署了戰略合作協議。根據協議,螞蟻的創新科技總部將落地海淀。

據螞蟻方面透露,創新科技總部,將覆蓋安全科技、移動科技、SaaS服務(軟件即服務)等多個領域,還將設置數字科技研發中心和螞蟻技術研究院。螞蟻在可信AI、隱私計算等領域,開展了大量基礎和前沿技術研究,而創新科技總部的設立,將使螞蟻更好整合在京技術資源。

這既是螞蟻在關鍵技術領域加碼在京投入的鮮明信號,也從側面驗證了北京在數據科技領域的絕對實力。

04、算法、數據、算力、安全,全都很牛,北京是AI產業的“全能選手”

兵馬未動、糧草先行。

AI時代,大模型是沖在前面的一支“兵馬”,算力、數據、安全這些看不見的能力,則相當於藏在後院的“糧草”。

一個城市若想成為“AI之城”,就不能只是跟熱點,趕時髦,而需要從算法、算力、數據、安全等多維度、全方位努力,才能實現由點到面的產業突破。

我之所以看好北京這座城市在AI時代的引領意義,正在於它在眾多底層技術上的深厚增持與全面開花。

說到算力,無論是阿里雲、華為雲、騰訊雲,還是三大運營商的雲,在北京都早有佈局。

說到數據,北京從上世紀八十年代中關村興起以來,就是中國數據科技發展的中心,現在又有OceanBase等國產數據庫密集佈局。

說到安全,螞蟻、360、字節……不少互聯網公司都在北京佈局了相關的技術板塊。

從這個意義上說,北京在AI相關的底層技術上是個“全能選手”,它不僅在大模型這個算法領域很強,在相關的基礎技術上也幾乎沒有短板。

人類新一輪的科技奇點,已經漸行漸近,量子糾纏、可控核聚變、常溫超導體、大模型等原本屬於學術圈的小眾名詞,已經被大眾熟知。

其中,AI是當前已經看到曙光的領域。不僅是北京,也期待中國的超大特大城市都能到這個賽道成交量起來

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts