文章來源: 鈦媒體AGI
圖片來源:由無界AI生成
近期,百度創辦人、董事長兼CEO李彥宏稱“開源模型會越來越落後”,引起業界對“開源”技術的廣泛討論。不只在AI大模型領域,包括開源資料庫等多個從業人員也對此表達了看法。
4月20日上海OceanBase開發者大會上,OceanBase技術長(CTO)楊傳輝對鈦媒體App等表示,僅從資料庫領域而言,開源技術對於產業的意義非常重要,開源和商業化資料庫都有一定的生存空間。
「對於開源和商業的定位,我認為,首先我要把開源做好,我一定要讓開源出去的東西足夠有誠意,能夠真正解決用戶核心痛點;但同時,開源之後又不能讓這家公司完全不商業化,那也活不下去,最後開源社群也沒了。
在OB這裡,資料庫相當於發明的一個自行車,’開源’是教你怎麼去騎自行車,’商業’是賣給你一個好的自行車,但你不會騎沒用,開源對我們的商業化反而有助力。對OB來講沒有問題,我們可以把開源和商業很好地融合在一起。 」楊傳輝表示。
OceanBase CTO 楊傳輝
事實上,作為一款100%根自研的分散式資料庫,OceanBase持續實踐一體化資料庫的產品策略,以負載關鍵業務系統。
2020年,OceanBase宣布獨立商業化運作。當時OceanBase表示,在原有功能基礎上增加分析型業務處理能力,OceanBase 將升級為支援HTAP 混合負載的企業級分散式資料庫。
2022年,OceanBase 4.0發布,從技術上首次突破分散式資料庫的單機效能瓶頸,實現單機分散式一體化。目前在一體化上,OceanBase已實現單機分散式整合、TP/AP一體化、雲端上雲下一體化、多模一體化等,用一個資料庫滿足客戶80%的場景需求。
2024年4月,OceanBase正式發表4.3版本,推出列式儲存引擎,打造PB級即時分析資料庫,可實現秒級即時分析,進一步強化TP/AP一體化。現場跑分顯示,在同等硬體條件下,OceanBase4.3的AP查詢效能已達到業界一流列存大寬表資料庫相同水準。
這次OceanBase開發者大會上,楊傳輝表示,OceanBase 4.3在TP/AP一體化上的進一步突破,也是OceanBase堅持100%根自研的產品力結果。不基於開源資料庫二次開發、自建研發環境和流程,才使OceanBase具備對核心程式碼的完全掌控力和掌控權,才具備更強的突破複雜業務場景和為關鍵業務系統兜底的能力。這標誌著其在「關鍵業務負載」一體化策略上邁出重要一步。
目前,OceanBase Landscape技術生態已擴展至超750個主流產品,涵蓋基礎設施、資料整合、資料治理、應用整合等多個領域。 OceanBase已經服務超過1000家產業客戶,其中30%將其應用於核心系統。
值得一提的是,今年3月,螞蟻集團宣布,OceanBase已成立董事會,獨立面向市場。談到此事,楊傳輝表示,「這體現了螞蟻對把一個資料庫長期持續做下去這件事情的更加篤定、更大投入,這是一個核心。基於這個核心,我覺得對我們的產品技術是利好。這樣的思考和判斷,才有信心使其獨立運營,接受市場考驗。
「資料庫這件事要真的做好,首先要敢於挑戰最難的事情,敢於自研做TP(transaction processing,面向交易的處理系統)。TP壁壘是極強的,TP的壁壘和用戶場景的增持,才會使得一款資料庫形成特別大的生態。不是因為競爭多,良性競爭對所有參與者都是好事。
談到新一輪AI 熱潮,楊傳輝指出,GPT大模型對於資料庫有很大影響,儘管目前OceanBase沒有專門支援向量資料庫產品,但整個插件和社群已具備向量資料庫的能力,目前開源社群已有基於OB開源版去做向量Demo的嘗試。 “往後,我們會往這個方向去佈局研發,現在有一些嘗試。”
清華大學教授、螞蟻技術研究院院長陳文光錶示,AI 大模型的發展與崛起,對整個的資料處理、資料庫領域也提出了許多新的需求。
展望未來,陳文光在演講中表示,未來資料庫領域有三大新趨勢:線上離線一體化;向量資料庫和關聯式資料庫的一體化;更大的願景是資料處理與AI 運算的一體化。
「之前的資料處理更多是偏底層的方式去做的,然後先去收集、存儲,後面做記賬,再上面在這個數據上做一些分析聚合。AI已經越來越多的佔有整個計算的成本、容量,如果是這樣的情況,我們的資料處理跟AI到底應該是一個什麼樣的關係?
楊傳輝在演講結尾表示,「我希望未來在OceanBase開源社群裡面,應該有越來越多像『向量資料庫』這樣的有趣嘗試,我們的開源社群不是冷冰冰的產品,而是一個連結你我的,讓大家交朋友好玩的地方,一個真正的社區。