Greenplum數據庫走出的創(chuàng)新派 | 快公司

創(chuàng)新場景
“團隊并沒有沿襲GP技術棧進行創(chuàng)新,而是進行了數據庫內核的重構;但另一方面,拓數派保留了GP的部分優(yōu)勢,通過GP生態(tài)進行更廣泛的用戶連接?!?/div>

拓數派創(chuàng)始人兼CEO 馮雷(Ray Von) 

鈦媒體獲悉,拓數派(OpenPie)不久前發(fā)布了全新產品虛擬數倉PieCloudDB「云上云」版(CoC:Cloud on Cloud),并正式上線基于阿里云構建公共云數據倉庫服務。

據創(chuàng)始人兼CEO馮雷所述,基于數倉虛擬化打造的旗艦產品PieCloudDB,是對行業(yè)頂級數據庫的抽象思考和設計原則復用為技術路線,實現了分析型數據數倉上云虛擬化。

拓數派成立于2021年,創(chuàng)立之初便獲得頭部產業(yè)基金連續(xù)兩筆天使輪投資,并于2022年6月再度獲得新一輪戰(zhàn)略融資,其核心產品PieCloudDB是面向企業(yè)級的云原生虛擬數倉。

如今過去兩年,拓數派已相繼發(fā)布PieCloudDB的企業(yè)版/社區(qū)版(基于私有云部署)、軟硬件一體機、「云上云」版本(首先基于阿里云構建公共云數倉)。

拓數派為此給出了數倉虛擬化技術理念的完整演繹。據介紹,團隊將多個數倉整合到一個高可用的云虛擬數倉,以打通多云數據管道,數據計算資源按需擴縮容,同時可計算數據空間實現了數量級增加,數倉的管理復雜度和成本均得到降低。這個過程中使用了存算分離、eMPP(elastic Massive Parallel Processing,彈性大規(guī)模并行計算)、服務器無感知及TDE等多項核心技術。

PieCloudDB數倉虛擬化四大核心技術架構:

云原生存算分離架構:運用元數據-計算-數據分離的三層架構,實現云上存儲資源與計算資源的獨立管理。云上計算資源可彈性分配,有查詢計算任務的時候按需啟動,按照使用時間和規(guī)模計算成本。

eMPP分布式專利技術:在云上,PieCloudDB利用eMPP架構,實現多集群并發(fā)執(zhí)行任務。企業(yè)可靈活進行擴縮容,隨著負載的變化實現高效的伸縮,輕松應對PB級海量數據。

全新的存儲「簡墨」和緩存架構設計:在計算層,各個計算節(jié)點針對元數據和用戶數據都設計了多層緩存結構,避免網絡延遲和數據移動,提高計算效率,保證用戶的實時性需求。針對底層對象存儲設計了高效的文件格式,可在節(jié)省網絡請求的同時提高計算效率。

全新的優(yōu)化器「達奇」:可更智能高效地生成統計信息,并生成更高效的查詢計劃,達奇優(yōu)化器支持聚集下推,預計算,Block Skipping等高級特性,全面滿足各種復雜的分析查詢需求。

云原生數據庫/數倉技術近些年在概念上非常熱,但怎么實現云原生的彈性優(yōu)勢、存算分離,各家廠商的產品成熟度和技術積累難免有所差異。從產品迭代周期和研發(fā)復雜性上看,拓數派的技術路徑難度頗高。據了解,團隊已經進行了百萬行代碼的推倒重寫。

以eMPP為例,PC版分析型數據庫所采用的傳統MPP技術,在遇到云端海量數據時會存在比較明顯的缺陷:如拓展困難、升級部署難,以及大量的數據孤島。eMPP則基于云計算架構的彈性并行計算,存儲和計算各自作為兩個獨立變量,各自在云里彈性伸縮,同時可以實現瞬間擴縮容。此外,用戶對于云中數據同時開啟多個集群進行數據計算,可以持續(xù)將所有數據在云中存儲,為已有的應用和未來的應用真正實現數據共享。

在媒體溝通會上,拓數派CTO郭罡告訴鈦媒體,“團隊最開始在單機版本上進行原型創(chuàng)新,支持多節(jié)點共享元數據和用戶數據,后來才支持分布式集群,相當于在Postgres上重新實現了一個新的分析型數據庫(OLAP)。”

從產品迭代節(jié)奏上,他還指出,“并不是因為Teradata退出中國,而是目前國內企業(yè)客戶還是會有對一體機的場景需求,未來也會跟更多的國產硬件廠商進行適配。”“目前來看,基于私有化部署的業(yè)務占比會更高,但未來3~5年內還是希望將公有云的業(yè)務收入進行持續(xù)提升。”

另外值得一提的是,馮雷為原Pivotal(中國)創(chuàng)始人兼總經理,在此之前,Pivotal就已經是一家非常成功的技術公司,其支持運營的開源數據庫Greenplum、PaaS平臺Cloud Foundry和Java開發(fā)的Spring框架在業(yè)內赫赫有名,云原生(cloud native)一詞最早起也源于Pivotal公司。

談及Greenplum的創(chuàng)新邏輯,郭罡明確指出:“團隊并沒有沿襲GP技術棧進行創(chuàng)新,而是進行了數據庫內核的重構;但另一方面,團隊保留了GP的部分優(yōu)勢,通過GP生態(tài)進行更廣泛的用戶連接。”

在鈦媒體看來,從以Teradata為代表的一體機MPP數據庫產品,到Greenplum和Vertica等基于PC的MPP數據庫,再到如今企業(yè)所倡導的云原生數據庫/數倉,盡管市場對新一代數據技術棧的關注在近些年十分火熱,但國產數據庫產業(yè)的整體資金投入、人才積累以及實際應用案例的深度仍有待提高。

作為一家初創(chuàng)公司,拓數派正式組織研發(fā)與市場力量不過兩年,有其發(fā)展的優(yōu)勢與契機。

(本文首發(fā)鈦媒體APP 作者 | 楊麗)

本文系作者 TechHorizon 授權鈦媒體發(fā)表,并經鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現,點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

快報

更多

2025-09-15 23:47

中美馬德里經貿會談成果公布

2025-09-15 22:59

2026款嵐圖夢想家正式上市,純電續(xù)航350公里

2025-09-15 22:53

國內商品期貨夜盤,焦煤期貨漲5.20%

2025-09-15 22:47

光大同創(chuàng):股東擬減持不超1%公司股份

2025-09-15 22:39

土耳其股指漲6%,創(chuàng)2023年以來最佳盤中表現

2025-09-15 22:31

MSCI全球指數續(xù)創(chuàng)新高,日內漲0.41%,至976.17點

2025-09-15 22:31

尼日利亞8月消費者價格同比上漲20.12%,市場預計同比增長21.6%

2025-09-15 22:20

中國工程機械工業(yè)協會:8月銷售各類叉車118087臺,同比增長19.4%

2025-09-15 22:07

比特幣跌至114531.9美元,日內跌0.75%

2025-09-15 22:05

中國氣象局啟動重大氣象災害暴雨四級應急響應

2025-09-15 22:00

諾和諾德現漲超2%

2025-09-15 22:00

紐約期金站上3700美元/盎司,日內漲0.38%

2025-09-15 21:42

標普500指數漲0.38%,納斯達克綜合指數漲0.63%

2025-09-15 21:41

現貨黃金短線上揚8美元,向上觸及3660美元/盎司,日內漲0.47%

2025-09-15 21:38

Snap股價逆轉盤前走勢,現漲近2%

2025-09-15 21:38

谷歌漲超3%,總市值首次升破3萬億美元

2025-09-15 21:35

熱門中概股美股盤初大漲,蔚來漲超8%

2025-09-15 21:34

美股開盤:三大指數集體高開,特斯拉漲超6%

2025-09-15 21:31

中國太保:上海國際集團擬將5559萬股A股股份無償劃轉至久事集團

2025-09-15 21:21

天陽科技:與甲骨文、IBM等廠商是合作關系

掃描下載App