2022年的黨政信創(chuàng)試點即將進入尾聲。黨政信創(chuàng)國產(chǎn)化試點的成功加速了其他行業(yè)國產(chǎn)替代的腳步。預計從2023年起,數(shù)據(jù)庫國產(chǎn)化替代工作將在各行業(yè)的信息化、數(shù)字化建設(shè)中遍地開花。隨著信息化建設(shè)的推進,業(yè)務(wù)數(shù)據(jù)不斷增長,業(yè)務(wù)處理愈發(fā)復雜,傳統(tǒng)的單機或者集中式數(shù)據(jù)庫逐漸無法滿足對原有業(yè)務(wù)和新興業(yè)務(wù)的處理需求。由于傳統(tǒng)數(shù)據(jù)庫在功能、架構(gòu)等的局限性因素,難以支撐更高并發(fā)、更低延時的業(yè)務(wù)訴求,同樣也難以滿足企業(yè)多模融合、湖倉一體、隱私計算等新興業(yè)務(wù)需求。
在國際上,我們不難發(fā)現(xiàn),在2022年的俄烏沖突中,沖突雙方通過限制底層通用技術(shù)的使用,可以干預并控制民生、政府、金融等行業(yè)的正常運行。在Oracle宣布暫停俄羅斯所有業(yè)務(wù)后,大量企業(yè)的ERP、財務(wù)系統(tǒng)等一系列基于Oracle數(shù)據(jù)庫的業(yè)務(wù)系統(tǒng)在很長一段時間內(nèi)均處于癱瘓狀態(tài),相關(guān)業(yè)務(wù)無法正常開展。
同樣在國內(nèi),從美國近年來多次發(fā)動的經(jīng)濟制裁與技術(shù)封鎖行動中,我們也深刻認識到科技戰(zhàn)必將成為未來IT領(lǐng)域的新常態(tài)。作為信息化支撐的基礎(chǔ)軟件,數(shù)據(jù)庫的國產(chǎn)化替代已迫在眉睫。但是數(shù)據(jù)庫國產(chǎn)化替代往往涉及到IT底層架構(gòu)、業(yè)務(wù)應(yīng)用等各個方面,并不是一蹴而就的事情。
星環(huán)科技堅持核心技術(shù)自主研發(fā)與創(chuàng)新,打造先進的分布式分析型數(shù)據(jù)庫ArgoDB,深耕國內(nèi)市場,推動各行業(yè)國產(chǎn)化替代落地,助力企業(yè)加速數(shù)字化轉(zhuǎn)型。
堅持自主研發(fā),力求產(chǎn)品安全可控
在國產(chǎn)化替代的大背景下,受利好政策和用戶需求的催化,近年來“國產(chǎn)數(shù)據(jù)庫”如雨后春筍般涌現(xiàn)。但是剝開“國產(chǎn)數(shù)據(jù)庫”華麗的外殼,究其內(nèi)里,我們不禁要問,“國產(chǎn)數(shù)據(jù)庫”真的能夠?qū)崿F(xiàn)數(shù)據(jù)庫技術(shù)的“完全自主可控”嗎?其實,我們不難發(fā)現(xiàn),大多數(shù)所謂的“國產(chǎn)數(shù)據(jù)庫”中,絕大多數(shù)是基于開源MySQL或PostgreSQL數(shù)據(jù)庫進行加工改造,“基于開源”并非原創(chuàng),“抄作業(yè)”始終難以內(nèi)化為自己的東西。缺少對數(shù)據(jù)庫核心技術(shù)的掌控,又如何真正實現(xiàn)“完全自主可控”呢?
ArgoDB自誕生以來,星環(huán)科技始終堅持數(shù)據(jù)庫技術(shù)的自主研發(fā)路線,一步一個腳印,歷時長達9年時間,逐步積累了一系列數(shù)據(jù)庫的核心技術(shù),如分布式技術(shù)、實時數(shù)據(jù)處理技術(shù)、多模型數(shù)據(jù)的統(tǒng)一處理技術(shù)、湖倉一體化、隱私計算技術(shù)等。根據(jù)工信部電子第五研究所的代碼掃描結(jié)果顯示——ArgoDB代碼自主率(行數(shù))超過90%,完全滿足了各行業(yè)對國產(chǎn)數(shù)據(jù)庫“自主可控”的訴求。此外,ArgoDB還通過了信通院分布式數(shù)據(jù)庫產(chǎn)品能力基礎(chǔ)能力和性能測試2項測評認證,進一步驗證了使用ArgoDB數(shù)據(jù)庫建設(shè)自主可控的分析業(yè)務(wù)數(shù)字化底座的可行性。
得益于自主創(chuàng)新技術(shù),2019 年 8 月,經(jīng)過國際事務(wù)處理性能委員會(簡稱TPC)官方審計,ArgoDB成為全球第四個通過 TPC-DS 基準測試的數(shù)據(jù)庫產(chǎn)品。
當前,ArgoDB已與國內(nèi)主流軟硬件信創(chuàng)廠商完成了兼容適配互認證,并且深度適配飛騰、鯤鵬等國產(chǎn)CPU及麒麟、UOS等國產(chǎn)操作系統(tǒng),全面融入國產(chǎn)化生態(tài)。
基于技術(shù)創(chuàng)新,為數(shù)字化轉(zhuǎn)型鋪路
ArgoDB堅持核心技術(shù)全面自主創(chuàng)新,并積累了一系列核心技術(shù)。不止能夠幫助企業(yè)實現(xiàn)國產(chǎn)化替代,而且加速企業(yè)數(shù)字化轉(zhuǎn)型,滿足未來對于更多業(yè)務(wù)場景的需求。
* 高性能、高擴展、高可用的分布式計算框架
* 高吞吐、低時延的實時分析能力
* 支持10種數(shù)據(jù)模型,輕松實現(xiàn)多模型數(shù)據(jù)融合分析
* 支持多方言SQL兼容,協(xié)助業(yè)務(wù)極簡改造
* 高性能、高擴展、高可用的分布式計算框架
基于分布式計算框架,ArgoDB能完美支持交互式查詢、基于索引方式的點查等,協(xié)助用戶構(gòu)建大型的、低延遲的數(shù)據(jù)分析應(yīng)用程序。ArgoDB憑借Native、向量化計算引擎和多模存儲引擎的雙重利器,性能大幅度提升。典型應(yīng)用場景已全面優(yōu)于Clickhouse、Greenplum、Spark等常見OLAP引擎。在相同的測試環(huán)境配置下, ArgoDB的OLAP場景性能是Clickhouse、Greenplum、Spark的2~10倍。
此外,隨著新興硬件的不斷發(fā)展,為了充分發(fā)掘新興硬件的更多潛能,ArgoDB結(jié)合新硬件技術(shù),滿足更復雜的業(yè)務(wù)場景需求。如基于閃存存儲硬件進行深度優(yōu)化,相比機械硬盤分析性能有顯著提升,讓用戶真正感受到新興硬件帶來的巨大性能優(yōu)勢。
基于分布式計算框架,ArgoDB還能夠提供相對于傳統(tǒng)并行計算架構(gòu)更好的擴展能力。大多數(shù)基于并行計算的數(shù)據(jù)庫(如Teradata、Greenplum等MPP架構(gòu)數(shù)據(jù)庫)在實現(xiàn)集群擴展時,對IO資源消耗較大,直接影響現(xiàn)有業(yè)務(wù)的運行。部分基于并行計算架構(gòu)的數(shù)據(jù)庫在調(diào)整數(shù)據(jù)服務(wù)節(jié)點過程中,會出現(xiàn)元信息讀取的不可用,導致必須停服而中斷業(yè)務(wù)。而對于基于分布式計算框架的ArgoDB數(shù)據(jù)庫而言,由于通過TDDMS(星環(huán)分布式數(shù)據(jù)管理系統(tǒng))進行了元信息的統(tǒng)一管理,集群規(guī)模調(diào)整過程中,不會因為元信息同步導致對數(shù)據(jù)表無法讀寫,在集群規(guī)模變更時,僅需將小部分數(shù)據(jù)移動到新節(jié)點即可。
* 高吞吐、低時延的實時分析能力
對于上游業(yè)務(wù)數(shù)據(jù)庫(如MySQL、Oracle等)以日志形式實時傳遞數(shù)據(jù)的場景,傳統(tǒng)數(shù)據(jù)庫一般通過對日志解析,再以SQL重放的形式實現(xiàn)數(shù)據(jù)加載,在小數(shù)據(jù)量場景下可以實現(xiàn)近實時的數(shù)據(jù)同步和數(shù)據(jù)分析。但隨著上游業(yè)務(wù)源的增多,同步數(shù)據(jù)對象變多,需同步的數(shù)據(jù)量隨之增大,如果仍采用SQL重放的方式處理數(shù)據(jù)的實時同步,在分析庫端的SQL提交、SQL解析等過程中會出現(xiàn)嚴重的性能瓶頸,隨之就影響了分析庫中實時分析業(yè)務(wù)的性能。同樣的實時寫入分析場景,如果采用流式寫入的方式,在應(yīng)對大量表數(shù)據(jù)需要同步場景時,對于流式寫入中Kafka Topic的管理也會成為處理瓶頸,并且對上千任務(wù)的調(diào)度和維護成本也急劇增長。高并發(fā)、高吞吐的實時數(shù)據(jù)寫入分析型數(shù)據(jù)庫,并同時對外提供極致高效的查詢分析服務(wù)是對分析型數(shù)據(jù)庫能力的一個重大挑戰(zhàn)。
基于上述實時寫入和實時分析的業(yè)務(wù)場景,ArgoDB 以新的數(shù)據(jù)寫入接口方式提供了新的實時數(shù)據(jù)接入方案,該接口具備對數(shù)據(jù)的Insert、Update、Delete和Upsert操作能力。對于大規(guī)模的數(shù)據(jù)實時同步場景,客戶端可通過對接口的調(diào)用,直接將數(shù)據(jù)寫入ArgoDB的存儲引擎中,在實時更新的場景下進行高效的數(shù)據(jù)分析。
* 支持10種數(shù)據(jù)模型,輕松實現(xiàn)多模型數(shù)據(jù)融合分析
為解決多種數(shù)據(jù)庫或平臺混合使用的混合架構(gòu)中的數(shù)據(jù)孤島問題,ArgoDB提供了多模型融合分析處理能力。在編譯器層、計算引擎層、數(shù)據(jù)存儲管理層、資源管理層實現(xiàn)了統(tǒng)一重構(gòu),提供了統(tǒng)一的 SQL 引擎、統(tǒng)一的計算引擎、異構(gòu)的數(shù)據(jù)存儲模型、統(tǒng)一的分布式數(shù)據(jù)管理系統(tǒng)和統(tǒng)一的資源管理系統(tǒng)的技術(shù)架構(gòu),能夠支持關(guān)系型、搜索、文本、對象、圖等10種數(shù)據(jù)模型。
ArgoDB 通過統(tǒng)一的元數(shù)據(jù)管理、統(tǒng)一的事務(wù)管理和完備的多模優(yōu)化器支撐了對不同模態(tài)數(shù)據(jù)的統(tǒng)一讀取調(diào)度,支持跨模型聯(lián)合分析,滿足更多“一庫多用”場景。例如傳統(tǒng)反欺詐解決方案由于不同數(shù)據(jù)模型分散存儲在不同的數(shù)據(jù)庫(例如關(guān)系型數(shù)據(jù)庫和圖數(shù)據(jù)庫)等原因,在實際業(yè)務(wù)中需要大量數(shù)據(jù)轉(zhuǎn)換操作,應(yīng)用實施成本高,實時性有待提高。ArgoDB為解決此類業(yè)務(wù)中的數(shù)據(jù)關(guān)聯(lián)難問題,將多模型數(shù)據(jù)存儲、數(shù)據(jù)融合處理能力進行迭代加強,用戶可將關(guān)系型數(shù)據(jù)和圖數(shù)據(jù)庫進行統(tǒng)一存儲,用戶只需通過一個 SQL 即可關(guān)聯(lián)查詢分析關(guān)系型數(shù)據(jù)和圖數(shù)據(jù),在數(shù)據(jù)免搬遷、減少人工操作的同時,提升業(yè)務(wù)效率。
* 支持多方言SQL兼容,協(xié)助業(yè)務(wù)極簡改造
Oracle、IBM DB2、Teradata等國外數(shù)據(jù)庫往往已經(jīng)在企業(yè)中使用多年,國產(chǎn)化替代往往涉及到IT底層架構(gòu)、業(yè)務(wù)應(yīng)用等各個方面,因此遷移過程比較復雜。大多數(shù)國產(chǎn)數(shù)據(jù)庫存在SQL 語法無統(tǒng)一規(guī)范、對 ANSI SQL 標準和傳統(tǒng)關(guān)系型數(shù)據(jù)庫方言支持度較低、兼容的存儲過程語法有限等問題。這些問題導致國產(chǎn)化替代落地時,開發(fā)人員需要耗費大量人力進行業(yè)務(wù)改造,數(shù)據(jù)庫使用人員需要重新學習產(chǎn)品用法。
為了使得各行業(yè)國產(chǎn)化替代時,業(yè)務(wù)平滑遷移,降低遷移成本。星環(huán)科技自研編譯技術(shù),實現(xiàn)了用統(tǒng)一的 SQL 語言操作不同模型(如表、文檔、圖等)的數(shù)據(jù)。與其他國產(chǎn)數(shù)據(jù)庫相比,SQL 編譯技術(shù)達到業(yè)界先進水平,支持絕大部分 ANSI92、99、2003 SQL 標準,兼容傳統(tǒng)關(guān)系型數(shù)據(jù)庫方言,如 Oracle、IBM DB2、Teradata等,支持存儲過程,從而大幅降低了大數(shù)據(jù)應(yīng)用開發(fā)的難度和成本。
從Oracle、IMB DB2、Teradata等數(shù)據(jù)庫遷移至ArgoDB時,開發(fā)人員無需對原有業(yè)務(wù)進行過多的改造,使用人員無需重新學習產(chǎn)品用法,大幅度降低了遷移至ArgoDB的技術(shù)與人力成本,快速實現(xiàn)業(yè)務(wù)的平滑遷移。
經(jīng)過9年的自主研發(fā),ArgoDB已全面超越了國外數(shù)據(jù)庫產(chǎn)品,可以為用戶提供更優(yōu)的解決方案。
深耕業(yè)務(wù)模型,助力客戶架構(gòu)升級
經(jīng)過多年發(fā)展,ArgoDB 已經(jīng)在金融、政府等領(lǐng)域有數(shù)十個落地案例,其中包括諸多成功替換 Oracle、Teradata、IBM DB2 等傳統(tǒng)數(shù)據(jù)庫的案例。
* 某銀行替換Oracle數(shù)據(jù)庫,構(gòu)建新一代實時數(shù)據(jù)倉庫
某行是當?shù)匾?guī)模最大的商業(yè)性地方金融機構(gòu),行內(nèi)原基于 Oracle 數(shù)據(jù)庫建設(shè)業(yè)務(wù)系統(tǒng)。隨著行內(nèi)在移動互聯(lián)渠道提供的客戶服務(wù)逐漸豐富,客戶點擊流量增長快速,客戶的體驗要求也在提高,對數(shù)據(jù)庫的查詢和分析能力也提出了較高要求。原 Oracle數(shù)據(jù)庫在業(yè)務(wù)支撐能力方面有以下問題:
a)、隨歷史數(shù)據(jù)不斷增長,現(xiàn)存統(tǒng)一收單系統(tǒng)的交易明細查詢結(jié)果輸出緩慢,無法快速精確查詢到相關(guān)交易;
b)、業(yè)務(wù)需要實時統(tǒng)計分析用戶的相關(guān)信息,改進業(yè)務(wù)質(zhì)量和產(chǎn)品的服務(wù)水平?;?Oracle 的復雜分析能力的欠缺在業(yè)務(wù)中的掣肘愈發(fā)明顯,且經(jīng)常出現(xiàn)數(shù)據(jù)加工延遲的情況;
c)、Oracle 以交易型業(yè)務(wù)為主,分析型業(yè)務(wù)擠占交易業(yè)務(wù)的資源,給日常業(yè)務(wù)的穩(wěn)定性帶來隱患;
d)、Oracle支撐場景單一,無法滿足諸如基于實時數(shù)據(jù)處理等的創(chuàng)新型業(yè)務(wù)。
基于星環(huán) ArgoDB 數(shù)據(jù)庫平臺,支持滿足倉集一體、實時數(shù)倉等建設(shè)需求,同時具備完整的 SQL 及 PL/SQL 支持。通過支持 Oracle 方言,極大降低了 Oracle 數(shù)據(jù)庫業(yè)務(wù)數(shù)據(jù)和現(xiàn)有分析型業(yè)務(wù)的遷移成本。在分析型業(yè)務(wù)方面以更低成本、更高性能完整替代了傳統(tǒng) Oracle 數(shù)據(jù)倉庫,確保分析型業(yè)務(wù)與交易型業(yè)務(wù)的隔離。
新平臺滿足了行內(nèi)包括歷史明細數(shù)據(jù)查詢、交易流水查詢、實時交易大屏、大額交易提醒等十多個關(guān)鍵查詢業(yè)務(wù)場景需求。平臺針對各類分析型業(yè)務(wù)的自動性能優(yōu)化,保障了多用戶高并發(fā)場景下的性能要求。平臺將源數(shù)據(jù)庫 Oracle的增量數(shù)據(jù)以秒級延時快速同步到 ArgoDB 實時數(shù)倉,尤其確保了對源系統(tǒng)數(shù)據(jù)有刪改的經(jīng)常性調(diào)賬退款業(yè)務(wù)數(shù)據(jù)能即時反映在分析系統(tǒng)中。基于實時落庫的業(yè)務(wù)數(shù)據(jù),實現(xiàn)多流水表多維度數(shù)據(jù)整合的交互式復雜分析,將原基于 Oracle 的離線級分析能力提升到秒級的準實時級交互式分析能力,為行內(nèi)未來多種復雜的分析型業(yè)務(wù)應(yīng)用的拓展與更高的實時性要求打下堅實的技術(shù)基礎(chǔ)。
* 某銀行替換Teradata數(shù)據(jù)庫,構(gòu)建湖倉一體化架構(gòu)平臺
某銀行自 2012 年起建設(shè)了基于 Teradata 的數(shù)據(jù)倉庫。隨著銀行業(yè)務(wù)的演進,業(yè)務(wù)數(shù)據(jù)規(guī)模不斷擴大,隨之待處理數(shù)據(jù)激增,原Teradata 數(shù)據(jù)倉庫因功能單一,且數(shù)據(jù)處理效率低下,難以與更多數(shù)據(jù)源及上下游系統(tǒng)對接,導致出現(xiàn)了新業(yè)務(wù)上線困難等問題。
在該銀行數(shù)據(jù)倉庫解決方案中,針對客戶現(xiàn)狀進行數(shù)據(jù)/體系架構(gòu)設(shè)計,在原有系統(tǒng)基礎(chǔ)上提出了優(yōu)化方案。在新數(shù)據(jù)倉庫系統(tǒng)中,基于分布式分析型數(shù)據(jù)庫 ArgoDB構(gòu)建,不僅支持 SQL 99/2003 標準語法,并且完整兼容原 Teradata SQL 語法,方便開發(fā)人員熟悉使用。在原有基于 Teradata 的數(shù)據(jù)倉庫整體遷移到星環(huán)科技大數(shù)據(jù)基礎(chǔ)平臺過程中,完成了臨時數(shù)據(jù)層遷移、操作鏡像層遷移、臨時歷史層遷移、基礎(chǔ)模型層遷移、匯總層遷移、應(yīng)用集市層/視圖遷移等遷移工作,制定并落實數(shù)據(jù)標準管理辦法及流程、數(shù)據(jù)質(zhì)量管理辦法及流程、元數(shù)據(jù)管理辦法及流程、配套管控系統(tǒng)功能模塊設(shè)計與實現(xiàn),完善整個數(shù)據(jù)管控與治理體系,完成了數(shù)千張數(shù)據(jù)表、近萬個腳本、近千個數(shù)據(jù)服務(wù)接口的完整遷移,推動了該銀行的大數(shù)據(jù)戰(zhàn)略實施。通過ArgoDB替換Teradata,從根源上解決了該行在數(shù)據(jù)倉庫領(lǐng)域存在的問題,提升銀行對業(yè)務(wù)發(fā)展的數(shù)據(jù)支撐能力。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )