近日,MongoDB 5.0 正式發(fā)布,推出了時序集合等重磅新特性,進一步拓寬適用版圖。與此同時,這款分布式文檔數據庫在 DB-Engines 最新公布的 7月數據庫排行榜中高居第 5 位,且分數還在不斷增加,成為國際數據庫市場上最受歡迎的 NoSQL 數據庫產品。
自 MongoDB 公司于 2018 年更改開源協議之后,MongoDB 曾一度陷入巨大的爭議漩渦,導致了當時很多企業(yè)用戶的棄用,不少人對 MongoDB 的發(fā)展持消極態(tài)度。三年過去,MongoDB 卻以持續(xù)增長的態(tài)勢穩(wěn)坐 NoSQL 數據庫一哥的位置,出乎了很多人的意料。
MongoDB 在國內的現狀
MongoDB 中文社區(qū)創(chuàng)始人、前 MongoDB 大中華區(qū)技術總監(jiān)唐建法(TJ)是資深的數據庫技術專家,多年來一直從事 MongoDB 的相關工作。早在 2016 年時,TJ 曾指出國內對 MongoDB 的認知程度不夠,以至于大部分時候都是使用在非關鍵型應用場景。發(fā)展到今天,TJ 一路見證了 MongoDB 在國內的成長,越來越多的國內企業(yè)和開發(fā)者開始接受和使用 MongoDB。
TJ 表示,自己雖然已經離開了 MongoDB 團隊,但仍作為 MongoDB 中文社區(qū)創(chuàng)始人,一直在關注著 MongoDB 在國內的發(fā)展動向。
“MongoDB 這些年來在國內的發(fā)展一直是非常棒的,我們觀察到很多企業(yè)都已經接受了其在很多關鍵場景可以發(fā)揮獨特價值的地方,我身邊一半的創(chuàng)業(yè)公司都在使用 MongoDB。”TJ 說。在金融場景,中國銀行、招商銀行以及太平洋保險、泰康等這些頭部金融行業(yè),都開始使用 MongoDB;在很多公有云平臺,MongoDB 也成為除了 MySQL 之外使用最廣泛的一個數據庫之一。
而在社區(qū)方面,TJ 創(chuàng)立的 MongoDB 中文社區(qū)也已經從最初的幾十人發(fā)展到了今天的數萬人。TJ 表示,在疫情解除后,社區(qū)的技術交流活動也會回歸正常,今年社區(qū)在長沙、杭州、北京等地舉辦的技術交流活動也吸引了大量的 MongoDB 愛好者參加。
如今的 MongoDB 在國內的發(fā)展可謂是欣欣向榮。
MongoDB 的特色
在傳統(tǒng)關系型數據庫老而彌堅,新興 NewSQL 數據庫風頭正盛的今天,MongoDB 又是憑借什么優(yōu)勢在數據庫市場中立足的呢?
TJ 告訴我們,MongoDB 是一個比較通用的多用途分布式文檔數據庫產品。與其他主流數據庫相比,它的核心亮點是其彈性 JSON 模型,對應用開發(fā)非常友好,可以數量級的降低數據庫開發(fā)的工作量。
經過這些年的優(yōu)化迭代,MongoDB 可以像 MySQL 一樣,支持 ACID 事務,可以作為大部分 APP 的后臺數據庫。它原生的 Shared Nothing 的分片架構,可以提供非常強大的擴展能力,支持類似于字節(jié)跳動這樣海量用戶的高并發(fā)訪問。
MongoDB 通過 RAFT 協議來支持多節(jié)點互備,而不是傳統(tǒng)的通過落盤來保證數據的持久性,這樣能夠以接近內存數據庫的速度來為那些對響應延遲極低的應用提供支持,用戶往往不再需要 Redis 這樣的專用緩存。
此外,它的 Change Stream 功能就像一個 Mini-Kafka 一樣,能夠為 pub-sub 場景提供一個非常方便的隊列功能。
正是看中 MongoDB 的這些特性,TJ 決定將其用來作為實時數據服務平臺的存儲方案,開啟了自己的創(chuàng)業(yè)之路 —— 創(chuàng)辦 Tapdata。
MongoDB:創(chuàng)業(yè)者的不二之選
Tapdata 想要解決的問題是傳統(tǒng)企業(yè) IT 架構的“數據孤島”現象,即為客戶提供實時打通多源異構數據庫的能力。
事實上,這些年來為解決“數據孤島”出現的產品并不少見,從數倉、數據湖再到數據中臺,可以發(fā)現,三者支持的核心業(yè)務場景還是偏 BI 報表、各種數據分析等 OLAP 場景,重在對歷史數據做洞察和分析。而一個能為企業(yè)提供即時數據、用于 OLTP 業(yè)務支撐的實時數據平臺卻少之又少。正是看中了這一市場空白,Tapdata 決定以實時數據為服務,打造一個面向 TP 的實時 DaaS 平臺。
不過 TJ 也指出,Tapdata 的 DaaS 平臺與其他數倉和大數據平臺并不是非此即彼的關系,因為 DaaS 是以數據服務為導向的數據平臺,并不企圖大而全地支撐起所有數據業(yè)務,因此可以和數據湖和數倉形成上下游關系,為其提供完整、統(tǒng)一、準確的實時數據。用 TJ 的話說就是:“我只把數據像自來水一樣給到你,你把‘水’拿過去以后,是用去做飲料還是啤酒,由你來定。”這也是 Tapdata 創(chuàng)立的初衷:Make Your Data on Tap!
TJ 介紹,相比于動輒需要 5-10 個開源技術棧集成起來的大數據平臺,Tapdata 實時數據服務平臺依賴 MongoDB 的特性實現了部署運維輕,學習成本低等高度產品化的優(yōu)點。其中的核心技術優(yōu)勢,則是實現了覆蓋數據采集到存儲過程的全鏈路實時。
Tapdata 目前面向的數據管理人員、應用開發(fā)或者架構師,在定位上更偏向基礎軟件。關于如何讓市場更好的理解這一點并接受,TJ 表示有一個明確的“開放+開源”的路線圖。
開源商業(yè)化的探索
在基礎架構軟件領域,開源是最快提高市場接受度的一種模式。2021 年可以說是開源商業(yè)化爆發(fā)的一年,根據 oss capital 的統(tǒng)計,截止到 2021 年上半年,僅僅 6 個月的時間里風投公司對開源商業(yè)公司的投資額已經超過了 50 億美元,全年產品融資額已經達到甚至超越此前 20 年的總和。但是作為一個從市值 230 億美元的開源商業(yè)化大坑里爬出來的老兵,TJ 表示他還在琢磨 Tapdata 開源后最合適的商業(yè)化模式。
據悉,在代碼開源之前,Tapdata 會通過云上開放的方式,以另一種方式將核心產品能力免費提供給社區(qū)。Tapdata Cloud 已于近日正式推出公測版(http://cloud.tapdata.net), 目前這個版本還只是 Tapdata產品的一部分功能,但是已經可以獨立完成多達十幾種數據庫的異構數據同步能力,為新業(yè)務擴展,緩存加速, 全文檢索,數據庫備份容災等很多新型業(yè)務場景提供生產級的支撐。
TJ 表示 Tapdata 的這款云產品其實已經在數月前成功和移動公有云 ecloud 合作上線,為移動云上和云下所有的數據庫提供上云和云間同步遷移能力。所以大家可以放心使用。Tapdata Cloud 目前的版本現在和將來都不會收費。由于其架構的特性,運營管理成本完全可以將持續(xù)由 Tapdata 公司來承擔。TJ 希望通過免費云版開放來讓大家體會到實時數據的巨大價值,并能夠進一步了解并采用 Tapdata 的 Real Time DaaS 數據架構及產品。
下一步,在完成必要的準備工作后,Tapdata 將會把核心模塊的代碼開源,使得不能上云的用戶也能使用到 Tapdata 的技術。也是通過這樣的策略,Tapdata 將海外市場作為未來增長的重要方向。事實上,在尚未開源和推廣的情況下,Tapdata 已經獲得了若干海外付費客戶,并于今年 7 月獲得了數千萬美元的融資。
最后,TJ 也為自己的創(chuàng)業(yè)團隊打了個小廣告:“Tapdata 正處于高速發(fā)展的時期,希望能有更多技術大牛加入我們,我們會提供書面期權等豐厚的福利。”
嘉賓簡介
唐建法(TJ),MongoDB 中文社區(qū)主席,Tapdata 創(chuàng)始人,前 MongoDB 大中華區(qū)技術總監(jiān)
8 月 1 日,TJ 將作為全球開源技術峰會 GOTC 2021 深圳站的演講嘉賓,在「分布式數據庫與存儲」分論壇上帶來主題為“基于 MongoDB 構建實時數據中臺的技術實現和挑戰(zhàn)”的精彩演講。TJ 將在本次分享中為大家講解什么是實時數據中臺,核心技術需求都有哪些,技術選型的主要依據什么,以及快速落地的方案。通過本次分享你將了解基于 MongoDB 的特點和特性,快速落地實施數據中臺系統(tǒng)的關鍵技術細節(jié)。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )