一個技術人“誤入歧途”,做了個向量數(shù)據(jù)庫新物種

向量數(shù)據(jù)庫公司 Zilliz 近日宣布完成一筆 6000 萬美元的 B+ 輪融資,累計融資 1.13 億美元。這在長于本土的開源創(chuàng)企中,無疑是非常耀眼的一筆。

而時間回到 6 年前,當 Zilliz 的創(chuàng)始人星爵帶著 Oracle 出身的背景尋找投資人,說出自己想要造一個新物種時,卻不似當下這番光景,更多時候面對的是投資人的不解:

“怎么誤入歧途呢?”

“你帶著 Oracle 的背景,隨隨便便做個數(shù)據(jù)庫公司,我肯定給你投錢啊。”

這些聲音會讓星爵開始審視要做的事情本質(zhì)上對不對?自己和投資人的溝通方式需要如何改進?但有一點非常明確——敢為天下先,要做就要做這個世界上還不存在的東西,即便在短期內(nèi)不被理解。

所幸,在 2017 年,星爵和他的團隊成功拿到了一筆天使輪融資,開始了對“新物種”的研究?;仡櫣景l(fā)展,星爵將 2017 年的天使輪融資作為第一個里程碑;2019 年將第一款真正意義上的產(chǎn)品 Milvus 開源視作第二個;第三個里程碑則發(fā)生在 2020 年下半年至 2021 年上半年,Zilliz 確立了接下來的“五年規(guī)劃”,即,把全球化作為核心發(fā)展目標。

在過去的 6 年創(chuàng)業(yè)時間里,星爵關注的重點一直只有技術創(chuàng)新,從用戶需求中摸索新的方向,然后實現(xiàn)它,并做到極致。商業(yè)化、資本市場的認可等要素尚未進入星爵的重點關注地帶,但也因為對技術的追求,讓 Zilliz 正成為下一個基礎軟件市場新星。

“不做”產(chǎn)品做技術

“在我們剛成立的那段時間里,我們覺得自己做的事產(chǎn)品,但現(xiàn)在回頭去看,我們當時做的是技術。”

Zilliz 的成立,來自于星爵對新技術的興趣和自身事業(yè)轉(zhuǎn)型的規(guī)劃。

讀華中科技大學研究生時,身在中國武漢的星爵跟隨老師參與“網(wǎng)格計算”技術相關的研究,這一技術后來被認為是云計算的前身。機緣巧合之下,星爵所在的小組和由芝加哥大學教授主導的網(wǎng)格計算項目 Globus 取得聯(lián)系,星爵也加入到 Globus 項目中去,學習和研究代碼,并且和 Globus 合作,最終建立起中國教育科研網(wǎng)格——中國最大的網(wǎng)格計算項目之一。

這是星爵第一次通過開源協(xié)作的模式,深度參與到開源軟件的建設,“如果不是開源,我很難想象到,一端是在中國武漢,另一端在美國芝加哥大學,相隔這么遠的實驗室科研人愿能夠連接起來,這對我來說非常陌生,同時也是打開了去學習全球最新技術的大門。”

碩士畢業(yè)后,星爵到了美國數(shù)據(jù)庫專業(yè)數(shù)一數(shù)二的威斯康星大學麥迪遜分校就讀,2009 年博士畢業(yè)進入硅谷 Oracle 工作,參與當時 Oracle 的云數(shù)據(jù)庫研發(fā)。2013 年,Oracle 12c 版本發(fā)布,主題是為云計算重新設計的數(shù)據(jù)庫,星爵正是核心開發(fā)人員之一。到了 2015 年,12c 已經(jīng)趨向于穩(wěn)定,星爵萌生了回國創(chuàng)業(yè)的想法。

一方面,此時的星爵在技術上有過數(shù)據(jù)處理和分布式項目經(jīng)歷,也見識到了一個大型數(shù)據(jù)庫軟件該怎么去做,希望能在不同維度拓寬自身能力。加之受到硅谷創(chuàng)業(yè)文化的影響,星爵想要通過技術創(chuàng)業(yè),完成從工程師到技術創(chuàng)業(yè)者的升華。

另一方面,在星爵看來,當時的數(shù)據(jù)分析走到了一個交叉路口,AI 模型、算法的研究如火如荼?;?AI 研究,對各種非結(jié)構(gòu)化數(shù)據(jù),包括圖片、視頻、自然語言等的研究也到了一個新的高度,并且取得了一些很好的結(jié)果。計算機視覺領域的圖片分類水平也首次超過了人類平均水平。在這種 AI 研究與非結(jié)構(gòu)化數(shù)據(jù)研究的發(fā)展之中,星爵的心中隱隱浮現(xiàn)一個念頭:在數(shù)據(jù)處理的基礎軟件領域,將會有新的技術出現(xiàn),新的機會正在誕生。

帶著對新技術的熱情,星爵開始了創(chuàng)業(yè)之旅,“我們選擇了的 AI 應用中的數(shù)據(jù)處理賽道,過去 5- 10 年間,中國的 AI 應用,以及非結(jié)構(gòu)化數(shù)據(jù)處理是走在全球前列的,無論是數(shù)據(jù)的總量還是使用場景都領先于世界。”秉持著靠近需求源泉的原則,Zilliz 的故事從中國啟程。2017 年,Zilliz 拿到天使輪融資,正式出發(fā)。

成立之后,Ziliiz 最初的定位是將數(shù)據(jù)庫搬到 GPU 上,基于 GPU 硬件加速做新一代 OLAP 數(shù)據(jù)庫系統(tǒng),進而希望將性能提高 100 倍。星爵認為,AI 時代出現(xiàn)了一些 GPU、異構(gòu)計算等新技術,那么便可以嘗試將分布式計算和異構(gòu)計算、數(shù)據(jù)處理等結(jié)合起來。Zilliz 先是做了一個通過 GPU 高效并行算法加速各種數(shù)據(jù)處理的引擎,將這一想法落地。

“我們沒有想清楚把這個引擎用到什么地方去,只覺得這個東西性能很好,很創(chuàng)新,很酷!所以要先把它做出來。”

接下來,便是拿著不斷地和用戶交流,接收反饋。最終,Zilliz 發(fā)現(xiàn)這套技術可以很好地用在幫用戶去加速 AI 應用中向量數(shù)據(jù)的分析和處理,并且此類用戶需求是廣泛存在和飛速增長的。在這樣邊做技術邊摸索的過程中,Zilliz 逐漸將向量數(shù)據(jù)庫作為核心產(chǎn)品方向,并堅持到了今天。

  開源 + 從用戶需求出發(fā)

埋頭“很酷”的技術 2 年后,Zilliz 在 2019 年迎來了“技術產(chǎn)品化”的關鍵轉(zhuǎn)折點。

在做數(shù)據(jù)分析處理引擎期間,Zilliz 陸續(xù)接到了用戶反饋,看到了向量數(shù)據(jù)分析與處理的強勁需求。以此需求為依托,2018 年下半年開始,Zilliz 啟動了新項目的調(diào)研、開發(fā)工作,并在 2019 年將成果一口氣開源,這個成果便是向量數(shù)據(jù)庫——Milvus。

“對我們來說,是帶著自身積累的,對大規(guī)模數(shù)據(jù)的處理能力、分布式計算能力、異構(gòu)計算等能力,跨越了從技術到產(chǎn)品的鴻溝,找到了明確的產(chǎn)品方向,即向量數(shù)據(jù)庫。”但對于 Milvus 之后的發(fā)展,當時的星爵心里也沒底:“我們看到了用戶需求,看到了市場機會,但我們不知道自己提供的產(chǎn)品是不是真的能夠完美滿足市場需求。”

出于這個“痛點”,在加上團隊開放的工程師文化,Milvus 從發(fā)布之日起開源,采用 Apache 許可證。“開源開放是我們公司長期以來的基本原則,這是一群工程師很質(zhì)樸的想法,我們希望好的技術可以更快傳播出去,幫行業(yè)的人取得更好地成功,也通過開源把技術開放出去,獲得更廣泛地支持。”

對于這款開源產(chǎn)品成功與否的考量,標準只有一條:“它能不能取得一個很好的早期用戶增長。”這個結(jié)果直觀反映出產(chǎn)品是否真正解決了用戶的痛點,是否真的為其他開發(fā)者創(chuàng)造了價值。最終,在開源的半年內(nèi),擁有了約 60 家企業(yè)級用戶。“我記得從有了第一個用戶之后,基本上每周都會有捷報,最初是每周一個用戶,然后第二周增加了三四個,第三周又增加了七八個。”

事實上,Milvus 瞄準的價值市場,在過去基本是一篇空白。

在星爵看來,數(shù)據(jù)庫行業(yè)在過去 20 年經(jīng)歷了一場巨大的“分化”,關系型數(shù)據(jù)庫、分布式數(shù)據(jù)庫、圖數(shù)據(jù)庫、文檔數(shù)據(jù)庫、時間序列數(shù)據(jù)庫……未來,在 AI 時代,會有更多數(shù)據(jù)庫類型出現(xiàn),“比如我們現(xiàn)在提到量子計算,那很有可能接下來會出現(xiàn)一個面向量子計算的數(shù)據(jù)庫。”整體上,這個行業(yè)在不斷的分工與分化,類似汽車行業(yè),在過去 100 年間,發(fā)展出幾十上百個細分品類,在數(shù)據(jù)庫領域也是同樣,并且有兩點是不變的:

第一,人類的需求是不斷增加的,第二,人類社會的數(shù)字信息化程度在不斷提高,那么人們對數(shù)據(jù)分析和處理的需求必然也是在上升的,因此便會催生出更多數(shù)據(jù)的應用場景,而在每個新興的應用場景之下,都會出現(xiàn)一些更加具體、分工更加明確的數(shù)據(jù)庫產(chǎn)品。

那么,再看回 Milvus,它并不需要和其他種類的數(shù)據(jù)庫做比較,而是專注于為 AI 應用處理非結(jié)構(gòu)化數(shù)據(jù),比如為金融應用做欺詐分析、做物聯(lián)網(wǎng)領域的移動 APP 等等,滿足新興的非結(jié)構(gòu)化數(shù)據(jù)處理需求即可。

不僅僅是 Milvus,對于所有項目,Zilliz 的判斷標準只有“需求”。

2021 年 9 月,Zilliz 發(fā)布 Millvus 的上游軟件 Towhee。

“我們推出新項目只考慮一個問題,那就是解決用戶需求。”Zilliz 會從用戶需求中提煉出該做一個怎樣的產(chǎn)品給到用戶。具體到 Towhee,本質(zhì)是用戶在使用Millvus 的過程中,雖然能很好地解決數(shù)據(jù)分析問題,但是對于一些中小型公司來說,從各種不同的非結(jié)構(gòu)化數(shù)據(jù)中提取向量數(shù)據(jù)本身需要投入很多資源。因此,為了解決這部分用戶需求,Zilliz 推出開源的 embedding 框架,包含豐富的數(shù)據(jù)處理算法與神經(jīng)網(wǎng)絡模型,可以幫助用戶完成原始數(shù)據(jù)到向量的轉(zhuǎn)換。

在評估需求方面,Zilliz 的方法非常“樸實”,通常是在用戶群中主動收集或接收需求,然后將用戶反饋做匯總、歸類、排序,篩選出高頻需求,歸納趨同的需求。然后將數(shù)據(jù)結(jié)果放到研發(fā)社區(qū)做進一步討論,最終根據(jù)討論結(jié)果規(guī)劃產(chǎn)品的設計與迭代排期。

只在云上掙錢

對于做技術該怎么掙錢的問題,星爵和他的團隊很早就有一個標準:在公有云上通過服務賺錢。

落實到具體在什么時候?qū)崿F(xiàn)商業(yè)價值的轉(zhuǎn)換,就變得非常“隨緣”。

2019 年 Milvus 產(chǎn)品開源之后,很長一段時間內(nèi),這只隊伍都沉浸在“如何打造一個全球技術領先的產(chǎn)品”的目標之中。回看當時的想法,星爵是抱著“如果這個技術和產(chǎn)品能夠解決用戶的痛點,同時技術上又是全球領先的,那么一定能為公司創(chuàng)造價值,所以前些年我們并沒有太去考慮商業(yè)模式,而是專注的把產(chǎn)品做好。”

對于 Milvus 團隊來說,2020 年底,產(chǎn)品開始邁入成熟階段,Milvus 已經(jīng)擁有 500 多家企業(yè)級用戶,產(chǎn)品趨于穩(wěn)定。一方面,他們發(fā)現(xiàn)了新的用戶核心需求:用戶希望能在云上使用,在云上提供一個更加便捷的云服務。對用戶來說,云服務可以省去安裝部署的步驟,直接通過 API 調(diào)用,那么開發(fā)和維護成本也會降低。結(jié)合這兩方面的因素,Zilliz 啟動了公有云產(chǎn)品的研發(fā)。

日前,Zilliz Cloud 的測試版本正式上線。Zilliz Cloud 定位于依托公有云的全托管數(shù)據(jù)庫即服務,旨在為向量數(shù)據(jù)處理、?結(jié)構(gòu)化數(shù)據(jù)分析和企業(yè) AI 應?開發(fā)提供?站式解決案。

Zilliz Cloud本質(zhì)是 Database as a service,是將 Zilliz 向量數(shù)據(jù)庫的能力以云上全托管的方式提供給用戶,免去用戶部署和運維的工作。同時,也幫用戶解決云上數(shù)據(jù)安全的問題,包括數(shù)據(jù)合規(guī)、高可用、容災等等,為各類在開發(fā) AI 應用的企業(yè),在其開發(fā)過程中,極大地簡化非結(jié)構(gòu)化數(shù)據(jù)管理的過程。

在云產(chǎn)品之前,Milvus 開源社區(qū)的用戶想向 Zilliz 購買服務的,都會遭到拒絕,“很為很早之前我們就決定,云才是我們商業(yè)產(chǎn)品的形態(tài),除此之外,不會收用戶的錢。”

事實上,許多開源的基礎軟件都和 Milvus 一樣,在走一條開源+長時間免費的道路。在星爵看來,基礎軟件的第一個特質(zhì)就是技術門檻高,那么在研發(fā)階段,就是一個慢工出細活的活動,需要長期投入,不斷總結(jié)用戶需求,將其做成通用產(chǎn)品。另一大特質(zhì)則是一旦做出了個全球領先的技術和產(chǎn)品,就會出現(xiàn)“贏者通吃”的格局。而這也是 Zilliz 長期堅持以技術主導,開源開放的重要原因之一。

談談當下

當下,Zilliz 正沿著一年多前定下的策略,走全球化的路子。具體到剛剛起步的云服務業(yè)務,北美市場將是接下來一兩年關注的重點。

“如果我們看全球市場的估量,在基礎軟件領域,美國市場占全球市場的 30%-40% 左右,是全球第一大單一市場。”因此,將全球劃作為目標的 Zilliz 將國際化的主戰(zhàn)場放到了北美。目前 Zilliz Cloud 已在 7 月支持 AWS,接下來將會進一步擴展能力,形成多云方案,包括支持谷歌 GCP,微軟的 Agile,實現(xiàn)北美三大公有云的跨云方案。

對于 Zilliz 來說,其與大型公有云廠商之間是競合關系,一方面 Zilliz Cloud 依托于公有云平臺,另一方面,在星爵看來,同臺競技也更能催生技術創(chuàng)新,“我們的信心是源于我們是一個創(chuàng)業(yè)公司,可以更快速地迭代產(chǎn)品,實現(xiàn)技術創(chuàng)新,所以在和公有云廠商同態(tài)競技的時候,我們會堅持開源開放,唯有產(chǎn)品和技術能保持核心競爭力,才能最終與大象共舞。”

談及 Zilliz Cloud 未來的發(fā)展,星爵并沒有做過多預測:“我不做預測,我們公司也很少做預測,預測容易打臉”。而商業(yè)化和營收,也依舊不是當下星爵關注的重點。面對在資本市場取得的成績,星爵將其歸因為團隊以技術為導向,敢為天下先地去創(chuàng)造了新技術,并將其做到極致,“大家都知道稀缺性很重要,但往往在親身實踐的過程中,會發(fā)信追求稀缺性是一件很奢侈的事情,稀缺性是孤獨的,相當不確定的,高風險的。”

同時,在星爵看來,將產(chǎn)品和技術做到極致之后再談商業(yè)化,也會更加容易實現(xiàn),“我們要先打造一個優(yōu)異的產(chǎn)品,這個產(chǎn)品如果不做到全球領先,我們認為就不應該推向市場,更不應該拿去賣。”

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )