文丨拓撲社 記者 海洋
“去IOE”這個(gè)概念正式火起來(lái)應該是在2013年“棱鏡門(mén)”前后,由阿里巴巴提出。雖然有些政治正確的味道,但是去IOE,尤其是去Oracle,已是企業(yè)發(fā)展路上必不可少的一步,原因很簡(jiǎn)單——進(jìn)入大數據時(shí)代以后,數據量不斷增加,動(dòng)輒數十TB,但以Oracle為代表的關(guān)系型數據庫的性能在大數據量下卻在持續下降。在海外,老一代關(guān)系型數據庫的迭代已經(jīng)進(jìn)行了將近十年,但在中國這個(gè)過(guò)程卻剛剛開(kāi)始,今天筆者尋訪(fǎng)到的SequoiaDB巨杉數據庫便是推動(dòng)中國數據庫技術(shù)迭代和國產(chǎn)化的重要力量之一。
一、國內第一家完全自主研發(fā)的NewSQL
關(guān)系型數據庫在存儲數據時(shí),需要對數據做大量預處理,這直接導致關(guān)系型數據庫無(wú)法很好地應對PB級別的數據,同時(shí),擴展性和訪(fǎng)問(wèn)速度都很差。但盲目去“O”容易導致一系列問(wèn)題,比如研發(fā)、運維成本驟然升高,選擇新廠(chǎng)商風(fēng)險較大等,同時(shí)也容易因為強行更換數據庫而導致業(yè)務(wù)停滯。2015年的數據庫技術(shù)大會(huì )上曾有過(guò)數據庫選型的相關(guān)分享,分享者認為,企業(yè)最好選擇一款新一代分布式數據庫,同時(shí)這家數據庫廠(chǎng)商應當擁有較強的企業(yè)化能力,提供較完善的解決方案。
分布式NewSQL數據庫最大的特點(diǎn)是能夠實(shí)現多類(lèi)型數據處理,既可處理關(guān)系型數據,亦可處理圖片、音視頻等非結構化數據,實(shí)現結構化非結構化統一存儲,這意味著(zhù),用戶(hù)不僅可以通過(guò)巨杉數據庫實(shí)現新型分布式數據庫的功能,又能完全兼容已有的傳統數據庫的應用。這樣企業(yè)在進(jìn)行數據庫迭代的時(shí)候,能夠實(shí)現平滑過(guò)渡,而不會(huì )“硬著(zhù)陸”。而在中國,這個(gè)領(lǐng)域鮮有企業(yè)涉足,巨杉數據庫就是其中之一。值得一提的是,巨杉數據庫完全自主研發(fā),擁有完全自主知識產(chǎn)權,不基于任何其它的開(kāi)源項目。
巨杉數據庫于2014年底正式出現在公眾視野中。聯(lián)合創(chuàng )始人王濤這樣形容巨杉數據庫:支持SQL、高并發(fā)、實(shí)時(shí)性、分布式、可擴展、靈活存儲的操作型NewSQL數據庫。巨杉的研發(fā)者們來(lái)自IBM DB2北美實(shí)驗室、華為數據庫研發(fā)團隊和各大互聯(lián)網(wǎng)公司,既對原有關(guān)系型數據庫有充分了解,又吸收了新一代分布式數據庫領(lǐng)域的研發(fā)人才?!皵祿飚a(chǎn)品的技術(shù)門(mén)檻是很高的,分布式架構和對象型存儲再加上分布式SQL引擎,現在無(wú)論是傳統關(guān)系型數據庫或者是一般的NoSQL數據庫都無(wú)法做到同時(shí)具備這幾點(diǎn)?!倍@樣的技術(shù)實(shí)現,正是依賴(lài)于這種復合式構成的研發(fā)團隊。
巨杉數據庫作為一款成熟的商業(yè)化產(chǎn)品,成為中國第一家將商業(yè)化數據庫開(kāi)源的軟件公司,同時(shí)巨杉還會(huì )為客戶(hù)提供企業(yè)版產(chǎn)品,而這兩點(diǎn)正符合前文數據庫技術(shù)大會(huì )上分享者提出的數據庫選型條件。對于開(kāi)源是否會(huì )造成被抄襲等問(wèn)題,王濤表示,“數據庫行業(yè)的門(mén)檻非常高,復制困難,我們的產(chǎn)品開(kāi)源,正是向我們的企業(yè)用戶(hù)展現我們對于產(chǎn)品技術(shù)的絕對主導權和‘安全可控’,也展示了我們團隊的技術(shù)實(shí)力,同時(shí)也能夠讓數據庫的質(zhì)量持續提高,同樣高技術(shù)門(mén)檻的產(chǎn)品使得對于系統的維護只有原廠(chǎng)才能駕馭?!?/p>
二、增量市場(chǎng)中,巨杉的機會(huì )與競爭
新型數據庫市場(chǎng)是一個(gè)標準的增量市場(chǎng)。首先,新型數據庫將逐漸代替關(guān)系型數據庫,而根據IDC的報告顯示,全球范圍內傳統數據庫市場(chǎng)規模約為400億美元,截至2015年400億的傳統關(guān)系型數據庫市場(chǎng)已經(jīng)有超過(guò)1/10被新一代分布式數據庫所替換,市場(chǎng)的增長(cháng)才剛剛開(kāi)始;同時(shí),全球新興大數據市場(chǎng)規模已經(jīng)到達330億美金的規模,在未來(lái)3年內市場(chǎng)規模更將突破500億美元。這其中,作為大數據應用基礎的新一代數據庫,占比將超過(guò)40%。因此,未來(lái)5年內,新一代分布式數據庫的全球市場(chǎng)規模接近300億美元。
從國內市場(chǎng)來(lái)看,2014年中國的數據庫市場(chǎng)約為70億人民幣,同時(shí),由于巨杉既能夠兼容已有關(guān)系型數據庫,也能夠實(shí)現新型分布式數據庫的功能,還能夠被企業(yè)用在新的大數據業(yè)務(wù)中,承擔數據存儲層的業(yè)務(wù)。而這一方面的市場(chǎng)前景同樣廣闊,王濤透露,未來(lái)5年內,SequoiaDB這樣的新一代分布式數據庫在國內的市場(chǎng)規模將接近200億人民幣。
這樣一個(gè)市場(chǎng)可謂挑戰與機會(huì )同在。挑戰是,國內企業(yè)由于技術(shù)、觀(guān)念等原因,對于新一代數據庫的接受程度較慢。機會(huì )在于,國內傳統數據庫廠(chǎng)商由于市場(chǎng)技術(shù)固定、人員體量僵化等原因,難以對新興的數據分析、BI等技術(shù)進(jìn)行快速學(xué)習和吸收,難以滿(mǎn)足大數據時(shí)代新興的需求;國外入局者M(jìn)ongoDB、Hadoop等又容易出現水土不服,而且產(chǎn)品將根據海外產(chǎn)品的走向來(lái)發(fā)展,無(wú)法做到根據本土業(yè)務(wù)、用戶(hù)需求調整產(chǎn)品方向。從這兩點(diǎn)來(lái)看,巨杉雖然需要較長(cháng)的時(shí)間來(lái)進(jìn)行市場(chǎng)教育,同時(shí)也可能成為國內分布式數據庫市場(chǎng)中的一匹黑馬。
巨杉數據庫作為商業(yè)化數據庫產(chǎn)品,此前已經(jīng)在金融、電信的傳統行業(yè)領(lǐng)域得到了應用,隨著(zhù)商業(yè)化產(chǎn)品的開(kāi)源,巨杉在互聯(lián)網(wǎng)行業(yè)也得到了更多認可,目前已經(jīng)獲得了民生銀行、廣發(fā)銀行、中國移動(dòng)、中國電信、途牛網(wǎng)、360智能路由等企業(yè)客戶(hù)。而巨杉數據庫開(kāi)源后,也培養了開(kāi)發(fā)者、互聯(lián)網(wǎng)技術(shù)用戶(hù)群體,開(kāi)始構建屬于自己的社區和生態(tài)。據王濤透露,2015年一年中,巨杉數據庫的企業(yè)客戶(hù)量增長(cháng)了4倍,目前達到幾百家,而社區中的用戶(hù)則早已過(guò)萬(wàn)。
此外,因為具有很強的北美和硅谷背景,巨杉在進(jìn)行本土化的同時(shí)也會(huì )立足中國做國際化。目前巨杉已經(jīng)和Databricks、Cloudera、Hortonworks等建立了全面的戰略合作關(guān)系,今年也第一次進(jìn)入了硅谷的“大數據象限”中,相信這家被評選為“2015紅鯡魚(yú)亞洲創(chuàng )新百強”的創(chuàng )業(yè)公司,在出海之路上也會(huì )走得更遠。
本文為拓撲社原創(chuàng ),未經(jīng)同意不得轉載或引用
尋求報道&合作請聯(lián)系:tobshe@itjuzi.com
評論列表