訂閱
糾錯
加入自媒體

歷經半個多世紀的數據庫,未來還有什么是值得期待?

2021-12-01 14:40
科技云報道
關注

近些年,數據庫技術路線和產品層出不窮,令人眼花繚亂應接不暇。

其中,有以MySQL、Oracle、PostgreSQL為代表的傳統(tǒng)產品,也有以Aurora、Spanner等為代表的創(chuàng)新路線產品,還有工業(yè)數據庫、時序數據庫、圖數據庫等面向應用場景的產品。

無論是信息技術進步的必然結果,還是科技巨頭們出于商業(yè)利益的推動,如今數據庫百花齊放的盛景,對于該領域的技術發(fā)展來講,都無疑是一件幸事。

從數據庫的誕生說開去關系模型依舊把持江湖地位 20世紀60年代中期,數據庫系統(tǒng)的研究和開發(fā)便已經開始,在將近60年的時間里,技術經歷三代演變,取得了十分輝煌的成就:造就了C.W.Bachman、E.F.Codd和J.Gray三位圖靈獎得主;發(fā)展了以數據建模和數據庫管理系統(tǒng)核心技術為主,帶動了一個巨大的數百億美元的軟件產業(yè)。 數據庫技術從誕生到現(xiàn)在,形成了堅實的理論基礎、成熟的商業(yè)產品和廣泛的應用領域,吸引了越來越多的研究者加入。

數據庫的誕生和發(fā)展給計算機信息管理帶來了一場巨大的革命。幾十年來,國內外已經開發(fā)建設了成千上萬個數據庫,它已成為企業(yè)、部門乃至個人日常工作、生產和生活的基礎設施。

同時,隨著應用的擴展與深入,數據庫的數量和規(guī)模越來越大,數據庫的研究領域也已經大大地拓廣和深化,這個領域依舊充滿活力和創(chuàng)新精神。

今天,隨著計算機系統(tǒng)硬件技術的進步以及互聯(lián)網技術的發(fā)展,數據庫系統(tǒng)所管理的數據以及應用環(huán)境發(fā)生了很大的變化。

其表現(xiàn)為數據種類越來越多、越來越復雜、數據量劇增、應用領域越來越廣泛,可以說數據管理無處不需無處不在,數據庫技術和系統(tǒng)已經成為信息基礎設施的核心技術和重要基礎。 從概念的提出到早期的數據庫,再到流行至今的關系型數據庫,可謂是發(fā)展迅猛。

從這條時間線來看,數據庫的發(fā)展好像是井然有序的,是什么原因導致了大量的數據庫出現(xiàn),是理論的突破?還是市場的需求?或者兩者皆有。 直到今天,數據模型依舊是數據庫的核心和理論基礎。

我們在劃分數據庫的時候,仍然會按照其基于的數據模型來分類。

從一開始的層面模型、網狀模型、關系模型,到對象模型、對象關系模型、半結構化等等。

可以說,基礎理論并沒有得到更大突破。關系型模型剛提出的一段時間里,學術界發(fā)生了數據系統(tǒng)語言協(xié)會(CODASYL)關于有向圖模型和關系模型的辯論。

有向圖的復雜,使得數據庫的技術門檻太高,而關系模型扎實的數學理論支撐以及更好的邏輯獨立性贏得了市場認可。 從此,關系模型一統(tǒng)江湖,新出現(xiàn)的各類數據庫依然是關系模型。

從MongoDB、Redis、Hbase、KV一路發(fā)展過來,最終在DB-Engines的統(tǒng)計中,Oracle帶著MySQL和微軟的SQLServer常年一路領跑,關系模型在數據庫分類中仍然占據較大比例。

從SQL到NoSQL再到NewSQL,每一次技術演進都有推翻傳統(tǒng)數據庫的統(tǒng)治,迎接新時代的感覺。 此外,數據庫還有另一個分支,是與計算技術相結合。

比如這兩年火熱的分布式數據庫,有著各種光環(huán)加持,為數據庫的發(fā)展帶來了一抹亮色。

分布式數據庫、并行數據庫、多媒體數據庫、主動數據庫都是數據庫技術和某個計算技術結合的產物,通過將兩個技術體系進行融合,可以滿足特定的市場需求。

數據庫技術面臨四大趨勢一把重錘不能解決所有問題 作為應用程序的一部分,數據庫的發(fā)展與應用架構的變化緊密相關,亞馬遜云科技大中華區(qū)產品部總經理顧凡認為,云原生關系型數據庫、開源數據庫、現(xiàn)代化應用、軟件架構的迭代和轉型,將影響著數據庫未來的發(fā)展走向,也驅動著整個數據庫技術和生態(tài)發(fā)生變化。 

隨著互聯(lián)網和移動互聯(lián)網的發(fā)展,電商、視頻、社交、出行等越來越多的應用產生海量數據存儲需求,在高并發(fā)請求、高可用、高可擴展性等方面提出了巨大挑戰(zhàn),這對數據庫提出了非常高的要求,傳統(tǒng)的關系型數據庫在應付這些調整時已經顯得力不從心,暴露了許多難以克服的問題。

由此,各種各樣的NoSQL數據庫作為傳統(tǒng)關系型數據的一個有力補充得到迅猛發(fā)展,它驅動著云原生關系型數據庫的出現(xiàn)。 與此同時,越來越多的用戶不希望把自己的應用架構捆綁在一個有著嚴苛授權、會被鎖定的數據庫引擎上,而是更傾向于MySQL、PostgreSQL這樣的開源數據庫引擎上。

業(yè)內普遍觀點認為,眼下數據庫已經到了變革的重要關口,最直觀的表現(xiàn)就是傳統(tǒng)數據庫持續(xù)衰落和云原生數據庫、開源數據庫等新一代數據庫加速崛起。 開源代表了“多方協(xié)同、合作共贏、未來共享”的開放生態(tài)趨勢,擁抱開源將有助于合作伙伴和開發(fā)者了解和熟悉其數據庫特性。

應用廠商可以做到更好原生的適配。合作伙伴可以圍繞其產品進行運維工具的開發(fā)。同時,開源社區(qū)將有助于經驗分享,為實施和研發(fā)提供便利。 第三個改變,快速構建現(xiàn)代化應用程序已成為企業(yè)提高敏捷性、實現(xiàn)更快創(chuàng)新、發(fā)揮數據價值的關鍵。

企業(yè)希望可以將更多時間和精力花在核心業(yè)務的應用開發(fā)上,這當然是一個非常美好的愿望,這個愿望背后的含義就是:客戶希望把那些無法讓自己在市場競爭中脫穎而出的臟活累活盡量拋掉,讓開發(fā)人員專注于應用和數據。

這個變化也驅動更多企業(yè)向全托管式的云數據庫服務進行轉型。 第四個改變,軟件架構的迭代決定數據庫技術變化。

從早年的PC、互聯(lián)網、移動互聯(lián)網,到現(xiàn)在的萬物互聯(lián),軟件架構基本上都是從Server到SOA再到微服務,這樣的軟件架構迭代和轉型,也在驅動著數據庫選型的變化。

伴隨一個客戶業(yè)務體量越來越大,復雜度越來越高,在這種情況下選擇將一個超級復雜的單體應用拆分成多個微服務和多個大的功能模塊就顯得十分必要。

在進行應用重構之后,必然也會對數據進行拆分,根據應用所使用的數據類型和數據訪問特點,來決定究竟應該選擇云上的哪一個專門構建的數據庫。因此,軟件架構的迭代和轉型,也在驅動著數據庫選型的變化以及數據庫技術和架構的迭代。 這應對數據庫技術未來變化時,亞馬遜云科技顯得更加務實一些。

其認為,當手中只有一把超重的錘子時,看什么都是釘子,一把錘子無法完成所有的事情。

為此,亞馬遜云科技針對不同應用場景需求,已推出十多種數據庫服務,為客戶提供兼具高性能、高可用性、可擴展及成本效益的專用數據庫服務,支撐客戶現(xiàn)代化應用的快速部署及創(chuàng)新。 你會發(fā)現(xiàn),關于數據庫的一切需求用戶都能在亞馬遜云科技找到對應的產品。

如果客戶想用托管的關系型數據庫就選Amazon RDS,它開啟了托管數據庫服務的新模式,從最初只支持MySQL,到目前支持多種常用的數據庫引擎,包括MySQL、PostgreSQL、Oracle、SQL Server、MariaDB。

如果客戶非常青睞開源數據庫,但又擔心它的可用性達不到專用數據庫的級別,那就選擇Amazon Aurora。

如果客戶想用非關系型數據庫,需要一個托管的鍵值數據庫,而且針對海量數據場景,應用的吞吐無論擴展到多大,都能夠提供毫秒級響應,那就用Amazon DynamoDB。

很多客戶需要的是極致響應延遲,常用于緩存、排行榜、廣告等場景,就可以選用Amazon ElastiCache和Amazon MemoryDB。

如果客戶需要一個托管的圖數據庫,就選Amazon Neptune,適用于欺詐檢測、社交網絡、推薦引擎。

如果需要一個托管的時序數據庫,可以去看Amazon Timestream,像IoT中比如車聯(lián)網的場景,或者是DevOps的場景都可以用到時序數據庫。

如果需要的是數據庫可以像一個不可篡改的賬本,那就選Amazon QLDB。 今天,亞馬遜云科技不斷加速數據庫相關服務在中國區(qū)域的落地,2021年至今已經通過與光環(huán)新網和西云數據的合作新發(fā)布60多個數據庫相關服務與功能。 作為亞馬遜云科技核心級咨詢合作伙伴,伊克羅德信息科技總經理桂梓捷也從側面印證了亞馬遜云科技的競爭優(yōu)勢。

桂梓捷表示,亞馬遜云科技在數據庫的服務效能、可靠性、伸縮性方面花了非常多的時間進行持續(xù)優(yōu)化,這可以讓服務商更放心的將其數據庫產品推薦給全球用戶。 除了技術方面領先全球,亞馬遜云科技無服務器數據庫服務在計價模式等方面也與眾不同。

比如傳統(tǒng)的數據庫服務是依據服務器的規(guī)格、大小、效能來收費,亞馬遜云科技的Amazon Aurora , DynamoDB等無服務器數據庫服務則是通過應用程序的讀/寫量來計價,而不用預先考慮客戶需要多少存儲空間和服務器。

始終站在客戶角度,為客戶的便利性與成本考慮,成為亞馬遜云科技能夠受到全球用戶青睞的關鍵。 未來,數據庫將會如何發(fā)展?首先不能拋開市場因素,也就是企業(yè)對數據庫在安全、性能、擴展性、易用性方面的要求;特定場景、業(yè)務類型、數據特征對數據庫的依賴。

而在數據庫內部,會不會出現(xiàn)產生下一個“關系模型”?比如XML會不會成為主流模型?數據庫的結構定義會不會動態(tài)變化甚至取消?

我們不用再先建表再寫入數據,數據庫隨著數據的寫入動態(tài)適配數據類型、動態(tài)適配索引、動態(tài)適配查詢計劃?越來越多的算法代碼將內置到數據庫中,比如對AI算法的支持、對搜索算法的支持……這些都有待行業(yè)進一步探索。 在這個一切皆可數據化的時代,無論是傳統(tǒng)企業(yè),還是互聯(lián)網企業(yè),數據庫都是底層系統(tǒng)的核心構成,其重要性不言而喻。

從最初的人工管理、文件管理,到后面的數據庫系統(tǒng),以及新興的NoSQL、NewSQL數據庫,都伴隨著時代發(fā)展在更替前進。

作為技術發(fā)展的親歷者,我們有感于數據庫行業(yè)的持續(xù)活力,希望隨著技術的演進這個領域能夠通過科技創(chuàng)新迸發(fā)出更加耀眼的光芒。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號