訂閱
糾錯(cuò)
加入自媒體

企業(yè)級(jí)存儲(chǔ)發(fā)展趨勢(shì)談:開(kāi)源存儲(chǔ)的冷思考

很多年之前,

業(yè)內(nèi)就討論過(guò)

開(kāi)源與自研的關(guān)系,

孰輕孰重,

孰好孰壞,

到現(xiàn)在也還沒(méi)有定論。

開(kāi)源軟件蓬勃發(fā)展,為何機(jī)遇與挑戰(zhàn)并存?

事實(shí)上,我們很多行業(yè)似乎都離不開(kāi)開(kāi)源軟件了。為什么呢?開(kāi)源造就了多個(gè)產(chǎn)業(yè)的發(fā)展,已經(jīng)成為了當(dāng)前不少行業(yè)創(chuàng)新的重要途徑。

Synopsys公司2020年研究數(shù)據(jù)顯示,99%的商業(yè)軟件含有開(kāi)源組件,75%則直接由開(kāi)源代碼組成。開(kāi)源軟件的使用不斷增多,在云計(jì)算、大數(shù)據(jù)、人工智能、工業(yè)互聯(lián)網(wǎng)等新興領(lǐng)域,開(kāi)源軟件已成為重要的創(chuàng)新發(fā)展模式。

從中國(guó)對(duì)于全球開(kāi)源軟件的整體貢獻(xiàn)情況來(lái)看,2021年7月,國(guó)家信息安全發(fā)展中心副主任董大健分析指出,中國(guó)開(kāi)源代碼貢獻(xiàn)已經(jīng)占全球40%左右,國(guó)家“十四五規(guī)劃”也首次加入了開(kāi)源體系建設(shè)的相關(guān)發(fā)展要求。不過(guò),他同時(shí)也指出,開(kāi)源體系也具有一些系統(tǒng)性的問(wèn)題和風(fēng)險(xiǎn)。

盡管開(kāi)源軟件存在一定的問(wèn)題與風(fēng)險(xiǎn),但大家對(duì)于開(kāi)源應(yīng)用與開(kāi)發(fā)的興趣依舊濃厚,因此,國(guó)內(nèi)外對(duì)于開(kāi)源的安全性研究也十分重視。美國(guó)WhiteSource公司發(fā)布的《2019年開(kāi)源組件安全漏洞現(xiàn)狀報(bào)告》顯示,2019年公開(kāi)的開(kāi)源軟件漏洞數(shù)量已增至6000多個(gè),增幅近50%;而后在其2020年發(fā)布的《開(kāi)源安全年度報(bào)告》顯示,平均每1000行開(kāi)源代碼中就有14個(gè)安全漏洞,每1400行開(kāi)源代碼中就有1個(gè)高危安全漏洞。

2021年底,國(guó)家信息中心公共技術(shù)服務(wù)部王曉冬在《我國(guó)開(kāi)源軟件產(chǎn)業(yè)面臨的突出風(fēng)險(xiǎn)及對(duì)策研究》一文中分析指出,我國(guó)開(kāi)源軟件產(chǎn)業(yè)存在斷供、代碼安全、知識(shí)產(chǎn)權(quán)、自主創(chuàng)新等風(fēng)險(xiǎn)。

理性認(rèn)識(shí)開(kāi)源存儲(chǔ),到底哪里好哪里不好?

事實(shí)上,開(kāi)源帶動(dòng)了存儲(chǔ)初創(chuàng)科技公司的誕生,帶動(dòng)了與存儲(chǔ)相關(guān)的開(kāi)源生態(tài)的發(fā)展。基于開(kāi)源軟件構(gòu)建存儲(chǔ)產(chǎn)品的廠商,與開(kāi)源社區(qū)相輔相成,相互促進(jìn),共同發(fā)展。開(kāi)源項(xiàng)目也吸引了資本的興趣,在資本與開(kāi)源社區(qū)加持下,這類存儲(chǔ)廠商也開(kāi)始了開(kāi)源項(xiàng)目的商業(yè)化之路。

然而,企業(yè)級(jí)存儲(chǔ)廠商的開(kāi)源商業(yè)化之路來(lái)得還是不容易的,從分布式存儲(chǔ)軟件的開(kāi)源發(fā)展與現(xiàn)狀來(lái)看,目前主流的開(kāi)源軟件主要包括Ceph、HDFS、Swift、Lustre、GlusterFS等。

其中,按照存儲(chǔ)類型來(lái)劃分,Ceph屬于融合塊、對(duì)象、文件于一體的統(tǒng)一存儲(chǔ), HDFS、Lustre、GlusterFS歸屬于文件存儲(chǔ)類,Swift是OpenStack開(kāi)源云計(jì)算項(xiàng)目的子項(xiàng)目之一,屬于OpenStack Object Storage對(duì)象存儲(chǔ)。Ceph與GlusterFS的齊頭并進(jìn),將中國(guó)的開(kāi)源存儲(chǔ)發(fā)展推向了新的階段,對(duì)于云計(jì)算與軟件定義存儲(chǔ)的發(fā)展貢獻(xiàn)了一定的力量。當(dāng)前來(lái)看,Ceph的開(kāi)源存儲(chǔ)支持者比較多,社區(qū)建設(shè)更為龐大,開(kāi)發(fā)者貢獻(xiàn)頻率也相對(duì)較高。

從開(kāi)源存儲(chǔ)的整體發(fā)展優(yōu)勢(shì)來(lái)分析,因?yàn)樯鐓^(qū)開(kāi)發(fā)者與開(kāi)發(fā)團(tuán)隊(duì)貢獻(xiàn)的代碼多,各自有所專長(zhǎng)專注的功能領(lǐng)域,迭代自然更快。

同時(shí),因?yàn)榇a開(kāi)源,只要是社區(qū)組織中的成員,遵循一定的規(guī)則,代碼就都可以拿來(lái)使用,必然存在開(kāi)發(fā)成本優(yōu)勢(shì)。

建設(shè)開(kāi)源社區(qū)的同時(shí)也就是在建設(shè)開(kāi)源生態(tài),這是來(lái)自全球開(kāi)發(fā)者的貢獻(xiàn)地。每一位社區(qū)成員與社區(qū)組織本身都在開(kāi)源生態(tài)的共同作用下,不斷推動(dòng)開(kāi)源存儲(chǔ)軟件的應(yīng)用與對(duì)外交付。由此可見(jiàn),開(kāi)源存儲(chǔ)軟件的整體生態(tài)還是非常強(qiáng)大,行業(yè)影響力也在不斷深入。

然而,存儲(chǔ)軟件面臨的商業(yè)化挑戰(zhàn),不是一時(shí)半會(huì)兒可以解決的。堅(jiān)持自研路線的存儲(chǔ)廠商,如曙光、華為等經(jīng)歷了數(shù)十年之久的技術(shù)積累,如果開(kāi)源存儲(chǔ)軟件短時(shí)間內(nèi)就能搞定,這說(shuō)明了什么?值得冷靜思考一下。

站在用戶需求的角度來(lái)看,分布式存儲(chǔ)的發(fā)展正確路線應(yīng)該是如何實(shí)現(xiàn)容量、性能、可用性、可靠性、可伸縮性這五點(diǎn)的平衡。對(duì)于開(kāi)源存儲(chǔ)軟件而言,Scale-out架構(gòu)帶來(lái)的存儲(chǔ)容量上的靈活擴(kuò)展能力,加上閃存與大容量硬盤技術(shù)的迅猛發(fā)展,讓存儲(chǔ)系統(tǒng)的性能也能獲得足夠高的表現(xiàn),同時(shí)也實(shí)現(xiàn)了很好的伸縮性。然而在可用性與可靠性上,都需要進(jìn)一步的優(yōu)化與提升。

在穩(wěn)定性方面,開(kāi)源社區(qū)處于一個(gè)開(kāi)放的生態(tài)中,不是一批人或某一個(gè)開(kāi)發(fā)團(tuán)隊(duì)寫的代碼,對(duì)軟件架構(gòu)設(shè)計(jì)的理解參差不齊,開(kāi)發(fā)邏輯可能不一致,不穩(wěn)定因素及安全隱患風(fēng)險(xiǎn)更大。代碼程序及產(chǎn)品軟件存在缺陷是不可避免的,在不同的階段發(fā)現(xiàn)缺陷并進(jìn)行修正,對(duì)于代碼穩(wěn)定性的影響程度不同,付出的成本也不同。據(jù)相關(guān)統(tǒng)計(jì)數(shù)據(jù)估計(jì),在軟件測(cè)試、發(fā)布階段糾正缺陷的成本是編碼階段發(fā)現(xiàn)并糾正缺陷的成本的15-90倍,如果在交付用戶之后才發(fā)現(xiàn)并解決缺陷,這個(gè)數(shù)字將達(dá)到50-200倍。因此,任何安全隱患都可能造成巨大的損失。而對(duì)于開(kāi)源社區(qū)代碼而言,由于其開(kāi)放性和龐雜性,導(dǎo)致很難有社區(qū)開(kāi)發(fā)者將開(kāi)源存儲(chǔ)代碼進(jìn)行完整的測(cè)試;陂_(kāi)源存儲(chǔ)軟件構(gòu)建的商業(yè)化產(chǎn)品,如果不能對(duì)100%的源代碼進(jìn)行測(cè)試,那么這就可能為用戶交付穩(wěn)定可靠的存儲(chǔ)系統(tǒng)埋下了不少隱患。

在整體服務(wù)質(zhì)量方面,因?yàn)殚_(kāi)源帶來(lái)的Bug問(wèn)題逐年遞增,如何真正解決實(shí)際應(yīng)用中的Bug問(wèn)題,對(duì)開(kāi)源存儲(chǔ)廠商的技術(shù)能力有著不同程度的挑戰(zhàn)。廠商研發(fā)實(shí)力強(qiáng)大,自然對(duì)于用戶的服務(wù)質(zhì)量就高,廠商研發(fā)實(shí)力弱一些,帶給用戶的服務(wù)質(zhì)量就存在“折扣”?梢(jiàn),每一次開(kāi)源存儲(chǔ)軟件的交付,都是對(duì)開(kāi)源存儲(chǔ)廠商的技術(shù)考驗(yàn)。

此外,在大規(guī)模部署的時(shí)候,開(kāi)源存儲(chǔ)的穩(wěn)定性和可用性存在一定的挑戰(zhàn)。以Ceph為例,其商業(yè)化存儲(chǔ)有不少案例,但直接使用開(kāi)源Ceph構(gòu)建數(shù)十PB甚至上百PB的大規(guī)模案例,到目前幾乎沒(méi)有。

當(dāng)然,這里需要值得注意的是,自主研發(fā)的商業(yè)化存儲(chǔ)軟件,也不意味著所有代碼模塊都是封閉的。龐大的系統(tǒng)化工程中,必然會(huì)借鑒、改進(jìn)或采用少量開(kāi)源框架或組件,同樣也會(huì)因?yàn)殚_(kāi)源組件引入而潛藏安全漏洞。

存儲(chǔ)軟件自主研發(fā)的根本主要聚焦在四個(gè)方面:

一是,整體的架構(gòu)設(shè)計(jì);

二是,核心數(shù)據(jù)通路的構(gòu)建;

三是,從底層到上層的各個(gè)關(guān)鍵模塊的軟件設(shè)計(jì)及編碼實(shí)現(xiàn) ;

四是,系統(tǒng)的安全性等,即自主研發(fā)意味著廠商對(duì)于存儲(chǔ)系統(tǒng)的功能、性能、可靠性等具有完全控制權(quán),做到系統(tǒng)整體性上的自主,同時(shí)通過(guò)完備的單元測(cè)試、系統(tǒng)測(cè)試、產(chǎn)品測(cè)試,結(jié)合白盒測(cè)試、灰盒測(cè)試、黑盒測(cè)試等手段,交付高質(zhì)量的產(chǎn)品,將用戶的應(yīng)用風(fēng)險(xiǎn)降到最低。

用戶做存儲(chǔ)選型,到底是開(kāi)源還是自研?

全球存儲(chǔ)觀察分析認(rèn)為,開(kāi)源與自研好比硬幣的正反面,都有其存在的價(jià)值。根據(jù)不同場(chǎng)景與應(yīng)用需求,按照用戶自身技術(shù)開(kāi)發(fā)的能力高低選擇,這才是理性的解決之道。

從性能、可靠性、穩(wěn)定性、備份容災(zāi)等角度考量,用戶在面對(duì)核心業(yè)務(wù)應(yīng)用場(chǎng)景的方案選擇時(shí),對(duì)開(kāi)源存儲(chǔ)一直都比較謹(jǐn)慎。特別是用戶本身運(yùn)維團(tuán)隊(duì)比較薄弱的情況下,將面臨后續(xù)軟件維護(hù)、更新迭代等一系列技術(shù)挑戰(zhàn)。因此,在核心業(yè)務(wù)、生產(chǎn)系統(tǒng)和大規(guī)模部署情況下,用戶選擇存儲(chǔ)系統(tǒng)的觀念依然“保守”,自研存儲(chǔ)系統(tǒng)依然是其首選。

從另一方面來(lái)看,對(duì)于具備一定數(shù)量的存儲(chǔ)開(kāi)發(fā)人員,或具有存儲(chǔ)軟件領(lǐng)域開(kāi)發(fā)背景的用戶來(lái)說(shuō),自身具備對(duì)開(kāi)源存儲(chǔ)軟件的代碼修改、優(yōu)化與調(diào)試的綜合能力,甚至團(tuán)隊(duì)成員可能就是某些開(kāi)源社區(qū)的貢獻(xiàn)者。在這種情況下,借助存儲(chǔ)開(kāi)源軟件,便于配合業(yè)務(wù)創(chuàng)新應(yīng)用的發(fā)展趨勢(shì)下,可獲得更為快捷、靈活的應(yīng)用部署。由此可見(jiàn),倘若企業(yè)用戶的存儲(chǔ)軟件開(kāi)發(fā)能力強(qiáng),選擇開(kāi)源創(chuàng)新不失為一條符合產(chǎn)業(yè)發(fā)展的好路徑。

對(duì)用戶而言,存儲(chǔ)選擇到底是開(kāi)源還是自研產(chǎn)品,需要考慮到企業(yè)自身的綜合成本,包括自身應(yīng)用部署后的數(shù)據(jù)安全性要求,存儲(chǔ)軟件開(kāi)發(fā)與運(yùn)維人員成本,自身存儲(chǔ)實(shí)際應(yīng)用過(guò)程中解決問(wèn)題的服務(wù)質(zhì)量。當(dāng)然,數(shù)據(jù)安全、運(yùn)維成本與服務(wù)質(zhì)量,對(duì)于任何一個(gè)開(kāi)源存儲(chǔ)廠商而言,也是值得重視的三大問(wèn)題。

從存儲(chǔ)應(yīng)用角度出發(fā),開(kāi)源與自研已經(jīng)成為了企業(yè)級(jí)存儲(chǔ)發(fā)展的兩大趨勢(shì),好比人的左手與右手。企業(yè)用戶到底會(huì)用左手多一些,還是用右手多一些,只在于企業(yè)自身的技術(shù)能力與實(shí)際應(yīng)用需求。有時(shí)候左右手一起上,也不是沒(méi)有可能。一切皆有可能,當(dāng)然最大的可能還是在于自身的技術(shù)開(kāi)發(fā)能力到底有多少可能。

對(duì)于“開(kāi)源存儲(chǔ)+自研存儲(chǔ)”的融合發(fā)展模式,有多少企業(yè)用戶會(huì)真的開(kāi)啟,我們也可以拭目以待。


       原文標(biāo)題 : 企業(yè)級(jí)存儲(chǔ)發(fā)展趨勢(shì)談:開(kāi)源存儲(chǔ)的冷思考

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)