侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

以融合之勢(shì),突破困局 | 極道Achelous統(tǒng)一計(jì)算系統(tǒng),助力企業(yè)數(shù)據(jù)“加速跑”

2021-05-31 18:03
來(lái)源: 粵訊

對(duì)大數(shù)據(jù)的分析處、處理,是將數(shù)據(jù)從低價(jià)值密度體中煉到高價(jià)值密度體的過(guò)程,被現(xiàn)代商業(yè)譽(yù)為“煉金術(shù)”。這也是數(shù)據(jù)資源轉(zhuǎn)化為數(shù)據(jù)資產(chǎn)的過(guò)程,然而由于數(shù)據(jù)規(guī)模龐大、數(shù)據(jù)類(lèi)型眾多,使得數(shù)據(jù)價(jià)值的實(shí)現(xiàn)仍然存在很高的技術(shù)門(mén)檻,企業(yè)用戶(hù)也日益被大數(shù)據(jù)生態(tài)的復(fù)雜性所困。

企業(yè)“海量數(shù)據(jù)”之困

企業(yè)在擁有了海量非結(jié)構(gòu)化數(shù)據(jù)之后,要將這些數(shù)據(jù)同實(shí)際業(yè)務(wù)、商業(yè)目的和運(yùn)營(yíng)目標(biāo)相結(jié)合,對(duì)多樣性數(shù)據(jù)進(jìn)行融合分析處理成為必然,這使得數(shù)據(jù)分析和加工部門(mén)需投入大量的人力物力進(jìn)行數(shù)據(jù)分析、處理、加工和學(xué)習(xí),以得到有價(jià)值的結(jié)果輸出。

雖然數(shù)據(jù)分析本身是與行業(yè)和業(yè)務(wù)相關(guān),但非結(jié)構(gòu)化數(shù)據(jù)的分析計(jì)算模式是共通的。隨著技術(shù)發(fā)展,傳統(tǒng)批量計(jì)算、高性能計(jì)算、大數(shù)據(jù)分析、人工智能(分布式機(jī)器學(xué)習(xí)/深度學(xué)習(xí))等數(shù)據(jù)并行處理、分析方法相繼誕生,以滿(mǎn)足各行業(yè)數(shù)據(jù)分析需求。

在實(shí)際應(yīng)用中,企業(yè)各部門(mén)將以不同的計(jì)算模式,來(lái)構(gòu)建所需的系統(tǒng)和計(jì)算集群,但這種割裂的計(jì)算集群卻造成了重復(fù)建設(shè)和資源浪費(fèi)。而隨著業(yè)務(wù)的推進(jìn),同一批數(shù)據(jù)在不同處理階段所需的分析方法不同,計(jì)算分析基礎(chǔ)架構(gòu)還需要掌握復(fù)雜的技術(shù)棧,以及數(shù)據(jù)分析前期的服務(wù)部署能力。

另外,由于計(jì)算模式多樣化帶來(lái)的資源壁壘,企業(yè)還需要投入巨大的成本;數(shù)據(jù)計(jì)算系統(tǒng)建立后,數(shù)據(jù)分析人員如果沒(méi)有能力設(shè)計(jì)高度并行和健壯的數(shù)據(jù)分析流程,需要經(jīng)過(guò)漫長(zhǎng)等待才能夠獲得結(jié)果。

降低海量非結(jié)構(gòu)化數(shù)據(jù)使用門(mén)檻 助力企業(yè)數(shù)據(jù)“加速跑”

為了幫助企業(yè)用戶(hù)解決數(shù)據(jù)分析門(mén)檻高、效率低的問(wèn)題,極道潛心打造了Achelous統(tǒng)一計(jì)算系統(tǒng)。這是一款融合多種計(jì)算于同一套物理集群、支持EB級(jí)海量數(shù)據(jù)分析、處理、訓(xùn)練的系統(tǒng),并且Achelous有能力跟不同特征的存儲(chǔ)系統(tǒng)配合,做到計(jì)算與存儲(chǔ)應(yīng)用感知,輕松構(gòu)建復(fù)雜數(shù)據(jù)流的智能融合計(jì)算平臺(tái),降低企業(yè)IT建設(shè)投入

Achelous統(tǒng)一計(jì)算系統(tǒng)以統(tǒng)一的數(shù)據(jù)處理引擎更高效地挖掘數(shù)據(jù)價(jià)值,以智能化的方式驅(qū)動(dòng)整個(gè)數(shù)據(jù)處理閉環(huán),計(jì)算效率與資源利用的大幅提升,為開(kāi)發(fā)者、企業(yè)、以及政府的數(shù)字化、智能化升級(jí)打下堅(jiān)實(shí)基礎(chǔ)。

降低構(gòu)建業(yè)務(wù)數(shù)據(jù)分析流程難度

Achelous 是極道提供的調(diào)度復(fù)雜工作流或數(shù)據(jù)流的調(diào)度器和執(zhí)行引擎。為了降低業(yè)務(wù)專(zhuān)家利用現(xiàn)有的算法和模型進(jìn)行并行編程的難度,Achelous統(tǒng)一計(jì)算系統(tǒng)提供執(zhí)行引擎以及多種表達(dá)方式,進(jìn)行數(shù)據(jù)流業(yè)務(wù)的組合編程。

業(yè)務(wù)專(zhuān)家只需描述所要分析業(yè)務(wù)的分析階段,以及數(shù)據(jù)依賴(lài)關(guān)系,系統(tǒng)將自動(dòng)構(gòu)建負(fù)載的批量處理有向圖,并生成機(jī)器代碼調(diào)度執(zhí)行。例如,應(yīng)用領(lǐng)域?qū)S谜Z(yǔ)言(BSL、WDL)編寫(xiě)工作流(Pipeline),業(yè)務(wù)專(zhuān)家可以動(dòng)態(tài)構(gòu)建自己的大數(shù)據(jù)或者人工智能應(yīng)用,按照數(shù)據(jù)依賴(lài)進(jìn)行計(jì)算。實(shí)現(xiàn)完整的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)建模等業(yè)務(wù)流程,極大地簡(jiǎn)化了業(yè)務(wù)專(zhuān)家的數(shù)據(jù)處理流程,并大幅提高工作效率。

自動(dòng)構(gòu)建跨應(yīng)用計(jì)算框架工作流

基于Achelous統(tǒng)一計(jì)算系統(tǒng),用戶(hù)面對(duì)設(shè)計(jì)復(fù)雜跨框架的數(shù)據(jù)流,需要高并發(fā)或高通量計(jì)算時(shí),只需要制定計(jì)算框架和預(yù)計(jì)分配的資源,計(jì)算框架會(huì)在計(jì)算過(guò)程中自動(dòng)構(gòu)建,計(jì)算完成后,計(jì)算框架會(huì)自動(dòng)銷(xiāo)毀,資源重新釋放并共享給其他計(jì)算和數(shù)據(jù)處理應(yīng)用。創(chuàng)建集群的過(guò)程對(duì)用戶(hù)完全透明,無(wú)需人工干預(yù)和配置,高效完成。

另外,極道提供的可視化界面,方便用戶(hù)以拖拽的方式生成數(shù)據(jù)流和工作流,這一設(shè)計(jì)可以免去WDL或BSL程序編寫(xiě),幫助研究人員擺脫IT技術(shù)的束縛,將更多精力投入業(yè)務(wù)研發(fā)。

用事實(shí)見(jiàn)證數(shù)據(jù)流構(gòu)建能力

在某腫瘤檢測(cè)機(jī)構(gòu),通過(guò)部署極道Achelous統(tǒng)一計(jì)算系統(tǒng),其計(jì)算資源擴(kuò)充近2倍,樣本交付能力提升了6倍,滿(mǎn)足其對(duì)海量生物數(shù)據(jù)處理、分析和建模的多樣化需求,助力打通腫瘤臨床檢測(cè)全流程。

在BioFlow計(jì)算引擎的協(xié)助下,該機(jī)構(gòu)一個(gè)作業(yè)的特殊階段,被輕松分解為數(shù)千路并行,每天有超過(guò)幾萬(wàn)個(gè)任務(wù)運(yùn)行在高度并行的計(jì)算集群里。

在零專(zhuān)業(yè)IT人員情況下,該機(jī)構(gòu)運(yùn)行維護(hù)著一個(gè)復(fù)雜的數(shù)十節(jié)點(diǎn)HPC/Spark混雜計(jì)算集群,以及一個(gè)大規(guī)模分布式存儲(chǔ)系統(tǒng)。

利用強(qiáng)大的BioFlow WDL/BSL語(yǔ)言引擎和BioFlow執(zhí)行引擎, 幾名生物信息分析工程師在短短的4個(gè)月內(nèi),用近千個(gè)工具開(kāi)發(fā)出了數(shù)百個(gè)復(fù)雜的分析流程。

高效的執(zhí)行引擎簡(jiǎn)化了分析流程開(kāi)發(fā),讓業(yè)務(wù)流程變得更敏捷、更靈活、更可控和自動(dòng)化。

在未來(lái)數(shù)字經(jīng)濟(jì)浪潮中,降低計(jì)算成本、縮短任務(wù)周期、提高分析效率,是企業(yè)大數(shù)據(jù)點(diǎn)石成金的基礎(chǔ)。極道作為數(shù)據(jù)系統(tǒng)領(lǐng)域的生力軍,始終以用戶(hù)需求為導(dǎo)向,以技術(shù)創(chuàng)新為驅(qū)動(dòng),實(shí)現(xiàn)提高計(jì)算并行程度和提高資源利用率這一目標(biāo),進(jìn)一步降低用戶(hù)的整體擁有成本,助力企業(yè)釋放更多數(shù)據(jù)價(jià)值。

關(guān)于極道:

極道,專(zhuān)注于數(shù)據(jù)“存”、“管”、“算”的創(chuàng)新數(shù)據(jù)系統(tǒng)公司,由國(guó)內(nèi)頂尖的存儲(chǔ)和數(shù)據(jù)分析專(zhuān)家團(tuán)隊(duì)建立,是一家以分布式系統(tǒng)為核心幫助客戶(hù)提升IT資源效率,提供高效智能的數(shù)據(jù)處理基礎(chǔ)平臺(tái)的數(shù)據(jù)系統(tǒng)公司。

極道的核心產(chǎn)品涵蓋了分布式并行文件存儲(chǔ)、強(qiáng)關(guān)聯(lián)大規(guī)模實(shí)時(shí)數(shù)據(jù)管理系統(tǒng),以及集群的調(diào)度系統(tǒng)和執(zhí)行引擎,以滿(mǎn)足企業(yè)對(duì)數(shù)據(jù)處理、分析和建模的多樣化需求。極道注重自主知識(shí)產(chǎn)權(quán)和產(chǎn)品的可控性,核心軟件系統(tǒng)均為自主研發(fā),已擁有多項(xiàng)專(zhuān)利和軟件著作權(quán)。


聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)