侵權(quán)投訴
訂閱
糾錯
加入自媒體

當(dāng)藥物研發(fā)遇上阿里云超算,GHDDI如何實(shí)現(xiàn)高通量分子篩選?

于是,科學(xué)家嘗試通過機(jī)器模擬分子化合物與靶點(diǎn)的相互作用等計(jì)算方式篩選出可能有效的化合物做小通量實(shí)驗(yàn)。其中一種傳統(tǒng)虛擬篩選方式是通過小分子和靶點(diǎn)對接,對不同配體的結(jié)合效果打分或者通過分子動力學(xué)進(jìn)一步計(jì)算,篩選出得分高且結(jié)合模式合理的配體作為候選藥物進(jìn)行實(shí)驗(yàn)驗(yàn)證,加速藥物研究進(jìn)程。

由于分子庫巨大,哪怕用計(jì)算機(jī)實(shí)現(xiàn)虛擬篩選,需要在有限時間完成,也極大挑戰(zhàn)了計(jì)算機(jī)性能。假設(shè)某化合物庫有10,000個候選配體,以每個化合物在單核CPU平均處理時間1.5個小時計(jì)算,總共需要15,000 個小時(625天)才能完成此化合物庫的分子篩選。而高性能計(jì)算集群的應(yīng)用,為現(xiàn)代藥物研發(fā)提供了必不可少的支撐。如果在高性能集群上,用625個CPU并行計(jì)算,一天則可完成上述任務(wù)。如果用高性能GPU訓(xùn)練好的人工智能模型進(jìn)行預(yù)測篩選,在單個GPU上四分鐘則可以完成上述任務(wù)。

云超算的藥物研發(fā)場景驗(yàn)證

高性能計(jì)算又稱超算,是一種用超級計(jì)算機(jī)或大規(guī)模的計(jì)算集群來解決需要大量計(jì)算能力(如并行計(jì)算、AI模型運(yùn)算)需求的方法,在石油勘探、氣象預(yù)報、藥物研發(fā)中廣泛應(yīng)用。一般而言,為在規(guī)定時間內(nèi)完成藥物研發(fā)的分子篩選,研究者需要擁有強(qiáng)大計(jì)算能力的計(jì)算平臺、大容量存儲和大量配套的高性能應(yīng)用軟件,如Amber, NAMD等。

在高性能計(jì)算出現(xiàn)后的許多年中,由于虛擬化造成的性能損耗,云計(jì)算并不被從事高性能計(jì)算開發(fā)的專家看好。在單個節(jié)點(diǎn)實(shí)驗(yàn)中,物理機(jī)性能一定比虛擬機(jī)高,使用配置最好最快的物理機(jī)器幾乎成為高性能計(jì)算領(lǐng)域的“潛規(guī)則“。

2017年,阿里云在云棲大會上發(fā)布神龍服務(wù)器。這款由阿里云自主開發(fā)的云服務(wù)器,主要通過自研芯片和MOC卡來實(shí)現(xiàn)虛擬化功能,并將存儲網(wǎng)絡(luò)的管控放上來,使得CPU本身不再浪費(fèi),100%地為計(jì)算者提供服務(wù)。

盡管理論上還是會耗掉資源,但神龍服務(wù)器的優(yōu)勢顯而易見。容器在神龍服務(wù)器上運(yùn)行的性能,比傳統(tǒng)物理機(jī)上高20-30%。因?yàn)樵趥鹘y(tǒng)物理機(jī)上高密度部署容器時,由于存儲網(wǎng)絡(luò)虛擬化的資源核心和業(yè)務(wù)所占的CPU的資源,之間會互相爭搶,隨著整體負(fù)載率提升,它的業(yè)務(wù)的延時會迅速惡化,最后導(dǎo)致業(yè)務(wù)不可用。而在神龍上面,因?yàn)?每一個容器之間的數(shù)據(jù)鏈路都是用芯片的硬件隊(duì)列進(jìn)行隔離的,不會互相影響,即便負(fù)載接近90%,延時的變化依然不大。

消除了虛擬化損耗的神龍讓云超算得以實(shí)現(xiàn),阿里云超級算計(jì)集群以神龍服務(wù)器作為算力底座,通過RoCE高速網(wǎng)絡(luò)連接,加上并行存儲文件系統(tǒng)CPFS,對外提供了完整高性能計(jì)算所需要的硬件基礎(chǔ)設(shè)施。軟件調(diào)度層面則提供了E-HPC(Elastic High Performance Computing)能夠讓用戶自助在云上搭建自己的高性能集群系統(tǒng),配置高性能服務(wù)器和大容量存儲,提供軟件多節(jié)點(diǎn)運(yùn)行和高通量任務(wù)處理解決方案,直接滿足藥物研發(fā)人員對計(jì)算平臺的需求。

新冠疫情期間,GHDDI在阿里云之上搭建了開放共享平臺,使用E-HPC搭建高性能計(jì)算集群,用于藥物研發(fā)的分子對接、分子動力學(xué)模擬、深度學(xué)習(xí)模型訓(xùn)練,同時為合作伙伴創(chuàng)建不同的云超算子賬戶,實(shí)現(xiàn)計(jì)算資源共享和數(shù)據(jù)共享。

阿里云資深專家何萬青博士告訴動脈網(wǎng),GHDDI的共享平臺幫助科學(xué)家更便捷地將即時的想法轉(zhuǎn)化為具有指導(dǎo)意義的創(chuàng)新探索,極大地提高了新冠肺炎相關(guān)藥物、疫苗的開發(fā)效率。未來,阿里云超算將基于彈性的高性能計(jì)算能力,為更多的藥物研發(fā)工作提供必要的算力支撐。

<上一頁  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號