侵權(quán)投訴
訂閱
糾錯
加入自媒體

使用DriverPower識別癌癥driver基因的綜合負(fù)荷和功能影響測試

2020-12-24 14:21
科研菌
關(guān)注

      今天跟大家分享的是2020年發(fā)表在Nat.Commun .(IF:12.121)雜志上的一篇文章Combined burden and functional impact tests for cancer driver discovery using DriverPower.在文章中作者描述了一種新的高靈敏度算法DriverPower,用于在全基因組和外顯子組測序數(shù)據(jù)中識別區(qū)分癌癥的驅(qū)動和乘客突變。

Combined burden and functional impact tests for cancer driver discovery using DriverPower

使用DriverPower識別癌癥driver基因的綜合負(fù)荷和功能影響測試

(分享者:科研菌-碎碎冰)

一.研究背景

與癌癥發(fā)生發(fā)展相關(guān)的重要基因被稱為“驅(qū)動基因(driver基因)”,這種基因決定了癌癥的走向:當(dāng)driver基因發(fā)生突變后,癌細(xì)胞就會活躍起來。driver基因突變占腫瘤中體細(xì)胞變異比例少,而且在大多數(shù)癌癥中,腫瘤內(nèi)和腫瘤間存在明顯的異質(zhì)性,背景突變率(BMR)都可能存在數(shù)個數(shù)量級的差異。此外,大規(guī)模癌癥全基因組測序WGS的出現(xiàn)為人們探索driver基因在非編碼區(qū)中的作用成為可能。但由于突變對基因組非編碼區(qū)的影響人們了解甚少,所以也有不小的挑戰(zhàn)。大多數(shù)最新技術(shù)通過突變負(fù)荷測試(通過將基因組區(qū)域中觀察到的突變率與BMR預(yù)期的突變率進(jìn)行比較)或功能影響測試來檢測陽性選擇信號,從而識別driver基因。由此作者團(tuán)隊開發(fā)DriverPower算法——使用突變負(fù)荷和功能影響評分來識別編碼和非編碼癌癥driver基因。

二.分析流程

三.結(jié)果解讀

1.建立BMR模型

作者首先從PCAWG項目獲得WGS體細(xì)胞變異數(shù)據(jù)。在所有腫瘤隊列中,作者觀察到在組織,供體以及基因座水平上的突變率存在很大差異。driver基因突變檢測的精確性需要準(zhǔn)確估計整個腫瘤基因組中的BMR(背景突變率),此外還需要考慮到腫瘤類型、供體和基因組區(qū)域之間的廣泛差異(圖S1)。DriverPower通過使用與局部BMR共同變化的基因組特征,來建立BMR模型從而解決這個問題。

圖S1.隊列和供體水平的異質(zhì)性

背景知識:

目前通過體細(xì)胞突變識別癌癥driver基因的分析方法主要有兩種:①背景突變率(BMR)法和②背景突變比例度量法。背景突變率方法的思想是,評估一個基因在癌癥樣本中是否含有比預(yù)期更多的體細(xì)胞突變。基于比率測量的方法是通過考察一個基因中不同種類體細(xì)胞突變數(shù)的比例來探測癌癥driver基因。

作者研究了兩種基于基因組特征的BMR建模算法。第一個算法是首先先使用隨機(jī)lasso,然后是運用二項式廣義線性模型(GLM),第二種算法則是基于梯度提升機(jī)(GBM,一種非線性且非參數(shù)的樹集成算法)的算法。為了評估這兩種BMR建模算法,通過隨機(jī)采樣基因組坐標(biāo),制作了不重疊的1兆堿基對(Mbp)常染色體元件(n = 2521)和訓(xùn)練基因組元件(n = 867,266)。然后使用五重交叉驗證(cross validation,CV)來預(yù)測每個元件的突變數(shù)。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號