孟德爾隨機(jī)化+遺傳共定位分析的簡(jiǎn)介
在前期的孟德爾隨機(jī)化(MR)分析簡(jiǎn)介中,我們講述了如何利用公共數(shù)據(jù)庫,探討惡性腫瘤病因和預(yù)后相關(guān)的問題!今天給大家介紹孟德爾隨機(jī)化分析中的針對(duì)高端線!隨機(jī)對(duì)照臨床試驗(yàn)的平價(jià)替代——孟德爾隨機(jī)分析+共定位分析!為了方便理解,先做一下簡(jiǎn)單介紹。
藥靶標(biāo)孟德爾聯(lián)合共定位分析
立即掃碼上車
自從2006年全基因組關(guān)聯(lián)分析(GWAS)問世以來,已經(jīng)經(jīng)歷了多個(gè)世代,從單隊(duì)列時(shí)代(5000人左右)到多隊(duì)列meta分析時(shí)代(GWAS meta-analysis;1萬-10萬)和生物庫時(shí)代(如UK Biobank 50萬人)。如今,GWAS已經(jīng)正式進(jìn)入了全球多生物庫meta分析的新時(shí)代,人數(shù)也正式來到了百萬級(jí)別,各類Post-GWAS分析應(yīng)運(yùn)而生。
共定位分析屬于Post-GWAS的一項(xiàng)重要工作,旨在GWAS結(jié)果的基礎(chǔ)上鑒定與表型相關(guān)的遺傳變異位點(diǎn)。傳統(tǒng)的GWAS是將全基因組范圍內(nèi)的常見變異進(jìn)行關(guān)聯(lián)分析,鑒定與表型相關(guān)的信號(hào)位點(diǎn),但其如何通過基因或者通路影響表型很難被闡述。基于此,開發(fā)了共定位分析方法,其原理是利用已有數(shù)據(jù)庫公布的QTL位點(diǎn),結(jié)合GWAS summary數(shù)據(jù),鑒定與表型相關(guān)的QTL位點(diǎn).在MR后面做的共定位分析,其實(shí)最好的結(jié)果是兩個(gè)表型并不在遺傳學(xué)上共享因果變異,這樣才能更有利的證明兩個(gè)表型之間的因果關(guān)系。
首先需要了解的是,傳統(tǒng)孟德爾隨機(jī)化研究會(huì)運(yùn)用大量遺傳變異(SNP)來作為工具變量。具有大量的工具變量的表型,使得大多數(shù)的孟德爾隨機(jī)化方法學(xué),比如two-stage least squared, inverse variance weighted, MR-Egger regression等,都能被靈活運(yùn)用。然而,一些分子學(xué)性狀[比如基因表達(dá)或蛋白質(zhì)表達(dá)通常只有很少的遺傳變異能作為工具變量。比如大多數(shù)的蛋白質(zhì)都只有一到兩個(gè)SNP能作為工具變量。究其原因,傳統(tǒng)的暴露,如睡眠,是比較復(fù)雜的表型,受到多基因多生物通路的影響,所以和其相關(guān)的遺傳變異也比較豐富。而分子學(xué)性狀和人類的基因端非常接近,通常都是基因附近的一些遺傳變異(cis QTLs)才會(huì)直接影響到該基因或該蛋白質(zhì)的表達(dá)。
共定位的類型包括:1)GWAS和eQTL[基因的表達(dá)數(shù)量性狀位點(diǎn)]共定位;2)GWAS和sQTL[剪切]共定位;3)GWAS和mQTL[甲基化]共定位;4)GWAS和pQTL[蛋白質(zhì)數(shù)量性狀位點(diǎn)]共定位;在這個(gè)方法中有四個(gè)假設(shè):H0: 表型1(GWAS)和 表型2 (*QTL)與某個(gè)基因組區(qū)域的所有SNP位點(diǎn)無顯著相關(guān)。 H1/H2:表型1(GWAS)或表型2(*QTL)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān)。 H3:表型1(GWAS)和 表型2 (*QTL)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān),但由不同的因果變異位點(diǎn)驅(qū)動(dòng)。 H4:表型1(GWAS)和 表型2 (*QTL)與某個(gè)基因組區(qū)域的SNP位點(diǎn)顯著相關(guān),且由同一個(gè)因果變異位點(diǎn)驅(qū)動(dòng)。
所以共定位分析,本質(zhì)上是在檢驗(yàn)第四種的后驗(yàn)概率;基于上面的假設(shè),第四種設(shè)想 H4 在統(tǒng)計(jì)學(xué)上概率越高,越能解釋顯著信號(hào)位點(diǎn)如何影響表型。H4值的范圍在0-1之間,0表示概率為0%,1表示概率為100%。后驗(yàn)概率越高越好。一般文獻(xiàn)認(rèn)為0.75~ 0.95的位點(diǎn)是共定位位點(diǎn)。
今天的分享的文章使用的是pQTL,它是一種研究基因型-蛋白質(zhì)關(guān)聯(lián)的方法。由于蛋白質(zhì)代表疾病的中間表型,并提供對(duì)遺傳和非遺傳風(fēng)險(xiǎn)因素如何與臨床鏈接的信息。蛋白質(zhì)水平和DNA序列變異與常見疾病風(fēng)險(xiǎn)等位基因共定位之間的關(guān)聯(lián)可揭示疾病機(jī)制,揭示新型藥物靶點(diǎn)和生物標(biāo)記物。pQTL分兩類:順式pQTL(cis-pQTL)為靠近編碼蛋白質(zhì)的基因;反式pQTL(trans-pQTL)距離編碼蛋白質(zhì)的基因較遠(yuǎn),通常位于不同染色體上。
此外,蛋白質(zhì)比其他分子性狀更有可能被用作藥物靶點(diǎn),MR分析結(jié)合使用pQTL作為IV的共定位將對(duì)人類遺傳學(xué)的廣泛社區(qū)有價(jià)值。如果使用MR分析,結(jié)果表明基因變異和蛋白表達(dá)水平都能與表型穩(wěn)健相關(guān),則能驗(yàn)證該蛋白與疾病有因果關(guān)系。這是因?yàn)椋?strong>蛋白質(zhì)表達(dá)可能會(huì)因?yàn)榧膊《l(fā)生改變,但基因變異卻不能。
以pQTL發(fā)現(xiàn)為目標(biāo)的多組學(xué)臨床隊(duì)列研究的四個(gè)方向:01 發(fā)現(xiàn)疾病的致病機(jī)制;02 發(fā)現(xiàn)新的藥物靶點(diǎn);03 發(fā)現(xiàn)藥物的新治療適應(yīng)癥;04 識(shí)別臨床相關(guān)的生物標(biāo)志物。因?yàn)榇蠖鄶?shù)藥物都針對(duì)的是蛋白質(zhì)而非基因!雖然許多藥物是基于基因組研究發(fā)現(xiàn)開發(fā)的,但這些藥物通常在臨床階段失敗,因?yàn)樗鼈儫o法為成功的治療提供預(yù)期的結(jié)果。對(duì)來自已有藥物開發(fā)項(xiàng)目的數(shù)據(jù)評(píng)估顯示,具有MR分析和pQTL共定位支持的蛋白靶點(diǎn)適應(yīng)癥對(duì)更有可能獲得批準(zhǔn)!蛋白質(zhì)組的遺傳學(xué)研究方法在藥物靶點(diǎn)篩查上的三大優(yōu)勢(shì):
1)快速有效地篩查藥物對(duì)相關(guān)疾病的有效性;
2)通過篩查該藥物和其他疾病的關(guān)系,有效提示藥物的相關(guān)副作用;
3)通過檢索現(xiàn)有藥物,探索現(xiàn)有藥物對(duì)其他疾病的醫(yī)治效果,發(fā)現(xiàn)舊藥新用的可能性。
藥靶標(biāo)孟德爾聯(lián)合共定位分析
立即掃碼上車