復(fù)雜疾病的新思路:甲基化還能這樣玩兒?
苦苦尋找新的研究切入點(diǎn),不如將已有的研究熱點(diǎn)“以舊翻新”!今天小編展示一下如何利用公共數(shù)據(jù)庫,通過GWAS和MR分析,玩轉(zhuǎn)“甲基化”!重點(diǎn):易思路復(fù)制,易發(fā)高分,易找到研究空白!
文章發(fā)表在EBioMedicine IF: 11.20/ Q1 ,題目為“線粒體相關(guān)的全基因組孟德爾隨機(jī)化確定多種癌癥類型的推定因果基因Mitochondrial related genome-wide Mendelian randomization identifies putatively causal genes for multiple cancer types”
作者利用孟德爾隨機(jī)化(MR)分析線粒體相關(guān)基因中以遺傳易感性為特征的線粒體功能障礙與癌癥之間的潛在因果關(guān)系,利用基于單核苷酸多態(tài)性(SNPs)的性狀的遺傳關(guān)聯(lián),將GWAS數(shù)據(jù)與基因表達(dá)和甲基化整合,識(shí)別表達(dá)和甲基化數(shù)量性狀位點(diǎn)(eQTL或mQTL)。并證明線粒體功能障礙在多種癌癥類型發(fā)病機(jī)制中的重要性。這些已知的基因可以作為癌癥治療和預(yù)防的潛在藥理靶點(diǎn),進(jìn)一步的研究可以探索潛在的生物學(xué)機(jī)制細(xì)節(jié)。
一、背景
線粒體是調(diào)節(jié)細(xì)胞能量產(chǎn)生、代謝、增殖和凋亡的重要細(xì)胞器。線粒體功能的改變是癌癥的一個(gè)眾所周知的標(biāo)志,通常表現(xiàn)為異常的線粒體形態(tài),缺乏線粒體拷貝數(shù),異常的能量代謝,活性氧(ROS)的積累,不平衡的生物發(fā)生和線粒體吞噬輕微的線粒體功能障礙可增強(qiáng)癌細(xì)胞的擴(kuò)增和侵襲。除了線粒體本身編碼的37個(gè)關(guān)鍵生物能量基因外,線粒體相關(guān)基因組還包含1000多個(gè)額外的核基因,這些基因的遺傳易感性可能會(huì)導(dǎo)致線粒體功能障礙。
許多實(shí)驗(yàn)和流行病學(xué)研究試圖通過探索選擇性線粒體DNA (mtDNA)和線粒體相關(guān)的核DNA突變來推斷線粒體功能障礙和癌癥之間的因果關(guān)系,然而,這些研究產(chǎn)生的結(jié)果是不一致且沒有考慮混雜因素的影響來區(qū)分因果。
全基因組關(guān)聯(lián)研究(GWAS)利用基于單核苷酸多態(tài)性(SNPs)的性狀的遺傳關(guān)聯(lián),并將GWAS數(shù)據(jù)與基因表達(dá)和甲基化整合,GWAS允許識(shí)別表達(dá)或甲基化數(shù)量性狀位點(diǎn)(eQTL或mQTL)?;诳偨Y(jié)數(shù)據(jù)的MR (SMR)可以利用獨(dú)立的GWAS總結(jié)統(tǒng)計(jì)數(shù)據(jù)和QTL數(shù)據(jù),從GWAS中確定的命中中優(yōu)先考慮潛在的因果基因。目前還沒有MR研究調(diào)查線粒體功能障礙與常見類型癌癥風(fēng)險(xiǎn)之間的潛在因果關(guān)系。
研究旨在通過綜合雙樣本MR分析,探討線粒體相關(guān)基因遺傳易感性為特征的線粒體功能障礙與多種癌癥類型之間的因果關(guān)系。
二、方法
實(shí)驗(yàn)設(shè)計(jì):從人類MitoCarta3.0數(shù)據(jù)庫中提取1136個(gè)已知的線粒體相關(guān)基因(圖1)。
圖1
暴露因素工具變量的選擇:1)線粒體的工具變量Cis-eQTL:來自從Gen Consortium 數(shù)據(jù)庫獲取eQTL匯總統(tǒng)計(jì)數(shù)據(jù)。 2)線粒體基因甲基化相關(guān)的工具變量Cis-mQTL:來自包括了兩個(gè)公開數(shù)據(jù)庫隊(duì)列的薈萃分析。共篩選出931,304個(gè)SNPs,對應(yīng)于2550個(gè)線粒體相關(guān)DNA甲基化CpG位點(diǎn)。3)線粒體相關(guān)蛋白表達(dá)相關(guān)的遺傳變異的Cis- pQTL工具變量:從5個(gè)蛋白質(zhì)組數(shù)據(jù)集中獲取,選擇了23個(gè)線粒體相關(guān)蛋白表達(dá)密切相關(guān)的SNPs(P<5 × 10?8)。
結(jié)局指標(biāo)工具變量的選擇:18種癌癥的工具變量:來自GWAS癌癥的匯總統(tǒng)計(jì)數(shù)據(jù)。
數(shù)據(jù)分析:包括孟德爾隨機(jī)化分析(MR),敏感性分析和共定位分析:在使用TwoSampleMR R包完成主要SMR分析后;使用5種附加MR方法進(jìn)行敏感性分析。使用coloc R包對兩個(gè)特征的共定位分析,后驗(yàn)概率PP.H4 >0.8為 GWAS和QTL具有顯著性關(guān)聯(lián)。
三、結(jié)果
線粒體全基因組cis-eQTLs與癌癥結(jié)局的分析
在SMR測試之后,從血液中獲得了662,968個(gè)代表線粒體相關(guān)基因表達(dá)和癌癥結(jié)果的SNPs(圖1),在多重測試后仍顯示相關(guān)性的強(qiáng)有力的相關(guān)性證據(jù)(PSMR<4.936 × 10?5 [Bonferroni校正,P<0.05/1013]),HEIDI檢驗(yàn)(PHEIDI<0.01)提示相關(guān)性是由于共享因果變異。
MR分析:在乳腺癌的7個(gè)獨(dú)特遺傳位點(diǎn)上鑒定了7個(gè)關(guān)聯(lián)信號(hào),在前列腺癌的4個(gè)獨(dú)特遺傳位點(diǎn)上鑒定了4個(gè)關(guān)聯(lián)信號(hào),在胃癌上鑒定了1個(gè)關(guān)聯(lián)信號(hào)。
敏感性分析:證明并支持上述的發(fā)現(xiàn)。
共定位分析:排除由于連鎖不平衡導(dǎo)致的混雜因素并檢測基因表達(dá)和癌癥之間共享因果變異的后驗(yàn)概率以確定癌癥GWAS和eQTL之間是否存在顯著的共定位(圖2)。
圖2
線粒體全基因組cis-mQTLs與癌癥結(jié)局的分析
MR分析:在乳腺癌的14個(gè)獨(dú)特遺傳位點(diǎn)上鑒定出15個(gè)關(guān)聯(lián)信號(hào),在前列腺癌的10個(gè)獨(dú)特遺傳位點(diǎn)上鑒定出11個(gè)關(guān)聯(lián)信號(hào),在胃癌上鑒定出1個(gè)關(guān)聯(lián)信號(hào),在肺癌的3個(gè)獨(dú)特遺傳位點(diǎn)上鑒定出4個(gè)關(guān)聯(lián)信號(hào),在黑色素瘤的1個(gè)獨(dú)特遺傳位點(diǎn)上鑒定出2個(gè)關(guān)聯(lián)信號(hào)(圖3)。
敏感性分析:支持相同的關(guān)聯(lián)(圖S4和S5)。
共定位分析:調(diào)節(jié)NSUN4的不同基因變異對甲基化水平有不同的影響,從而導(dǎo)致BU不同的結(jié)果。
作者共發(fā)現(xiàn)了6個(gè)獨(dú)特的位點(diǎn),它們調(diào)控NUSU4中7個(gè)不同CpG位點(diǎn)的甲基化水平,并與乳腺癌的風(fēng)險(xiǎn)呈正相關(guān)(圖3),這6個(gè)位點(diǎn)其中2個(gè)也與前列腺癌的風(fēng)險(xiǎn)呈正相關(guān)。此外,NUDT5甲基化增加1個(gè)SD與前列腺癌風(fēng)險(xiǎn)降低4%相關(guān);對于肺癌,VARS2甲基化增加1個(gè)SD與癌癥風(fēng)險(xiǎn)增加20%以上相關(guān),這取決于甲基化CpG位點(diǎn)的不同(圖3)。
圖3
圖S4
圖S5
線粒體相關(guān)基因甲基化和其表達(dá)之間的因果關(guān)系的分析
SMR分析得到了DNA甲基化CpG位點(diǎn)調(diào)控線粒體基因表達(dá)的基因列表,結(jié)果顯示由rs6682266、rs5013329、rss56063031和rs6681857調(diào)控的NSUN4的甲基化與NSUN4的表達(dá)相關(guān),而由rs2596495調(diào)控的VARS2甲基化也與VARS2的表達(dá)相關(guān)。
線粒體全基因組cis-pQTLs與癌癥結(jié)局的MR分析
僅從cis-pQTLs中提取了23個(gè)線粒體相關(guān)SNP,在SMR分析后,沒有發(fā)現(xiàn)因果關(guān)系。
對已識(shí)別的遺傳變異進(jìn)行全現(xiàn)象掃描
全現(xiàn)象掃描分析以排除所調(diào)查癌癥可能的多效性[使用GWASATLAS和PhenoScanner數(shù)據(jù)庫](圖S8-S10)。根據(jù)以下選擇標(biāo)準(zhǔn):1)與結(jié)果共享相同的效應(yīng)等位基因;2)關(guān)聯(lián)達(dá)到GWAS顯著性(P < 5 × 10?8;3)大小效應(yīng)絕對值(β) >0.01。
與乳腺癌和前列腺癌有因果關(guān)系的NSUN4基因表達(dá)和DNA甲基化相關(guān)的變異與的次要性狀無關(guān),進(jìn)一步表明NSUN4與這兩種癌癥的因果關(guān)系是強(qiáng)有力的(圖S7和S8)。
rs6677385 (FDPS表達(dá)相關(guān))與血尿素氮和克羅恩病等次要性狀相關(guān)(圖S9a)。
rs4750175 (NUDT5甲基化相關(guān))也與內(nèi)分泌相關(guān)的特征相關(guān)(圖S9b)。
與VARS2甲基化相關(guān)的三個(gè)SNPs與代謝、骨骼、呼吸、精神、免疫和內(nèi)分泌相關(guān)特征等多種特征相關(guān)(圖S10)。
圖S8
圖S9
圖S10
線粒體功能障礙與癌癥的雙向MR分析
對mtDNA拷貝數(shù)(線粒體功能障礙的代理生物標(biāo)志物)和癌癥進(jìn)行雙向MR分析的結(jié)果表明,因果關(guān)系方向是癌癥類型特異性的;其中mtDNA拷貝數(shù)變異對宮頸癌、特定亞型卵巢癌有因果關(guān)系,而三陰性乳腺癌、頭頸癌與mtDNA拷貝數(shù)變異有因果關(guān)系。
四、討論
在本研究中,作者證明了以遺傳易感性為特征的線粒體功能障礙對癌癥具有因果影響,并確定了重要的推定因果線粒體相關(guān)基因:1)乳腺癌的FDPS;2)前列腺癌的NUDT5;3) VARS2治療肺癌,4)NSUN4治療乳腺癌和前列腺癌。
研究結(jié)果表明,線粒體功能障礙的遺傳決定因素以癌癥類型特異性的方式與癌癥風(fēng)險(xiǎn)相關(guān),這為將遺傳位點(diǎn)、基因表達(dá)和甲基化與多種癌癥聯(lián)系起來的潛在機(jī)制提供了強(qiáng)有力的證據(jù)。
五、思維拓展
GWAS和MR分析,可以聯(lián)合mQTL分析或者共定位分析找到一些與某基因甲基化水平顯著相關(guān)的SNP位點(diǎn)。這樣,以甲基化為中間橋梁,實(shí)現(xiàn)了SNP——甲基化——性狀的生物學(xué)模型。利于探究對DNA序列變異和DNA甲基化之間關(guān)系,為和調(diào)控中的分子網(wǎng)絡(luò)、基因變異與人類表型的潛在聯(lián)系提供了新的見解。同時(shí),研究還揭示了多個(gè)新的調(diào)控網(wǎng)絡(luò),這些發(fā)現(xiàn)為支持表型變異的生物學(xué)途徑提供信息基礎(chǔ)。
苦苦尋找新的研究切入點(diǎn),不如將已有的研究熱點(diǎn)“以舊翻新”!通過以上思路,可以在已有的臨床研究的基礎(chǔ)上,進(jìn)行進(jìn)一步的論證!應(yīng)用范圍十分廣泛,大致可以分類為:
疾病易感性甲基化位點(diǎn)關(guān)聯(lián)分析;
藥物敏感性甲基化位點(diǎn)關(guān)聯(lián)分析等。
對表型研究感興趣的小伙伴不要錯(cuò)過,趕緊上車吧~