代謝組與基因組的碰撞——不懂生信也可以復(fù)制的MR分析思路
代謝產(chǎn)物在表型調(diào)節(jié)中發(fā)揮重要作用,但代謝產(chǎn)物與腫瘤之間的因果關(guān)系尚未得到充分研究,作者通過孟德爾隨機(jī)化(MR)研究來研究代謝產(chǎn)物與各種癌癥之間的因果關(guān)系。整合了代謝組學(xué)和基因組學(xué),以探索癌癥發(fā)生的危險(xiǎn)因素。在臨床實(shí)踐中,是否可以將具有因果關(guān)系的代謝物作為生物標(biāo)志物來區(qū)分癌癥高風(fēng)險(xiǎn)患者,這一點(diǎn)值得探討。需要更詳細(xì)的研究來闡明機(jī)制途徑。
今天再分享一篇在前人研究的基礎(chǔ)上,推陳出新的文章“(遺傳決定的代謝產(chǎn)物對(duì)肺癌、乳腺癌、卵巢癌和膠質(zhì)瘤等癌癥的因果影響:一項(xiàng)孟德爾隨機(jī)化研究Causal effects of genetically determined metabolites on cancers included lung, breast, ovarian cancer, and glioma: a Mendelian randomization study )”,于2022/7/11發(fā)表在Transl Lung Cancer Res上~
這一類的文章,均為思路簡(jiǎn)潔,可復(fù)制性強(qiáng),新手小白也可以學(xué)!只要緊追熱點(diǎn),跟緊數(shù)據(jù)庫中的更新數(shù)據(jù),打開思路,聯(lián)系臨床即可!同時(shí),作者和的研究結(jié)果也可以作為我們研究其他癌癥研究的基礎(chǔ),可以結(jié)合轉(zhuǎn)化和臨床研究來解釋代謝產(chǎn)物如何誘導(dǎo)癌癥的發(fā)展以及它們?cè)谙嚓P(guān)疾病發(fā)病機(jī)制中的作用。
下面是原文,學(xué)習(xí)起來吧~
一、背景
代謝產(chǎn)物是影響腫瘤發(fā)生的關(guān)鍵因素之一。例如,肝激酶B1(LKB1)突變型肺癌具有核苷酸代謝缺陷,導(dǎo)致對(duì)脫氧胸苷酸激酶抑制的超敏反應(yīng)。N-乙酰天門冬氨酸在促進(jìn)腫瘤生長中起著重要作用。2-羥基戊二酸在膠質(zhì)瘤中異常升高。然而,關(guān)于代謝產(chǎn)物與腫瘤之間的因果關(guān)系的研究并不全面。
由于代謝組學(xué)的敏感性,可以檢測(cè)到生物行為的細(xì)微變化,從而深入了解各種生理狀態(tài)和異常過程以及合并疾病的機(jī)制。但生物標(biāo)志物驗(yàn)證的最大挑戰(zhàn)之一是克服由于遺傳因素和環(huán)境暴露的差異導(dǎo)致的個(gè)體間代謝物差異。鑒定代謝產(chǎn)物及其生物學(xué)作用是至關(guān)重要的一步。在這些條件下,許多研究表明代謝組學(xué)在癌癥研究中具有巨大潛力。
孟德爾隨機(jī)化(MR)是一種基于GWAS匯總數(shù)據(jù)的通用方法,以遺傳變異作為工具變量(IV)評(píng)估暴露與結(jié)果之間的因果關(guān)系。換句話說,GWAS的基因變異可用于模擬隨機(jī)對(duì)照比較,以驗(yàn)證各種因素之間的因果關(guān)系。此外,GWAS已擴(kuò)展到代謝概況。
作者使用雙樣本MR方法來檢測(cè)基因決定的代謝型(GDMs)對(duì)肺癌(LC)、乳腺癌(BC)、卵巢癌(OC)和膠質(zhì)瘤的因果效應(yīng)影響。
二、方法
1.代謝產(chǎn)物GWAS的遺傳變異
經(jīng)過嚴(yán)格的質(zhì)量控制,486種代謝產(chǎn)物被用于遺傳分析,其中309種已知代謝產(chǎn)物和177種未知代謝產(chǎn)物。309種已知代謝產(chǎn)物被進(jìn)一步分為8個(gè)廣泛的代謝類別(氨基酸、碳水化合物、輔因子和維生素、能量、脂質(zhì)、核苷酸、肽和異種代謝)。流程圖如圖1。
圖1流程圖
2.工具變量的選擇標(biāo)準(zhǔn)
一開始,從486種血清代謝物中選擇SNP采用統(tǒng)一標(biāo)準(zhǔn)。我們選擇了匯總統(tǒng)計(jì)中列出的SNPs,這些SNPs通過了質(zhì)量控制,P<1×10-5,該松弛統(tǒng)計(jì)閾值通常在MR研究中實(shí)施,以說明當(dāng)少數(shù)全基因組顯著SNPs可用于暴露時(shí)的更大變化。
聚類程序通過連鎖不平衡(LD)分析完成,以較低的P值作為獨(dú)立的工具。此外,接下來的步驟是評(píng)估這些工具變量是否足夠強(qiáng)大,以通過兩個(gè)參數(shù)預(yù)測(cè)因果效應(yīng):解釋的遺傳變異(R2)和F統(tǒng)計(jì)。根據(jù)公式F=R2(n?k?1)/(1?R2)k(n是樣本量,k代表SNPs的數(shù)量),計(jì)算與相應(yīng)代謝產(chǎn)物暴露相關(guān)的前者和F統(tǒng)計(jì),以避免儀器偏倚(表S1)。
廣泛地說,F(xiàn)統(tǒng)計(jì)量大于10被作為選擇強(qiáng)工具變量的典型閾值。將篩選出每種小于10的代謝物的F統(tǒng)計(jì)。
癌癥GWAS的遺傳變異
為了評(píng)估代謝產(chǎn)物與四種癌癥之間的潛在因果關(guān)系,納入了來自不同聯(lián)合體的四種癌癥GWAS匯總統(tǒng)計(jì)數(shù)據(jù)。根據(jù)癌癥類型對(duì)不同人群的整合源自以下聯(lián)合體:國際肺癌協(xié)會(huì)聯(lián)合會(huì)(ILCCO),肺癌[包括11348例病例和15861例對(duì)照,組織學(xué)上可分為肺腺癌(LAC)和鱗狀細(xì)胞癌],乳腺癌協(xié)會(huì)聯(lián)合會(huì)(BCAC),針對(duì)乳腺癌(包括122977例病例和105974例對(duì)照,分為ER陽性乳腺癌和ER陰性乳腺癌),卵巢癌協(xié)會(huì)聯(lián)合(OCAC)針對(duì)卵巢癌(包括25509例病例和40941例對(duì)照)。關(guān)于膠質(zhì)瘤的GWAS包括14個(gè)隊(duì)列、3個(gè)病例對(duì)照研究和1個(gè)基于人群的病例研究(包括6811例病例)(表S2)。
表S2
3.MR統(tǒng)計(jì)分析
MR的原理如圖S1所示。使用逆方差加權(quán)(IVW)方法估計(jì)代謝物與四種原發(fā)性癌癥之間的因果關(guān)系。然后,我們使用Bonferroni校正,使用P<1.02×10?4(0.05/486)的多重測(cè)試調(diào)整閾值。敏感性分析:采用加權(quán)中值、MR Egger和留一法進(jìn)行敏感性分析,并檢驗(yàn)第二種假設(shè)。通過MR Egger回歸和MR-PRESSO全局檢驗(yàn)檢測(cè)到水平多效性的存在。最后,利用可用數(shù)據(jù)進(jìn)一步探討了亞組分析。
圖S1 MR分析流程
4.代謝途徑分析
使用基于web的MetaboAnalyst 5.0軟件對(duì)識(shí)別的代謝產(chǎn)物進(jìn)行代謝途徑分析。所有代謝產(chǎn)物在PIFW<0.05時(shí)通過IVW鑒定。當(dāng)使用途徑分析模塊來探測(cè)可能參與四種主要癌癥生物學(xué)過程的潛在途徑時(shí),共有49條來自兩個(gè)代謝產(chǎn)物集合庫的人血清代謝途徑,包括來自小分子途徑數(shù)據(jù)庫(SMPDB)和KEGG數(shù)據(jù)庫的44個(gè)代謝產(chǎn)物集,僅來自KEGG庫的4個(gè)代謝產(chǎn)物。
三、結(jié)果
1.研究概況
使用GWAS匯總統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了兩樣本MR分析,以評(píng)估人類血清代謝物對(duì)四種原發(fā)性癌癥的因果影響。流程圖如圖1。工具變量在其各自表型中的解釋率為0.01%至9.37%。遺傳預(yù)測(cè)因子有效性檢驗(yàn)的最小F統(tǒng)計(jì)量為17.21,這說明486個(gè)代謝型的所有工具變量都足夠可信(F統(tǒng)計(jì)量>10)。
2.代謝產(chǎn)物對(duì)癌癥的因果效應(yīng)
通過使用遺傳變異作為代理變量,鑒定出202個(gè)顯著的致病關(guān)系特征。7-α-羥基-3-氧代-4-膽甾醇酸酯、γ-谷氨酰異亮氨酸、1-油?;视土姿崮憠A、γ-Gutamylyleucine是肺癌卵巢癌、乳腺癌和膠質(zhì)瘤危險(xiǎn)因素;假尿苷、2-甲基丁?;鈮A、2-甲酰丁?;鈮A、甘氨酰纈氨酸是對(duì)肺癌、卵巢癌、乳腺癌的保護(hù)因素,和膠質(zhì)瘤(表1)。
表1
不同類型癌癥的已知和未知代謝產(chǎn)物之間的所有重要致病關(guān)系特征如圖2所示。結(jié)果顯示,2-甲基丁酰肉堿降低了肺癌、乳腺癌和卵巢癌的發(fā)病率,但與膠質(zhì)瘤的較高死亡率相關(guān)(表2)。
表2
圖S2
3.敏感性和多效性分析
為了避免MR研究的水平多效性,進(jìn)行了敏感性和多效性分析(表3)。
甲基丁?;鈮A對(duì)乳腺癌和肺癌具有多效性(圖3)。通過所有敏感分析(P<0.05)的四個(gè)提示性關(guān)聯(lián)特征:亮氨酸對(duì)肺癌的影響、3-脫氫肉堿對(duì)乳腺癌的影響、布洛芬對(duì)卵巢癌的影響,亮氨酸對(duì)卵巢癌的影響。
表3敏感性和多效性分析
圖3
圖2 不同類型癌癥的代謝產(chǎn)物之間的致病關(guān)系
表2
4.肺癌和乳腺癌的亞組分析
在ILCCO和BCAC獲得的暴露中,肺癌分為腺癌和鱗狀細(xì)胞癌;乳腺癌分為ER陽性癌和ER陰性癌。在Bonferroni校正下,2-甲基丁酰肉堿對(duì)LAC(ORIVW=0.60;95%可信區(qū)間:0.48–0.70;PIFW=1.14×,但在ER陰性乳腺癌(ORIVW=1.06;95%CI:0.88–1.26;PIFW=0.55)和鱗狀細(xì)胞肺癌(SCLC)(ORIVW=0.78;95%CI=0.63–0.98;PIFW=0.03)中,這些結(jié)果可能為不同腫瘤的生物發(fā)生機(jī)制提供潛在證據(jù)。值得注意的是,當(dāng)進(jìn)行兩次額外的MR測(cè)試時(shí),2-甲基丁?;鈮A和LAC之間的因果關(guān)系是可靠的(加權(quán)中值=0.007,PMR Egger=0.019)。表S20和S21中列出了解釋2-甲基丁酰肉堿與兩種癌癥之間關(guān)系的這些遺傳變異。敏感性分析結(jié)果一致,見表S22-S24。
5.代謝途徑分析
代謝途徑分析確定了四種癌癥中的四種代謝途徑(P<0.05)。結(jié)果表明,“維生素B6代謝(P=0.028)和丁酸代謝(P=0.047)”通路可能參與肺癌的發(fā)生?!鞍滨RNA生物合成(P=0.006)和苯丙氨酸、酪氨酸和色氨酸生物合成(P=0.033)”途徑可能與LAC相關(guān)(表S25)。
四、討論和小結(jié)
這項(xiàng)MR研究使用標(biāo)準(zhǔn)IVW和替代加權(quán)中值MR Egger方法提供了人類血清代謝物對(duì)四種原發(fā)性癌癥的潛在因果影響。使用遺傳變異作為工具變量,觀察到137種與癌癥風(fēng)險(xiǎn)相關(guān)的代謝產(chǎn)物。
這篇文章可以學(xué)習(xí)的優(yōu)勢(shì)之處在于,這項(xiàng)研究是第一項(xiàng)將代謝組學(xué)與基因組學(xué)相結(jié)合的MR研究,以檢測(cè)血清代謝產(chǎn)物與癌癥的因果關(guān)系。其次,作者所選擇代謝產(chǎn)物與癌癥之間因果關(guān)系的方法是值得借鑒的!全文清晰且嚴(yán)謹(jǐn),用了包括IVW、加權(quán)中值和MR Egger在內(nèi)的多種方法,并且,實(shí)施了嚴(yán)格的Bonferroni校正。
總之,這一項(xiàng)MR研究確定了132種可能對(duì)癌癥進(jìn)展有因果影響的代謝物。有趣的是,38種代謝產(chǎn)物對(duì)不止一種癌癥有因果影響,這意味著不同癌癥之間存在一些重疊的代謝途徑。作者和的研究結(jié)果也可以作為其他癌癥研究的基礎(chǔ),并結(jié)合轉(zhuǎn)化和臨床研究來解釋代謝產(chǎn)物如何誘導(dǎo)癌癥的發(fā)展以及它們?cè)谙嚓P(guān)疾病發(fā)病機(jī)制中的作用。
思路擴(kuò)展
小編認(rèn)為泛癌是孟德爾分析較為高階的應(yīng)用,但是思路簡(jiǎn)單,不需要設(shè)計(jì)過于復(fù)雜的研究方案,完全可以用臨床醫(yī)生的思路來尋找問題!解決方案也類似于前瞻性隊(duì)列研究的思維方式,簡(jiǎn)直不要太方便!
近期,涌現(xiàn)了非常多的癌癥相關(guān)的孟德爾分析的高分文章,范圍廣泛,創(chuàng)新點(diǎn)多,但大多沒有特別深入!新手小白只需要抓住某一具體的研究熱點(diǎn),使用已經(jīng)整理好的數(shù)據(jù),做進(jìn)一步的探究,即可輕松搞定一篇質(zhì)量中上等的文章!常用的暴露因素和泛癌結(jié)局指標(biāo)已經(jīng)在上一篇文章中做好了總結(jié)!
熱點(diǎn)寫一篇,就少一篇!趁著新鮮,抓緊時(shí)間,趁著現(xiàn)在快速上車吧~