近年來(lái)孟德?tīng)栯S機(jī)化(Mendelian Randomization, MR)逐漸作為因果推斷的有效方法流行了起來(lái)。如圖所示,MR通過(guò)引入一個(gè)叫做工具變量(Instrumental variables,IVs)的中間變量,來(lái)去除混雜因素的干擾,分析工具變量與結(jié)局變量之間的關(guān)系,工具變量往往是遺傳變異。今天就跟著小編一起來(lái)看看一篇 2022年10月發(fā)表在Frontiers in Nutrition(IF:6.590)上的文章如何使用孟德?tīng)栯S機(jī)化分析,讓我們一起解開(kāi)孟德?tīng)栯S機(jī)化分析研究套路。
研究背景
茶是世界上消費(fèi)最廣泛的飲料之一。茶被認(rèn)為對(duì)健康有多種益處。例如,一些研究表明,茶具有抗癌作用。然而,在流行病學(xué)研究中,關(guān)于飲茶是否有益于人群健康,特別是對(duì)癌癥預(yù)防有沒(méi)有作用,還沒(méi)有達(dá)成明確的共識(shí)。
孟德?tīng)栯S機(jī)化設(shè)計(jì)采用遺傳變異作為暴露的工具變量(IVs),可以增強(qiáng)因果推斷,最小化殘留混雜。因?yàn)檫z傳變異在受孕時(shí)是隨機(jī)分配的,MR受反向因果關(guān)系的影響較小,因此一個(gè)性狀通常與其他性狀(也就是潛在的混雜因素或環(huán)境因素)無(wú)關(guān)。因此,作者進(jìn)行了一項(xiàng)MR研究,以評(píng)估茶攝入量與乳腺癌風(fēng)險(xiǎn)的關(guān)系。
結(jié)果
工具變量的篩選
作者對(duì)UK biobank(UKB)中SNP數(shù)據(jù)進(jìn)行了全基因組關(guān)聯(lián)研究(GWAS)分析,確定與飲茶相關(guān)的單核苷酸多態(tài)性(SNPs)。并使用GWAS根據(jù)年齡、性別和前20個(gè)主成分對(duì)結(jié)果進(jìn)行了調(diào)整,排除了其他混雜表型的干擾。作者選擇了P<5×10?8的常染色體雙等位SNPs,并進(jìn)一步以小頻率>1%進(jìn)行質(zhì)量控制。這里之所以使用P<5×10?8而不是使用0.05是對(duì)P值進(jìn)行了調(diào)整。因?yàn)閁KB中的樣本量很大,往往是幾十萬(wàn)計(jì),因此P值往往調(diào)整為0.05×10?6也就是5×10?8。這些初篩出的SNP之間可能會(huì)有連鎖不平衡現(xiàn)象,當(dāng)兩個(gè)位點(diǎn)的不同等位基因的關(guān)聯(lián)頻率高于或低于獨(dú)立隨機(jī)關(guān)聯(lián)的條件下的期望頻率,這種情況是客觀存在的,此時(shí)這些工具變量之間相關(guān)性就叫連鎖不平衡,也就是說(shuō)這兩個(gè)等位基因之間是存在關(guān)聯(lián)的。作者使用1000 Genomes Project中的歐洲樣本作為參考數(shù)據(jù),選取了連鎖不平衡r2 < 0.01的SNPs,避免SNPs之間關(guān)聯(lián)混雜。他們還使用F-statistics(Fixation indices)檢驗(yàn)弱IVs偏倚,F(xiàn)-statistics> 10提示為強(qiáng)遺傳IV,從而刪除了F-statistics小于10的SNPs,確保IV與茶攝入量強(qiáng)相關(guān)。最后,在作者選擇了45個(gè)與茶葉攝入量密切相關(guān)的獨(dú)立SNPs作為工具變量(IVs)來(lái)進(jìn)行后續(xù)分析。
2. Steiger分析結(jié)果
孟德?tīng)栯S機(jī)化分析假定工具變量先影響暴露,然后通過(guò)暴露影響結(jié)局,但這個(gè)假定的方向性需要驗(yàn)證, Steiger分析可以分別計(jì)算IV對(duì)暴露和結(jié)局的variance explain,如果結(jié)局的variance explain小于暴露,則方向正確。本文作者應(yīng)用了Steiger分析來(lái)判斷飲茶與乳腺癌風(fēng)險(xiǎn)之間潛在因果關(guān)系的方向。Steiger-MR發(fā)現(xiàn)相較于結(jié)果(乳腺癌的發(fā)生)SNPs更能解釋暴露(茶攝入)中的差異(所有P > 0.05),這說(shuō)明本研究選用的IV先影響了茶攝入再影響了乳腺癌發(fā)生。
3. Power 分析結(jié)果
統(tǒng)計(jì)功效(power)指的是在原假設(shè)為假的情況下,接受備擇假設(shè)的概率。Power越大,犯第二型錯(cuò)誤的概率越小,就更有把握認(rèn)為結(jié)果是顯著的。作者使用mRnd方法計(jì)算統(tǒng)計(jì)功效,計(jì)算出解釋的表型方差為0.76%,這等于所有有效IV解釋的茶葉消費(fèi)的總表型方差,這個(gè)值并不是很高,其實(shí)很多研究是不進(jìn)行Power 分析的,因?yàn)榈玫降慕Y(jié)果往往不太好,但本研究還是進(jìn)行了。在當(dāng)前樣本量下,當(dāng)估計(jì)統(tǒng)計(jì)功效為80%時(shí),總體乳腺癌、er陽(yáng)性乳腺癌和er陰性乳腺癌的OR分別為1.14、1.16和1.28,這個(gè)OR值雖然大于1,但并不是很高,也不是很讓人滿意。
4. 孟德?tīng)栯S機(jī)化分析結(jié)果
圖三 孟德?tīng)栯S機(jī)化分析結(jié)果的散點(diǎn)圖。(A)整體乳腺癌與飲茶的相關(guān)性;(B) ER陽(yáng)性乳腺癌與飲茶的相關(guān)性;(C) ER陰性乳腺癌與飲茶相關(guān)性
乳腺癌與飲茶關(guān)聯(lián)的散點(diǎn)圖如圖3所示,圖上的每一個(gè)點(diǎn)代表著一個(gè)SNP位點(diǎn),橫坐標(biāo)是SNP對(duì)暴露(飲茶)的效應(yīng),縱坐標(biāo)是SNP對(duì)結(jié)局(乳腺癌發(fā)?。┑男?yīng)。作者不僅對(duì)總體乳腺癌進(jìn)行了分析,還對(duì)ER陽(yáng)與ER陰性乳腺癌患者進(jìn)行了亞組分析,從圖中我們也可以看出飲茶與乳腺癌發(fā)生在三組中的關(guān)聯(lián)性都不強(qiáng)。同時(shí)從這張圖上,我們還能看到,當(dāng)SNP對(duì)BMI的飲茶為0,也就是工具變量的效應(yīng)(橫坐標(biāo))為0的時(shí)候,結(jié)局變量的效應(yīng)(縱坐標(biāo))并不是0,說(shuō)明了數(shù)據(jù)內(nèi)存在水平多效應(yīng)(簡(jiǎn)單理解就是存在混雜因素),也就是說(shuō)作者選擇的SNP可能不通過(guò)飲茶而通過(guò)其他表型影響了乳腺癌發(fā)病,這需要進(jìn)行敏感性分析來(lái)排除這些導(dǎo)致偏倚的工具變量,后續(xù)研究中患者進(jìn)行了敏感性分析來(lái)校正。圖4顯示了飲茶對(duì)乳腺癌風(fēng)險(xiǎn)的因果影響的估計(jì)。作者通過(guò)IVW和MR-Egger方法進(jìn)行Cochran異質(zhì)性檢驗(yàn),發(fā)現(xiàn)飲茶與整體乳腺癌、ER陽(yáng)性乳腺癌和ER陰性乳腺癌之間存在顯著的異質(zhì)性。但MR-Egger方法飲茶與總體乳腺癌、ER陽(yáng)性和ER陰性乳腺癌風(fēng)險(xiǎn)之間均無(wú)相關(guān)性。總之,使用加權(quán)中位數(shù)、簡(jiǎn)單中位數(shù)和MR-Egger回歸方法,作者發(fā)現(xiàn)飲茶與ER陽(yáng)性和ER陰性乳腺癌的發(fā)病風(fēng)險(xiǎn)之間沒(méi)有關(guān)聯(lián)。
5敏感性分析結(jié)果
因?yàn)橥粋€(gè)SNP可能導(dǎo)致多個(gè)表型,也就是說(shuō),一個(gè)SNP除了與飲茶有關(guān),也可能與性別、吸煙等表型有關(guān),這樣就會(huì)造成偏倚。作者使用MR-PRESSO排除了潛在的多效SNPs。其中,rs199621380、rs2315024、rs397074(這些均為SNP編號(hào))被排除在乳腺癌整體分析之外;在ER陽(yáng)性乳腺癌的分析中,rs2315024被排除;rs112476491和rs2315024被排除在ER陰性乳腺癌的分析之外。在這些分析中,作者發(fā)現(xiàn)去除異常值前后的估價(jià)值沒(méi)有差異(作者將MR-PRESSO失真試驗(yàn)的P值定為>0.05)。在MR-PRESSO異常值校正分析中,ER陽(yáng)性和ER陰性乳腺癌的OR分別為1.030 (0.984-1.078,P = 0.2158)、1.050 (0.995-1.109,P = 0.0852)和1.025 (0.361-2.907,P = 0.597),也就是說(shuō)校正了異常值后,飲茶與乳腺癌的患病仍然沒(méi)有相關(guān)性。結(jié)果表明,使用現(xiàn)有的SNPs作為IVs,飲茶與總體(ORIVW = 1.029, 95% CI = 0.983-1.077, P = 0.2086)、ER陽(yáng)性(ORIVW = 1.050, 95% CI = 0.994-1.109, P = 0.078)和ER陰性乳腺癌風(fēng)險(xiǎn)(ORIVW = 1.081, 95% CI = 0.990-1.103, P = 0.6513)無(wú)關(guān)。此外,使用加權(quán)中位數(shù)、簡(jiǎn)單中位數(shù)和MR-Egger回歸方法,作者發(fā)現(xiàn)飲茶與總體、ER陽(yáng)性、以及ER陰性乳腺癌跟無(wú)關(guān),在排除了其他混雜因素干擾后,仍有沒(méi)有顯著關(guān)系。
討論
本文使用孟德?tīng)栯S機(jī)化分析結(jié)合UKB等數(shù)據(jù)庫(kù)探討了飲茶對(duì)于乳腺癌發(fā)病的影響,雖然發(fā)表雜志影響因子并不是很高,但需要注意的是,文章得到的是一個(gè)陰性結(jié)果,能夠發(fā)在5分以上的雜志說(shuō)明這篇文章的想法以及嚴(yán)謹(jǐn)程度都是很過(guò)關(guān)的。文章首先利用UKB選取了中間變量,隨后證明這個(gè)中間變量滿足孟德?tīng)栯S機(jī)化分析中的三個(gè)假設(shè):1.與暴露因素強(qiáng)相關(guān);2.與混雜因素?zé)o關(guān);3.工具變量(IVs)是通過(guò)暴露因素而不是其他方法影響結(jié)局的,這一點(diǎn)作者通過(guò)MR-PRESSO檢驗(yàn)水平基因多效性進(jìn)行了證明??傊m然研究結(jié)果不是很讓人滿意,但研究的設(shè)計(jì)以及方法是嚴(yán)謹(jǐn)?shù)?,值得大家學(xué)習(xí)。
參考文獻(xiàn):Deng Y, Ge W, Xu H, Zhang J. A Mendelian randomization study of the effect of tea intake on breast cancer. Front Nutr. 2022 Oct 18;9:956969. doi: 10.3389/fnut.2022.956969. PMID: 36330145; PMCID: PMC9623097.