Post-GWAS時代藥靶蛋白孟德爾隨機——兩次登頂Nature為新藥上市“保駕護航”
前期已經(jīng)給大家介紹了全基因組關(guān)聯(lián)性分析(GWAS),孟德爾隨機化分析(MR),沒想到2023年才過去一個月,MR分析就已經(jīng)兩次登頂Nature!
18 January 2023, https://doi.org/10.1038/s41586-022-05420-7
18 January 2023, https://doi.org/10.1038/s41586-022-05473-8
作為一個GWAS研究資深愛好者,本著大力出奇跡的原則,小編詳盡的研究了近期的高分文章,畢竟一個可以通過挖掘數(shù)據(jù)就能蹭上的大熱點,誰能不愛!終于,小編從中歸納總結(jié)出了“高分秘籍”,迫不及待地和大家分享~
另外,作為Post-GWAS的一項重要工作,共定位分析的詳細(xì)介紹,收錄在今天的第三篇推文,感興趣的小伙伴可以去一探究竟。
今天分享的文章,于2023/1 發(fā)表在Society of Biological Psychiatry(IF 12.8/Q1),題目為“循環(huán)蛋白影響精神疾病:孟德爾隨機化研究(Circulating Proteins Influencing Psychiatric Disease: A Mendelian Randomization Study )”。
藥靶標(biāo)孟德爾聯(lián)合共定位分析
立即掃碼上車
大多數(shù)藥物會通過改變?nèi)梭w內(nèi)蛋白質(zhì)的水平來調(diào)節(jié)疾病性狀,蛋白質(zhì)是其直接靶點。因此,構(gòu)建蛋白質(zhì)和人類疾病之間的因果關(guān)系,是藥物研發(fā)的核心問題之一。隨機對照試驗是構(gòu)建藥物(蛋白質(zhì)靶點)和疾病之間關(guān)系的黃金法則。但是其成本昂貴,耗時費力,然而,藥物研發(fā)的成功率卻不斷下降,超過50%的藥物沒有藥效,25%的藥物副作用過大;然而這些藥物卻都已經(jīng)投入了昂貴的第三和第四期的隨機對照試驗。因此,有效的早期藥物靶點的篩選系統(tǒng)對降低藥物研發(fā)成本非常重要。
MR的核心是運用遺傳學(xué)數(shù)據(jù)作為橋梁,來探索暴露和結(jié)局之間的因果關(guān)系,一直被稱為“大自然創(chuàng)造的隨機雙盲試驗”。通過MR分析,可以很好的預(yù)測藥物隨機對照試驗的結(jié)果,進行藥物靶點的早期系統(tǒng)性篩選。并且,有孟德爾隨機化篩查證據(jù)支持的藥物靶點,其最終轉(zhuǎn)化為上市藥物的成功率有非常顯著的提高。
今天分享的文章中,作者利用已有的大規(guī)模蛋白質(zhì)組學(xué)研究和GWAS薈萃數(shù)據(jù),揭示了10種復(fù)雜精神疾病中的7種可能的蛋白質(zhì)與疾病的關(guān)聯(lián)。作者確定了可能影響幾種疾病(如TIMP4和ESAM)風(fēng)險的強候選靶點。此外,作者發(fā)現(xiàn)ERLEC1對精神分裂癥的潛在因果效應(yīng)可能是通過選擇性剪接獲得的。這些發(fā)現(xiàn)將促進對循環(huán)蛋白在精神疾病中的作用的探索,并指導(dǎo)疾病相關(guān)生物標(biāo)志物的鑒定和新型藥物的開發(fā)。
以下是原文~
一、背景
據(jù)估計,精神疾病者占全球殘疾疾病負(fù)擔(dān)的7%。目前對大多數(shù)精神疾病的治療是有限的,因此,迫切需要新的治療方式。循環(huán)蛋白可以在外周血中獲取并測量,提供了治療的早期參考,可能是影響這些疾病的風(fēng)險的因素和有利的干預(yù)靶點。
關(guān)于精神疾病循環(huán)蛋白的隨機對照試驗難以實施,而觀察性研究可能存在偏差和反向因果關(guān)系。通過孟德爾隨機化分析(MR)研究精神疾病中的循環(huán)蛋白作用,可以減少由于混淆和反向因果關(guān)系造成的偏倚。
最近在基于大樣本的與循環(huán)蛋白水平相關(guān)的遺傳變異,即蛋白質(zhì)數(shù)量性狀位點(pQTLs)的研究,為識別與疾病結(jié)果有因果關(guān)系的靶蛋白提供了機會。MR已被用于評估循環(huán)生物標(biāo)志物對一系列復(fù)雜疾病的因果影響,包括冠狀動脈疾病、缺血性中風(fēng)和COVID-19結(jié)局等。
在這項研究中,作者使用了6項大規(guī)模的蛋白質(zhì)組學(xué)研究和針對10種精神疾病的最大的全基因組關(guān)聯(lián)研究生物精神病學(xué)(GWASs)進行了兩個樣本MR,以確定影響這些精神疾病風(fēng)險的循環(huán)蛋白。然后,通過系統(tǒng)篩選水平多向效應(yīng),進行共定位分析,并通過蛋白質(zhì)改變變體檢查其他因果途徑,驗證了MR假設(shè)。研究結(jié)果強調(diào)了循環(huán)蛋白質(zhì)可能在精神疾病風(fēng)險中起因果作用。
二、方法
蛋白組學(xué)研究數(shù)據(jù)
來自6項大規(guī)模評估了循環(huán)蛋白水平與遺傳變異之間的關(guān)系全基因組蛋白質(zhì)組學(xué)研究的GWAS薈萃分析數(shù)據(jù)。
精神疾病數(shù)據(jù)
來自精神基因組學(xué)聯(lián)盟(PGC)進行的大規(guī)模GWASs薈萃分析數(shù)據(jù)。確定了與10種復(fù)雜精神疾病的遺傳關(guān)聯(lián):注意力缺陷/多動障礙,神經(jīng)性厭食癥,焦慮癥,自閉癥譜系障礙,雙相情感障礙,重度抑郁癥,強迫癥,創(chuàng)傷后應(yīng)激障礙,精神分裂癥,圖雷特綜合征。
雙樣本的MR分析
1.雙樣本MR以分析蛋白質(zhì)組學(xué)研究中所有循環(huán)蛋白對這10種精神疾病的潛在因果影響。在所分析的蛋白質(zhì)的cis-pQTL (s)中鑒定了遺傳變異或其連鎖不平衡(LD)代理作為工具變量(IVs)。這些工具變量是位于相應(yīng)蛋白質(zhì)編碼基因轉(zhuǎn)錄起始位點1 Mb內(nèi)的遺傳變異,并與測量的蛋白質(zhì)水平表現(xiàn)出全基因組顯著相關(guān)性(p< 5*10-8)。
2.對于每種蛋白質(zhì),F(xiàn)HS和IMPROVE、AGES和KORA F4研究提供了1個在所有相關(guān)單核苷酸多態(tài)性(SNPs)中p值最先導(dǎo)cis-pQTL。同一蛋白質(zhì)的cis-pQTL可能不同,或者可能具有不一致的關(guān)聯(lián)量。因此,作者在每個蛋白質(zhì)組學(xué)研究中分別對每個SOMAmer/抗體結(jié)合蛋白進行MR,并對結(jié)果進行比較。對于精神疾病的每一種GWAS,當(dāng)匯總統(tǒng)計中不存在先導(dǎo)cis-pQTL時,用LD( r 2 > 0.8)找到它的代理。
3.使用Two Sample MR R包進行了MR分析。每種蛋白質(zhì)對每種精神疾病的潛在因果影響通過Wald比值檢驗和逆方差加權(quán)比值檢驗進行評估,對p值進行了Benjamini-Hochberg校正。對于至少有3種工具變量的蛋白質(zhì),使用加權(quán)中位數(shù)、懲罰加權(quán)中位數(shù)和加權(quán)模式方法進行敏感性分析。F統(tǒng)計量來評估MR結(jié)果是否存在弱工具變量,并采用MR Steiger法來評估結(jié)果是否存在反向因果關(guān)系
MR假設(shè)的驗證
評估MR是否滿足以下3個主要假設(shè):1)工具變量應(yīng)與暴露相關(guān),即循環(huán)蛋白水平,據(jù)此,使用F統(tǒng)計量排除若工具變量;2)工具變量應(yīng)僅通過其對循環(huán)蛋白水平的效應(yīng)作用于結(jié)果,即精神疾病(無水平多效性)。據(jù)此,作者檢查了目標(biāo)蛋白所選擇的cis-pQTL (s)是否同時是另一種疾病風(fēng)險影響基因的順式或反式pQTL、剪接QTL(sQTL)或表達(dá)QTL(eQTL),還搜索了PhenoScanner數(shù)據(jù)庫中記錄的顯著SNP -性狀關(guān)聯(lián)以排除水平多效性;3)工具變量不與是與暴露-結(jié)果關(guān)聯(lián)的任何混雜因素相關(guān)。據(jù)此,作者研究了與cis-pQTL顯著相關(guān)的特征是否與相應(yīng)的精神障礙已知相關(guān)。此外,使用至少3種工具變量對蛋白質(zhì)進行MR-Egger回歸。
共定位分析
1.使用PWCoCo包進行了共定位分析,以評估與蛋白質(zhì)水平和疾病結(jié)局的遺傳關(guān)聯(lián)是否由相同的SNP驅(qū)動,即在同一位點上的SNP可以通過單獨的生物學(xué)機制影響蛋白質(zhì)和結(jié)果,并且通過LD相互聯(lián)系。
2.在具有顯著性的蛋白質(zhì)與疾病的關(guān)聯(lián)中,將蛋白質(zhì)分為3個目標(biāo)組(圖1)。一級靶標(biāo)蛋白:后驗概率PPH4>0.80,且不受任何已知水平多效性影響的具有強烈共定位證據(jù)的蛋白質(zhì)。三級靶標(biāo)蛋白:有證據(jù)表明不存在共定位或受潛在水平多效性影響的蛋白質(zhì)。二級靶標(biāo)蛋白:其余的蛋白質(zhì),包括那些沒有評估共定位或水平多效性的蛋白質(zhì)。
圖1
SOMAmer/抗體結(jié)合效應(yīng)的評估
由于SOMAmer或抗體在不同的蛋白質(zhì)組學(xué)研究中可能針對不同的肽序列或蛋白質(zhì)異構(gòu)體,作者研究了這種潛在的SOMAmer/抗體結(jié)合效應(yīng)。對于每個研究特異性的cis-pQTL,作者檢查了它是否也是變異的蛋白質(zhì)變體(無義變體、錯義變體、外顯子跳過替代剪接變體等)或與變異的蛋白質(zhì)變體具有高度的連鎖不平衡效應(yīng)(r 2>0.8),并在不同的蛋白質(zhì)組學(xué)研究中比較MR推斷的蛋白質(zhì)與疾病的相關(guān)性。cis- pQTL (s)與同一基因轉(zhuǎn)錄本的選擇性剪接之間的顯著關(guān)聯(lián)可能指向剪接變異所賦予的因果效應(yīng)。對于這些靶標(biāo),作者分別利用GTEx數(shù)據(jù)庫中確定的先導(dǎo)全血cis-eQTLs和先導(dǎo)全血cis-sQTLs重復(fù)了MR和共定位分析,因為信使RNA (mRNA)豐度的測量對肽序列的變化不敏感。
三、結(jié)果
1.估計循環(huán)蛋白水平對精神疾病的潛在因果影響
MR分析確定了9種蛋白質(zhì)與疾病的關(guān)聯(lián),且有強烈的共定位證據(jù),不太可能受到水平多效性的影響(圖2);
確定了58個二級靶標(biāo)和40個三級靶標(biāo),這些靶點需要額外的證據(jù)來驗證(圖1);
通過基于抗體的蛋白質(zhì)圖譜在所有10個大腦區(qū)域檢測到所有一級靶標(biāo)蛋白質(zhì),但DrugBank中沒有記錄到針對這些蛋白質(zhì)的藥物或開發(fā)藥物的計劃,盡管已知與相應(yīng)的疾病結(jié)局相關(guān)。
圖2
2.一級靶標(biāo)蛋白質(zhì)和SOMAmer/抗體結(jié)合效應(yīng)的評估
在一級靶標(biāo)蛋白中,循環(huán)TIMP4和ESAM在3項蛋白質(zhì)組學(xué)研究中復(fù)制了關(guān)聯(lián)(圖2),共定位分析證實了在每種蛋白質(zhì)-疾病關(guān)系中存在單一共享因果(圖3)。
循環(huán)ESAM也在與TIMP4相同的3個蛋白質(zhì)組學(xué)研究中被描述。基因預(yù)測的循環(huán)ESAM水平每增加1個SD與精神分裂癥的估計相關(guān)性在INTERVAL和AGES研究之間是一致的(圖2),并顯示了共定位的有力證據(jù)(圖3)。然而,基于Fenland研究的MR得出了一個顯著減弱的效應(yīng)量(圖2)。
FOLH1與雙相情感障礙、OLA1與雙相情感障礙、TMEM106B與重度抑郁癥、NPTXR與精神分裂癥之間的關(guān)聯(lián)可以在兩項蛋白質(zhì)組學(xué)研究中得到復(fù)制(圖2)。
FOLH1 cis-pQTL周圍的遺傳結(jié)構(gòu)很復(fù)雜(圖3),因為只有在PWCoCo進行條件和聯(lián)合分析后,F(xiàn)OLH1共定位的證據(jù)才很強。
DNPH1與雙相情感障礙和ACADVL與精神分裂癥之間的關(guān)系在Fenland研究中被確定(圖2),并得到了強有力的共定位證據(jù)的支持(圖3),但這2種循環(huán)蛋白在其他蛋白質(zhì)組學(xué)研究中沒有被描述。
圖3
3.ERLEC1蛋白異構(gòu)體的潛在因果效應(yīng)
循環(huán)的ERLEC1僅在INTERVAL研究中被描述,是精神分裂癥的第2級靶標(biāo)蛋白,被認(rèn)為不太可能受到水平多效性的影響(圖4A)。
利用ERLEC1基因的先導(dǎo)cis eQTL工具變量(rs143112696),作者發(fā)現(xiàn)ERLEC1的總體mRNA豐度與精神分裂癥風(fēng)險無關(guān)(圖4A),沒有證據(jù)表明ERLEC1 mRNA豐度和精神分裂癥存在共定位(圖4B)。相比之下,利用先導(dǎo)cis- sQTL工具變量(rs62137566),選擇性剪接的比例與疾病結(jié)果顯著相關(guān)(圖4A),這種cis- sQTL與精神分裂癥的遺傳關(guān)聯(lián)存在共定位證據(jù)(圖4C),降低ERLEC1- 201與ERLEC1-202的比例可能對精神分裂癥具有保護作用(圖4D)。
圖4
四、討論
在本研究中,作者進行了MR研究,系統(tǒng)地篩選可能在此類疾病病因?qū)W中發(fā)揮作用的循環(huán)蛋白,從而為治療開發(fā)提供了潛在可干預(yù)的靶點。作者確定了9種蛋白質(zhì)與疾病的關(guān)聯(lián),涉及8種不太可能受到混雜效應(yīng)或水平多效性影響的循環(huán)蛋白質(zhì)。兩種循環(huán)蛋白,TIMP4和ESAM,在3項蛋白質(zhì)組學(xué)研究中被復(fù)制。
TIMP4和其他TIMP蛋白是基質(zhì)金屬蛋白酶抑制劑的重要抑制劑,后者負(fù)責(zé)維持突觸功能和血腦屏障的通暢?;|(zhì)金屬蛋白酶抑制劑過表達(dá)或TIMP蛋白不足已廣泛涉及各種復(fù)雜疾病,包括神經(jīng)精神障礙。正如預(yù)期的那樣,作者的結(jié)果提供了強有力的證據(jù),表明增加循環(huán)TIMP4可以預(yù)防神經(jīng)性厭食癥、躁郁癥和重度抑郁癥,并提示它可以預(yù)防精神分裂癥。這些結(jié)果支持TIMP4和其他基質(zhì)金屬蛋白酶抑制劑作為治療開發(fā)的候選藥物。
內(nèi)皮細(xì)胞粘附分子ESAM促進血腦屏障的通透性,介導(dǎo)中性粒細(xì)胞外滲,并在內(nèi)皮緊密連接和血小板上特異性表達(dá)。有人提出ESAM相關(guān)的早期免疫反應(yīng)異常參與了精神分裂癥的發(fā)病機制。作者發(fā)現(xiàn)循環(huán)ESAM水平的降低與精神分裂癥風(fēng)險的降低有關(guān)。然而,它已經(jīng)在小鼠中被證明了,只有內(nèi)皮緊密連接處的ESAM而不是血小板上的ESAM與中性粒細(xì)胞外滲有關(guān)。因此,有必要確定循環(huán)中ESAM水平的降低是否代表內(nèi)皮緊密連接處功能ESAM數(shù)量的減少或增加,因為后者可能導(dǎo)致更有效的藥物靶點。
內(nèi)質(zhì)網(wǎng)凝集素ERLEC1通過選擇性結(jié)合不正確折疊的腔蛋白參與內(nèi)質(zhì)網(wǎng)質(zhì)量控制,并參與轉(zhuǎn)移細(xì)胞對缺氧和內(nèi)質(zhì)網(wǎng)應(yīng)激的反應(yīng)。作者發(fā)現(xiàn)降低ERLEC1-201與erlec1 -202的比例可以預(yù)防精神分裂癥,而改變總體mRNA豐度似乎與疾病風(fēng)險無關(guān)。雖然這兩種剪接變體在大小和構(gòu)象上有所不同,但基于Ensembl數(shù)據(jù)庫,預(yù)測的甘露糖6-磷酸受體結(jié)構(gòu)域和預(yù)測的蛋白質(zhì)OS9樣結(jié)構(gòu)域可以在ERLEC1-202中被截斷。考慮到ERLEC1的共定位證據(jù)弱于一級靶標(biāo)蛋白,需要更多的研究來闡明這些剪接變異在精神分裂癥發(fā)病機制中的作用,并探索干預(yù)方案。
腦靶向藥物的另一個主要挑戰(zhàn)是有效地穿過血腦屏障。在這里,TIMP4和ESAM都在血腦屏障中起著至關(guān)重要的調(diào)節(jié)作用,ERLEC1的年齡依賴差異基因表達(dá)也與血腦屏障有關(guān)。綜上所述,這些循環(huán)蛋白可能指向有希望的藥物靶點或作為預(yù)測性生物標(biāo)志物。
思路借鑒
1.本篇文章是MR分析+pQTL共定位為核心,以pQTL發(fā)現(xiàn)為目標(biāo)的多組學(xué)臨床隊列研究的主要有以下四個方向,通過挖掘公共數(shù)據(jù)庫以及借鑒已經(jīng)發(fā)表的研究的數(shù)據(jù),就可以輕松借鑒啦!
發(fā)現(xiàn)疾病的致病機制;
骨質(zhì)疏松癥和類風(fēng)濕關(guān)節(jié)炎的復(fù)雜遺傳結(jié)構(gòu):發(fā)現(xiàn)因果效應(yīng)的途徑。文章于2022/5 發(fā)表在Human Molecular Genetics(IF 5.1 /Q2)上。類風(fēng)濕關(guān)節(jié)炎(RA)和骨質(zhì)疏松癥(OP)是兩種復(fù)雜炎性疾病,但可能具有共同的遺傳背景,作者旨在闡明RA和各種OP表型背后的遺傳結(jié)構(gòu),GWAS統(tǒng)計數(shù)據(jù),使用MR分析來檢測因果關(guān)系,共定位分析以確定CRP和OP表型之間共享的遺傳變異。共定位在CRP和OP之間建立了共享的基因組區(qū)域,包括GCKR和SERPINA1基因。富集分析發(fā)現(xiàn)這些基因具有相同分子功能,進一步的研究兩者的共享分子途徑,并為潛在治療方法的提供見解。
https://doi.org/10.1093/hmg/ddac061
發(fā)現(xiàn)新的藥物靶點;
1.可用于藥物治療的全基因組孟德爾隨機化確定了新冠肺炎的新機會,于2021年發(fā)表在Nature Medicine (IF 87.2 /Q1)。為了確定與COVID-19相關(guān)的治療靶點,作者進行了MR分析,利用公共數(shù)據(jù)庫數(shù)據(jù),基于已批準(zhǔn)或藥物開發(fā)臨床階段藥靶蛋白的轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)數(shù)據(jù),以順式eQTL和QTL作為工具變量,聯(lián)合共定位分析,發(fā)現(xiàn)與COVID-19住院共定位的藥靶蛋白IL10RB和IFNAR2。全現(xiàn)象關(guān)聯(lián)掃描(PWAS)和通路富集分析,進一步提示IFNAR2更有可能在COVID-19住院治療中發(fā)揮作用。以IFNAR2和ACE2作為優(yōu)先蛋白,進行藥物試驗,可能可以用于COVID-19的早期管理。
發(fā)現(xiàn)藥物的新治療適應(yīng)癥;
1.血管緊張素轉(zhuǎn)換酶對阿爾茨海默病而不是其他神經(jīng)退行性疾病的保護作用的遺傳證據(jù),于 2022/8發(fā)表于Neurol Genet。血管緊張素轉(zhuǎn)換酶(ACE)抑制劑是一種常用的處方藥,用于治療心力衰竭,高血壓和慢性腎臟疾病。然而,遺傳證據(jù)支持大腦ACE對阿爾茨海默?。ˋD)的保護作用。作者進行了MR聯(lián)合共定位分析,分析ACE表達(dá)對歐洲血統(tǒng)人群AD風(fēng)險的影響以及其是否是通過血壓變化介導(dǎo)。結(jié)果提示遺傳證據(jù)支持大腦ACE表達(dá)對AD的保護作用,但不支持歐洲血統(tǒng)人群的其他神經(jīng)退行性結(jié)果。
Neurol Genet 2022;8:e200014. doi:10.1212/NXG.0000000000200014
識別臨床相關(guān)的生物標(biāo)志物。
1.整合基因組策略確定sRAGE是肺功能的因果性和保護性生物標(biāo)志物,于2022年發(fā)表在Chest(IF 11.3/Q1),作者將sRAGE pQTL變異與肺部特征的GWAS變異進行整合。將sRAGE pQTL變異體與肺特征GWAS變異體進行共定位,并使用sRAGE順式-pQTL變異體進行孟德爾隨機化,旨在分析sRAGE作為肺功能的因果性和保護性蛋白質(zhì)生物標(biāo)志物的效能。結(jié)果提示sRAGE對肺生理功能具有保護作用,AGER/sRAGE靶向干預(yù)軸可能對炎癥相關(guān)肺部疾病的治療和預(yù)防有益。
https://doi.org/10.1016/j.chest.2021.06.053
除了MR分析+共定位這個核心思路以外,Post-GWAS還可以整合轉(zhuǎn)錄組、表觀遺傳等多組學(xué)數(shù)據(jù)對相關(guān)位點進行注釋,篩選潛在功能位點并對候選位點做進一步的功能注釋。如甲基化、組蛋白修飾、染色質(zhì)開放程度等信息;預(yù)測遺傳變異是否影響轉(zhuǎn)錄因子結(jié)合等;還可以加做體內(nèi)外實驗闡明風(fēng)險位點的致病機制。如熒光素酶報告基因?qū)嶒灐hIP-seq、染色體構(gòu)象捕獲技術(shù)、基因敲除等;此外,還可以聯(lián)合自測數(shù)據(jù),結(jié)合臨床研究,影像學(xué)數(shù)據(jù)等。
總之,Post-GWAS絕對是數(shù)據(jù)挖掘愛好者的福音!小編非??春肕R聯(lián)合共定位的思路,還苦于沒有科研思路的小伙伴,請聯(lián)系我們,一起捕獲這顆“新秀”吧~
藥靶標(biāo)孟德爾聯(lián)合共定位分析
立即掃碼上車