今天小編為大家?guī)硪黄衲臧嗽路莅l(fā)表在Nature genetics[IF :38.333]上的一篇關于映射基因型結構到細胞類型的文章,利用GWAS研究疾病潛在機制和治療方法,闡明常用的降壓和腎保護藥物的作用機制,確定了腎臟疾病的藥物重置。
Mapping the genetic architecture of human traits to cell types in the kidney identifies mechanisms of disease and potential treatments
背景介紹
慢性腎病影響著全世界超過8億人。全世界范圍內(nèi),每60個人中就有一人死于腎臟疾病,因此迫切需要新的治療方法。在人類致病基因證據(jù)的支持下,正在研發(fā)的藥物靶點獲得批準的可能性是其他藥物的兩倍,這凸顯了了解疾病遺傳學的重要性。
名詞解釋
- eQTL(expression Quantitative Trait Loci):表達數(shù)量性狀位點
- GWAS(genome-wide association studies):全基因組關聯(lián)研究
- LD( linkage disequilibrium):連鎖不平衡
- eGFR(estimated glomerular filtration rate):估算腎小球濾過率
- PT(proximal tubule):近端小管
- eQTL(cf):eQTL cell fraction
- eQTL(ci):‘cell-typeinteracting’ eQTLs
數(shù)據(jù)和方法
eQTL data:http://susztaklab.com/eQTLci/index.php
Figshare:https://doi.org/10.6084/m9.figshare.14718015.v1
RNA-seq and human kidney snATAC-seq data:GSE173343;GSE115098;GSE172008
http://susztaklab.com/HumanKidneysnATAC/
http://susztaklab.com/human_kidney/igv/
代碼:https://github.com/shengxin321/HumanKidney_eQTL_and_snATAC-seq
內(nèi)容和結果
一、顯微解剖人腎樣本的細胞組分eQTL
- 收集303個微量解剖的人腎小球和359個小管樣本的基因型和RNA-seq數(shù)據(jù)。利用CIBERSORTx反褶積估計細胞組分,然后使用體積和細胞分數(shù)調(diào)整模型鑒定eQTL。最初的cis-eQTL分析分別在腎小管和腎小球樣本中鑒定了3599和5871個eGene(Fig.1a)。
- 接下來分析了359個近小管標本中各類細胞的占比和303個腎小球標本中各類細胞的分布。不出意料,近端小管(PT)細胞和腎小球內(nèi)皮細胞分別是兩類組織中最常見的細胞類型(Fig.1bFig.1c)。
- 最終的eQTL細胞分數(shù)模型包括通過表達殘差因子的概率(PEER)估計來估計潛在變量調(diào)整。該分析在小管和腎小球樣本中分別鑒定了9,209和10,106個eGenes(Fig.1d,e)。
- 另外,觀察到在625個(功能編碼缺失)腎病基因中,有303個被鑒定為eGenes。
- GO分析表明,eGenes富集在代謝過程中。在eQTL研究中,對已發(fā)表的GTEx數(shù)據(jù)中的48個組織進行的meta分析顯示,有大量共有的eGenes 39,但也有1309個小管特異性和1458個腎小球特異eGene(Fig.1fg)。
二、定義細胞類型依賴的eQTLs
- 為了識別以細胞類型依賴的方式調(diào)控基因表達的細胞類型相互作用的eQTL,作者進行了線性回歸分析,模擬了細胞組分和基因型之間的相互作用(Fig.2a)。例如,G等位基因劑量較高的個體的腎臟(SNP rs4968146)顯示,PT細胞組分與ABR表達呈負相關,表明細胞類型依賴于基因類型-基因表達相互作用(Fig.2b)。
- 為了確定rs4968146重疊基因組區(qū)域(補充表9)在調(diào)節(jié)ABR表達中的作用,我們在培養(yǎng)的人類胚胎腎細胞(HEK293)中進行了基于CRISPR的基因組編輯。該區(qū)域缺失后ABR表達明顯降低(Fig.2c)。
- 總之,在23種腎細胞類型中,通過評估基因型和細胞分數(shù)相互作用的重要性,我們分別在腎小管和腎小球樣本中鑒定了1613和713個蛋白編碼的eQTL(ci)基因(Fig.2d)。
- 最后,為了描述eQTL(ci)的細胞類型特異性,作者使用多變量自適應收縮方法檢測了腎臟細胞類型間的eQTL(ci)共享(Fig.2e)。
三、人類腎臟的單細胞分辨率調(diào)節(jié)圖
- 為了在細胞分辨率上表征基因調(diào)控區(qū),我們利用高通量測序(snATAC-seq)信息對人類腎細胞轉座酶可及染色質(zhì)進行了單核分析(Fig.3a)。
- 通過比較每個簇中啟動子區(qū)域的讀取密度,作者根據(jù)先前確定的細胞類型標記將簇與已知的細胞類型相匹配(Fig.3bc)。
- 接下來,通過比較簇間的開放染色質(zhì)區(qū)域生成染色質(zhì)差異可及區(qū)域(DAR)列表,確定60661個細胞類型特異性峰(Fig.3d)。
- 估計相關細胞類型特異性開放染色質(zhì)區(qū)域中eQTL(ci)變異的富集(Fig.3e)。
四、內(nèi)表型來源于相同的細胞類型
為了優(yōu)先考慮特定腎臟特征和疾?。ㄈ鏴GFR和高血壓)的潛在驅(qū)動細胞類型,首先根據(jù)scRNA-seq數(shù)據(jù)對每種細胞類型中每個基因的表達特異性進行排序。
- 從每十分位基因的GWAS匯總統(tǒng)計數(shù)據(jù)中評估了分割遺傳力富集。隨著PT細胞基因表達特異性的增加,eGFR SNP遺傳力的增加(Fig.4a)。收縮壓(SBP)與遠端曲小管(Fig.4b)、集合管主細胞和內(nèi)皮細胞(Fig.4c)之間也存在類似的正相關關系。
- 接下來,進行基因組注釋多標記分析(MAGMA)中實施的廣義基因集富集分析,以評估與腎臟相關表型的基因水平遺傳關聯(lián)是否隨著細胞類型特異性的增加而增加。作者分析了24種不同的GWAS性狀(Fig.4d)。
五、了解腎功能和血壓
- 對可能導致特定腎內(nèi)表型變異的基因進行了優(yōu)先排序。利用貝葉斯共定位測試整合6個腎臟相關性狀和腎臟顯微解剖室eQTL(cf)數(shù)據(jù),作者在腎小管中鑒定了240個共定位蛋白編碼基因,在腎小球室中鑒定了230個基因。Fig.5a說明了eGFR和SBP優(yōu)先基因在整個基因組的腎小球和腎小管間隔中的分布。
- 使用6個腎臟相關性狀的GWAS匯總數(shù)據(jù)和eQTL(ci)數(shù)據(jù)重復進行貝葉斯共定位分析。作者優(yōu)先考慮了61個可能的因果蛋白編碼基因,其中6個腎內(nèi)表型和細胞類型特異性基因調(diào)控的變異。通過GWAS的氣泡圖分析eGFR(上)和SBP(下)共定位的11個優(yōu)先細胞類型特異性eQTL(ci)基因(Fig.5b)。
六、CKD和高血壓的治療見解
- 最近SBP GWAS在17號染色體rs4292上發(fā)現(xiàn)了一個遺傳信號。eQTL分析表明,在小管樣本中,同樣的SNP與ACE表達顯著相關。
- 對腎區(qū)室和46個GTEx組織中這種eQTL關聯(lián)的meta分析表明,rs4292對腎小管區(qū)室中的ACE(M=1)具有最顯著的eQTL效應。此外,該信號與PT eQTL(ci)共定位,具有較高的可信度(Fig.6a)。
- 單細胞開放染色質(zhì)可及性分析突出了PT細胞ACE周圍rs4292開放染色質(zhì)區(qū)域之間的強相關性(Fig.6b)。
- 此外,使用基于缺口k-mer支持向量機的方法,計算量化這種變體可能的因果調(diào)節(jié)效應。發(fā)現(xiàn)轉錄因子結合活性顯著高于T等位基因(Fig.6c)。
- 通過考慮ACE和AGE,作者識別了200多個腎臟功能和高血壓基因。這些基因的發(fā)現(xiàn)可以幫助識別潛在的藥物(Fig.6def)。
- 利用藥物基因相互作用數(shù)據(jù)庫,作者確定了54個基因,這些基因可以被已經(jīng)批準的藥物靶向。
結論和展望
在這項研究中,作者生成了一個全面的多組學數(shù)據(jù)集,并使用正交分析方法來注釋腎臟相關的表型。優(yōu)先考慮了182多個與腎功能有關的致病基因和88個與高血壓有關的致病基因,確定了腎臟中這些疾病的核心基因。功能注釋表明代謝在腎臟疾病和高血壓血管生成中可能的作用。最后,分析闡明了最常用的抗高血壓和腎臟保護藥物作用的關鍵基因基礎,并強調(diào)了大量可能對高血壓和CKD有效的其他藥物。