表觀遺傳的改變一直都是癌癥研究中不可或缺的一部分,今天小編要給大家介紹的這篇文章是今年7月份發(fā)表在Briefings in Bioinformatics(IF:11.622)雜志上關(guān)于結(jié)直腸癌DNA甲基化的研究,作者通過(guò)對(duì)WGBS和scBC-seq檢測(cè)到的結(jié)直腸癌DNA甲基化譜分析,對(duì)結(jié)直腸癌中DNA甲基化的研究在細(xì)胞層面提供了新的見(jiàn)解。文章內(nèi)容豐富,研究DNA甲基化的小伙伴不要錯(cuò)過(guò)啦!
Comprehensive analysis of partial methylation domains in colorectal cancer based on single-cell methylation profiles
基于單細(xì)胞甲基化譜的結(jié)直腸癌部分甲基化結(jié)構(gòu)域綜合分析
一、研究背景
DNA甲基化的改變是人類癌癥中關(guān)鍵的表觀遺傳變化之一,結(jié)直腸癌中DNA甲基化模式的常見(jiàn)改變包括整體DNA低甲基化和區(qū)域特異性高甲基化。部分甲基化結(jié)構(gòu)域 (PMD) 是大基因組塊中甲基化減少的區(qū)域,PMDs已在多種組織和細(xì)胞系中得到描述。不止人類基因組,小鼠基因組中也發(fā)現(xiàn)了PMDs且覆蓋了大部分基因組,大約50-75%。每種細(xì)胞類型都有一組獨(dú)特的PMDs,可用作細(xì)胞類型鑒別。以前的研究主要集中在WGBS數(shù)據(jù)分析組織中PMDs的分布和特征,但是基于細(xì)胞群的高通量測(cè)序忽略了來(lái)自同一腫瘤的細(xì)胞之間的異質(zhì)性。因此,作者利用scBC-seq數(shù)據(jù)結(jié)合WGBS數(shù)據(jù),檢測(cè)和分類結(jié)直腸癌細(xì)胞中的PMDs。通過(guò)比較同一腫瘤不同細(xì)胞和區(qū)域的DNA甲基化,對(duì)PMDs呈現(xiàn)的廣泛的表觀遺傳異質(zhì)性進(jìn)行了研究。
二、數(shù)據(jù)及方法
1.結(jié)直腸癌數(shù)據(jù):作者從GEO數(shù)據(jù)庫(kù)中下載結(jié)直腸癌患者與之匹配的鄰近正常單細(xì)胞BS-seq和RNA-seq數(shù)據(jù)集GSE97693;從TCGA中下載了WGBS和450K檢測(cè)的結(jié)直腸癌甲基化數(shù)據(jù)和RNA-seq基因表達(dá)譜。該研究使用的是ucsc中提供的參考基因組版本19(hg19)的基因位置和CpG島信息。
2.PMDs的檢測(cè):在檢測(cè)PMDs之前,作者首先通過(guò)dbSNP數(shù)據(jù)庫(kù)排除了與常見(jiàn)單核苷酸多態(tài)性重疊的CpG。接下來(lái)使用R包MethylSeekR來(lái)檢測(cè)正常和癌癥樣本中的PMDs,參數(shù)num.cores = 2。由于具有高CpG密度的基因組區(qū)域傾向于產(chǎn)生不平衡的平均甲基化,作者在移除了所有與CpG島(shores, shelves)和啟動(dòng)子重疊的CpG后使用PMDs內(nèi)的平均DNA甲基化水平作為PMDs的甲基化水平。對(duì)于單個(gè)細(xì)胞中的PMD,作者根據(jù)已發(fā)表的文章中定義方法對(duì)單個(gè)細(xì)胞中的PMDs進(jìn)行定義。
3.PMDs的子類: 通過(guò)比較正常和結(jié)直腸癌樣本的PMD,作者將PMD分為三個(gè)亞類:Gain-PMDs, Loss-PMDs and Conserved-PMDs。Gain-PMDs是指在正常樣本中不存在,但在結(jié)直腸癌樣本中檢測(cè)到的PMDs;Loss-PMDs是指在正常樣本中被檢測(cè)為部分甲基化結(jié)構(gòu)域,但在結(jié)直腸癌樣本中缺失的PMDs;Conserved-PMDs是在正常和結(jié)直腸癌樣本中均被檢測(cè)為PMDs的基因組區(qū)域。
4.對(duì)來(lái)自不同采樣區(qū)域的細(xì)胞進(jìn)行聚類:接下來(lái)作者基于Gain-PMDs內(nèi)部的DNA甲基化程度計(jì)算樣本間的歐式距離,通過(guò)R中的cmdscale函數(shù)進(jìn)行MDS細(xì)胞聚類。Wilcoxon 符號(hào)秩檢驗(yàn)用于比較來(lái)自不同采樣區(qū)域的 Gain-PMD 內(nèi)的 DNA 甲基化。
5.人類基因組區(qū)域注釋:啟動(dòng)子被定義為轉(zhuǎn)錄起始位點(diǎn)上游0.5 kb和下游0.5 kb;CpG shore被定義為CpG島上游2 kb和下游2 kb;CpG shelf定義為CpG shore上游2 kb和下游2 kb。作者根據(jù)已發(fā)表的啟動(dòng)子分類方法,利用CpG 密度將人類啟動(dòng)子分為三類:高密度CpG啟動(dòng)子、中密度 CpG 啟動(dòng)子和低密度 CpG 啟動(dòng)子。
三、主要結(jié)果
1. 單細(xì)胞中部分甲基化結(jié)構(gòu)域的檢測(cè)
在文章的第一部分,為了分析結(jié)直腸癌中的異常甲基化模式,作者使用了WGBS(n=1)和scBS-seq(n=4)檢測(cè)到的5例患者的原發(fā)腫瘤和匹配的鄰近正常組織的DNA甲基化譜,通過(guò)在100kb的連續(xù)片段中的平均甲基化來(lái)生成全基因組甲基化譜。如圖1A所示,作者發(fā)現(xiàn)鄰近的正常樣本顯示出高甲基化,而相同的基因組區(qū)域在匹配的腫瘤樣本中顯示出降低的平均DNA甲基化水平。此外,與WGBS檢測(cè)到的原發(fā)性腫瘤的甲基化譜相比,單個(gè)癌細(xì)胞內(nèi)的甲基化水平顯示出更明顯的缺失。并且還觀察到甲基化缺失在不同的取樣區(qū)域是不同的。由于全基因組范圍的大規(guī)模低甲基化與部分甲基化結(jié)構(gòu)域的概念相呼應(yīng)。因此,為了研究低甲基化區(qū)域?qū)Y(jié)直腸癌的影響,下面的分析將集中在部分甲基化區(qū)域。
如圖1B所示,由于單個(gè)細(xì)胞中檢測(cè)到的DNA甲基化譜具有例如適度的CpG覆蓋和固有的數(shù)據(jù)稀疏性等缺點(diǎn),為了防止PMDs的檢測(cè)收到測(cè)序數(shù)據(jù)的影響,作者建立了一套識(shí)別PMDs的程序。分析結(jié)果如圖1C所示,PMD最多的患者為CRC13;PMD最少的患者為CRC01。如圖1D,在CRC01、CRC10、CRC11和CRC13中,PMD覆蓋基因組的百分比分別為54.10%、55.57%、55.01%和58.51%。平均而言,每個(gè)患者保留了9073.25個(gè)PMD,覆蓋了55.8%的基因組。
2. PMDs的子類和特征
為了比較癌癥和正常樣本中PMDs的差異,作者將PMDs分成三個(gè)不同的亞類(圖2A)。通過(guò)識(shí)別單個(gè)細(xì)胞的PMD數(shù)(圖2B),作者發(fā)現(xiàn)CRC01、CRC10、CRC11和CRC13的Gain-PMD數(shù)分別為1597、2174、1860和3054;Conserved-PMD的數(shù)量分別為6125、7039、6738和7706,平均而言,每個(gè)患者識(shí)別了2171個(gè)Gain-PMD,6902個(gè)識(shí)別了Gain-PMD。作者進(jìn)一步觀察了四名患者共享的Gain-PMDs和Conserved-PMDs,如圖2C,發(fā)現(xiàn)4名患者中分別共有1079個(gè)Gain-PMDs和5283個(gè)Conserved-PMDs,這表明結(jié)直腸癌的PMDs在患者中廣泛存在。
先前有研究表明,PMDs的特性和功能可能受到長(zhǎng)度的影響。例如,與長(zhǎng)PMD相比,短PMD含有更多的蛋白質(zhì)編碼基因、長(zhǎng)非編碼RNA (lincRNA)和假基因,短PMD保留了更多的表觀遺傳可塑性,具有更多的細(xì)胞類型特異性特征。因此,作者重點(diǎn)關(guān)注了Gain-PMDs和Conserved-PMDs的長(zhǎng)度。如圖2D所示,Gain-PMDs 通常是短 PMDs,而大多數(shù) Conserved-PMDs 是長(zhǎng) PMDs,作者推測(cè)本研究中檢測(cè)到的Gain-PMD 可能會(huì)影響細(xì)胞功能。
接下來(lái)作者分析了基因在兩個(gè)不同亞類中的覆蓋情況,如圖2E所示,患者CRC01、CRC10、CRC11和CRC13中的Gain-PMDs分別覆蓋了1.72、2.09、1.91和2.90%的基因組區(qū)域;Conserved-PMDs分別覆蓋了52.38、52.92、53.66和55.61%的基因組區(qū)域。與Conserved-PMDs相比,雖然Gain-PMDs只覆蓋了較小的基因組區(qū)域,但它們包含的基因比例更高。
作者接下來(lái)對(duì)Gain-PMDs中的基因是否對(duì)結(jié)腸癌的形成有推動(dòng)作用進(jìn)行了討論。通過(guò)Metascape在線工具進(jìn)行了GO富集分析,結(jié)果顯示這些基因在調(diào)節(jié)有絲分裂細(xì)胞周期的G1/硫轉(zhuǎn)換、對(duì)前列腺素E的反應(yīng)、T細(xì)胞共刺激、淋巴細(xì)胞共刺激、對(duì)脂肪酸的反應(yīng)、白細(xì)胞遷移的積極調(diào)節(jié)、腫瘤壞死因子產(chǎn)生的積極調(diào)節(jié)和骨形態(tài)發(fā)生蛋白信號(hào)通路的調(diào)節(jié)等與結(jié)直腸癌的形成和發(fā)展密切相關(guān)的生物學(xué)過(guò)程中高度富集,且Gain-PMDs內(nèi)部的基因廣泛參與癌癥的免疫反應(yīng)。
3. 同一腫瘤不同細(xì)胞和區(qū)域之間廣泛的表觀遺傳異質(zhì)性
在這一部分,作者分析了不同細(xì)胞間Gain-PMDs是否存在表觀遺傳異質(zhì)性。首先,作者對(duì)結(jié)直腸癌患者的單細(xì)胞PMDs進(jìn)行了過(guò)濾,保留了70%細(xì)胞中檢測(cè)到CpGs的Gain-PMDs區(qū)域且對(duì)于每個(gè)細(xì)胞保留CpG位點(diǎn)的平均甲基化在0.2-0.7的Gain-PMDs,如圖3A所示。接下來(lái)作者計(jì)算了具有Gain-PMDs的細(xì)胞數(shù)量的頻率分布,如圖3B,作者發(fā)現(xiàn)四名患者的細(xì)胞數(shù)量的頻率分布直方圖呈正態(tài)分布。作者在此得出結(jié)論:通過(guò)單細(xì)胞數(shù)據(jù),WGBS檢測(cè)到的大多數(shù) Gain-PMD 可以在一半以上的細(xì)胞中再次被識(shí)別。
然而,該基因組區(qū)域中另一部分細(xì)胞的平均甲基化水平與部分甲基化結(jié)構(gòu)域不匹配,這表明Gain-PMDs在細(xì)胞之間存在廣泛的異質(zhì)性。如圖3C,作者根據(jù)Gain-PMDs的甲基化水平對(duì)不同采樣區(qū)域的細(xì)胞進(jìn)行聚類,發(fā)現(xiàn)Gain-PMDs的甲基化水平可能受到腫瘤微環(huán)境的影響,來(lái)自同一區(qū)域的細(xì)胞會(huì)聚集在一起。此外,作者還進(jìn)行了Wilcoxon符號(hào)秩檢驗(yàn),以探討不同采樣區(qū)域之間Gain-PMDs甲基化水平的差異,圖3D的結(jié)果表明對(duì)于檢測(cè)多個(gè)采樣區(qū)域的重要性,有助于發(fā)現(xiàn)腫瘤內(nèi)異質(zhì)性。
4. Gain-PMDs 中發(fā)生異常甲基化變化
在這一部分,作者為了確定結(jié)直腸癌細(xì)胞中 Gain-PMD 中是否存在異常甲基化變化,比較了正常和原發(fā)腫瘤細(xì)胞之間 Gain-PMD 內(nèi)的甲基化水平。如圖4A,結(jié)果表明與鄰近的正常細(xì)胞相比,結(jié)直腸癌細(xì)胞中Gain-PMDs的甲基化水平顯著降低,不同采樣區(qū)域細(xì)胞中甲基化的降低程度也不相同。
多項(xiàng)研究證實(shí),基因組功能元件如啟動(dòng)子和CpG島的異常甲基化在癌癥的發(fā)展中起著重要作用,因此作者比較了正常和結(jié)直腸癌細(xì)胞內(nèi)Gain-PMDs基因組元件的DNA甲基化水平,將CpG根據(jù)甲基化水平分為三組:甲基化水平高于0且低于0.2的低甲基化組;甲基化水平高于0.2且低于0.8的中間甲基化組;和甲基化水平高于0.8且低于1的高甲基化組。如圖4B所示,作者發(fā)現(xiàn)與正常細(xì)胞相比,在結(jié)直腸癌細(xì)胞中,Gain-PMDs內(nèi)部CpG島的高甲基化組和中間甲基化組的CpG比例增加,低甲基化組的CpG比例降低;對(duì)于啟動(dòng)子,在4名患者中發(fā)現(xiàn),與正常細(xì)胞中Gain-PMDs內(nèi)的啟動(dòng)子相比,大腸癌細(xì)胞中高甲基化組和低甲基化組的CpG比例降低,但中間甲基化組的CpG比例升高??偨Y(jié)一下就是作者發(fā)現(xiàn)Gain-PMDs內(nèi)CpG島啟動(dòng)子甲基化異常增加。
5.Gain-PMDs中異常的DNA甲基化對(duì)基因表達(dá)的影響
由于啟動(dòng)子中的異常高甲基化可能抑制基因表達(dá)。因此,作者在這一部分主要關(guān)注CpG島啟動(dòng)子的甲基化與基因表達(dá)的關(guān)系。通過(guò)之前的分析,在TCGA數(shù)據(jù)集中選擇了290個(gè)具有甲基化和表達(dá)數(shù)據(jù)的基因進(jìn)行后續(xù)分析,結(jié)果如圖5A,腫瘤標(biāo)本的DNA甲基化水平明顯高于正常標(biāo)本(P< 0.01),這表明腫瘤中Gain-PMDs內(nèi)部CGI啟動(dòng)子的甲基化程度較高。同時(shí),比較290個(gè)基因在正常和結(jié)直腸癌樣本中的表達(dá)值,發(fā)現(xiàn)兩組之間存在顯著差異(wilcox.test,P= 0.002),結(jié)直腸癌樣本中的基因表達(dá)降低。
接下來(lái),作者計(jì)算了Gain-PMDs內(nèi)部CGI啟動(dòng)子的DNA甲基化與結(jié)直腸癌樣本中基因表達(dá)之間的Pearson相關(guān)系數(shù),發(fā)現(xiàn)77.59%的基因表達(dá)與DNA甲基化顯著負(fù)相關(guān)(Cor <0,P< 0.05);11.38% 的基因呈強(qiáng)負(fù)相關(guān)(Cor <-0.6,P< 0.05)。作者進(jìn)一步討論了啟動(dòng)子甲基化和表達(dá)負(fù)相關(guān)的基因功能,以及他們是否參與促進(jìn)結(jié)直腸癌的發(fā)病和進(jìn)展。如圖5B,這225個(gè)基因與多種癌癥相關(guān)的生物學(xué)過(guò)程和通路顯著相關(guān),它們有可能成為結(jié)直腸癌治療的靶點(diǎn)。ID4已有研究證實(shí)其在結(jié)直腸癌細(xì)胞中的低表達(dá)促進(jìn)了細(xì)胞增殖和克隆的形成,圖5C顯示了ID4基因啟動(dòng)子中的DNA甲基化和表達(dá)之間的Pearson相關(guān)性,Pearson相關(guān)系數(shù)為-0.37,這再次證明高甲基化抑制了ID4的表達(dá)。在此,作者得出結(jié)論:在從正常細(xì)胞向腫瘤細(xì)胞發(fā)展的過(guò)程中,對(duì)于Gain-PMDs內(nèi)部的大多數(shù)基因,當(dāng)CpG島啟動(dòng)子DNA發(fā)生異常甲基化時(shí),可以在一定程度上抑制基因表達(dá),從而促進(jìn)結(jié)直腸癌的形成、增殖和轉(zhuǎn)移。
以上這篇文章的全部?jī)?nèi)容就介紹完啦,總的來(lái)說(shuō),作者利用通過(guò)單細(xì)胞甲基化數(shù)據(jù)對(duì)部分甲基化結(jié)構(gòu)域進(jìn)行篩選,進(jìn)而在WGBS和基因表達(dá)數(shù)據(jù)中確定其與基因表達(dá)的關(guān)系,在細(xì)胞和組織層面對(duì)PMDs與結(jié)直腸癌的關(guān)系都進(jìn)行了闡述,相信隨著單細(xì)胞甲基化數(shù)據(jù)的增多,今后對(duì)于DNA甲基化的研究可能更多的會(huì)聚焦于單細(xì)胞層面,感興趣的小伙伴可以多多關(guān)注喲。