人類癌癥中增強(qiáng)子甲基化與轉(zhuǎn)錄因子調(diào)控的極限拉扯
作為連接表觀基因組改變與基因表達(dá)變化橋梁的增強(qiáng)子,其甲基化與增強(qiáng)子轉(zhuǎn)錄、靶基因表達(dá)之間的調(diào)控關(guān)系與人類癌癥有著怎樣的愛恨情仇?今年6月初發(fā)表于《Oncogene》(IF:8.756)的一篇文章則刻畫了人類泛癌中增強(qiáng)子甲基化-增強(qiáng)子轉(zhuǎn)錄-靶基因表達(dá)三元組間的調(diào)控模式,其中強(qiáng)調(diào)了增強(qiáng)子甲基化驅(qū)動(dòng)的核心轉(zhuǎn)錄因子調(diào)控回路,這種回路的重連可以作為藥物靶點(diǎn)和預(yù)后風(fēng)險(xiǎn)標(biāo)志物。
一、研究背景
越來越多的證據(jù)表明,增強(qiáng)子甲基化對(duì)基因表達(dá)具有強(qiáng)大的動(dòng)態(tài)調(diào)控作用。某些轉(zhuǎn)錄因子可以通過前饋的方式進(jìn)行自調(diào)節(jié)和交叉調(diào)節(jié),并與其增強(qiáng)子協(xié)同形成核心轉(zhuǎn)錄調(diào)控回路(CRC)。然而,研究人員對(duì)于增強(qiáng)子甲基化和核心轉(zhuǎn)錄調(diào)控回路之間的詳細(xì)調(diào)控機(jī)制的了解只是冰山一角。
二、研究思路
本研究整合公共的TCGA癌癥樣本與正常樣本的基因表達(dá)、DNA甲基化以及增強(qiáng)子轉(zhuǎn)錄等數(shù)據(jù),從以下五個(gè)方面開展研究:增強(qiáng)子轉(zhuǎn)錄刻畫、DNA甲基化對(duì)增強(qiáng)子轉(zhuǎn)錄的影響、差異甲基化增強(qiáng)子、增強(qiáng)子甲基化-增強(qiáng)子轉(zhuǎn)錄-靶基因表達(dá)三元組調(diào)控模式、增強(qiáng)子甲基化驅(qū)動(dòng)的核心轉(zhuǎn)錄調(diào)控回路。
三、研究結(jié)果
1、增強(qiáng)子甲基化在其轉(zhuǎn)錄活性調(diào)控中起著重要作用
基于在33種TCGA癌癥類型中鑒定得到的12559個(gè)轉(zhuǎn)錄增強(qiáng)子,作者利用Jaccard系數(shù)探究組織或者癌癥類型間增強(qiáng)子的轉(zhuǎn)錄組相似性,發(fā)現(xiàn)具有相似組織起源的癌癥譜系聚集在一起,表明增強(qiáng)子轉(zhuǎn)錄通常具有組織特異性(圖1 A)。作者隨后識(shí)別差異的增強(qiáng)子,并根據(jù)其從正常到癌癥的轉(zhuǎn)錄改變劃分為兩類:“升高”與“降低”。在識(shí)別的9131個(gè)差異增強(qiáng)子中,大多數(shù)的增強(qiáng)子都是癌癥類型特異的(圖1 B)。
進(jìn)一步,該研究探究DNA甲基化對(duì)于增強(qiáng)子基礎(chǔ)轉(zhuǎn)錄的影響。作者識(shí)別增強(qiáng)子甲基化區(qū)域以及進(jìn)一步篩選差異的甲基化增強(qiáng)子(癌癥vs 正常),并根據(jù)從正常到癌癥的甲基化改變將其劃分為“去甲基化”、“重新”以及“增強(qiáng)”。結(jié)果發(fā)現(xiàn)“去甲基化”的增強(qiáng)子在多種癌癥類型中占比50%以上(圖1C),而且大多數(shù)的增強(qiáng)子只在一種或兩種癌癥中存在差異甲基化(圖1 D)。在大多數(shù)的癌癥類型中,增強(qiáng)子的甲基化程度與其轉(zhuǎn)錄活性顯著負(fù)相關(guān)(圖1 E),也即大約76.5%的增強(qiáng)子其甲基化程度降低而轉(zhuǎn)錄水平增高(“去甲基化-升高”)。這些結(jié)果表明DNA甲基化是調(diào)控癌癥特異性增強(qiáng)子轉(zhuǎn)錄活性的重要因素,其中與增強(qiáng)子轉(zhuǎn)錄活性增加相關(guān)的去甲基化在人類癌癥中廣泛存在。
圖1、人類癌癥中增強(qiáng)子的轉(zhuǎn)錄與甲基化
2、人類癌癥中低甲基化增強(qiáng)子的全局激活
為了了解不同癌癥類型中增強(qiáng)子轉(zhuǎn)錄和甲基化的多樣性和普遍性,作者分別基于增強(qiáng)子的轉(zhuǎn)錄和甲基化水平對(duì)10種癌癥類型的4296個(gè)癌癥樣本進(jìn)行了一致性聚類分析。基于增強(qiáng)子轉(zhuǎn)錄將樣本聚成了4個(gè)轉(zhuǎn)錄亞型(T1,T2,T3以及T4),這4個(gè)亞型中增強(qiáng)子轉(zhuǎn)錄的平均水平都顯著高于正常樣本,表明了增強(qiáng)子轉(zhuǎn)錄可能在癌癥中被全局激活(圖2 A,B)。隨后,基于增強(qiáng)子甲基化對(duì)相同的樣本進(jìn)行聚類導(dǎo)致了4個(gè)甲基化亞型(M1,M2,M3以及M4),其中M1的甲基化水平與正常樣本相似,并且顯著高于M2、M3與M4(圖2 C,D)。因此,作者將M1亞型命名為“正常樣甲基化”亞型,而M2、M3與M4定義為“低甲基化”。
此外,作者基于累積超幾何分布利用甲基化亞型豐富樣本的轉(zhuǎn)錄亞型,綜合定義了6個(gè)樣本亞群(cluster A-F)(圖2 E)。據(jù)此,癌癥中增強(qiáng)子呈現(xiàn)兩種狀態(tài):“低甲基化-激活的轉(zhuǎn)錄”(cluster A,B,C,D以及F,占總樣本的70.5%);“正常樣甲基化-激活的轉(zhuǎn)錄”(cluster E,占總樣本的70.5%)。BRCA與PRAD主要表現(xiàn)為“正常樣甲基化-激活的轉(zhuǎn)錄”增強(qiáng)子狀態(tài),而COADREAD,HNSC、LIHC、LUAD、LUSC、KIRC、KIRP和THCA主要表現(xiàn)為“低甲基化-激活的轉(zhuǎn)錄”的增強(qiáng)子狀態(tài)(圖2 F)。這些結(jié)果表明低甲基化增強(qiáng)子的全局激活在人類癌癥中是一種常見的現(xiàn)象。
圖2、癌癥樣本中低甲基化增強(qiáng)子的全局激活
3、增強(qiáng)子的甲基化改變涉及復(fù)雜的基因表達(dá)調(diào)控模式
為了進(jìn)一步闡述增強(qiáng)子甲基化相關(guān)的調(diào)控關(guān)系,作者系統(tǒng)性地識(shí)別了增強(qiáng)子擾動(dòng)的靶基因(蛋白編碼基因與lncRNAs)以及進(jìn)一步組裝了增強(qiáng)子甲基化三元組(增強(qiáng)子甲基化-增強(qiáng)子轉(zhuǎn)錄-靶基因表達(dá))。在三元組中,去甲基化誘導(dǎo)增強(qiáng)子的激活從而上調(diào)靶基因表達(dá)(“去甲基化”-“升高”-“上調(diào)”)的調(diào)控關(guān)系占比最高(圖3A)。其中在LUAD中觀測到一個(gè)去甲基化的增強(qiáng)子(chr12: 31,902,03 -31,903,126)可以激活增強(qiáng)子基礎(chǔ)轉(zhuǎn)錄,上調(diào)lncRNA DENND5B-AS1的表達(dá),該調(diào)控關(guān)系進(jìn)一步在組織水平測序數(shù)據(jù)以及A549細(xì)胞中被驗(yàn)證(圖3 B)。DENND5B-AS1共表達(dá)基因的功能富集分析結(jié)果顯示該基因參與DNA損傷修復(fù),而轉(zhuǎn)錄因子FOXA1在已有研究中被證實(shí)通過誘導(dǎo)DNA去甲基化參與DNA損傷修復(fù)機(jī)制。確實(shí),在A549細(xì)胞中DENND5B-AS1啟動(dòng)子和增強(qiáng)子區(qū)域中觀測到明顯的FOXA1結(jié)合峰(圖3C)和染色質(zhì)相互作用。此外,在LUAD中FOXA1表達(dá)與增強(qiáng)子的甲基化水平顯著負(fù)相關(guān)(圖3D)。實(shí)驗(yàn)驗(yàn)證表明FOXA1敲除后,MCF-7細(xì)胞中增強(qiáng)子甲基化水平明顯恢復(fù)(圖3E)。這些結(jié)果暗示轉(zhuǎn)錄因子在主導(dǎo)增強(qiáng)子調(diào)控中起到重要的作用。
圖3、推斷人類癌癥中增強(qiáng)子甲基化主導(dǎo)的調(diào)控模式
隨后,作者提出了四種以增強(qiáng)子甲基化為主的調(diào)控模式,以闡明三元組中可能的調(diào)控關(guān)系:“獨(dú)立”,“級(jí)聯(lián)”,“協(xié)同”,以及“復(fù)合”模式(圖3F)。獨(dú)立模式表明DNA甲基化獨(dú)立調(diào)控增強(qiáng)子的基礎(chǔ)轉(zhuǎn)錄和靶基因的表達(dá),其中包括三個(gè)子模式:(1)轉(zhuǎn)錄因子和染色質(zhì)重塑復(fù)合物綁定誘導(dǎo)的去甲基化促進(jìn)了增強(qiáng)子的基礎(chǔ)轉(zhuǎn)錄,將增強(qiáng)子從平衡狀態(tài)切換到激活狀態(tài)(“靜態(tài)”模式);(2)激活狀態(tài)增強(qiáng)子的去甲基化增加了轉(zhuǎn)錄因子結(jié)合概率并影響靶基因的表達(dá)(“直接”模式);(3)增強(qiáng)子轉(zhuǎn)錄和靶基因都可能對(duì)DNA甲基化改變做出響應(yīng)(“共響應(yīng)”模式)。級(jí)聯(lián)模式則假設(shè)增強(qiáng)子甲基化可以調(diào)控其基礎(chǔ)轉(zhuǎn)錄產(chǎn)生增強(qiáng)子RNA(eRNA),而新生的eRNAs將構(gòu)成轉(zhuǎn)錄起始復(fù)合物調(diào)控靶基因表達(dá)程序。在協(xié)同模式中,增強(qiáng)子甲基化和eRNA協(xié)同調(diào)控靶基因的表達(dá)。最后,復(fù)合模式則表示增強(qiáng)子甲基化及其所產(chǎn)生的eRNA共同影響靶基因的表達(dá)。
其次,作者進(jìn)一步基于貝葉斯網(wǎng)絡(luò)與最大似然估計(jì)方法來識(shí)別每個(gè)三元組其數(shù)據(jù)擬合的調(diào)控模式,結(jié)果包括3212個(gè)“獨(dú)立”模式,951個(gè)“級(jí)聯(lián)”模式,766個(gè)“協(xié)同模式”以及47個(gè)“復(fù)合”模式(圖3 G)。有趣的是,基于靶基因的功能富集分析結(jié)果顯示“級(jí)聯(lián)”模式主要富集于免疫反應(yīng)和發(fā)育以及分化;“協(xié)同”模式主要富集于細(xì)胞周期與信號(hào)通路功能術(shù)語;“獨(dú)立”模式主要參與RNA穩(wěn)定性調(diào)節(jié)與生殖細(xì)胞發(fā)育的生物過程(圖3 H)。這些結(jié)果進(jìn)一步強(qiáng)調(diào)了增強(qiáng)子甲基化驅(qū)動(dòng)癌癥進(jìn)展的可能影響。
圖3、推斷人類癌癥中增強(qiáng)子甲基化主導(dǎo)的調(diào)控模式
4、核心轉(zhuǎn)錄因子能夠塑造增強(qiáng)子甲基化并形成核心轉(zhuǎn)錄調(diào)控回路
先前的研究表明一些轉(zhuǎn)錄因子的占用可以介導(dǎo)調(diào)控元件上DNA甲基化的主動(dòng)轉(zhuǎn)換。因此,作者調(diào)查幾個(gè)能夠修飾DNA甲基化的轉(zhuǎn)錄因子(MeTFs)對(duì)增強(qiáng)子甲基化的影響,例如轉(zhuǎn)錄因子RUNX3,CEBPB, CEBPA, GATA2, SOX2以及 FOXA1。這些在癌癥中顯著表達(dá)失調(diào)的MeTFs不僅在多個(gè)癌癥細(xì)胞系中觀測到其在增強(qiáng)子甲基化區(qū)域上表現(xiàn)出很強(qiáng)的結(jié)合信號(hào),而且其表達(dá)與增強(qiáng)子甲基化水平顯著相關(guān)(圖4A),暗示了轉(zhuǎn)錄因子與增強(qiáng)子甲基化間存在緊密的聯(lián)系。例如,轉(zhuǎn)錄因子CEBPB能夠結(jié)合其增強(qiáng)子區(qū)域來調(diào)節(jié)自身的表達(dá)程序(圖4B),體外實(shí)驗(yàn)已經(jīng)證明CEBPB可以通過誘導(dǎo)增強(qiáng)子甲基化的改變進(jìn)行自我調(diào)節(jié),從而導(dǎo)致其在癌癥中的表達(dá)失調(diào)。在以往的研究中,這種轉(zhuǎn)錄因子自我調(diào)節(jié)回路也被稱為核心轉(zhuǎn)錄調(diào)控回路(CRC)。
為了進(jìn)一步探索增強(qiáng)子甲基化對(duì)人類癌癥CRC的影響,作者系統(tǒng)地識(shí)別了增強(qiáng)子甲基化驅(qū)動(dòng)的CRC (emCRCs):首先識(shí)別增強(qiáng)子甲基化區(qū)域內(nèi)的超級(jí)增強(qiáng)子以及癌癥特異的核心轉(zhuǎn)錄因子;然后將含有核心轉(zhuǎn)錄因子的增強(qiáng)子甲基化三元組定義為是emCRCs;最終識(shí)別到33個(gè)自調(diào)控的核心轉(zhuǎn)錄因子,涉及48個(gè)emCRCs。在TAMR與WS8細(xì)胞中GRHL2在超級(jí)增強(qiáng)子與啟動(dòng)子區(qū)域上的結(jié)合信號(hào)支撐了GRHL2可以導(dǎo)致自調(diào)控回路(圖4C)。此外,TEAD4的過表達(dá)可以被下游超級(jí)增強(qiáng)子 (chr12:3,068,563-3,070,563)的去甲基化所調(diào)控,形成正反饋循環(huán)。值得注意的是,與正常細(xì)胞相比HCT116細(xì)胞的超級(jí)增強(qiáng)子區(qū)有更強(qiáng)的TEAD4結(jié)合信號(hào)(圖4 C)。作者進(jìn)一步探究前人研究中實(shí)驗(yàn)支持的emCRCs下游基因,結(jié)果表明emCRC轉(zhuǎn)錄因子能夠調(diào)控彼此的表達(dá),從而形成一個(gè)緊密相連的調(diào)控網(wǎng)絡(luò)(圖4 D)。通過注釋這些下游基因的功能,結(jié)果發(fā)現(xiàn)它們參與了癌癥進(jìn)展的多種生物學(xué)過程,例如癌癥通路,免疫反應(yīng),染色質(zhì)構(gòu)成,細(xì)胞周期以及蛋白質(zhì)修飾(圖4E)。這些結(jié)果表明,emCRCs對(duì)調(diào)控轉(zhuǎn)錄重編程和控制癌癥過程至關(guān)重要。
圖4、轉(zhuǎn)錄因子參與增強(qiáng)子甲基化調(diào)控
5、emCRC的重連接是潛在的治療靶點(diǎn)
作者進(jìn)一步探究emCRCs在人類癌癥中的臨床應(yīng)用價(jià)值。相比于emCRC中單個(gè)的增強(qiáng)子甲基化、增強(qiáng)子轉(zhuǎn)錄或者轉(zhuǎn)錄因子表達(dá),基于COX多元回歸計(jì)算的各emCRC的風(fēng)險(xiǎn)得分具有最高的預(yù)后價(jià)值(圖5A)。例如,受其自身增強(qiáng)子甲基化調(diào)控的核心轉(zhuǎn)錄因子E2F8構(gòu)成的emCRC在LIHC, LUAD,以及LUSC具有最高的預(yù)后價(jià)值(圖5B)。增強(qiáng)子(chr11:2,225,980 -2,227,103)的去甲基化激活增強(qiáng)子基礎(chǔ)轉(zhuǎn)錄并上調(diào)E2F8的轉(zhuǎn)錄。據(jù)此,作者通過免疫組化(IHC)和免疫熒光(IF)染色觀察到癌癥組織中E2F8蛋白水平高于正常組織(圖5 C,D)。E2F8相關(guān)的emCRC的風(fēng)險(xiǎn)得分在LUAD以及LIHC中可以作為風(fēng)險(xiǎn)預(yù)后標(biāo)志物(圖5 E)。
在COADREAD, HNSC以及LUAD中核心轉(zhuǎn)錄因子ZNF384的上調(diào)可以被可以被下游增強(qiáng)子(chr12:13,024,869-13,025,992)的去甲基化所誘導(dǎo)(圖5F)。IHC和IF染色也支持結(jié)腸癌組織中具有較高的ZNF384蛋白水平(圖5G, H)。通過靶向ZNF384的CRISPR干擾處理,在K562細(xì)胞中觀察到其增強(qiáng)子基礎(chǔ)轉(zhuǎn)錄顯著降低(圖5I),暗示轉(zhuǎn)錄因子ZNF384可以調(diào)控其增強(qiáng)子活性。此外,在HNSC中基于ZNF384相關(guān)emCRC定義的風(fēng)險(xiǎn)得分則指示較差的疾病特異生存DSS(圖5J)。這些結(jié)果表明,emCRC的重連接可以增強(qiáng)ZNF384的表達(dá),而上調(diào)ZNF384也可以通過調(diào)節(jié)其增強(qiáng)子活性形成一個(gè)正向的自調(diào)控環(huán)。
圖5、emCRCs的潛在臨床應(yīng)用
6、EmethCRC:用于探索人類癌癥中的emCRC的網(wǎng)站服務(wù)器
EmethCRC (http://bio-bigdata.tech/EmethCRC/)包含癌癥特異的emCRCs和它們的調(diào)控關(guān)系、emCRCs的潛在臨床應(yīng)用以及實(shí)驗(yàn)支撐的emCRCs下游基因。所有結(jié)果均可免費(fèi)下載用于后續(xù)分析。
四、小結(jié)
文章所有章節(jié)都是采用整體描述結(jié)合特例分析的手法,全局基調(diào)則從增強(qiáng)子甲基化-增強(qiáng)子轉(zhuǎn)錄-靶基因表達(dá)三元組中逐漸聚焦到增強(qiáng)子甲基化驅(qū)動(dòng)的核心調(diào)控回路,最后以核心調(diào)控回路的整體動(dòng)態(tài)變化相比于單個(gè)元素更能指示癌癥的生存完美收官。