基于ATAC-seq和RNA-seq預(yù)測子宮內(nèi)膜非典型增生和子宮內(nèi)膜樣癌患者黃體酮不敏感的潛在模型
子宮內(nèi)膜樣癌(EEC)是婦科最常見的惡性腫瘤之一,每年新發(fā)癌癥病例和死亡人數(shù)呈上升趨勢。值得注意的是,EEC及其癌前病變,子宮內(nèi)膜不典型增生(EAH)呈現(xiàn)出年輕化的趨勢,大約一半的年輕EEC和EAH患者在確診時是未分娩的。因此,保留生育能力的治療在臨床研究中受到越來越多的關(guān)注。目前,大劑量孕激素治療是主要的保守治療策略,達到約70%-80%的完全緩解(CR)率。然而,仍有大約20%-30%的病例對孕激素不敏感。
目前尚缺乏預(yù)測EAH或EEC患者孕激素敏感性的客觀指標。研究表明,孕激素受體(PR)在EAH和EEC組織中的陽性表達與保留生育治療的CR時間較短有關(guān)。能用于預(yù)測EAH和EEC病例孕激素反應(yīng)的分子標志物的高質(zhì)量證據(jù)較少。因此,仍然需要進一步的研究來探索預(yù)測EAH和EEC患者孕激素反應(yīng)的有前景的模型。
為了構(gòu)建EAH或EEC患者孕激素敏感的潛在預(yù)測模型,該研究基于EAH和EEC組織的ATAC-seq和RNAseq數(shù)據(jù)的綜合生物信息學分析,確定了候選基因,并在另外35例病例中進一步驗證了預(yù)測模型。該研究提供了預(yù)測EAH和EEC患者孕激素不敏感的潛在模型。
結(jié)果:
1. ATAC-seq數(shù)據(jù)比較PIS與PS患者染色質(zhì)可及性
ATAC-seq分析基因組染色質(zhì)的可及性(PIS,n=7和PS,n=7)。每組中有5名患者同時有ATAC-seq和RNA-seq數(shù)據(jù)。每組中剩下的兩名患者分別只有ATAC-seq數(shù)據(jù)或RNA-seq數(shù)據(jù)。在ATAC-seq結(jié)果中,根據(jù)功能和位置信息,每個樣本中所有讀取的比例與人類基因組中的元素相匹配。PIS組轉(zhuǎn)錄位點的可及性在啟動子區(qū)域更為豐富,而PS組在內(nèi)含子和遠端基因間隔區(qū)的可及性更豐富。PIS組比PS組有更多的開放差示峰(圖1D)。通過系統(tǒng)聚類分析,PIS組較PS組有2773個開放峰和948個閉合峰(圖1E)。熱圖顯示,在PIS病例中,轉(zhuǎn)錄活躍的基因比例高于PS病例。每組6個樣本的基因峰按等級聚類成一組,說明了ATAC-seq數(shù)據(jù)的可靠性和準確性。
2. 應(yīng)用RNA-seq技術(shù)比較PIS和PS的基因表達譜
為了比較PIS和PS的表達譜,通過層次聚類分析顯示DEG(圖2A)。與PS組相比,PIS組有4349個上調(diào)的DEG和2102個下調(diào)的DEG(圖2B)。GO和REACTOME富集分析確定PIS組中上調(diào)和下調(diào)的DEG的功能(圖2,C-D)。
BP:PIS組下調(diào)的DEGS主要在中性粒細胞相關(guān)活性、高爾基囊泡轉(zhuǎn)運、膜內(nèi)系統(tǒng)組織、巨噬細胞自噬和細胞對化學應(yīng)激的反應(yīng)中豐富,而PIS組上調(diào)的DEGS主要豐富于膜電位和突觸信號相關(guān)功能。
CC:PIS組下調(diào)的DEG主要集中在顆粒腔、囊腔、細胞-底物連接和局灶性粘連,而PIS組上調(diào)的DEG主要集中在突觸膜和相關(guān)的轉(zhuǎn)運體。
MF:PIS組下調(diào)的DEGS富集在鈣粘素、核苷、GTP和泛素蛋白連接酶結(jié)合等,而PIS組上調(diào)的DEG富含通道、跨膜轉(zhuǎn)運體和神經(jīng)遞質(zhì)受體活性。
REACTOME通路:PIS組下調(diào)的DEGS顯著豐富于天冬酰胺N-連接糖基化、中性粒細胞脫顆粒、自噬和高爾基體與內(nèi)質(zhì)網(wǎng)(ER)之間的轉(zhuǎn)運等途徑,而PIS組上調(diào)的DEGS豐富于化學和突觸信號傳遞、成纖維細胞生長因子受體(FGFR)和G蛋白偶聯(lián)受體(GPCR)。
3. ATAC-seq和RNA-seq整合的GO和REACTOME分析
為了進一步確定與孕激素不敏感相關(guān)的特定功能和途徑,綜合ATAC-seq和RNA-seq結(jié)果進行進一步分析。通過重疊ATAC-seq和RNA-seq的結(jié)果,與PS組相比,PIS組在染色質(zhì)可及性方面具有138個上調(diào)的DEG和92個下調(diào)的DEG,其中染色質(zhì)可及性具有關(guān)閉的峰。相關(guān)分析表明,上述230個重疊區(qū)的表達譜與染色質(zhì)可及性呈顯著正相關(guān)(圖3 A,B)
為了進一步了解這230個重疊的DEG是否參與了特定的功能和通路,我們進行了GO注釋和REACTOME通路(圖3C-D)。
BP:PIS組中重疊下調(diào)的DEGS主要影響細胞的輸入運輸、半胱氨酸型內(nèi)肽酶活性的負調(diào)節(jié)、對活性氧的反應(yīng)和脂肪細胞分化。
CC:PIS組中重疊下調(diào)的DEG位于谷氨酸能突觸、膜外成分、含膠原細胞外基質(zhì)和胞內(nèi)囊泡腔中,而PIS組中重疊上調(diào)的DEG位于糖蛋白復(fù)合體、鈉通道復(fù)合體、β-連環(huán)素-Tcf復(fù)合體和肌膜。
MF:PIS組中重疊下調(diào)的DEG在細胞外基質(zhì)結(jié)合、鈣粘附素結(jié)合、轉(zhuǎn)錄輔因子結(jié)合和磷脂酰絲氨酸結(jié)合中豐富,而在PIS組中上調(diào)的DEG與bHLH轉(zhuǎn)錄因子結(jié)合、β-連環(huán)蛋白結(jié)合和鈉通道活性相關(guān)。
REACTOME通路:PIS組中這些重疊下調(diào)的DEG主要影響MAPK家族信號級聯(lián)、第二信使的細胞內(nèi)信號轉(zhuǎn)導、PI3K/AKT網(wǎng)絡(luò)的負調(diào)控、G1中的細胞周期蛋白D相關(guān)事件以及FOXO?介導的細胞周期基因的轉(zhuǎn)錄;而PIS組中上調(diào)的DEG主要豐富于膽鹽和有機酸、金屬離子和胺化合物的運輸、微管蛋白的羧基末端翻譯后修飾、參與巨核細胞發(fā)育和血小板生成的因子以及動蛋白。
綜上所述,PIS組中重疊下調(diào)的DEGS主要負責信號傳遞、轉(zhuǎn)錄輔因子活性、DNA損傷、細胞凋亡和細胞周期,而PIS組中重疊上調(diào)的DEGS主要負責物質(zhì)轉(zhuǎn)運和細胞骨架蛋白的調(diào)節(jié)。
4. 孕激素不敏感預(yù)測基因的篩選
為了進一步篩選預(yù)測孕激素不敏感的候選基因,利用HOMER軟件對調(diào)節(jié)230個重疊DEG表達的潛在轉(zhuǎn)錄因子進行了豐富。根據(jù)PIS組中69個下調(diào)的DEG,確定的TF包括CUX1、TBP、SOX5、FOXJ1、PRRX2、SOX9、FOXQ1、POU1F1、MECOM和NKX2-1,而根據(jù)PIS組中76個上調(diào)的DEG,僅識別出ZBTB18和CDC5L。此外,根據(jù)ATAC-seq和RNA-seq整合的結(jié)果,通過HOMER峰分析進行了基序富集化。生成超過20%的具有富含染色質(zhì)區(qū)域的基序的靶序列的已知轉(zhuǎn)錄因子(PIS與PS)包括NANOG、TGIF2、NF1、HOXA9、FOXO1、SP2、SOX10、SOX3、TWIST2、SOX6、SOX21、KLF5、MAZ、TCF4、AP-1、BHLHA15R、NEUROG2、ATF3、SOX15和BATF。
此外,使用STRING和Cytoscape軟件分析了DEGS編碼的蛋白質(zhì)之間的相互作用(圖4B)。根據(jù)連接的品系越多綜合得分越高的原則,篩選出潛在的候選基因或中心基因。前四位連接4條以上蛋白質(zhì)分別由SOX9、CDH2、IRF4和TCF4編碼。PIS組下調(diào)區(qū)有8個蛋白質(zhì)有4條以上連接線,分別由CD44、ACTB、KLF4、APOE、SNAI2、FYN、PAX2和FOXO1編碼。25個候選基因(SYTL2、SOX5、DMD、TCF4、PDGFC、SOX9、BNC2、CDH2、BCL11A、ANKS1B、PPP2R2B、DIO2、IRF4、FGF19、FOXO1、GATA6、IRS2、CD44、APOE、KLF4、ACTB、FYN、CNTLN、HOXA9和RXRA)。
5. 預(yù)測孕激素不敏感的潛在模型的建立
為了建立準確預(yù)測孕激素敏感狀態(tài)的模型,將35例患者進一步分為PS-C組(n=13)、sub-PS-C組(n=15)和PIS-C組(n=7)(圖5)。首先,用RT-qPCR方法檢測這35例患者中25個候選基因的表達。由于SYTL2、ANKS1B、PPP2R2B和FGF19基因的CT值超過35,表明基因表達水平低,分析不準確,因此這4個基因不包括在后續(xù)的分析中。
根據(jù)不同孕激素敏感條件,對其余21個基因的歸一化ΔCT值進行多項Logistic回歸分析,建立預(yù)測模型。圖6的結(jié)果顯示,對于PIS-C患者,總共生成了25個預(yù)測模型,預(yù)測準確率為100%,其中11個模型對于亞PS-C預(yù)測的預(yù)測準確率超過80%(P<0.01)。有3個模型的總體預(yù)測準確率超過90%,涉及9個候選基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)。
總結(jié):
ATAC-seq和RNA-seq整合分析共獲得230個重疊的差異表達基因。進一步,基于GO分析、反應(yīng)途徑、轉(zhuǎn)錄因子預(yù)測、基序豐富、細胞角蛋白分析,確定了25個可能與孕激素不敏感相關(guān)的候選基因。最后,使用擴展樣本進行數(shù)據(jù)驗證,并基于這些數(shù)據(jù)建立了包含9個基因(FOXO1、IRS2、PDGFC、DIO2、SOX9、BCL11A、APOE、FYN和KLF4)的預(yù)測模型,總體預(yù)測準確率在90%以上。這項研究提供了潛在的預(yù)測模型,可能有助于在保留生育能力的治療之前識別孕激素不敏感的EAH和EEC患者。