肺腺癌CDK2相關(guān)的免疫預(yù)測模型和ceRNA的識(shí)別及泛癌分析
本文(Identification of CDK2-Related Immune Forecast Model and ceRNA in Lung Adenocarcinoma, a Pan-Cancer Analysis)于2021年7月發(fā)表在Frontiers in Cell and Developmental Biology雜志上,影響因子6.684。
研究背景:我們的研究旨在識(shí)別肺腺癌(LUAD)中具有顯著預(yù)后價(jià)值的分子,并構(gòu)建相關(guān)的Nomogram、immuno模型及ceRNA網(wǎng)絡(luò)。
研究方法: 應(yīng)用“GEO2R”、“l(fā)imma”R包對GEO和TCGA數(shù)據(jù)庫中所有差異表達(dá)mRNA進(jìn)行鑒定。p<0.01,LogFC>2或<-2的基因被納入進(jìn)一步分析。通過DAVID和Metascape軟件對250個(gè)重疊mRNA進(jìn)行功能分析。通過UALCAN, Oncomine和R包,探索了CDK2在33種癌癥中的表達(dá)水平及其與生存的關(guān)系。采用“Survival”、“surveminer”、“rms”等R包構(gòu)建年齡、性別、分期、T、M、N的Nomogram預(yù)測模型,采用單因素和多因素Cox回歸建立LUAD患者預(yù)后相關(guān)的免疫預(yù)測模型。ceRNA網(wǎng)絡(luò)由各種在線數(shù)據(jù)庫組成。利用GDSC數(shù)據(jù)庫探討CDK2的表達(dá)與抗腫瘤藥物IC50的相關(guān)性(圖1)。
研究流程:
研究結(jié)果
一、GSE68465數(shù)據(jù)的mRNA差異表達(dá)
根據(jù)P-value和LogFC篩選出250個(gè)差異表達(dá)的基因。在19個(gè)相鄰非LUAD組織和433個(gè)LUAD組織中,有161個(gè)mRNA高表達(dá),78個(gè)mRNA低表達(dá)(圖2)。
圖2:GSE68465樣本的火山圖、散點(diǎn)圖、峰值圖
二、250個(gè)DEmRNA的GO,KEGG分析
通過Metascape軟件,找到了大量顯著富集的通路,包括免疫應(yīng)答激活、細(xì)胞粘附調(diào)節(jié)、參與免疫應(yīng)答的T細(xì)胞激活以及PID-HNF3B通路(圖3 A-D)。根據(jù)DEmRNA的關(guān)系,進(jìn)行了幾種蛋白分析(圖3 E)。CDK2、MYB、GATA3在某些腫瘤通路中相互關(guān)聯(lián)(圖3 F)。利用DAVID分析基因的KEGG結(jié)果,發(fā)現(xiàn)9種mRNA參與了經(jīng)典P13-AKT信號(hào)通路,如MYB、COL3A1、COL4A1、CSF1R、CDK2、ITGB7、LAMA2、TLR2、VWF。結(jié)合LUAD患者的生存,選擇CDK2作為目標(biāo)分子。利用KEGG進(jìn)一步識(shí)別P13-AKT信號(hào)通路中CDK2的上游分子。最后,CDKN1A可能調(diào)節(jié)下游分子CDK2影響LUAD的細(xì)胞周期進(jìn)程。使用GEPIA發(fā)現(xiàn),CDK2和CDKN1A之間存在正相關(guān)關(guān)系(圖3 G)。
圖3: (A)顯著富集的通路。(B) 不同通路之間的相互作用。(C,D)不同通路徑的p值。(E)根據(jù)DE mrna的關(guān)系,進(jìn)行多種蛋白分析。(F) CDK2、MYB、GATA3相互關(guān)聯(lián)。(G) CDK2和CDKN1A之間存在正相關(guān)關(guān)系。
三、CDK2及其在LUAD中的預(yù)后價(jià)值的進(jìn)一步研究
通過Ualcan數(shù)據(jù)庫,研究了CDK2在LUAD組織和正常組織中的表達(dá)。與59個(gè)正常組織相比,515個(gè)LUAD組織中CDK2表達(dá)較高(圖 4A)。CDK2在不同年齡層的表達(dá)水平存在差異(圖 4B)。CDK2的表達(dá)與不同的臨床特征有關(guān),如分級(jí)、腺癌的類型、性別、吸煙、階段、TP53突變狀態(tài)及權(quán)重(圖4 C-I)。CDK2的表達(dá)與LUAD患者的生存和預(yù)后有關(guān)(圖 4J)。CDK2的表達(dá)越高,存活時(shí)間越短。通過這個(gè)數(shù)據(jù)庫,發(fā)現(xiàn)了CDK2相關(guān)的基因(圖4 K-L)。許多參與腫瘤經(jīng)典信號(hào)通路的分子都與CDK2的表達(dá)有關(guān)。PrognoScan數(shù)據(jù)庫:用于基因預(yù)后價(jià)值的meta分析的新數(shù)據(jù)庫。進(jìn)一步分析發(fā)現(xiàn)CDK2的表達(dá)影響了不同GSE數(shù)據(jù)集LUAD患者的OS和RFS(圖4 M-P)。
圖4 進(jìn)一步研究CDK2在LUAD中的表達(dá)及預(yù)后分析(A) 515個(gè)LUAD組織中CDK2的表達(dá)高于59個(gè)正常組織。(B)不同年齡CDK2的表達(dá)水平可能存在差異(C) CDK2的表達(dá)與級(jí)別有關(guān)(D)腺癌的類型。(E)性別。(F)吸煙習(xí)慣。(G)分期。(H)TP-53突變狀態(tài)。(I)體重。(J) CDK2表達(dá)與LUAD患者的生存和預(yù)后有關(guān)。(K,L)CDK2相關(guān)基因和熱圖。(M-P)CDK2表達(dá)影響LUAD患者的OS和RFS。
四、CDK2在泛癌中的表達(dá)分析
Oncomine數(shù)據(jù)庫顯示,15個(gè)癌組織中CDK2的表達(dá)高于正常組織 (圖 5A)。腫瘤組織與正常組織有很大的不同。在TIMER數(shù)據(jù)庫中進(jìn)一步發(fā)現(xiàn)了正常組織和腫瘤組織之間的統(tǒng)計(jì)學(xué)意義(圖 5B)。15篇已發(fā)表的LUAD研究的Mata分析顯示,CDK2在LUAD中表達(dá)較高(圖 5C-E)。根據(jù)CDK2在33種癌癥中的表達(dá)情況對其進(jìn)行了排名(圖 5F)。
圖5 CDK2在泛癌分析中的表達(dá)。(A)通過Oncomine數(shù)據(jù)庫,CDK2的表達(dá)在15種癌癥組織中高于正常組織。(B)數(shù)據(jù)庫TIMER中CDK2的表達(dá)。(C)對15個(gè)發(fā)表的LUAD研究進(jìn)行Meta分析,結(jié)果顯示在LUAD中CDK2高表達(dá)。(D, E)LUAD中CDK2的t檢驗(yàn)、箱式圖圖和峰值圖(F) CDK2在33種腫瘤中的表達(dá)。
CDK2的表達(dá)在17種癌癥中有所增加(圖 6A–Q)。CDK2的不同表達(dá)水平在患者分期上有統(tǒng)計(jì)學(xué)意義。CDK2在第I階段和第III階段、第I階段和第IV階段、第II階段和第IV階段之間表達(dá)存在顯著差異(圖 6R–Y)。
圖6 不同腫瘤的表達(dá)及分期(A-Q) CDK2在17種腫瘤中表達(dá)較高(R-Y) CDK2的不同表達(dá)水平在患者分期上具有統(tǒng)計(jì)學(xué)意義。
對于不同類型的癌癥,進(jìn)行了CDK2的配對樣本差異表達(dá)分析。發(fā)現(xiàn)14種腫瘤類型的差異均有統(tǒng)計(jì)學(xué)意義(圖 7A-N)。在10種癌癥中,CDK2的高表達(dá)與患者不良預(yù)后相關(guān)(圖 7O-X)。
圖7 CDK2的配對樣本表達(dá)及生存分析(A-N)對于不同類型的癌癥,進(jìn)行了CDK2的配對樣本差異表達(dá)(O-X)在10種癌癥中,CDK2的表達(dá)與患者的預(yù)后有關(guān)。
五、CDK2的功能富集分析
作者比較了LUAD中CDK2高表達(dá)組和低表達(dá)組的基因表達(dá)(圖 8A、B)。以FP為橫坐標(biāo),TP為縱坐標(biāo),繪制1、3、5、8年的AUC曲線來預(yù)測患者的生存期(圖 8C)。功能分析表明,CDK2與DNA復(fù)制、細(xì)胞周期調(diào)控、細(xì)胞周期檢查點(diǎn)、P53信號(hào)通路有關(guān)(圖 8D-G)。GO、KEGG、Reactome的波譜圖顯示,CDK2參與了TP53活性調(diào)控、PTEN調(diào)控、細(xì)胞凋亡、P13K-AKT信號(hào)通路等經(jīng)典腫瘤信號(hào)通路(圖 8H-K)。利用CIBERSORT,發(fā)現(xiàn)CDK2與CD4 T細(xì)胞、巨噬細(xì)胞M1正相關(guān),與Mast細(xì)胞負(fù)相關(guān)(圖 8L)。
圖8 CDK2功能富集分析。(A, B)展示了CDK2高表達(dá)組和低表達(dá)組前50個(gè)基因的熱圖。(C)1、3、5、8年的AUC曲線預(yù)測患者的生存(D) CDK2與DNA復(fù)制、細(xì)胞周期調(diào)控、細(xì)胞周期檢查點(diǎn)、P53信號(hào)通路有關(guān)。(H-J) GO、KEGG、Reactome的波譜圖顯示CDK2參與了TP53活性調(diào)控、PTEN調(diào)控、細(xì)胞凋亡、P13K-AKT信號(hào)通路等經(jīng)典腫瘤信號(hào)通路。(K)通路環(huán)形圖(L)CIBERSOPT算法顯示CDK2與CD4 T細(xì)胞、巨噬細(xì)胞M1 正相關(guān),與肥大細(xì)胞呈負(fù)相關(guān)。
六、CDK2免疫細(xì)胞浸潤特征
在LUAD中,進(jìn)一步研究了CDK2在不同免疫細(xì)胞類型中的表達(dá)情況。發(fā)現(xiàn)有14種免疫細(xì)胞與CDK2的表達(dá)密切相關(guān),如濾泡細(xì)胞、T細(xì)胞調(diào)節(jié)性TREG細(xì)胞、巨噬細(xì)胞M0、巨噬細(xì)胞、嗜酸性粒細(xì)胞、激活的肥大細(xì)胞、巨噬細(xì)胞M1、肥大細(xì)胞、單核細(xì)胞、靜息肥大細(xì)胞、漿細(xì)胞、CD8+T細(xì)胞、中性粒細(xì)胞、CD4+T細(xì)胞(圖 9A-N)。根據(jù)CDK2表達(dá)的中位數(shù),將LUAD患者分為高表達(dá)組和低表達(dá)組。不同組的10個(gè)免疫細(xì)胞表達(dá)有系統(tǒng)性差異(圖 9O-X)。
圖9 CDK2免疫細(xì)胞浸潤特征。(A-N)14種免疫細(xì)胞與CDK2表達(dá)密切相關(guān),(O-X)在不同的CDK2表達(dá)組,免疫細(xì)胞的表達(dá)存在系統(tǒng)性差異。
七、免疫相關(guān)預(yù)測模型的構(gòu)建
通過TISIDB數(shù)據(jù)庫,發(fā)現(xiàn)了CDK2相關(guān)的免疫調(diào)節(jié)劑,免疫增強(qiáng)劑和免疫抑制劑(圖 10A,B)。通過P值排序,鑒定了與CDK2高度相關(guān)的13種免疫抑制劑和21種免疫增強(qiáng)劑。在cBioProtal中,探索了與34個(gè)免疫調(diào)節(jié)劑相關(guān)的49個(gè)基因。從TCGA數(shù)據(jù)庫下載臨床數(shù)據(jù)和基因表達(dá)數(shù)據(jù)。使用“perl”和“R”包從TCGA中混合了49個(gè)基因(圖 10C)。在Metascape數(shù)據(jù)庫中,49個(gè)基因中最富集的通路是免疫系統(tǒng)過程,其他功能有生物粘附、生物調(diào)節(jié)、細(xì)胞增殖(圖 10D)。49個(gè)免疫相關(guān)基因的蛋白存在相互作用(PPI,圖 10E)。GSEA分析了49個(gè)基因的功能、ES、NES、NOM p-val、FDR q-val。具有統(tǒng)計(jì)學(xué)意義的項(xiàng)為PUJANA_ATM_PCC_NETWORK和INTRACELLULAR_SIGNAL_TRANSDUCTION (圖 10F)。結(jié)合臨床資料和表達(dá)矩陣,對年齡、性別、腫瘤分期進(jìn)行單因素和多因素回歸分析。如預(yù)期的那樣,腫瘤分期是影響LUAD患者預(yù)后的獨(dú)立危險(xiǎn)因素(圖 10G)。Nomogram預(yù)后預(yù)測模型結(jié)合年齡、性別、分期、T、N、M等臨床因素從而直觀地分析LUAD的預(yù)后(圖 10H)。以臨床數(shù)據(jù)為基礎(chǔ),采用Nomogram模型對每個(gè)患者進(jìn)行評(píng)估。單因素回歸分析顯示,有36個(gè)基因與LUAD的預(yù)后相關(guān)。CDK2是LUAD的獨(dú)立預(yù)后基因(圖 10I)。對36個(gè)基因進(jìn)行多因素回歸分析,預(yù)測模型中僅包含4個(gè)基因(SIT1、SNAI3、ASB2、CDK2)。通過GEPIA數(shù)據(jù)庫,LUAD中SIT1、SNAI3、ASB2的表達(dá)較低(圖 10J-L)。為了驗(yàn)證預(yù)后模型,風(fēng)險(xiǎn)曲線顯示高風(fēng)險(xiǎn)組對肺癌患者的致命性更高(圖10M)。根據(jù)不同的風(fēng)險(xiǎn)得分,將患者分為高、低風(fēng)險(xiǎn)組(圖10N,O)。ROC曲線顯示4個(gè)感興趣基因的AUC不同,CDK2在預(yù)后模型中具有更大的預(yù)測價(jià)值(圖 10P)。
圖10 構(gòu)建免疫相關(guān)的預(yù)測模型。(A, B)CDK2的免疫增強(qiáng)劑和免疫抑制劑的熱圖。(C) 使用“perl”和“R”包對TCGA中的49個(gè)基因進(jìn)行混合。(D) 49個(gè)基因最富集的通路是免疫系統(tǒng)過程。(E)49個(gè)免疫相關(guān)基因的蛋白質(zhì)互作網(wǎng)絡(luò)。(F)GSEA 分析 49個(gè)基因的功能,ES, NES, NOM,p-val 和 FDRq-val。(G)森林圖顯示了LUAD的風(fēng)險(xiǎn)比和一致性指數(shù)。(H)Nomogram模型結(jié)合了年齡、性別、分期、T、N、M等臨床因素。 (I)36個(gè)顯著基因的危險(xiǎn)比(HR)、HR95L、HR95H、p值。(J-L) 通過GEPIA數(shù)據(jù)庫,LUAD中SIT1、SNAI3、ASB2表達(dá)較低。(M)風(fēng)險(xiǎn)曲線顯示,高危組對肺癌患者的致命性更高,(N,O)高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)圖,(P) ROC曲線顯示四個(gè)感興趣基因的不同AUC。
八、LUAD中HPA分析與預(yù)測ceRNA網(wǎng)絡(luò)構(gòu)建
免疫組化結(jié)果顯示,LUAD組織中CDK2的表達(dá)明顯高于正常肺組織(圖 11A,B)。作者從TargetScan數(shù)據(jù)庫中選擇了455個(gè)與CDK2相關(guān)的miRNA。miRWalk數(shù)據(jù)庫中發(fā)現(xiàn)10018個(gè)miRNA。作者探索了來自mirDB的76個(gè)miRNAs和來自Starbase的28個(gè)miRNAs。結(jié)合LUAD中差異表達(dá)的miRNAs, 7個(gè)miRNAs通過Venn map加入到網(wǎng)絡(luò)中(圖 11C)。這些miRNAs對LUAD患者的預(yù)后有顯著影響(圖 11D-J)。我們使用Starbase數(shù)據(jù)庫找到了可能調(diào)控7個(gè)miRNAs的lncRNA。這些編碼基因與非編碼基因通過Cytoscape軟件相互作用(圖 11L)。根據(jù)網(wǎng)絡(luò)的程度,使用CytoHubba篩選出前15的基因(6個(gè)lncRNAs: XIST、SNHG16、RP11-145M9.4、MAP3K14、MIR4720、RP11-379K17.11)(圖11K)。
圖11 HPA分析和ceRNA網(wǎng)絡(luò)。(A)正常肺組織中的免疫組化結(jié)果。(B)LUAD組織中的免疫組化結(jié)果。(C)四個(gè)數(shù)據(jù)庫的交集結(jié)果用維恩圖表示。(D-J) 7個(gè)miRNA的生存分析。(K) 6lncRNAs-7miRNAs-cCDK2被CytoHubba視為前15個(gè)基因。(L)用Cytoscape構(gòu)建ceRNA網(wǎng)絡(luò)。
九、CDK2表達(dá)的PCR結(jié)果
與BEAS-2B細(xì)胞株相比,A549細(xì)胞株CDK2表達(dá)增加,但差異無統(tǒng)計(jì)學(xué)意義。H1299細(xì)胞株與H1975細(xì)胞株差異有統(tǒng)計(jì)學(xué)意義(圖11M)。
(M) CDK2在BEAS-2B、A549 、H1299、H1975 中的表達(dá)情況。
十、耐藥相關(guān)性分析
共有192種抗腫瘤藥物被納入研究。89種抗腫瘤藥物的IC50水平與CDK2的表達(dá)有關(guān)。根據(jù)P<0.05,篩選出相關(guān)性最高的20種抗腫瘤藥物,如喜樹堿、長春堿、順鉑、阿糖胞苷、納維托樂、伏立諾他、尼羅替尼、奧拉帕尼、阿昔替尼、AZD7762、SB216763、kul -55933、PLX4720、Wee1抑制劑、PD173074、Obatoclax 甲磺酸帕珠沙星、索拉非尼,伊立替康、BMS536924、 GSK1904529A (12A-T)。
圖12 與CDK2(A-T)相關(guān)的前20位抗腫瘤藥物。
研究結(jié)論
綜上所述,我們發(fā)現(xiàn)一組包括CDK2表達(dá)在內(nèi)的4個(gè)基因在LUAD中具有重要的預(yù)后價(jià)值。CDK2的表達(dá)與癌癥的免疫反應(yīng)高度相關(guān)。作者做了一些預(yù)測,將CDK2的表達(dá)與藥物反應(yīng)和miRNA的表達(dá)聯(lián)系起來。