DLEU2L/TAOK1軸作為肝癌預(yù)后標(biāo)志物的綜合分析
這篇文章發(fā)表在期刊: Molecular Therapy-nucleic Acids,該期刊文章在2021影響因子: 8.886比去年增長了1.854。在中科院大類: 醫(yī)學(xué) 2區(qū)。中科院小類: 2區(qū) 醫(yī)學(xué):研究與實(shí)驗(yàn)。筆者認(rèn)為該篇文章為ceRNA相關(guān)的純生信分析文章,邏輯思維和作圖質(zhì)量高,值得我們學(xué)習(xí)。
發(fā)現(xiàn)問題:
越來越多的證據(jù)強(qiáng)調(diào)了競爭性內(nèi)源性RNA(ceRNA)調(diào)控網(wǎng)絡(luò)在各種人類癌癥中的關(guān)鍵作用。然而,肝細(xì)胞癌中ceRNA網(wǎng)絡(luò)的復(fù)雜性和行為特征仍不清楚。
背景知識(shí):
肝細(xì)胞癌(HCC)是危害人類健康的最致命的惡性腫瘤之一。越來越多的證據(jù)強(qiáng)調(diào)了競爭性內(nèi)源性RNA(ceRNA)調(diào)控網(wǎng)絡(luò)在各種人類癌癥中的關(guān)鍵作用。然而,肝細(xì)胞癌中ceRNA網(wǎng)絡(luò)的復(fù)雜性和行為特征仍不清楚。
結(jié)果:
作者在這里先給讀者提供一張流程圖(Figure 1),使本文的思路清晰明了。首先,通過對(duì)371例肝癌樣本中PTEN高表達(dá)和低表達(dá)兩組(PTENhigh 和 PTENlow)進(jìn)行差異表達(dá)分析,再利用差異表達(dá)RNA構(gòu)建了肝癌相關(guān)的lncRNA-miRNA-mRNA三重調(diào)控網(wǎng)絡(luò)。功能富集分析評(píng)估了該網(wǎng)絡(luò)在肝癌中的功能作用和潛在機(jī)制。然后,通過對(duì)三重調(diào)控網(wǎng)絡(luò)的RNA進(jìn)行表達(dá)分析、生存分析和核質(zhì)定位分析,確定了一個(gè)關(guān)鍵的ceRNA網(wǎng)絡(luò)。此外,作者還對(duì)這多個(gè)預(yù)測(cè)基因與PTEN進(jìn)行了相關(guān)性分析,結(jié)果表明DLEU2L/TAOK1軸在肝癌中起著重要作用。最后進(jìn)行Cox回歸分析,得出TAOK1在肝癌中的診斷和預(yù)后價(jià)值。利用基因本體論(GO)和京都基因與基因組百科全書(KEGG)分析TAOK1在肝癌中的可能功能(見附圖),并通過甲基化分析和免疫浸潤分析進(jìn)一步研究TAOK1在肝癌中的潛在生物學(xué)功能。
Figure 1. Flowchart of construction and analysis of ceRNA
作者為了探討PTEN在肝癌中的可能作用,使用人類蛋白質(zhì)圖譜(Human Protein Atlas,HPA)數(shù)據(jù)庫,發(fā)現(xiàn)了PTEN在正常肝組織中高表達(dá),而在肝癌組織中低表達(dá)(Figures 2A)。HPA的免疫組化(IHC)染色也證實(shí)了PTEN表達(dá)有相似的調(diào)節(jié)(Figure 2B)。鑒于PTEN在腫瘤樣本中的異常低表達(dá),作者隨后研究了PTEN在肝癌患者中的表達(dá)的臨床意義。根據(jù)Kaplan-Meier生存曲線,如Figure 2C所示,作者的數(shù)據(jù)表明PTEN的低表達(dá)與HCC隊(duì)列患者的總體生存率(OS)低呈顯著相關(guān)。此外,為了了解PTEN在肝癌中異常低表達(dá)的可能機(jī)制,作者分析了PTEN的基因組和拷貝數(shù)。OncoPrint圖顯示了TCGA HCC數(shù)據(jù)集中PTEN基因的缺失(圖2D)。超過三分之一的肝癌樣本含有PTEN缺失,而且,PTEN缺失的肝細(xì)胞癌組織的mRNA表達(dá)低于二倍體PTEN的肝癌組織(Figure 2E)。肝癌組織中PTEN拷貝數(shù)與mRNA表達(dá)呈正相關(guān)(Figure 2F)。綜上所述,這些數(shù)據(jù)表明PTEN在HCC中的表達(dá)下調(diào),PTEN拷貝數(shù)的缺失可能是肝癌患者PTEN表達(dá)下調(diào)的主要機(jī)制之一。
Figure 2. The tumor suppressor role of PTEN in human hepatocellular carcinoma (HCC)
根據(jù)以上分析,與PTEN相關(guān)的ceRNA網(wǎng)絡(luò)可以作為預(yù)測(cè)肝癌患者預(yù)后的潛在模型。另外,作者還必須知道PTENhigh 和 PTENlow在癌組織和癌旁組織的表達(dá)水平是相反的意義何在。作者首先利用TCGA數(shù)據(jù)庫,以p<0.05和|log fold changeFC| >0.5為lncRNA閾值,p<0.05和|logFC|>0.3為miRNA閾值,p<0.05和|logFC|>0.7/0.5為mRNA閾值,鑒定出PTENhigh 和 PTENlow在肝癌和癌旁正常組織中的DElncRNAs、DEmiRNAs和DEmRNAs。在肝癌樣本PTENhigh 和 PTENlow 組中,共篩選出860個(gè)DElncRNAs(137個(gè)上調(diào)和723個(gè)下調(diào))、54個(gè)DEmiRNAs(21個(gè)上調(diào)和33個(gè)下調(diào))和1,871個(gè)DEmRNAs(195個(gè)上調(diào)和1676個(gè)下調(diào))。此外,在HCC和正常肝組織中共檢測(cè)到3371個(gè)DElncRNAs(3041個(gè)上調(diào)和330個(gè)下調(diào)),420個(gè)DEmiRNAs(102個(gè)上調(diào)和318個(gè)下調(diào))和8294個(gè)DEmRNAs(7059個(gè)上調(diào)和1235個(gè)下調(diào))。作者用火山圖直觀地顯示DElncRNAs、DEmiRNAs和DEmRNAs。(Figures 3A–3C),作者還利用熱圖顯示了在PTENhigh 和 PTENlow的肝癌組織中以及在肝癌和正常組織中的重要的可變區(qū)基因(Figures 3D–3F)。
Figure 3. Volcano plots and heatmap plots of DElncRNAs, DEmiRNAs, and DEmRNAs between the expression of PTENhigh and PTENlow in HCC samples
為了建立肝癌組織中的lncRNA-miRNA-mRNA三重調(diào)控網(wǎng)絡(luò),作者在PTENhigh 和 PTENlow組以及HCC和正常肝組織組中進(jìn)行了聯(lián)合分析。首先,作者將DElncRNAs放入TarBase數(shù)據(jù)庫中,以確定針對(duì)lncRNAs的潛在miRNAs。在與54個(gè)DEmiRNAs相交后,從預(yù)測(cè)的miRNAs中選擇了4個(gè)。然后,作者使用miRDB和TargetScan的數(shù)據(jù)庫,參照4個(gè)DEmiRNAs來識(shí)別下游的靶mRNA。此外,作者尋找兩個(gè)數(shù)據(jù)庫共有的候選mRNA,這么做的目的是提高預(yù)測(cè)的準(zhǔn)確性。結(jié)果表明,在8294個(gè)DEmRNA中鑒定出373個(gè)。最后,利用Cytoscape軟件,把5個(gè)lncRNA(4個(gè)上調(diào)和1個(gè)下調(diào))、4個(gè)miRNAs(1個(gè)上調(diào)和3個(gè)下調(diào))和372個(gè)mRNAs(326個(gè)上調(diào)和46個(gè)下調(diào))做成了肝癌相關(guān)的lncRNA-miRNAmRNA三重調(diào)控網(wǎng)絡(luò)(Figure 4A). 作者又利用Cytoscape插件Cell Hubba確定中樞三重調(diào)控網(wǎng)絡(luò)。結(jié)果表明,共鑒定出3個(gè)lncRNA(DLEU2L、FAM99A和ARRDC1-AS1),4個(gè)miRNAs(miR-99a5p、miR-100-5p、miR-9-5p和miR-125b-5p)和6個(gè)mRNA(TAOK1、HS3ST3B1、RHOQ、AGO2、BAZ2A和NR6A1) (Figure 4B)。 作者通過Metascape的功能富集分析(包括GO和KEGG)進(jìn)一步探索與三重調(diào)控網(wǎng)絡(luò)相關(guān)的潛在功能。(Figure 4C).
Figure 4. Construction and functional enrichment analysis of the lnRNA-miRNA-mRNA triple regulatory network
為了建立一個(gè)在HCC中具有重要預(yù)后價(jià)值的重要ceRNA,作者首先分析了PTENhigh 和 PTENlow的HCC樣本以及HCC和鄰近正常肝組織中三重調(diào)控網(wǎng)絡(luò)中RNA的表達(dá)水平。作者的結(jié)果顯示一共有一個(gè)下調(diào)的(DLEU2L)和兩個(gè)未分化的(ARRDC1AS1和FAM99A)lncRNA,一個(gè)上調(diào)的(miR-9-5p)和三個(gè)下調(diào)的(miR-99a-5p,miR-100-5p和miR-125b5p)miRNAs,三個(gè)下調(diào)的(TAOK1,HS3ST3B1和AGO2)和三個(gè)未分化的(RHOQ,BAZQ) (Figure 5A) 作者還發(fā)現(xiàn)了兩個(gè)上調(diào)的(DLEU2L和ARRDC1-AS1)和一個(gè)下調(diào)的(FAM99A)lncRNA,一個(gè)上調(diào)的(miR-9-5p)和三個(gè)下調(diào)的(miR-99a5p、miR-100-5p和miR-125b-5p)miRNAs,以及五個(gè)上調(diào)的(TAOK1、RHOQ、AGO2、BAZ2A和NR6A1)mRNAs(Figure 5B)。然后,為了確定這些RNA是否與HCC預(yù)后相關(guān),作者使用Kaplan-Meier分析和log-rank檢驗(yàn)對(duì)HCC患者進(jìn)行OS分析。總之,發(fā)現(xiàn)1個(gè)DElncRNA(DLEU2L)、2個(gè)DEmiRNAs(miR-99a-5p和miR-100-5p)和3個(gè)DEmRNAs(TAOK1、HS3ST3B1和RHOQ)與預(yù)后有關(guān)(p<0.05)(Figure 6)??紤]到lncRNAs的細(xì)胞定位決定了潛在的機(jī)制,作者通過lncLocator分析了這三個(gè)DElncRNAs的亞細(xì)胞定位。如Figure 7A所示,DLEU2L主要分布在細(xì)胞質(zhì)中,而另外兩個(gè)LncRNAs(FAM99A和ARRDC1-AS1)主要分布在胞質(zhì)溶膠中。這些數(shù)據(jù)表明,DLEU2L可能通過海綿miR-99a-5p/miR-100-5p作為ceRNA促進(jìn)TAOK1的表達(dá)(Figure 7B) 。TarBase和TargetScan預(yù)測(cè)DLEU2L和TAOK130UTR中的目標(biāo)位點(diǎn)分別與miR-99a-5p和miR-100-5p (Figure 7C) 相關(guān)。此外,表達(dá)相關(guān)性分析表明,DLEU2L的表達(dá)與TAOK1的表達(dá)呈正相關(guān)(Figure 7D) 。因此,ceRNA網(wǎng)絡(luò)中的DLEU2L/TAOK1軸被選作下一步分析的潛在預(yù)測(cè)模型。
Figure 5. The distribution of 13 hub-RNA expression patterns from the triple regulatory network in TCGA HCC dataset
Figure 6. Overall survival analysis for the RNAs in the hub triple regulatory network
Figure 7. Construction and correlation analysis of the ceRNA network
為了確定DLEU2L和TAOK1的表達(dá)水平是否受臨床特征的影響,作者探討了DLEU2L和TAOK1的表達(dá)與臨床因素的相關(guān)性。作者進(jìn)行了單變量和多變量Cox回歸分析,以確定OS相關(guān)特征。在DLEU2L和TAOK1的單因素Cox回歸模型中,TCGA隊(duì)列中肝癌患者的某些預(yù)后因素(TNM分期、腫瘤直徑、淋巴結(jié)轉(zhuǎn)移和遠(yuǎn)處轉(zhuǎn)移)與OS密切相關(guān)。DLEU2L(風(fēng)險(xiǎn)比[HR]=1.572,p=0.011)和TAOK1(HR=1.537,p=0.016)過表達(dá)均與較差的預(yù)后顯著相關(guān)。然而,對(duì)DLEU2L的多因素Cox回歸分析顯示,DLEU2L的高表達(dá)與預(yù)后不良無關(guān)(HR=1.369,p=0.078)。因此,TAOK1可能成為肝癌患者的獨(dú)立預(yù)后因子。
為了更好地理解DLEU2L/TAOK1軸在肝癌中的作用,作者接下來詳細(xì)分析了TAOK1。首先,作者使用在線工具Cancer Cell Line Encyclopedia (CCLE) 并發(fā)現(xiàn)TAOK1在肝癌細(xì)胞系中高表達(dá)。此外,作者還對(duì)GEO數(shù)據(jù)庫中的GSE41804肝癌隊(duì)列中的20對(duì)肝癌樣本進(jìn)行了TAOK1的差異分析,以進(jìn)一步驗(yàn)證TAOK1的表達(dá)。結(jié)果表明,TAOK1在肝癌組織中的表達(dá)明顯高于配對(duì)的非腫瘤性肝組織,這與作者從TCGA數(shù)據(jù)中得到的結(jié)果是一致的(Figures 5A and 6)。
作者為了進(jìn)一步闡明TAOK1在肝癌組織中的異常上調(diào)機(jī)制,還用多種方法探討TAOK1的表達(dá)水平與其甲基化狀態(tài)的相關(guān)性。首先,對(duì)肝癌TAOK1high 和 TAOK1low組三種DNA甲基轉(zhuǎn)移酶(DNMT1、DNMT3a和Dnmt3b)進(jìn)行差異表達(dá)分析,結(jié)果表明TAOK1high組DNMT1、DNMT3a和Dnmt3b的表達(dá)明顯高于TAOK1low組(Figure 8A)。其次, UALCAN分析表明,DNMT1在正常肝組織中的甲基化水平高于在肝癌組織中的甲基化水平(p = 0.101, Figure 8B)。并且DiseaseMeth 2.0版分析表明,與肝癌組織相比,癌旁正常組織中TAOK1的甲基化水平顯著升高(p < 0.0001; Figure 8C) 。此外,作者在TAOK1的DNA序列中發(fā)現(xiàn)了兩個(gè)甲基化位點(diǎn)(cg16008158和cg2570978),它們與其表達(dá)水平呈負(fù)相關(guān)(Figure 8D)
Figure 8. Methylation analysis of TAOK1
在一些腫瘤中,腫瘤浸潤性淋巴細(xì)胞(TIL)是前哨淋巴結(jié)(SLN)狀態(tài)和生存期的獨(dú)立預(yù)測(cè)因子。作者接下來使用TIMER研究肝癌組織中TAOK1表達(dá)與免疫浸潤水平的關(guān)系(也是熱點(diǎn)之一),首先,“SCNA”模塊分析顯示,肝癌中幾種免疫細(xì)胞浸潤水平似乎與TAOK1基因拷貝數(shù)改變有關(guān),包括B細(xì)胞、CD4+T細(xì)胞、巨噬細(xì)胞和樹突狀細(xì)胞(DC)(Figure 9A) ?!癎ene”模塊分析顯示,TAOK1的表達(dá)與腫瘤純度無顯著相關(guān)性,但與肝癌組織中CD4+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞和樹突狀細(xì)胞的浸潤水平呈顯著正相關(guān)(Figure 9B)。最后,作者進(jìn)一步評(píng)估了免疫浸潤對(duì)肝癌患者臨床預(yù)后的影響。結(jié)果表明,生存期小于24個(gè)月的肝癌患者,CD4+細(xì)胞、巨噬細(xì)胞和中性粒細(xì)胞水平高與預(yù)后不良有關(guān)(Figure 9C)。提示DLEU2L/TAOK1軸可能通過調(diào)節(jié)腫瘤浸潤性免疫細(xì)胞水平而影響HCC和臨床預(yù)后。
Figure 9. Correlation analysis of TAOK1 expression and immune infifiltration in HCC
本文小結(jié):
作者建立了一個(gè)與肝癌預(yù)后相關(guān)的ceRNA(DLEU2L-hsa-miR-100-5p/hsa-miR-99a-5p-TAOK1)過表達(dá)網(wǎng)絡(luò),更好地了解了lncRNA-miRNA-mRNA之間的相關(guān)性。此外,作者還發(fā)現(xiàn)基于ceRNA的DLEU2L/TAOK1軸可能是參與HCC的一個(gè)新的重要預(yù)后因子,該預(yù)后模型有助于探討HCC的發(fā)病機(jī)制。