近年來,利用各種基因構(gòu)建預(yù)后模型的報(bào)道層出不窮,其中很多分析思路和內(nèi)容都值得借鑒。本篇推文選取2022年7月11日發(fā)表在Journal of Oncology(IF:4.5,2021-2022)上的報(bào)道,基于8類RNA修飾基因構(gòu)建模型,預(yù)測肺腺癌(LUAD)亞群的免疫微環(huán)境、hallmark以及預(yù)后的差異。
一 研究背景
肺癌是世界上發(fā)病率和死亡率最高的癌種。肺癌可分為兩種病理學(xué)亞型:占比85%的非小細(xì)胞肺癌(NSCLC)和15%小細(xì)胞肺癌(SCLC),而NSCLC亞型中,又以LUAD最為常見。如今,腫瘤微環(huán)境的解析為LUAD患者的治療方案帶來了變革,更多病人由傳統(tǒng)的放/化療變?yōu)榘邢蛑委熀兔庖咧委?,顯著改善了患者的預(yù)后。然而,臨床上只有少量LUAD患者對新型治療手段有響應(yīng),且腫瘤耐藥性不可避免,導(dǎo)致預(yù)后不佳。因此,進(jìn)一步解析LUAD耐藥機(jī)制和挖掘潛在靶點(diǎn)有助于提升病人的治療效果。
RNA修飾是一種重要的轉(zhuǎn)錄后調(diào)控機(jī)制,已證實(shí)與腫瘤的發(fā)生發(fā)展密切相關(guān)。如今在真核生物中已經(jīng)發(fā)現(xiàn)超過170種RNA修飾類型,其中以m6A和m5C最為常見,研究證實(shí)這些RNA修飾基因的異常與LUAD發(fā)生發(fā)展之間存在聯(lián)系。然而,絕大多數(shù)研究聚焦一種RNA修飾及相關(guān)基因,不能解析多種RNA修飾之間的聯(lián)系,因此系統(tǒng)地分析多種RNA修飾基因在LUAD中的變化情況有助于挖掘新的LUAD潛在分子機(jī)制,并針對性地設(shè)計(jì)治療靶點(diǎn)。
本研究系統(tǒng)地分析了LUAD中100個(gè)RNA修飾基因(8種修飾類型)在基因組和轉(zhuǎn)錄組層面的異常,并勾畫了不同修飾類型之間的互作情況。研究發(fā)現(xiàn)基于8種RNA修飾類型可以將LUAD病人分為兩種分子亞型,不同亞型之間在腫瘤hallmark、免疫細(xì)胞浸潤和預(yù)后等指標(biāo)上有顯著差異。此外,作者還基于RNA修飾相關(guān)基因建立了預(yù)后模型RMScore,其可作為LUAD病人的獨(dú)立預(yù)后因子。
二 結(jié)果
1. LUAD中8類RNA修飾相關(guān)基因的突變和表達(dá)變化
作者收集了8類(m6A、m5C、Nm、Ψ、m1A、m7G、A-to-I和mcm5s2U)共100個(gè)RNA修飾相關(guān)基因進(jìn)行后續(xù)分析。突變分析結(jié)果顯示,從RNA修飾類型來看,m6A相關(guān)基因的突變率最高(33.16%),其次是m5C(20.63%)、Nm(12.17%)、Ψ(6.53%)、m1A(5.64%)、A-to-I(5.47%)和m7G(3.53%);而從基因角度,Nm writer CMTR2的突變率最高(5%),隨后是m6A writer ZC3H13(4%)和m5C writer DNMT3A(4%)。此外,作者還發(fā)現(xiàn)IGF2BP2和FMR1之間存在共突變現(xiàn)象。為了探究100個(gè)基因的表達(dá)情況,作者利用TCGA和GEO數(shù)據(jù)進(jìn)行了差異分析,鑒定出約10%的基因發(fā)生了表達(dá)失調(diào),且部分基因的異常表達(dá)與其拷貝數(shù)變異相關(guān)。
2. LUAD中8類RNA修飾相關(guān)基因的預(yù)后價(jià)值和互作
為了評估100個(gè)RNA修飾基因的預(yù)后價(jià)值,作者利用uniCox回歸分析來挖掘與病人生存時(shí)間相關(guān)的基因,鑒定得到18個(gè)顯著相關(guān)的基因,且multiCox回歸分析顯示其中5個(gè)基因可以作為獨(dú)立預(yù)后因子。此外,Kaplan–Meier分析也證實(shí)了uniCox分析的結(jié)果。作為外部驗(yàn)證,作者選取了GEO數(shù)據(jù)庫種的相應(yīng)隊(duì)列進(jìn)行類似分析,結(jié)果和前文保持一致。隨后,作者分析了100個(gè)基因之間的表達(dá)相關(guān)性,結(jié)果發(fā)現(xiàn)很多基因之間存在較高水平的表達(dá)相關(guān)性(r>0.5),進(jìn)一步分析發(fā)現(xiàn)m6A和m5C修飾基因之間顯著共表達(dá)。這些結(jié)果表明不同修飾相關(guān)基因之間可能通過互作來發(fā)揮共同調(diào)控功能。
3. 不同RNA修飾模式之間的腫瘤標(biāo)志特征和微環(huán)境差異
為了探究LUAD中RNA修飾的總體類型,作者基于100個(gè)修飾基因的表達(dá)水平,利用無監(jiān)督聚類將TCGA-LUAD樣本分為兩類:Cluster A和Cluster B。兩組樣本中,100個(gè)基因的突變頻率和表達(dá)水平均有顯著差異,且Cluster A組病人的生存時(shí)間也顯著長于Cluster B組。為了解釋兩組樣本潛在的生物學(xué)差異,作者利用GSVA和ssGSEA方法比較了兩組樣本在cancer hallmark和免疫浸潤細(xì)胞兩組指標(biāo)上的差別。結(jié)果發(fā)現(xiàn)絕大多數(shù)cancer hallmarks如hypoxia、epithelial–mesenchymal transition、angiogenesis、TNFα pathway、PI3K-AKT-mTOR pathway、E2F targets、G2M checkpoint、MYC pathway以及glycolysis pathway都在Cluster B中富集,而activated B cells、memory CD4 T cells、effector memory CD8 T cells、 eosinophil cells、immatureB cells、dendritic cells和natural killer cells卻在Cluster A中浸潤程度更高。此外,ESTIMATE分析顯示Cluster A中的樣本有更高的immune score和stromal score。以上結(jié)果說明Cluster A組病人較好的預(yù)后可能與腫瘤微環(huán)境中的免疫浸潤有關(guān),而Cluster B的不良預(yù)后則可能與眾多cancer hallmarks富集相關(guān)。很多研究以及證實(shí)RNA修飾基因可以影響腫瘤免疫細(xì)胞的浸潤,為了鑒定與之相關(guān)的RNA修飾基因,作者分析了100個(gè)基因表達(dá)水平與28種免疫細(xì)胞豐度之間的相關(guān)性。結(jié)果發(fā)現(xiàn),7類RNA修飾相關(guān)基因都與免疫細(xì)胞浸潤之間呈現(xiàn)顯著聯(lián)系,除了mcm5s2U。而對于多種免疫浸潤細(xì)胞,除了WTAP、CBLL1、IGF2BP3、G3BP1和G3BP2等基因,大多數(shù)m6A、m5C、m1A、m7G和Nm調(diào)節(jié)基因均與之顯著負(fù)相關(guān)。綜上,RNA修飾相關(guān)基因通過影響cancer hallmarks和腫瘤微環(huán)境來塑造不同的修飾亞型。
4. RNA修飾score的建立
為了便于評估病人的RNA修飾亞型和預(yù)測病人的預(yù)后,作者基于100個(gè)RNA修飾基因建立了RMScore。首先,作者對Cluster A和Cluster B兩組樣本進(jìn)行差異基因分析,鑒定得到1348個(gè)差異表達(dá)基因(DEG),隨后發(fā)現(xiàn)其中229個(gè)DEGs與病人預(yù)后顯著相關(guān)。為了證實(shí)RNA修飾基因和DEG之間的聯(lián)系,作者利用公共CLIP-seq數(shù)據(jù),發(fā)現(xiàn)超過半數(shù)的DEG可以被RNA修飾基因結(jié)合,表明兩者之間的直接調(diào)控關(guān)系。隨后,作者利用multiCox回歸分析從229個(gè)DEGs提取5個(gè)基因建立RMScore模型。根據(jù)RMScore中位值將病人分為高低組,發(fā)現(xiàn)Cluster A組病人主要為RMScore-low,而Cluster B主要為RMScore-high。生存分析表明RMScore-low的病人生存時(shí)間顯著長于RMScore-high組,表明基于8類RNA修飾基因建立的RNA修飾亞型客觀存在。GSVA分析顯示絕大多數(shù)cancer hallmarks如G2M checkpoint、E2F targets、DNA repair、MYC pathway、glycolysis pathway、PI3K-AKTmTOR pathway、EMT、hypoxia和angiogenesis在RMScore-high組病人中顯著富集,與Cluster B結(jié)果類似,且免疫細(xì)胞浸潤結(jié)果也與之前結(jié)果吻合。為了更好地探究RNA修飾基因和RMScore之間的互作,作者分析了兩者以及RMScore模型基因之間的聯(lián)系,結(jié)果發(fā)現(xiàn)m6A、Nm和m7G基因與RMScore顯著正相關(guān),而m5C和m1A相關(guān)基因則與RMScore顯著負(fù)相關(guān)。
5. RNA修飾score可作為獨(dú)立預(yù)后因子
前文主要是針對TCGA-LUAD數(shù)據(jù)集分析得到的結(jié)果,為了進(jìn)一步驗(yàn)證RMScore的臨床價(jià)值,作者又選取了兩個(gè)相關(guān)數(shù)據(jù)集作為外部驗(yàn)證。結(jié)果發(fā)現(xiàn)在兩組數(shù)據(jù)中,RMScore-low均和病人的較長生存時(shí)間相關(guān),與前文結(jié)果一致。且ROC分析顯示RMScore模型的預(yù)測結(jié)果具有較高準(zhǔn)確度。
三 小結(jié)
本篇研究中,作者選取當(dāng)下的研究熱點(diǎn)之一-RNA修飾相關(guān)基因作為研究對象,參考已有研究報(bào)道的流程(生信人公眾號前期亦有總結(jié):“三人行必有我?guī)煟簃6A regulators整合生信分析又又又來了!”),最終建立了具有預(yù)后價(jià)值的RMScore這樣一個(gè)模型,并從cancer hallmarks和免疫細(xì)胞浸潤等角度解析了不同RNA修飾亞型之間差異的潛在分子機(jī)制,還基于表達(dá)相關(guān)性推測了不同類型RNA修飾之間的互作。整個(gè)內(nèi)容容易上手,對初學(xué)者友好,然而創(chuàng)新性較低,被認(rèn)可的程度也就不高了。