前言
m6A是作為最近的熱點(diǎn)方向,已經(jīng)有了各種方向的研究。如何在眾多文章中讓讀者眼前一亮呢?或者說,對于同種數(shù)據(jù)類型的同種癌癥,怎么推陳出新,讓這個(gè)研究具有故事性?今天這篇文章可能可以給大家一些啟發(fā)。Identification of Two m6A Readers YTHDF1 and IGF2BP2 as Immune Biomarkers in Head and Neck Squamous Cell Carcinoma【Frontiers in Genetics IF:4.27】
研究m6A的常規(guī)思路,可以概述為“分型+預(yù)后”思路。m6A只有20多個(gè)基因,沒有必要進(jìn)行降維,可以直接使用二十多個(gè)m6A基因,進(jìn)行聚類,聚類將患者分為兩類后,進(jìn)行差異分析,然后找相關(guān)基因,進(jìn)行預(yù)后分析。但如果說,所有的m6A去參與聚類,聚類相關(guān)并不好的話,課題開展就遇到了瓶頸。常規(guī)思路的后面,得到模型之后,可以和免疫、免疫檢查點(diǎn)、鐵死亡等熱點(diǎn)進(jìn)行關(guān)聯(lián)。
這篇文章則巧妙的設(shè)計(jì)了一個(gè)新的思路——將m6A基因與患者的免疫得分計(jì)算相關(guān)性,得到幾個(gè)與免疫相關(guān)的m6A基因,使用這些免疫相關(guān)的m6A基因?qū)颊哌M(jìn)行聚類。這個(gè)時(shí)候,患者往往可以較好的被分為兩類。可以說這篇文章思路精巧,另辟蹊徑,將原本可能無法進(jìn)行的研究思路打通??芍^是,“山重水復(fù)疑無路,柳暗花明又一村”。 現(xiàn)在我們來正式看一下這篇文章吧。
數(shù)據(jù)和代碼
結(jié)果
一、鑒定與 HNSCC 免疫譜相關(guān)的 m6A調(diào)控子
為了探究m6A調(diào)控子的表達(dá)是否影響HNSCC免疫譜,首先,對來自TCGA的HNSCC患者進(jìn)行過濾,使用具有生存信息的499名HNSCC患者;然后應(yīng)用 ESTIMATE 工具和 CIBERSORT 算法這些患者的ESTIMATE 評分和免疫細(xì)胞浸潤;使用21個(gè)m6A修飾調(diào)控子[Table.1],計(jì)算這些調(diào)控子的表達(dá)與 ImmuneScore 的相關(guān)性[Fig.1]。
接下來,對21個(gè)m6A 調(diào)控子和ImmuneScores相關(guān)性的絕對值進(jìn)行排序。 相關(guān)性最大的兩個(gè)調(diào)控子(YTHDF1、IGF2BP2)構(gòu)建免疫相關(guān)特征。
二、基于YTHDF1和IGF2BP2對HNSCC患者進(jìn)行一致性聚類
選擇499例HNSCC患者的YTHDF1和IGF2BP2的表達(dá)數(shù)據(jù)進(jìn)行一致性聚類,患者被分為兩個(gè)不同的cluster[Fig.2a]。其中,Cluster1包含294名患者,Cluster2包含205名患者。去除106個(gè)沒有分期和等級信息的患者后,分析兩個(gè)cluster中剩余患者的臨床特征[Table.2]。
同時(shí),PCA分析證實(shí)一致性聚類效果良好[Fig.2b]。YTHDF1和IGF2BP在Cluster1表達(dá)更高[Fig.2c],而T分期和病理學(xué)等級也在cluster1中進(jìn)展更顯著。 比較腫瘤組織和正常組織中YTHDF1和 IGF2BP2 的表達(dá)水平,明顯在腫瘤組織中的表達(dá)水平較高[Fig.2d]。使用Kaplan-Meier分析cluster1和cluster2的生存情況,cluster2具有更高的生產(chǎn)率[Fig.2e]。
三、基于YTHDF1和IGF2BP2的cluster的免疫圖譜
通過GSEA分析兩個(gè)cluster之間的通路富集。確定cluster1和m6A修飾相關(guān),而cluster2與HNSCC的免疫調(diào)節(jié)密切相關(guān)[Fig3a]。接下來,為了理解cluster1和cluster2之間免疫浸潤譜的差異,分別進(jìn)行CIBERSORT、ssGSEA分析。cluster2表現(xiàn)出更活躍的抗腫瘤免疫細(xì)胞聚集[Fig.3b]。比較關(guān)鍵免疫相關(guān)基因的表達(dá),結(jié)果表明兩個(gè)cluster都參與了抗腫瘤免疫細(xì)胞失效,但cluster2的TGF-β和FAP水平更低[Fig.3c]。
四、基于YTHDF1和IGF2BP2的聚類與HNSCC相關(guān)基因的關(guān)聯(lián)
使用幾個(gè)公認(rèn)的影響HNSCC生物學(xué)行為和免疫治療反應(yīng)的基因,分別比較來自TCGA和GEO的兩套數(shù)據(jù)中兩個(gè)cluster的表達(dá)水平[Fig.4ab]。結(jié)果表明,cluster1可能與更差的生物學(xué)行為有關(guān)。
五、通過DEG分析和WGCNA識別Hub基因
使用499個(gè)患者的原始count數(shù)據(jù),計(jì)算兩個(gè)cluster之間的差異表達(dá)基因(Fig.5ab)。然后通過WGCNA將識別到的差異表達(dá)基因劃分模塊,識別和兩個(gè)cluster最相關(guān)的模塊[Fig.5c]。
六、Hub基因的功能富集分析和PPI網(wǎng)絡(luò)分析
為了理解WGCNA識別的最相關(guān)的模塊,對該模塊進(jìn)行富集分析,并構(gòu)建PPI網(wǎng)絡(luò)。功能富集分析表明,該模塊和免疫調(diào)節(jié)有關(guān),包括淋巴細(xì)胞活化、免疫反應(yīng)的陽性調(diào)節(jié)、免疫效應(yīng)器過程的調(diào)節(jié)和B細(xì)胞活化[Fig.6ab]。通過MCODE算法將整個(gè)PPI網(wǎng)絡(luò)進(jìn)一步劃分為兩個(gè)主要MCODE,其中,MCODE1與Gα(i)信號事件、GPCR配體結(jié)合相關(guān);MCODE2與第二信使分子、T細(xì)胞受體信號通路的產(chǎn)生密切相關(guān)[Fig.6c]。
七、在GEO數(shù)據(jù)庫中基于YTHDF1和IGF2BP2聚類驗(yàn)證免疫特征
為了驗(yàn)證基于基于m6A聚類的顯著性,從GEO數(shù)據(jù)庫中獲得額外數(shù)據(jù)。使用“ConsensusClusterPlus”對來自GEO的270名患者進(jìn)行一致性聚類[Fig.7a]。PCA分析證實(shí)上述聚類效能良好[Fig.7b]。其中cluster2的YTHDF1和IGF2BP2基因具有更低的表達(dá)[Fig.7c]。同時(shí),使用CIBERSORT和ssGSEA來估計(jì)腫瘤微環(huán)境的組成[Fig7.de]。總之,上述結(jié)果表明基于YTHDF1和IGF2BP2的聚類識別了不同的免疫譜。
總結(jié)
本篇文章在眾多m6A研究中,算得上是另辟蹊徑。整篇文章的亮點(diǎn)在于第一部分,后面的六個(gè)部分都建立在第一部分基于相關(guān)性找到的兩個(gè)免疫相關(guān)的m6A基因,這兩個(gè)基因可以將患者聚為較好的兩個(gè)類。后面的分析也就一通百通了。小編看了兩個(gè)基因和免疫得分的相關(guān)性,分別是-0.318和-0.285。單看起來,相關(guān)性并不高,不過依據(jù)它在兩套數(shù)據(jù)中都可以將患者較好的分開,且具有預(yù)后意義,這兩個(gè)基因還是極具魯棒性的。