哈嘍,好久不見~你們可愛勤勞的SHZ小編又回來啦~回歸的第一天,先帶大家解讀一篇預后風險模型相關的文章,題為“The Aging-Related Prognostic Signature Reveals the Landscape of the Tumor Immune Microenvironment in Head and Neck Squamous Cell Carcinoma”,近期剛剛發(fā)表在Frontiers in Oncology雜志上(IF:6.244)。雖然簡單,但是干活滿滿!小編更是頭懸梁錐刺股,嘔心瀝血地為你們總結了預后風險模型的萬能公式——“找、篩、建、驗、挖”。
數(shù)據(jù)來源
TCGA:https://portal.gdc.cancer.gov/
MSigDB:http://www.gsea-msigdb.org/gsea/msigdb/index.jsp
IBERSORT:http://cibersort.stanford.edu/
TIMER:https://cistrome.shinyapps.io/timer/
結果解讀
1.“找”—尋找HNSCC差異表達衰老相關基因
從TCGA數(shù)據(jù)庫下載頭頸部鱗狀細胞癌(HNSCC)患者的RNA測序數(shù)據(jù)和臨床隨訪數(shù)據(jù),包括502個腫瘤樣本和44個非腫瘤樣本。從MSigDB數(shù)據(jù)庫獲得11個已知的與人類衰老相關的基因集,將這11個基因集作為預定義的衰老相關基因集。將TCGA數(shù)據(jù)庫中獲得的HNSCC患者的測序基因與與預定義的衰老相關基因集進行比較,發(fā)現(xiàn)其中7個基因集在HNSCC樣品中顯著富集,如圖S1。
對上述7個基因集進行LEA分析(leading edge analysis),共鑒定出134個核心富集基因,定義為衰老相關基因(AGs)。然后,根據(jù)腫瘤和非腫瘤樣品中所有核心富集基因的表達,共獲得41個顯著上調(diào)的AGs,并分別用三種不同的繪圖方式(火山圖、熱圖、箱式圖)可視化這41種AGs的表達模式,如圖1。
2.“篩”—篩選預后相關的衰老相關基因
通過單變量Cox回歸分析,獲得12種差異表達的AGs(DKK1,SERPINE1,ADA,HMGA2,APP,CDKN2A,MIF,NEK6,ADM,BAK1,CDK6和PRNP)與HNSCC患者的OS顯著相關,如圖2A;
通過LASSO Cox回歸分析,消除預后相關的假陽性AGs,進一步篩選了7個AGs,包括BAK1,DKK1,CDKN2A,ADA,APP,MIF和ADM,如圖2B、S2。
通過多因素Cox回歸分析評估這7種預后相關AGs對HNSCC患者OS和臨床結局的影響(p <0.05,圖2B)。最后鑒定出具有獨立預后值的BAK1、DKK1、MIF和CDKN2A等4個AGs,用于OS預測,并進一步應用于建立預后風險模型。
3.“建”—構建衰老相關基因預后風險模型
通過LASSO Cox回歸分析構建了從四種選定的AGs中提取的預后風險模型,其中BAK1,DKK1和MIF被鑒定為高風險基因,而CDKN2A被鑒定為低風險基因。風險評分公式如下:風險評分 = (0.2126) * BAK1 + (0.137) * DKK1 + (-0.0716) * CDKN2A + (0.2474)*MIF。
4.“驗”—驗證所構建預后風險模型的準確性
在訓練隊列(整個數(shù)據(jù)集,n = 502)和測試隊列(隨機選擇,n = 250)中驗證了AGs簽名的預后價值。Kaplan-Meier生存分析顯示,在訓練和測試隊列中,高風險組患者的OS比低風險組的患者短(p <0.001;圖3A-B)。訓練隊列中 AGs簽名的 ROC 曲線的 2 年、3 年和 5 年 AUC 值分別為 0.663、0.676 和 0.652(圖 3C)。測試隊列中ROC曲線的相應2年,3年和5年AUC值分別為0.660,0.684和0.709(圖3D)。這些數(shù)據(jù)共同揭示了四種選定的AGs用于HNSCC預后的風險模型的準確性。
5.“挖”—挖掘預后風險模型與其他因素的潛在關聯(lián)性
【小編有話說】
通過前面的分析,我們已經(jīng)初步構建了一個相對準確可靠的預后風險模型,但是如果想要發(fā)表高分文章,僅僅構建了一個預后風險模型,內(nèi)容略顯單薄,此時,我們就要充分發(fā)揮這個模型的潛在價值,進一步挖掘預后模型與其他因素的關聯(lián)性,包括但不限于臨床病理特征、免疫評分及免疫細胞浸潤水平、免疫檢查點和免疫檢查點阻斷反應等(此處應該吹個牛皮兒:沒有生信做不到的,只有你想不到的)。
接下來言歸正傳,我們以本文為例,帶你領略風險預后模型的“附加玩法”
5.1)風險模型與總生存期及臨床病理特征的相關性
通過Wilcoxon檢驗比較年齡、腫瘤分級、病理TNM分期、病理T分期、病理N分期、性別、治療方法等亞組間的風險評分差異,探討風險模型與HNSCC患者臨床病理特征的相關性,如圖4。結果發(fā)現(xiàn),風險評分與腫瘤分級和病理性T分期顯著相關,而與年齡,病理TNM分期,病理性N期,性別和治療方法沒有關系(圖4A)。此外,單因素Cox回歸分析顯示,HNSCC患者的年齡,病理性N期和病理性TNM分期與OS顯著相關(圖4B)。多因素Cox回歸分析顯示,年齡、病理性N期、病理性TNM分期和放療與HNSCC患者的OS有明顯相關性(圖4B)。為了提供整合年齡、病理性N分期、病理性 TNM 分期和放療的 HNSCC 預后,構建了生存預測 C 指數(shù)為 0.764 的列線圖(p < 0.001)(圖 4C)。2年、3年和5年OS列線圖模型的校準曲線顯示列線圖預測與實際觀察結果之間具有良好的一致性(圖4D)。
此外,按照年齡(<60歲和≥60歲),性別(男性和女性),腫瘤分級(I級,II級和III級),病理性TNM分期(I-II期和III-IV期),病理性T期(T1-2和T3-4), 病理性N期(N0和N1-2)和治療方式(放射治療和藥物治療)分為不同的亞組,進一步進行分層生存分析,如圖5。
結果顯示,除病理性 T1-2 亞組外(5J),在其余所有亞組中,高危組患者的OS明顯低于低危組(圖 5A-I, K–O)。這些結果表明,所鑒定的4-AGs風險模型對HNSCC的預后具有可靠的預測價值。
5.2)風險模型與免疫評分及免疫細胞浸潤水平的相關性
首先研究了免疫評分與風險評分之間的關聯(lián)。高危組的免疫評分顯著低于低危組(p <0.001)(圖6A)。隨后,通過CIBERSORT評估了高危和低危組之間22種免疫細胞的浸潤水平差異(圖6B)。結果發(fā)現(xiàn),與低危組相比,高危組患者中記憶B細胞(p <0.05),CD8+ T細胞(p <0.001),濾泡輔助T細胞(p <0.001),調(diào)節(jié)性T細胞(Tregs)(p <0.001)和活化肥大細胞(p <0.001)浸潤水平較低,而靜息狀態(tài)NK細胞(p <0.01)、M0巨噬細胞(p < 0.01)、 M2巨噬細胞(p < 0.05)、靜息狀態(tài)肥大細胞(p < 0.001) 的浸潤水平較高。然后,作者進一步探索上述九種免疫細胞類型與風險模型中所選AGs的關聯(lián)(圖6C-F)。
此外,基于TIMER數(shù)據(jù)庫對六種類型免疫細胞的風險評分和浸潤水平進行了相關性分析,以評估4-AGs風險模型對HNSCC患者腫瘤免疫微環(huán)境(TIME)的影響(圖7)。結果顯示,風險評分與B細胞(p <0.001,圖7A)、CD4 + T細胞(p <0.001,圖7B)和CD8 + T細胞(p <0.05,圖7C)浸潤水平呈顯著負相關,而風險評分與嗜中性粒細胞(p >0.05,圖7D)、巨噬細胞(p >0.05,圖7E)和髓狀樹突狀細胞(p >0.05,圖7F)的浸潤水平未發(fā)現(xiàn)顯著負相關。
為了探究AGs在TIME上的作用機制,作者進一步研究了6種免疫細胞與4種AGs之間的關系,如圖8。結果顯示,與BAK1低表達組相比,BAK1高表達組中CD8 + T細胞(p <0.05)和嗜中性粒細胞(p <0.001)的浸潤水平顯著較高,而B細胞(p <0.001)的浸潤水平較低;在6種免疫細胞中,只有B細胞與DKK1的表達水平呈負相關(p <0.001,圖8B),但對于CDKN2A,只有B細胞與CDKN2A的表達水平呈正相關(p <0.05,圖8C)。與MIF低表達組相比,MIF高表達組中B細胞,CD4 + T細胞,CD8 + T細胞,嗜中性粒細胞,巨噬細胞和髓系樹突狀細胞的浸潤水平均顯著降低(所有p<0.05,圖8D)。以上結果證明,風險模型中選擇的4個AGs(BAK1,DKK1,CDKN2A和MIF)在調(diào)節(jié)HNSCC患者TIME方面具有重要功能。
5.3)風險模型與免疫檢查點和免疫檢查點阻斷反應評分的相關性
計算CD274、CTLA4、HAVCR2、LAG3、PDCD1、PDCD1LG2、TIGIT和SIGLEC15等8個免疫檢查點基因的表達水平,探討免疫檢查點與風險評分和4個選定AGs的相關性。 結果發(fā)現(xiàn),在HNSCC高危組中,CTLA4,PDCD1和TIGIT的表達下調(diào),而PDCD1LG2表達上調(diào)(圖9A)。BAK1與CD274,LAG3和PDCD1LG2的表達呈極顯著的正相關,而與SIGLEC15的表達呈負相關(圖9B)。DKK1與PDCD1LG2的表達呈正相關,而與TIGIT的表達呈負相關(p<0.05,圖9C)。CDKN2A與PDCD1表達呈正相關(p <0.05,圖9D)。MIF與CD274,CTLA4,HAVCR2,PDCD1,PDCD1LG2和TIGIT的表達呈顯著負相關(p <0.05,圖9E)。此外,作者還評估了按風險評分和四種選定的AGs分層的高危組和低危組中免疫檢查點封鎖(ICB)反應評分的差異。結果顯示,與低風險亞組和低表達亞組相比,高風險亞組、高DKK1表達亞組和高MIF表達亞組的ICB反應評分顯著升高(p <0.001,圖9F)。
總結
作者構建了四個AGs (BAK1、DKK1、CDKN2A和MIF)的預后風險模型,并在訓練和測試數(shù)據(jù)集中進行驗證。Kaplan-Meier曲線和ROC曲線分析證實,AGs風險特征對HNSCC患者的預后具有準確的預測價值。相關分析顯示,風險評分與免疫評分、免疫細胞浸潤水平呈負相關,與免疫檢查點封鎖(ICB)反應評分呈正相關。高危組患者中,靜息狀態(tài)NK細胞、M0巨噬細胞、 M2巨噬細胞、靜息狀態(tài)肥大細胞的浸潤水平較高,而記憶B細胞,CD8+ T細胞,濾泡輔助T細胞,調(diào)節(jié)性T細胞(Tregs)和活化肥大細胞浸潤水平較低。高危組中CTLA4、PDCD1、TIGIT表達下調(diào),而PDCD1LG2表達上調(diào)。此外,在風險模型中選擇的4個AGs在HNSCC的免疫細胞浸潤和ICB反應中具有重要作用。
不是廢話的廢話
有人說預后風險模型已經(jīng)爛大街了,一點也不高大上,也發(fā)不了好文章了,但是為什么現(xiàn)在仍然可以看到很多優(yōu)秀的預后風險模型文章如雨后春筍般出現(xiàn)呢?吃不到葡萄說葡萄酸的童鞋們,您可長點心吧!過時落后的不是預后風險模型,而是老舊思維模式。小編總結預后模型5步玩轉法—“找、篩、建、驗、挖”,可以說是所有預后風險模型的經(jīng)典模式,“找、篩、建、驗”是基礎,“挖”是升級,也是一篇文章的靈魂,感興趣的小伙伴,趕快學起來吧~