今天給大家分享一篇2022年2月24日發(fā)表在Genome Medicine(IF:11.117)上,結(jié)合突變和免疫治療數(shù)據(jù)構(gòu)建泛癌預后模型的文章,如果覺得純生信工作過于單薄的小伙伴可以來看一下,整合公共數(shù)據(jù)是如何發(fā)到10分+的。
A mutation-based gene set predicts survival benefit after immunotherapy across multiple cancers and reveals the immune response landscape
基于突變的基因組預測多種癌癥免疫治療后的生存獲益,并揭示免疫反應圖譜
一.文章背景
免疫檢查點抑制劑療法(ICI)徹底改變了許多癌癥的治療。然而受益于ICI治療的人群有限,在臨床上有指示作用的標志物(如TMB)并不能有效預測患者對于ICI 的治療反應。因此,有必要篩選預測標志物對患者分層,預測ICI 的治療效果,提高患者的生存效益。今天小編就和大家分享一篇基于突變數(shù)據(jù)、跨癌癥類型預測ICI治療效果的文章。
二、數(shù)據(jù)及方法
數(shù)據(jù)來源:作者收集了cBioPortal數(shù)據(jù)庫中Samstein MSK-IMPACT (n=1661)的突變和免疫治療數(shù)據(jù)作為訓練集,從8個已發(fā)表的工作中(PMID: 31792460、PMID: 29443960、PMID: 30150660、PMID: 29301960、PMID: 29033130、PMID: 26997480、PMID: 26359337、PMID: 25409260)收集數(shù)據(jù)作為驗證集。并使用TCGA中突變、拷貝數(shù)、mRNA表達數(shù)據(jù)針對預測模型鑒定的亞組進行分析。
2、PSM加權(quán)算法:為了平衡MSK-IMPACT 數(shù)據(jù)集中突變和野生型之間潛在混雜因素,在此研究中作者使用PSM加權(quán)算法處理數(shù)據(jù),先使用邏輯回歸分析計算傾向得分,令突變基因組和野生型基因組之間加權(quán)傾向得分的標準差小于10%;再使用多因素COX回歸篩選生存相關(guān)基因,使用permutation test隨機100次確定統(tǒng)計學意義。
3、基于突變基因集篩選預測基因:使用PSM分析,LASSO懲罰COX回歸分析,最后使用多因素COX回歸構(gòu)建風險評分模型。根據(jù)X-tile 3.6.1軟件確定最佳臨界值,將患者分為低風險和高風險評分組。
4、免疫分析:使用CIBERSORT評估免疫細胞浸潤水平。TIL 分數(shù)、白細胞分數(shù)和淋巴細胞分數(shù)從Thorsson、Saltz等人的研究中獲得。從 Danaher 等人的TCGA 泛癌研究中提取免疫浸潤評分。從 He 等人獲得29個經(jīng)典免疫特征,ssGSEA來量化每個樣本中29個免疫特征的富集水平。使用ABSOLUTE計算腫瘤間異質(zhì)性。
5、其他分析:CYT被定義為GZMA和PRF1表達的幾何平均值?!癕utationalPatterns” 包進行NMF分析,通過余弦相似性將突變剖面與COSMIC特征進行比較。GISTIC 2.0處理拷貝數(shù)數(shù)據(jù),使用clusterProfiler包進行富集分析,使用Kaplan-Meier方法比較生存差異,C-index表示預測準確性,Wilcoxon檢驗對兩組進行比較進行統(tǒng)計分析。
三、結(jié)果
1、基于突變鑒定用于預測免疫治療結(jié)果的的基因集及驗證
作者篩選了468個腫瘤抑制基因、癌基因以及被認為可用于靶向治療并獲得美國 FDA 授權(quán)的通路基因作為候選基因進行篩選。先使用PSM算法篩選出98個候選基因,然后使用LASSO懲罰COX回歸模型,隨機1000次篩選出現(xiàn)超過990次的基因為預后相關(guān)基因,共得到11個預后相關(guān)基因,量化每位患者的風險得分,使用X-tile軟件生成最佳臨界值。作者發(fā)現(xiàn)患者的低風險組的OS比高風險組要長(圖1B),且各亞組無論年齡、藥物類型或者癌癥類型如何,低風險組的OS都要比高風險組的要長(圖1C-E)。
2、驗證用于預測免疫治療結(jié)果的突變基因集
KM生存曲線顯示,驗證集與訓練集相同的趨勢(圖1F)。作者還比較了基于突變基因集的性能和訓練隊列中現(xiàn)有的基于突變的ICI響應特征(如UV、APOBEC和DNA損傷響應通路等),使用C-index指數(shù)進行量化,發(fā)現(xiàn)基于突變基因集的C-index指數(shù)是最大的。作者還和TP53、B2M等基因的性能作比較,發(fā)現(xiàn)基于突變基因集的性能是最好的。這篇文章中指出低風險組的ICI治療有顯著的DCB(圖1G),低風險組的患者更可能對ICI治療有反應(圖1-H),并在驗證集中取得進一步證實(圖1I和J)。
3、基于突變的基因組是免疫治療后預后的一個獨立預測因素
COX回歸分析顯示,無論是在訓練集還是驗證集基于突變的基因集與OS相關(guān),且均為獨立的預測因素(圖2A和B)。為了確定哪個因素具有最佳預測性能,使用 C-index來比較訓練和驗證隊列中基于突變的基因集與 TMB 和藥物類型之間的性能,結(jié)果表明基于突變的基因組能更準確的預測預后(圖2C),驗證集展示了同樣的效果(圖2D)。
4、基于突變的基因組、疾病分期、CTL和6-IFN-g基因特征可以結(jié)合起來預測ICI治療的臨床效益。
通過ssGSEA方法發(fā)現(xiàn),與高危組相比,低危組顯示出更高的 2-gene cytolytic得分(P = 0.071),6-gene IFN-g 得分(P < 0.05),和18-gene IFN-g 得分(P < 0.05)。將基于突變的基因集、疾病分期、CTL 和 6 基因 IFN-g 基因特征整合到 ICI 治療的預測列線圖中(圖2E),列線圖在觀察值與預測值之間顯示出良好的一致性(圖2F)。
5、高風險和低風險群體的潛在外在免疫景觀
將風險評分系統(tǒng)應用于TCGA隊列(圖3A),基因組水平的比較顯示,低風險組的白細胞、淋巴細胞和 TIL 分數(shù)高于高風險組(圖3B-D),使用其他方法評估也得到同樣的結(jié)論(圖3E-F)。根據(jù) Danaher 等人的免疫浸潤評分分析顯示,低風險組有更多的免疫細胞(圖3G-H)。使用無監(jiān)督聚類根據(jù)免疫特征評分對TCGA隊列患者進行聚類,結(jié)果顯示了兩種不同的免疫模式,即高水平和低水平的免疫浸潤(圖3I-J)。此外,在低風險組中,腫瘤部位的免疫特征評分明顯高于正常部位;相反,高危組在腫瘤部位的免疫特征評分明顯低于正常部位(圖4A),低風險組免疫活動之間的相關(guān)性高于高風險組(圖4B-C)。GSEA結(jié)果顯示,在低風險組中,有13條通路明顯富集,包括6條免疫相關(guān)通路(圖4D),相比之下,高風險組沒有富集到任何免疫相關(guān)的通路。低風險與明顯較高的CYT評分有關(guān)(圖4E),并且在高風險組中有明顯較多的纖維細胞(圖4F),低風險組在腫瘤部位顯示出豐富的免疫細胞,對ICI治療更容易響應,而高風險組的成纖維細胞可能有助于外在的免疫逃逸。此外,作者發(fā)現(xiàn)低風險組中趨化因子的表達更高(圖 4G-H),由此推斷趨化因子的富集可能會在低風險組中引發(fā)免疫反應。
6、高風險和低風險群體的潛在內(nèi)在免疫景觀
低風險組顯示出比高風險組更高的突變率和新抗原負荷,以及更高的 TCR 多樣性和 BCR 多樣性;與低風險組相比,高風險組表現(xiàn)出更高的 CNV 負荷和非整倍性,表明腫瘤非整倍性與對免疫治療的反應降低和免疫逃避標志物有關(guān),同時高風險組的瘤間異質(zhì)性高于低危組(圖 5A),高免疫原性可能會在低風險組中引起外在免疫反應。根據(jù)體細胞突變數(shù)據(jù)描繪了突變特征,并在來自 TCGA 的隊列中確定了四種不同的誘變模式(圖5B),在低風險組中發(fā)現(xiàn)這四個特征的頻率明顯高于高風險組(圖 5C)。計算了低風險和高風險人群中 10 種常見致癌通路中致癌基因的富集分數(shù)。細胞周期、Hippo、NRF2、PI3K 和 TP53 通路在低風險組中得分較高,而 MYC 和 Wnt 通路在高風險組中富集(圖 5D)。與低風險組相比,高風險組表達較少量的 MHC I 和 II 相關(guān)抗原呈遞分子導致內(nèi)在免疫逃逸,低風險組大多數(shù) MHC 基因的表達較高,這表明免疫原性更強。作者還發(fā)現(xiàn)免疫檢查點分子(如 PD-1、PD-L1 和 CTLA4)和共刺激分子在低風險組中的表達高于高風險組(圖 5E)。
7、高低風險人群的拷貝數(shù)特征
在高風險組和低風險組之間有染色體畸變的顯著差異(圖 6A)。與高風險組相比,在低風險組中觀察到特征明顯的免疫基因如 PD-L1(9p24.1)和 PD-L2(9p24.1)的局部擴增峰(圖6B-C)。Venn顯示,兩組共有692個拷貝數(shù)擴增的基因,高危組和低危組分別有310和1218個基因被特異性擴增(圖 6D)。使用Gene Ontology 中的注釋信息對這些擴增基因進行注釋,并對前10的生物學過程進行聚類,低風險組顯著富集了 2 個免疫相關(guān)的生物學過程,高危組顯著富集“成纖維細胞增殖的正調(diào)節(jié)”,但沒有任何免疫相關(guān)的生物學過程(圖 6E),這個結(jié)果與之前的結(jié)果驚人地一致。PD-L1 和 PD-L2在兩個免疫相關(guān)的生物學過程中都有注釋,表明 PD-L1 和 PD-L2 可能調(diào)節(jié)低風險組的免疫狀態(tài)(圖 6F)。來自 TCGA 的隊列中的 mRNA 表達水平分析發(fā)現(xiàn),低風險組中 PD-L1 和 PD-L2 的 mRNA 表達顯著增高(圖 6G),與 CNV 數(shù)據(jù)一致。這一發(fā)現(xiàn)表明,腫瘤中的 CNV 有助于觀察到免疫浸潤的差異。
在這篇工作中,整合了多套公共數(shù)據(jù)結(jié)合PSM、LASSO、單因素COX和多因素COX算法構(gòu)建風險評分,并在大樣本數(shù)據(jù)集中進行驗證,解析了高低風險組中的外在和內(nèi)在免疫景觀,分析高低風險組的CNV特征?;谕蛔兊臄?shù)據(jù)進行檢測時不容易受技術(shù)手段的影響,在今后的工作中使用突變數(shù)據(jù)分析為臨床轉(zhuǎn)化提供更大的便利,純生信分析也可以助力臨床轉(zhuǎn)化,感興趣的小伙伴千萬不要錯過呀!