6+純生信好文:多組學(xué)+脂質(zhì)代謝+預(yù)后模型
多組學(xué)分析可以更系統(tǒng)、更全面地了解惡性腫瘤中生物成分的潛在規(guī)律,是生信分析中經(jīng)久不衰的熱點(diǎn)。今天給大家分享一篇2022年2月11日發(fā)表在Frontiers in Cell and Developmental Biology(IF:6.684)上的文章,看看這篇文章是如何把當(dāng)下的多個(gè)研究熱點(diǎn)整合起來的吧!
一、研究背景
結(jié)直腸癌(CRC)的發(fā)病率和死亡率分別位居世界第三和第四位。 CRC的進(jìn)展與遺傳因素、年齡、慢性炎癥、吸煙和飲酒等生活方式、飲食習(xí)慣和環(huán)境因素有關(guān)。 目前,CRC患者預(yù)后的改善仍相當(dāng)有限,主要是因?yàn)橄喈?dāng)一部分CRC患者在早期往往無癥狀。 因此,尋找CRC發(fā)生、發(fā)展和侵襲的分子機(jī)制和有利的預(yù)后監(jiān)測指標(biāo)是當(dāng)前研究的熱點(diǎn)。
目前,大量研究表明,脂質(zhì)代謝異常與腫瘤的發(fā)生發(fā)展密切相關(guān)。惡性轉(zhuǎn)化和癌細(xì)胞增殖過程的加速需要更多的能量,這可能會(huì)導(dǎo)致脂質(zhì)代謝障礙,使癌細(xì)胞存活。鑒于脂質(zhì)代謝功能障礙在腫瘤的發(fā)生發(fā)展中發(fā)揮著重要作用,脂質(zhì)代謝的生物學(xué)活性一直是篩選腫瘤治療靶點(diǎn)的重點(diǎn)研究領(lǐng)域。代謝組學(xué)是系統(tǒng)生物學(xué)的一個(gè)重要分支,主要研究代謝動(dòng)態(tài)過程中代謝物的變化,以揭示生命活動(dòng)的代謝特征。代謝物檢測結(jié)果能更準(zhǔn)確、更直接地反映機(jī)體的病理生理狀態(tài)。目前,血液和尿液是主要的研究對(duì)象,通過去除不純的代謝物(如蛋白質(zhì)或糖類)來保證檢測結(jié)果的準(zhǔn)確性。代謝組學(xué)在癌癥研究中的應(yīng)用旨在提高癌癥的診斷和預(yù)后,并將其應(yīng)用于潛在的癌癥生物標(biāo)志物。
二、結(jié)果
代謝組學(xué)模式識(shí)別分析
作者總共納入了 236 名 CRC 患者的臨床特征,包括年齡、性別、組織學(xué)類型、病理分期、T 分期、N 分期和 M 分期。首先,作者進(jìn)行了 PCA 和 PLSDA 分析來研究代謝物在K-means 聚類得到的亞組(Kgroup 1 和 Kgroup 2)中的空間分布(圖 2A)。 K-M 生存分析表明,Kgroup 2 中 CRC 患者的總生存期高于 Kgroup 1(圖 2B)(p < 0.001)。圖 2C、D 顯示了 Kgroup 1 和 Kgroup 2 的 PCA 結(jié)果,表明兩個(gè)亞組之間存在顯著的個(gè)體差異。此外,為了消除組內(nèi)的隨機(jī)偏差和偏差,對(duì) Kgroup 1 和 Kgroup 2 進(jìn)行了 PLSDA,以進(jìn)一步驗(yàn)證兩個(gè)亞組之間的個(gè)體差異(圖 2E,F(xiàn))。
差異代謝物的生物學(xué)功能
接下來,作者采用 T 檢驗(yàn)區(qū)分 357 種代謝物的差異(FDR < 0.05),然后對(duì) HMDB 上的特定成分進(jìn)行鑒定。 最終確認(rèn)了 175 種不同的脂質(zhì)代謝物。 對(duì) 175 種差異脂質(zhì)代謝物的KEGG 通路富集分析顯示,差異脂質(zhì)代謝物最富含甘油磷脂代謝(圖 2G)。
6-脂質(zhì)代謝物預(yù)后標(biāo)志的構(gòu)建
接下來,作者使用單變量 Cox 回歸分析識(shí)別了 14 種與生存相關(guān)的脂質(zhì)代謝物(p < 0.05)。然后又進(jìn)行了多變量 Cox 回歸分析,以建立基于六種脂質(zhì)代謝物的預(yù)后特征 “LMS”,包括五種高風(fēng)險(xiǎn)脂質(zhì)代謝物(HR > 1)和一種低風(fēng)險(xiǎn)脂質(zhì)代謝物(HR < 1)。根據(jù)LMS 中位數(shù) (0.875) 將CRC患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,并繪制了K-M 生存曲線(圖 3A)。如圖 3B 所示,LMS 較高的 CRC 患者的總生存期低于 LMS 較低的患者。圖 3D顯示了基于預(yù)后特征的六種代謝物水平的分布和變化。隨著LMS的增加,5種高危代謝物水平升高,而低危代謝物水平呈下降趨勢。此外,作者還預(yù)測了患者 1 年、3 年和 5 年總生存期的 ROC 曲線的 AUC 分別為 0.769、0.711 和 0.723(圖 3E)。結(jié)合 LMS 和臨床特征(年齡、性別、病理分期、組織學(xué)類型、T 分期、N 分期和 M 分期),進(jìn)行單變量和多變量獨(dú)立預(yù)后分析(圖 3F,G),以檢驗(yàn) LMS 的預(yù)后可行性。通過整合預(yù)后特征和獨(dú)立預(yù)后因素(組織學(xué)類型(腺癌和粘液性腺癌)、病理分期、T 分期),作者構(gòu)建了復(fù)合列線圖(圖 3H),以單獨(dú)預(yù)測 CRC 患者的總生存期。一年、三年和五年的校準(zhǔn)曲線也驗(yàn)證了復(fù)合列線圖的良好擬合和穩(wěn)定性(圖 3I)。基于列線圖的 ROC 的一年、三年和五年 AUC 分別為 0.815、0.815 和 0.805,顯示預(yù)測患者預(yù)后的良好準(zhǔn)確性(圖 3J)。多指數(shù) ROC 曲線的一年、三年和五年 AUC(圖 3K M)驗(yàn)證了復(fù)合列線圖增強(qiáng)的預(yù)后準(zhǔn)確性。
利用WGCNA來識(shí)別GMRHGs
為了確保腫瘤特異性基因選擇,作者使用TCGA CRC患者的差異表達(dá)基因矩陣進(jìn)行WGCNA。 首先進(jìn)行層次聚類和皮爾森相關(guān)分析以構(gòu)建WGCNA網(wǎng)絡(luò)(圖4A,B)。 然后通過動(dòng)態(tài)樹切割模塊的識(shí)別和相似模塊的合并(圖4C),最終識(shí)別出8個(gè)基因模塊(MEbrown、MEturquoise、MEmidnightblue、MEyellow、MEmagenta、MEgreenyellow、MEpink、MEgrey)(圖4D),其中MEbrown 包含 342 個(gè) DEG 的模塊與甘油磷脂代謝顯著相關(guān)。MEbrown 模塊的總共 342 個(gè) DEG 被視為 GMRHG 進(jìn)行進(jìn)一步分析。
5-GMRHG預(yù)后標(biāo)志物的構(gòu)建
作者加入了GEO 數(shù)據(jù)集(GSE17536、GSE38832 和 GSE103479)和TCGA中的 877 名 CRC 患者進(jìn)行預(yù)后標(biāo)志物的構(gòu)建。對(duì) 342 個(gè) GMRHG 表達(dá)數(shù)據(jù)進(jìn)行單變量 Cox 回歸分析(圖 5A)、LASSO 回歸分析(圖 5B、C)和多變量 Cox 回歸分析(圖 5D),以構(gòu)建五個(gè) GMRHG(ACOX1、ATOH1、CPT2、PCSK5、和 TINCR) 預(yù)后特征 “GMS”。
GMS 大于或等于中位GMS (0.939) 的 CRC 患者將被分配到高風(fēng)險(xiǎn)組,而那些小于中位 GMS 的將被分配到低風(fēng)險(xiǎn)組。訓(xùn)練組(圖 6A)和測試組(圖 6E)的 K-M 生存曲線說明低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組之間的總生存率存在顯著差異。 訓(xùn)練組(圖 6B)和測試組(圖 6F)的散點(diǎn)圖表明,GMS 較高的患者的總生存期低于 GMS 較低的患者。訓(xùn)練組(圖 6C)和測試組(圖 6G)的 GMS 曲線顯示了 GMS 的分布。訓(xùn)練組(圖 6D)和測試組(圖 6H)的熱圖顯示了預(yù)后特征的五個(gè) GMRHG 的表達(dá)趨勢。隨著 GMRHG 的增加,兩個(gè)高危 GMRHG(PCSK5 和 TINCR)的表達(dá)會(huì)增加,而三個(gè)低危 GMRHG(ATOH1 和 ACOX1 和 CPT2)的表達(dá)會(huì)降低。訓(xùn)練組(圖 6I)和測試組(圖 6J)的時(shí)間依賴性 ROC 的一年、三年和五年 AUC 分別為 0.662、0.716、0.719 和 0.623、0.660、0.633。如圖 6K、L 所示,單變量和多變量獨(dú)立預(yù)后分析的結(jié)果表明,GMS 可被視為獨(dú)立的預(yù)后因素。時(shí)間依賴性 ROC 驗(yàn)證了五種 GMRHG 預(yù)后特征在預(yù)測 CRC 患者預(yù)后方面的更佳精度。
臨床相關(guān)性分析
作者用卡方檢驗(yàn)比較了基于 JLUFH CRC 患者和 TCGA CRC 患者的臨床特征(年齡、性別、組織學(xué)類型、病理分期、T 分期、N 分期、M 分期)在高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組中的分布。對(duì)于 JLUFH CRC 患者,作者發(fā)現(xiàn)晚期病理分期(III 期和 IV 期)和粘液性腺癌的 CRC 患者主要分布在高危組,具有顯著統(tǒng)計(jì)學(xué)差異(p ≤ 0.031 和 p ≤ 0.001)(圖 7A、B )。還發(fā)現(xiàn) TCGA CRC 患者具有晚期病理分期(stage and )和 N 分期(N1-2)主要分布在高危組(圖 7C、D)?;贘LUFH結(jié)直腸癌患者和TCGA結(jié)直腸癌患者的臨床特征,采用臨床相關(guān)性分析和Wilcoxon排序檢驗(yàn)進(jìn)一步探討6-脂質(zhì)代謝物水平和5-GMRHG表達(dá)在臨床特征上的組內(nèi)差異。 發(fā)現(xiàn)晚期病理階段 JLUFH CRC 患者的高危脂質(zhì)代謝物 水平較高(圖 7E,7F)。CPT2 在 65 歲以下 TCGA CRC 患者中的表達(dá)高于大于 65 歲的 CRC 患者(圖 7G)。此外,ATOH1 和 CPT2 的表達(dá)在病理分期方面存在統(tǒng)計(jì)學(xué)差異(圖 7H)。在 T 分期中,PCSK5 在 T3-4 中的表達(dá)高于 T1-2(圖 7I)。此外,隨著N分期的增加,ATOH1和CPT2的表達(dá)呈下降趨勢(圖7J)。對(duì)于 M 分期,ATOH1 在 M0 中的表達(dá)高于 M1,具有靜態(tài)差異(圖 7K)。
基于預(yù)后特征的腫瘤免疫浸潤和TME特征
作者計(jì)算了16種免疫細(xì)胞和13種免疫功能的相對(duì)豐度。箱線圖(圖 8A、B)形象地說明了 T_helper_cells、Tfh、Th1_cells、TIL、CCR的相對(duì)豐度高危組高于低危組,差異有統(tǒng)計(jì)學(xué)意義(p < 0.05)。圖 8C 顯示高風(fēng)險(xiǎn)組的免疫評(píng)分、基質(zhì)評(píng)分和估計(jì)評(píng)分高于低風(fēng)險(xiǎn)組。作者還系統(tǒng)地描述了基質(zhì)評(píng)分、免疫評(píng)分、估計(jì)評(píng)分以及高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組中腫瘤免疫細(xì)胞和免疫功能的相對(duì)豐度之間的分布關(guān)系(圖 8D)。此外,作者發(fā)現(xiàn)基質(zhì)評(píng)分、免疫評(píng)分和估計(jì)評(píng)分均與 T_helper_cells、Tfh、Th1_cells TIL、CCR的相對(duì)豐度呈統(tǒng)計(jì)學(xué)正相關(guān)(圖 8E)。高危組和低危組免疫檢查點(diǎn)表達(dá)的比較結(jié)果表明,高危組CTLA4、PDCD1、TIGIT、CD274、HAVCR2的表達(dá)高于低危組(圖8F)。 如圖 8G 所示,低風(fēng)險(xiǎn)組的 TIDE 評(píng)分低于高風(fēng)險(xiǎn)組,表明與高風(fēng)險(xiǎn)組的樣本相比,低風(fēng)險(xiǎn)組的樣本對(duì)抗 PD1 和抗 CTLA4 免疫治療的敏感性更高。并且,TIDE 評(píng)分較低的 CRC 患者的總生存期較好(p < 0.017)(圖 8H)。此外,對(duì)高危組和低危組 CRC 患者的分層生存分析結(jié)果表明,TIDE 評(píng)分較低的低危組 CRC 患者與更好的總生存率相關(guān)(圖 8I)。
體細(xì)胞突變和MSI概述
圖 9A、B 顯示了突變頻率最高的前 30 個(gè)基因,其中 TP53 在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間顯示出最顯著的統(tǒng)計(jì)學(xué)差異(圖 9C)。為了進(jìn)一步研究 TP53 突變狀態(tài)中五種 GMRHG 預(yù)后特征的預(yù)后意義,作者對(duì) TP53 野生型和 TP53 突變型 CRC 患者進(jìn)行了分層生存分析,發(fā)現(xiàn) TP53 突變 CRC 患者的總生存期高危組低于低危組,具有顯著統(tǒng)計(jì)學(xué)差異(p≤0.001)。同時(shí),TP53-野生型 CRC 患者的總生存期表現(xiàn)出與TP53-突變型 CRC 患者總生存期相似的趨勢(圖 9D)。此外,作者還研究了 MMR 系統(tǒng)與五種 GMRHG 預(yù)后特征之間的關(guān)系。如圖 9E、F 所示,MSH6 和 MSH2 分別在高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組中表現(xiàn)出最高的突變頻率。此外,MSH6-MSH2表現(xiàn)出最強(qiáng)烈的陽性共表達(dá)相關(guān)性(圖9G)。 MSH6、MSH2、PMS2和MLH1表達(dá)差異的結(jié)果表明,MLH1在低危組中的表達(dá)高于高危組(圖9H)。用斯皮爾曼相關(guān)分析進(jìn)行的線性相關(guān)也驗(yàn)證了 GMS 和 MLH1 表達(dá)之間的負(fù)相關(guān)關(guān)系 (圖 9I)。
基因集富集分析
針對(duì)高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)群體的基因表達(dá)矩陣,作者進(jìn)行了 GSEA 以分層揭示 TCGA CRC 患者的潛在生物學(xué)功能。在 HALLMARK 功能通路的 GSEA 結(jié)果中(圖 10A),高危組的基因表達(dá)主要富集在經(jīng)常研究的癌癥相關(guān)通路中,例如上皮-間質(zhì)轉(zhuǎn)化、血管生成 和 KRAS 信號(hào)傳導(dǎo),而低風(fēng)險(xiǎn)組的基因表達(dá)主要富集在代謝相關(guān)通路中,即氧化磷酸化和脂肪酸代謝。在 KEGG 功能通路的 GSEA 結(jié)果中(圖 10B),高風(fēng)險(xiǎn)組的基因主要富集在 ECM 受體相互作用、補(bǔ)體和凝血級(jí)聯(lián)和間隙連接 ,而低風(fēng)險(xiǎn)組的基因主要富集了33條KEGG功能通路,其中NES值最高的前5條通路中有4條是代謝相關(guān)途徑(脂肪酸代謝,丁酸代謝,纈氨酸亮氨酸和異亮氨酸降解和檸檬酸循環(huán)(TCA cycle) 。在 HALLMARK 和 KEGG 的分析中,低風(fēng)險(xiǎn)組的基因表達(dá)均富含脂肪酸代謝和過氧化物酶體。
三、總結(jié)
本研究從代謝組學(xué)和轉(zhuǎn)錄組學(xué)角度詳細(xì)探討了脂質(zhì)代謝在結(jié)直腸癌(CRC)預(yù)后中的作用。為促進(jìn)個(gè)體化治療和揭示結(jié)直腸癌潛在的分子生物學(xué)特征提供新的視角??偟膩碚f,這篇文章的研究內(nèi)容很全面,并且結(jié)合了當(dāng)下的科研熱點(diǎn),是一個(gè)不錯(cuò)的預(yù)后模型工作。
參考文獻(xiàn)
1. Sun, Y., Liu, B., Chen, Y., Xing, Y. and Zhang, Y. (2021) Multi-Omics Prognostic Signatures Based on Lipid Metabolism for Colorectal Cancer. Front Cell Dev Biol, 9, 811957.