預(yù)后模型的構(gòu)建思路相信各位小伙伴已經(jīng)爛熟于心了,一般是基于基因表達(dá)、甲基化或者突變等多個基因組指標(biāo)的一個或多個構(gòu)建預(yù)后模型并進(jìn)行驗證,進(jìn)而將其擴展到泛癌水平。但在今年4月15日EBioMedicine(IF=8.143)發(fā)表的這篇低級別膠質(zhì)瘤的預(yù)后模型文章卻讓人眼前一亮,作者運用多種臨床指標(biāo)與基因表達(dá)構(gòu)建低級別膠質(zhì)瘤預(yù)后模型對患者預(yù)后顯示出了良好的預(yù)測效能。多種指標(biāo)是如何整合在一起的?快來和小編一起看看吧!
APOLLO: An accurate and independently validated prediction model of lower-grade gliomas overall survival and a comparative study of model performance
APOLLO:一個準(zhǔn)確且獨立驗證的低級別膠質(zhì)瘤總生存率預(yù)測模型和模型性能的比較研究
一.研究背景:
膠質(zhì)瘤是大腦和中樞神經(jīng)系統(tǒng)最常見的惡性腫瘤,占惡性腦腫瘤的80%以上。低級別膠質(zhì)瘤(LGG)由彌漫性低度和中度膠質(zhì)瘤組成,與膠質(zhì)母細(xì)胞瘤(GBM)的患者相比,LGG患者預(yù)后更佳。然而幾乎沒有準(zhǔn)確和穩(wěn)健的低級別膠質(zhì)瘤(LGG)生存預(yù)測模型存在,已有的預(yù)測模型僅僅進(jìn)行了有限的模型驗證,因為大多數(shù)模型要么依賴于訓(xùn)練種群或在測試種群中再訓(xùn)練模型來評估模型性能,會由于過擬合而被高估。于是作者通過結(jié)合人口統(tǒng)計學(xué)、臨床信息以及具有主要效應(yīng)的基因-基因相互作用的轉(zhuǎn)錄生物標(biāo)志物來構(gòu)建LGG準(zhǔn)確且獨立驗證的預(yù)后預(yù)測模型APOLLO,作者還將其開發(fā)為一個在線工具,供研究者免費使用。
二.主要結(jié)果
1.APOLLO的開發(fā)與構(gòu)建
作者首先收集整理了TCGA-LGG、中國膠質(zhì)瘤基因組圖譜(CGGAⅠ)、CGGA2、GSE108476、GSE61374和GSE16011共6個膠質(zhì)瘤隊列的臨床及基因表達(dá)數(shù)據(jù)。作者使用了由COSMIC定義的723個泛癌驅(qū)動基因中6個隊列共享的680個基因,共1420個LGG樣本進(jìn)行后續(xù)的研究。圖1描述了作者研究的工作流程。
對于主要效應(yīng)分析及G×G互作分析使用兩個Cox模型:
Model1: h(t)=h0(t)exp(α × gene + ∑βi × covariatei)
Model2: h(t)=h0(t)exp(α1 × gene1 + α2×gene2 +
α3×gene1×gene2 + ∑βi × covariatei)
并且矯正了協(xié)變量,包括年齡,WHO分級,IDH突變和1p/19q狀態(tài)。在這一步,作者識別了與TCGA隊列總生存率相關(guān)的42個主效應(yīng)基因和307對G×G互作基因,其中28個主效應(yīng)基因和27對G×G互作基因在CGGA1隊列中被驗證為候選轉(zhuǎn)錄預(yù)測因子。接下來作者在TCGA訓(xùn)練隊列中通過正向逐步回歸對候選轉(zhuǎn)錄因子篩選以構(gòu)建最終的Cox模型,最終的模型包括5個主效應(yīng)基因和4對G×G互作基因。通過Cox模型的系數(shù)估計,圖2將APOLLO_Score和Transcriptional_Score進(jìn)行定義。
2.APOLLO的轉(zhuǎn)錄預(yù)測因子及其免疫相關(guān)性
通過KEGG富集分析發(fā)現(xiàn)基因富集到包括膠質(zhì)瘤通路在內(nèi)多條通路,GO注釋鑒定出279個生物過程通路、24個分子功能通路和20個細(xì)胞成分通路,提示潛在的生物功能。作者通過中位Transcriptional_Score將患者分為高風(fēng)險組和低風(fēng)險組,發(fā)現(xiàn)兩組間22種免疫細(xì)胞比例存在顯著差異(圖3A);Transcriptional_Score與基質(zhì)得分,免疫得分和ESTIMATE得分相關(guān)(圖3B),此外,作者還觀察到轉(zhuǎn)錄預(yù)測因子和免疫檢查點基因之間的高連通性和高相關(guān)性(圖3C)。因此,APOLLO可能在指導(dǎo)免疫治療方面有潛在作用。
3.APOLLO的預(yù)測效能及驗證
接下來作者對APOLLO進(jìn)行多種驗證。首先通過APOLLO打分中位數(shù)將TCGA訓(xùn)練集和測試集樣本分為兩組。在TCGA隊列和CGGA1隊列以及4個外部測試集中,高危組較低危組具有較差的生存,且顯示出較大的風(fēng)險比(HR)值(圖4a-f)。進(jìn)一步作者為了證實APOLLO的鑒別能力,通過五分位數(shù)將患者分為6組。中位生存期隨著APOLLO得分的分組升高而急劇降低,得分最高的組與較短的生存期和較高的死亡風(fēng)險相關(guān)(圖4g-h)。
在TCGA和CGGA1中,APOLLO相當(dāng)準(zhǔn)確地預(yù)測了36和60個月的生存率(圖5a-b),在外部測試集中也展現(xiàn)出良好的預(yù)測能力(圖5c-f). 此外,APOLLO在TCGA訓(xùn)練隊列和CGGA1內(nèi)部測試隊列以及4個外部測試隊列中均表現(xiàn)出良好的c指數(shù)(圖5i)。
以36個月生存期為重點,APOLLO與無干預(yù)且具有合理閾值概率的策略相比,APOLLO模型的凈收益(NB)高于基本模型(圖6a),這意味著APOLLO可以減少55.4%的不必要的臨床干預(yù)(圖6b)。敏感度的分析顯示,APOLLO的決策曲線也高于其他策略,且在36個月和60個月的平均NB和 NR均為最佳(圖6a-e)。在進(jìn)一步的評估APOLLO的穩(wěn)健性中,作者進(jìn)行了全方面的亞組分析。在所有的亞種群中,APOLLO均表現(xiàn)出較好的鑒別能力。
以上文章的大體內(nèi)容就介紹完啦,下面應(yīng)該是小伙伴們最關(guān)心的如何應(yīng)用作者構(gòu)建的APOLLO預(yù)測模型啦。作者將其成果開發(fā)了一個在線網(wǎng)站(http://bigdata.njmu.edu.cn/APOLLO/)供大家免費使用,且不需要任何編程功底哦。
我們打開網(wǎng)站主頁,頁面做的也相當(dāng)精美,首先映入眼簾的便是APOLLO的介紹與實例結(jié)果(圖7)。
接下來我們來學(xué)習(xí)一下如何使用呢。如圖所示,在左側(cè)我們可以輸入患者的臨床指標(biāo),如年齡、分級、IDH突變狀態(tài),1p/19q狀態(tài)以及是否需要添加轉(zhuǎn)錄組打分。
在我們選擇需要添加轉(zhuǎn)錄組打分后,點擊Edit score,就需要我們添加各個基因的log2的基因表達(dá)值。點擊OK,在Edit score旁就會實時出現(xiàn)作者在文中所計算的APOLLO打分。
通過改變基因的表達(dá)值,結(jié)果也都是實時顯示的,右側(cè)顯示了LGG患者36個月以及60個月的總生存率預(yù)測及預(yù)測曲線。ROC曲線展示了模型的預(yù)測效能,nomogram圖也進(jìn)一步的驗證解釋結(jié)果。
總的來說,作者通過整合多種臨床及基因組轉(zhuǎn)錄組指標(biāo),構(gòu)建了低級別膠質(zhì)瘤穩(wěn)健且易于實現(xiàn)的預(yù)后預(yù)測模型,結(jié)合多套數(shù)據(jù)集進(jìn)行驗證,嚴(yán)謹(jǐn)可靠。開發(fā)的網(wǎng)站非常簡介美觀,使用基本不存在難點,且可以實時展示結(jié)果。這為我們構(gòu)建預(yù)后模型的工作也提供了一定的思路,不再局限于篩基因特征,適當(dāng)?shù)募尤胍恍┡R床及多組學(xué)指標(biāo)可能會使模型的效能更好哦。小伙伴們快快學(xué)起來!