大家好~ 小編今天和大家分享的是最新發(fā)表在AGING雜志上的一篇文章,作者基于細(xì)胞周期相關(guān)基因來(lái)構(gòu)建胃癌患者預(yù)后模型,為胃癌患者的診療及預(yù)后效果評(píng)估提供了新參考,雖然簡(jiǎn)單,但借鑒意義很強(qiáng),難道你們不想學(xué)嗎?ok 進(jìn)入主題~
哺乳動(dòng)物的細(xì)胞周期具高度的組織結(jié)構(gòu)性,其精準(zhǔn)調(diào)控對(duì)于遺傳物質(zhì)的復(fù)制和細(xì)胞分化具重要作用。細(xì)胞周期的調(diào)控機(jī)制包括生長(zhǎng)調(diào)節(jié)和遺傳完整性。癌癥表現(xiàn)為細(xì)胞周期活性的異常,這可能是由于下游信號(hào)通路中的基因突變或編碼細(xì)胞周期蛋白的基因發(fā)生變異而導(dǎo)致的。一些細(xì)胞周期調(diào)控因子的變異能夠?qū)е挛赴╣astric cancer, GC)的發(fā)生。研究發(fā)現(xiàn),細(xì)胞周期調(diào)控因子能夠作為胃癌患者的預(yù)后標(biāo)志物,具重要的臨床價(jià)值。
胃癌是全球最常見(jiàn)的5種癌癥類(lèi)型之一,具較高的發(fā)病率和死亡率。盡管采取手術(shù)和輔助療法等,但患者的預(yù)后效果仍并不理想,5年存活率低于25%。目前,預(yù)后預(yù)測(cè)主要依賴(lài)于組織病理學(xué)診斷和腫瘤分期。然而,很多患者盡管臨床病理特征相似,但預(yù)后情況卻存在很大差異。
雖然已經(jīng)花費(fèi)了大量的努力來(lái)開(kāi)發(fā)用于胃癌患者預(yù)后預(yù)測(cè)的最佳工具,但目前還未達(dá)成共識(shí)。在目前已發(fā)表的大部分文章中,通常使用臨床基本特征(例如:腫瘤大小、淋巴結(jié)數(shù)目和淋巴血管侵犯等)和單分子生物標(biāo)志物(例如:CD44、PPAR γ、IL-13Rα2、HDAC6)來(lái)構(gòu)建預(yù)后模型。但僅僅使用單基因生物標(biāo)志物來(lái)進(jìn)行患者預(yù)后預(yù)測(cè)是遠(yuǎn)遠(yuǎn)不夠的。隨著測(cè)序技術(shù)的不斷發(fā)展,預(yù)后相關(guān)的多標(biāo)志物整合對(duì)于胃癌患者的預(yù)后預(yù)測(cè)具重要的潛在應(yīng)用價(jià)值。
本研究中,基于TCGA-STAD數(shù)據(jù)集,作者首先鑒定在癌和癌旁正常組織之間差異表達(dá)的細(xì)胞周期相關(guān)基因。然后,使用單因素cox和LASSO分析進(jìn)一步篩選和胃癌患者預(yù)后顯著相關(guān)的基因,并基于這些基因構(gòu)建預(yù)后模型。同時(shí),從GEO數(shù)據(jù)庫(kù)下載GSE84437數(shù)據(jù)集作為驗(yàn)證集,對(duì)模型進(jìn)行驗(yàn)證。
1 材料與方法
1.1 基因表達(dá)譜數(shù)據(jù)的獲取
從TCGA數(shù)據(jù)庫(kù)下載胃癌患者基因表達(dá)譜數(shù)據(jù)TCGA-STAD,共獲得癌癥樣本375例,正常組織樣本32例。細(xì)胞周期相關(guān)基因列表從KEGG數(shù)據(jù)庫(kù)獲取,共獲得125個(gè)細(xì)胞周期相關(guān)基因。從GEO數(shù)據(jù)庫(kù)下載GSE84437數(shù)據(jù)集作為驗(yàn)證集,用于預(yù)后模型的驗(yàn)證。
1.2 差異表達(dá)的細(xì)胞周期相關(guān)基因的鑒定
差異分析使用R package limma。以FDR < 0.05且logFC > 0.5作為差異基因的篩選標(biāo)準(zhǔn)。
1.3 預(yù)后模型的構(gòu)建
使用單因素cox分析篩選與胃癌患者預(yù)后顯著相關(guān)的差異表達(dá)的細(xì)胞周期相關(guān)基因。使用Wald檢驗(yàn)計(jì)算每個(gè)基因的HR值和p-value,以p-value < 0.05作為篩選條件。使用R package glmnet進(jìn)行LASSO回歸分析,進(jìn)一步篩選與患者預(yù)后相關(guān)更顯著的基因?;贚ASSO分析篩選出的基因,進(jìn)行多因素cox回歸分析構(gòu)建預(yù)后模型,獲得風(fēng)險(xiǎn)評(píng)分計(jì)算公式。將基因表達(dá)量帶入公式,對(duì)患者進(jìn)行打分,根據(jù)評(píng)分的中位數(shù),將患者分為高、低風(fēng)險(xiǎn)組。接下來(lái),作者通過(guò)KM曲線(xiàn)和ROC曲線(xiàn)進(jìn)一步評(píng)估模型的準(zhǔn)確性,并在驗(yàn)證集中進(jìn)行驗(yàn)證。
1.4 列線(xiàn)圖模型的構(gòu)建
列線(xiàn)圖模型的構(gòu)建使用R package rms,納入的因素包括:患者的生存信息、年齡、T分期、N分期和風(fēng)險(xiǎn)評(píng)分。使用C-index和AUC值來(lái)評(píng)估模型的敏感性和特異性。
1.5 基于免疫組化的基因表達(dá)水平評(píng)估
該部分研究,作者共獲取250個(gè)腫瘤組織樣本和144個(gè)正常組織樣本,均來(lái)自我國(guó)胃癌患者(N = 250)?;赥CGA數(shù)據(jù)集的分析結(jié)果,發(fā)現(xiàn)CDC6和MCM3基因的表達(dá)水平與胃癌患者的預(yù)后顯著相關(guān)。因此,作者選擇這兩個(gè)基因進(jìn)行免疫組化實(shí)驗(yàn)來(lái)進(jìn)一步驗(yàn)證基因的表達(dá)水平。
1.6 GSEA富集分析
基于TCGA-STAD隊(duì)列中高、低風(fēng)險(xiǎn)組間的差異表達(dá)基因,使用GSEA算法鑒定差異基因的富集通路,以p < 0.05且FDR < 0.25作為篩選條件。
1.7 統(tǒng)計(jì)學(xué)分析
全部的統(tǒng)計(jì)學(xué)分析均在R v4.0.4中進(jìn)行。使用χ2檢驗(yàn)評(píng)估風(fēng)險(xiǎn)評(píng)分與臨床特征之間的相關(guān)性。使用KM曲線(xiàn)和log-rank檢驗(yàn)來(lái)評(píng)估高、低風(fēng)險(xiǎn)組間患者的生存差異。單因素和多因素cox用于計(jì)算風(fēng)險(xiǎn)評(píng)分和患者生存狀態(tài)的相關(guān)性。AUC值用于評(píng)估模型預(yù)測(cè)的準(zhǔn)確性。
2 結(jié)果
2.1 基于細(xì)胞周期相關(guān)基因的預(yù)后模型的構(gòu)建及驗(yàn)證
基于TCGA數(shù)據(jù)庫(kù)334個(gè)胃癌患者(OS > 30d)、55個(gè)細(xì)胞周期基因的表達(dá)矩陣構(gòu)建預(yù)后模型。單因素cox回歸分析初步篩選出7個(gè)與胃癌患者預(yù)后顯著相關(guān)的基因,分別為:GADD45B、TFDP1、CDC6、CDC25A、CDC7和SMC1A。LASSO回歸分析結(jié)果沒(méi)有進(jìn)一步篩選掉基因,因此這7個(gè)基因被納入到預(yù)后模型的構(gòu)建。多因素cox分析得出風(fēng)險(xiǎn)評(píng)分公式為:0.0090 × GADD45B表達(dá)量 - 0.0116 × TFDP1表達(dá)量 + 0.0053 × CDC6表達(dá)量 - 0.0177 × CDC25A表達(dá)量 - 0.0127 × CDC7表達(dá)量 - 0.0157 × SMC1A表達(dá)量 - 0.0018 × MCM3表達(dá)量?;谏鲜鲲L(fēng)險(xiǎn)評(píng)分公式,給每一個(gè)患者進(jìn)行打分,將患者分為高、低風(fēng)險(xiǎn)組。
預(yù)后模型的驗(yàn)證使用GEO數(shù)據(jù)集GSE84437,同樣僅納入OS > 30d的患者,共431例。根據(jù)訓(xùn)練集得出的風(fēng)險(xiǎn)評(píng)分公式,將患者劃分為高、低風(fēng)險(xiǎn)組。接下來(lái),作者基于KM算法繪制高、低風(fēng)險(xiǎn)組患者的生存曲線(xiàn)。從圖1中可以看出,訓(xùn)練集和驗(yàn)證集中高、低風(fēng)險(xiǎn)組間患者的生存均存在顯著差異。
2.2 預(yù)后模型和臨床指標(biāo)的預(yù)后風(fēng)險(xiǎn)值
納入的臨床指標(biāo)包括:年齡、性別、T分期和N分期,TCGA和GEO隊(duì)列均為上述4個(gè)指標(biāo),評(píng)估患者臨床病理特征與其預(yù)后情況的相關(guān)性。通過(guò)單因素和多因素cox分析結(jié)果,作者發(fā)現(xiàn)患者年齡、T分期和N分期與其預(yù)后情況顯著相關(guān)。此外,分析結(jié)果表明,所構(gòu)建的預(yù)后模型(風(fēng)險(xiǎn)評(píng)分計(jì)算公式)可作為生存狀態(tài)的獨(dú)立預(yù)后因素。
接下來(lái),作者通過(guò)ROC曲線(xiàn)評(píng)估模型的特異性和敏感性(圖2)。訓(xùn)練集和驗(yàn)證集ROC曲線(xiàn)下面積-AUC值分別為:0.656和0.629,說(shuō)明模型具中等水平的特異性和敏感度。
2.3 列線(xiàn)圖模型的構(gòu)建及驗(yàn)證
作者納入年齡、T分期、N分期和風(fēng)險(xiǎn)評(píng)分共4個(gè)因素來(lái)構(gòu)建列線(xiàn)圖模型。從圖3中可以看出,該模型對(duì)胃癌患者1年生存率的預(yù)測(cè)具較好的效果。臨床模型(包括年齡、T分期、N分期)、預(yù)后模型和列線(xiàn)圖模型的一致性指數(shù)(consistency indices,C-indices)分別為0.636、0.622和0.677。臨床模型的C-index顯著低于列線(xiàn)圖模型(p < 0.001)。將臨床模型和預(yù)后模型進(jìn)行合并,1-、2-、3-年生存率的AUC值分別為:0.708、0.727和0.657。因此,作者認(rèn)為,列線(xiàn)圖模型對(duì)于胃癌患者生存預(yù)后預(yù)測(cè)能力要優(yōu)于臨床模型。
2.4 蛋白水平的免疫組化驗(yàn)證
通過(guò)免疫組化實(shí)驗(yàn)獲得234名中國(guó)胃癌患者的CDC6和MCM3基因的表達(dá)水平。作者發(fā)現(xiàn),這兩個(gè)基因在腫瘤組織中的表達(dá)水平顯著高于正常組織(p < 0.01)。在全部的患者中,其中有232名患者的生存時(shí)間大于30天,我們僅將這些患者的生存數(shù)據(jù)納入到單因素和多因素cox分析中。分析結(jié)果表明,TNM分期與胃癌患者的預(yù)后顯著相關(guān)(表1)。此外,CDC6基因可作為T(mén)1-3N1-2M0分期患者的獨(dú)立預(yù)后因素,且在ACJJ的第7版本中沒(méi)有出現(xiàn)腫瘤血管血栓(圖4)。
2.5 GSEA富集分析
基于TCGA-STAD隊(duì)列差異基因的GSEA富集分析結(jié)果表明,細(xì)胞周期通路顯著富集在低風(fēng)險(xiǎn)組(p < 0.001且FDR < 0.001)。
3 全文結(jié)論
作者基于TCGA和GEO數(shù)據(jù)集構(gòu)建了7個(gè)細(xì)胞周期相關(guān)基因的預(yù)后模型。該模型能夠促進(jìn)胃癌患者的個(gè)體化診斷和治療,并進(jìn)一步地提高患者的預(yù)后。