導(dǎo)讀:
今天給大家分享的文獻(xiàn)是2022 年 5 月發(fā)表于《EBioMedicine》(IF:8.143)上的一篇文獻(xiàn)。這篇文獻(xiàn)介紹了一種基于個(gè)體樣本中基因表達(dá)水平排序的個(gè)體化通路活性計(jì)算 (IPAM) 的新方法。利用 IPAM,研究人員對(duì)來自 TCGA 中的 33 種癌癥的 10528 個(gè)腫瘤/正常樣本計(jì)算了KEGG 數(shù)據(jù)庫(kù)的 318 條通路的通路活性,以識(shí)別不同癌癥類型之間的特征性失調(diào)通路。
個(gè)體化通路活性算法識(shí)別泛癌分析中的致癌通路
算法開發(fā)流程
1. 數(shù)據(jù)收集
2. 算法原理
該研究共納入 TCGA中的33種癌癥類型隊(duì)列中的 10528 個(gè)腫瘤/正常樣本。首先對(duì)于給定的樣本,將所有基因的表達(dá)值從小到大排序,排序值作為基因的表達(dá)水平。為減少基因表達(dá)的微小變化對(duì)整個(gè)通路活性水平的影響,突出變化大的基因?qū)Ρ磉_(dá)水平的影響,研究人員將相同十位的基因等級(jí)視為同一水平,分配給相同的分?jǐn)?shù)。然后通過將每個(gè)通路中所有基因的基因表達(dá)水平相加并除以該特定通路的基因數(shù)量來計(jì)算途徑活性,以解釋不同通路中的基因數(shù)量效應(yīng)。最后獲得了318 條 KEGG 通路的通路活性用于后續(xù)分析(圖1)。
結(jié)果
1. IPAM 在癌癥分類中的性能
為評(píng)估 IPAM 的性能,研究人員將其與其他算法和工具進(jìn)行比較。圖2a結(jié)果顯示,在所有通路活性算法中,IPAM 在幾乎所有癌癥類型中都具有最高的分類性能。為進(jìn)一步驗(yàn)證 IPAM 的穩(wěn)定性,研究人員利用IPAM對(duì)來自GEO 數(shù)據(jù)庫(kù)中的獨(dú)立癌癥數(shù)據(jù)集進(jìn)行分類,IPAM 表現(xiàn)出比其他五種通路活性算法(iPAS 、Pathifier、PLAGE、ssGSEA 和 IndividPath)更好的性能(圖2b)。此外,在血小板 (TEP) 數(shù)據(jù)集的分析中,IPAM 在癌癥早期診斷中表現(xiàn)出的潛力顯著優(yōu)于除 Pathifier 之外的其他方法(圖2c)。綜上,IPAM在多種癌癥數(shù)據(jù)的癌癥分類中具有顯著優(yōu)勢(shì),在癌癥的早期診斷中也具有很高的應(yīng)用潛力。
2. 通路失調(diào)的泛癌鑒定
研究人員在TCGA的20 個(gè)不同癌癥隊(duì)列中對(duì) 318 條 KEGG 通路進(jìn)行差異分析,以識(shí)別不同癌癥類型之間的特征失調(diào)通路。圖 2d結(jié)果顯示,在所有癌癥類型中,肺鱗狀細(xì)胞癌(LUSC)、膽管癌(CHOL) 和 腎透明細(xì)胞癌(KIRC) 的失調(diào)通路數(shù)量最多,而 胰腺癌(PAAD)、宮頸鱗癌和腺癌(CESC)和子宮內(nèi)膜癌(UCEC)的最少。在318條 KEGG 通路中,酪氨酸代謝通路在大多數(shù)癌癥類型中都變化顯著,并在除 CESC、PAAD 和前列腺癌(PRAD )之外的 17 種癌癥類型中都顯著失調(diào)(圖 2e、f)。為確定不同癌癥之間的特征失調(diào)通路,研究人員基于 318 條 KEGG 通路的變化程度進(jìn)行聚類分析。圖2g中的聚類結(jié)果顯示出很強(qiáng)的組織特異性,具有相同組織學(xué)起源的癌癥類型表現(xiàn)出相似的通路失調(diào)模式。
3. 基于通路活性的生存分析
具有不同通路失調(diào)模式的癌癥類型可能在生存結(jié)果方面存在差異。因此研究人員對(duì)每種途徑進(jìn)行生存分析,鑒定出多種癌癥類型中與生存相關(guān)的通路。圖 3a結(jié)果顯示,在所有癌癥類型中,腦低級(jí)別膠質(zhì)瘤(LGG)、腎透明細(xì)胞癌(KIRC)和葡萄膜黑色素瘤(UVM)中與患者生存相關(guān)的通路最多,直腸癌(READ)、甲狀腺癌(THCA)和子宮肉瘤(UCS)中最少。DNA復(fù)制、細(xì)胞周期、鈣信號(hào)通路以及脂肪細(xì)胞中脂肪分解的調(diào)節(jié)等通路與多種類型癌癥患者的預(yù)后顯著相關(guān)(圖3b)。圖 3c結(jié)果顯示,ECM-受體相互作用、粘著斑、癌癥中的microRNAs和糖胺聚糖生物合成等通路是對(duì)癌癥患者生存最不利的通路;乙醛酸和二羧酸鹽代謝、過氧化物酶體、丁酸代謝和脂肪酸降解等通路則是對(duì)癌癥者生存最有利的通路。為進(jìn)一步確定不同癌癥之間的生存特征,研究人員基于 318 條 KEGG 通路的風(fēng)險(xiǎn)比 (HR) 進(jìn)行聚類分析。圖 3d結(jié)果顯示,一些癌癥類型在聚類分析中緊密聚集,如多形成性膠質(zhì)細(xì)胞瘤(GBM)和急性髓細(xì)胞樣白血?。↙AML)、胃癌(STAD)和 LUSC等,說明這些類型癌癥的患者生存情況具有相似的模式。為檢驗(yàn) IPAM 對(duì)患者預(yù)后的預(yù)測(cè)能力,研究人員對(duì) 25 種癌癥類型進(jìn)行單變量和多變量 Cox 回歸分析,結(jié)果顯示該算法可以作為預(yù)測(cè)癌癥患者生存的有用工具(圖3e-f)??偠灾?,上述結(jié)果表明IPAM 能夠表征個(gè)體患者的通路失調(diào),可作為癌癥分類和生存預(yù)測(cè)的有用工具。
4. 不同 KEGG 類別中的泛癌通路失調(diào)
KEGG 通路可分為 6 大類,分別是細(xì)胞過程、環(huán)境信息處理、遺傳信息處理、人類疾病、新陳代謝和生物系統(tǒng)。圖 4a結(jié)果顯示,在細(xì)胞過程這一類別中,只有細(xì)胞周期和 p53 信號(hào)通路在大多數(shù)癌癥類型中顯著上調(diào);在環(huán)境信息處理中,大多數(shù)信號(hào)轉(zhuǎn)導(dǎo)通路在大多數(shù)癌癥類型中呈下調(diào)趨勢(shì);在遺傳信息處理的類別中,大多數(shù)通路在大多數(shù)癌癥類型中都被上調(diào);在參與代謝的途徑中,大多數(shù)這些代謝通路在多種癌癥類型中被下調(diào);在生物系統(tǒng)這一類別中,大多數(shù)通路在大多數(shù)癌癥類型中都被下調(diào)。
為確定不同 KEGG類別之間通路失調(diào)的模式,研究人員進(jìn)一步對(duì)每個(gè) KEGG 類別的失調(diào)通路進(jìn)行層次聚類,圖 4b結(jié)果顯示包括肺癌(LUAD 和 LUSC)、結(jié)直腸癌(COAD 和 READ)和子宮癌(CESC 和 UCEC)在內(nèi)的大多數(shù)癌癥亞型構(gòu)成了代謝類別聚類分析中的主要組別,表明這些癌癥亞型具有類似的代謝失調(diào)模式。
5. 代謝途徑在癌癥途徑失調(diào)中起主導(dǎo)作用
通過對(duì)每種癌癥類型的 6 個(gè)主要 KEGG 類別中顯著失調(diào)的通路數(shù)量進(jìn)行統(tǒng)計(jì),研究人員發(fā)現(xiàn)所有癌癥中失調(diào)的通路屬于代謝類別的數(shù)量最多,其次是生物系統(tǒng)類別,而細(xì)胞過程類別中的通路失調(diào)數(shù)量最少(圖5a)。與其他類別的途徑相比,代謝途徑在大多數(shù)癌癥類型中失調(diào)的概率更大,并且在每個(gè)癌癥數(shù)據(jù)中的樣本之間的異質(zhì)性差異也最大,說明了代謝途徑的重要作用(圖 5b-c)。于是研究人員利用 11 種癌癥類型中的 85 種代謝通路的通路活性作為腫瘤分類模型,圖 5d結(jié)果顯示,基于 85 種代謝途徑的癌癥分類模型與基于所有 KEGG 途徑的預(yù)測(cè)效率一樣好,體現(xiàn)了代謝途徑在途徑失調(diào)中的主導(dǎo)作用。研究人員又將 85 條單獨(dú)的代謝途徑細(xì)分為 8 個(gè)主要代謝類別,分析發(fā)現(xiàn)氨基酸、碳水化合物和脂質(zhì)的代謝在泛癌中廣泛失調(diào),且與多種類型癌癥患者預(yù)后顯著相關(guān)(圖 5e-g)
6. 支鏈氨基酸代謝影響腎癌的進(jìn)展和預(yù)后
為進(jìn)一步研究通路失調(diào)的驅(qū)動(dòng)因素并闡明癌癥的病理機(jī)制,研究人員對(duì)特定癌癥類型中通路失調(diào)的個(gè)別通路進(jìn)行了系統(tǒng)分析。氨基酸代謝類別的聚類分析結(jié)果顯示,纈氨酸、亮氨酸和異亮氨酸生物合成途徑在包括腎嫌色細(xì)胞癌(KICH)、腎透明細(xì)胞癌(KIRC)和腎乳頭狀細(xì)胞癌(KIRP)在內(nèi)的腎癌中顯著上調(diào)(圖 5e)。纈氨酸、亮氨酸和異亮氨酸是支鏈氨基酸 (BCAA),在調(diào)節(jié)能量穩(wěn)態(tài)和營(yíng)養(yǎng)代謝中發(fā)揮關(guān)鍵作用。圖 6a生存分析顯示,高 BCAA 水平與 KIRC 和 KIRP 的不良預(yù)后顯著相關(guān)。且大多數(shù)腎癌患者都出現(xiàn)各種BCAA代謝基因的體細(xì)胞拷貝數(shù)變異(CNV)丟失(圖6b)。BCAA 表達(dá)水平和 1627 個(gè)轉(zhuǎn)錄因子 (TFs) 表達(dá)水平之間的相關(guān)性分析顯示,轉(zhuǎn)錄因子PPRA與 BCAA的相關(guān)性最顯著(圖 6c)。圖6d中的BCAA 代謝基因的轉(zhuǎn)錄因子基序富集分析結(jié)果顯示,PPRA結(jié)合基序在48個(gè)BCAA分解代謝基因的啟動(dòng)子中富集??偟膩碚f,這些結(jié)果表明 PPARA 的低表達(dá)可能通過下調(diào) BCAA 分解代謝基因引起B(yǎng)CAA積累,導(dǎo)致腎癌預(yù)后不良。為驗(yàn)證這一推論,研究人員對(duì)野生型小鼠和 PPARA 敲除小鼠進(jìn)行差異表達(dá)分析,結(jié)果顯示大多數(shù) BCAA 分解代謝基因在 PPARA 敲除小鼠中被下調(diào),且這些基因富集與細(xì)胞周期相關(guān)通路(圖6e-f)。
總結(jié)
文章利用TCGA中的泛癌數(shù)據(jù)開發(fā)了一種基于個(gè)體樣本中基因表達(dá)水平排名的個(gè)體化通路活性計(jì)算 (IPAM) 的新方法。IPAM 精確量化了泛癌分析中每個(gè)通路的活性水平,表現(xiàn)出了優(yōu)越的癌癥分類和患者預(yù)后預(yù)測(cè)性能?;谠撍惴?,研究人員證實(shí)了代謝通路在癌癥通路失調(diào)中的主導(dǎo)作用,并確定了特定通路失調(diào)的驅(qū)動(dòng)因素。
參考文獻(xiàn)
Ke X, Wu H, Chen YX, Guo Y, Yao S, Guo MR, Duan YY, Wang NN, Shi W, Wang C, Dong SS, Kang H, Dai Z, Yang TL. Individualized pathway activity algorithm identifies oncogenic pathways in pan-cancer analysis. EBioMedicine. 2022 May;79:104014. doi: 10.1016/j.ebiom.2022.104014. Epub 2022 Apr 26. PMID: 35487057.