預(yù)后一直是癌癥研究中的一個(gè)經(jīng)典方向,各種預(yù)后模型層出不窮,那么如何讓我們的預(yù)后文章脫穎而出呢,不妨結(jié)合單細(xì)胞試試。今天小編就和大家分享一篇前幾天剛剛發(fā)表在Frontiers in Oncology(IF:6.244)雜志上關(guān)于結(jié)腸癌預(yù)后的文章,文章將傳統(tǒng)bulk數(shù)據(jù)與單細(xì)胞數(shù)據(jù)結(jié)合,并以熱點(diǎn)的代謝為切入點(diǎn)構(gòu)建了預(yù)后模型,進(jìn)行了多角度分析,為文章增加了亮點(diǎn)。文章思路新穎,方法簡(jiǎn)潔非常值得做預(yù)后的小伙伴學(xué)習(xí)借鑒。
Multi-Omics Characterization of a Glycerolipid Metabolism-Related Gene Enrichment Score in Colon Cancer
結(jié)腸癌中甘油脂代謝相關(guān)基因富集評(píng)分的多組學(xué)特征
一.研究背景
結(jié)腸癌(COAD)是世界上第三大常見(jiàn)的惡性腫瘤,2020年占所有癌癥相關(guān)死亡的近10%。盡管目前手術(shù)技術(shù)和治療策略迅速發(fā)展,但由于轉(zhuǎn)移和術(shù)后復(fù)發(fā),晚期結(jié)腸癌的5年生存率仍低于30%。此外,結(jié)腸癌的發(fā)病和發(fā)展過(guò)程涉及多種危險(xiǎn)因素和多種基因改變,其預(yù)后因患者的異質(zhì)性而存在差異,且臨床病理特征,對(duì)治療的反應(yīng)也不同。有研究發(fā)現(xiàn)甘油脂代謝參與結(jié)腸癌的發(fā)生和發(fā)展。這篇文章就從多組學(xué)角度探討甘油脂代謝相關(guān)基因在結(jié)腸癌中的預(yù)后價(jià)值及潛在的分子機(jī)制。
二.?dāng)?shù)據(jù)及方法
1. 數(shù)據(jù)獲?。?/strong>研究涉及三個(gè)數(shù)據(jù)集。TCGA-COAD患者的臨床信息和生存數(shù)據(jù),以及基因表達(dá)、體細(xì)胞突變、拷貝數(shù)變異和甲基化測(cè)序結(jié)果。GEO中結(jié)腸癌數(shù)據(jù)集GSE39582的患者臨床信息和生存數(shù)據(jù)及RAW CEL數(shù)據(jù)文件。GEO數(shù)據(jù)庫(kù)中還獲得了GSE146771數(shù)據(jù)集中COAD患者單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集。研究也從MSigDB數(shù)據(jù)庫(kù)下載了KEGG_GLYCEROLIPID_METABOLISM基因組和50個(gè)癌癥標(biāo)志基因組。其中從KEGG_GLYCEROLIPID_METABOLISM 通路中共獲得49個(gè)甘油脂代謝相關(guān)基因。
2. 臨床數(shù)據(jù)集預(yù)處理:TCGA-COAD和GSE39582數(shù)據(jù)集預(yù)處理步驟如下。(1)無(wú)臨床資料的患者被排除。(2)生存時(shí)間為0或生存狀態(tài)未知的患者被排除。(3)將兩個(gè)數(shù)據(jù)集的基因表達(dá)矩陣中的基因ID類型同步到gene Symbol中。當(dāng)多個(gè)基因ID同步到一個(gè)gene Symbol時(shí),選擇中值表示表達(dá)水平。
3. 結(jié)腸癌中甘油脂代謝的多組學(xué)特征:將49個(gè)甘油脂代謝相關(guān)基因定位到基因表達(dá)矩陣和基因甲基化矩陣,比較腫瘤組織與正常組織中這些基因的表達(dá)水平及甲基化水平。根據(jù)腫瘤樣本的相對(duì)序列結(jié)果計(jì)算與甘油脂代謝相關(guān)基因的CNV擴(kuò)增、刪失頻率以及體細(xì)胞單核苷酸變異。
4. 單樣本基因集富集分析:采用R包GSVA中的ssGSEA分析方法,基于TCGA-COAD和GSE39582的基因表達(dá)矩陣,計(jì)算KEGG_GLYCEROLIPID_METABOLISM基因集富集評(píng)分(GLMS)。根據(jù)TCGA-COAD和GSE39582數(shù)據(jù)集的GLMS中值將樣本分為高GLMS和低GLMS組。
5. 臨床特征與GLMS的關(guān)系:通過(guò)R包CMScaller估算TCGA-COAD數(shù)據(jù)集的一致分子亞型(CMSs)。并納入TCGA-COAD數(shù)據(jù)集的年齡、性別、BMI、分期、微衛(wèi)星不穩(wěn)定性、腫瘤部位等臨床特征,結(jié)合CMS亞型評(píng)估GLMS與臨床特征的相關(guān)性。
6. 通路相關(guān)分析:基于TCGA-COAD數(shù)據(jù)集的基因表達(dá)矩陣,采用ssGSEA分析方法計(jì)算50個(gè)癌癥標(biāo)志基因集富集得分。采用Spearman相關(guān)分析,根據(jù)TCGA-COAD樣本的ssGSEA評(píng)分,量化GLMS與50個(gè)癌癥標(biāo)志基因集之間的相關(guān)性。通過(guò)基于基因表達(dá)的R包WGCNA corAndPvalue函數(shù)和hallmark ssGSEA評(píng)分計(jì)算KEGG基因組中每一個(gè)甘油脂代謝相關(guān)基因與50個(gè)癌癥標(biāo)志基因組的相關(guān)性。
7. 免疫微環(huán)境分析:用xCell評(píng)估TCGA-COAD腫瘤樣品中64種細(xì)胞類型在腫瘤微環(huán)境中的比例。比較高、低GLMS組CD274、CD276、CD40、CTLA4、HAVCR2、ICOS、IDO1、LAG3、PDCD1、TIGIT、TNFRSF18、TNFRSF4、TNFRSF9、VTCN1 14種免疫檢查點(diǎn)的表達(dá)。
8. 潛在的藥物敏感性分析:基于基因表達(dá)芯片數(shù)據(jù)和來(lái)自癌癥基因組計(jì)劃(CGP)數(shù)據(jù)庫(kù)的近700個(gè)細(xì)胞系的138種藥物反應(yīng)數(shù)據(jù)的最大半抑制濃度(IC50)的pRRophetic算法最初用于藥物反應(yīng)預(yù)測(cè),文章用其預(yù)測(cè)TCGA-COAD數(shù)據(jù)集中這些藥物的IC50值,并評(píng)價(jià)高、低GLMS組對(duì)每種藥物的敏感性差異。然后根據(jù)表達(dá)量和IC50,通過(guò)R包WGCNA corAndPvalue函數(shù)計(jì)算KEGG_GLYCORLIPID_METABOLISM基因組中每個(gè)單基因與藥物敏感性的相關(guān)性。
9. 單細(xì)胞轉(zhuǎn)錄組分析:單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集GSE146771的GLMS也采用ssGSEA方法計(jì)算。從腫瘤免疫單細(xì)胞中心(TISCH)數(shù)據(jù)庫(kù)下載該數(shù)據(jù)集對(duì)應(yīng)的細(xì)胞注釋信息。采用UMAP圖,顯示每個(gè)單個(gè)細(xì)胞的GLMS。采用Kruskal Wallis檢驗(yàn)評(píng)價(jià)GLMS在不同細(xì)胞類型間是否存在差異。最后,甘油脂代謝影響的細(xì)胞亞群被計(jì)算估計(jì)。
三.研究的主要內(nèi)容及結(jié)果
1. 結(jié)腸癌中甘油脂代謝相關(guān)基因的表觀遺傳學(xué)和基因組特征
在文章的第一部分,作者基于TCGA-COAD數(shù)據(jù)集的430個(gè)腫瘤樣本和39個(gè)正常樣本,分析了KEGG_GLYCEROLIPID_METABOLISM基因集的49個(gè)基因。文章首先比較了腫瘤組織與正常組織的表達(dá)及甲基化水平差異(圖1A)。發(fā)現(xiàn)9個(gè)表達(dá)與甲基化水平負(fù)相關(guān)的基因表明在這些基因的mRNA表達(dá)中存在甲基化抑制功能。然而,6個(gè)基因的表達(dá)水平與甲基化呈正相關(guān),提示這些基因的mRNA表達(dá)可能存在甲基化以外的調(diào)節(jié)機(jī)制。接下來(lái)作者根據(jù)癌癥樣本分析拷貝數(shù)變異和基因突變,結(jié)果發(fā)現(xiàn)AGPAT1、AKR1B1、DGKB、DGAT2和DGKH出現(xiàn)了拷貝數(shù)擴(kuò)增,而AGPAT3、ALDH2、DGKD、MBOAT1和LIPC出現(xiàn)了顯著的拷貝數(shù)缺失(圖1)。作者也發(fā)現(xiàn)共有120個(gè)(27.9%)腫瘤樣本存在甘油脂代謝相關(guān)基因突變,其中兩個(gè)基因被識(shí)別為高頻率突變,為DGKB(15%)和DGKD(14%)(圖1)。
2. 甘油脂代謝評(píng)分作為結(jié)腸癌預(yù)后指標(biāo)
在這一部分,作者對(duì)TCGA-COAD數(shù)據(jù)集中的每個(gè)樣本根據(jù)單樣本基因集富集分析(ssGSEA)算法分配了甘油脂代謝相關(guān)基因富集評(píng)分(GLMS),并根據(jù)中值的臨界值將其分為高GLMS組和低GLMS組。Kaplan-Meier分析顯示,與GLMS較低的患者相比,GLMS較高的患者總體生存期(OS)有所改善。此外,作者也對(duì)其他臨床因素,包括年齡、性別、分期、腫瘤部位、MSI狀態(tài)、CMS均進(jìn)行了單因素分析,其中只有臨床分期和GLMS具有統(tǒng)計(jì)學(xué)意義。接下來(lái)這些臨床因素與GLMS一起被納入多因素Cox回歸,結(jié)果發(fā)現(xiàn)GLMS與OS之間的相關(guān)性仍然顯著,表明GLMS是結(jié)腸癌潛在的獨(dú)立預(yù)后因素。為了進(jìn)一步驗(yàn)證GLMS預(yù)測(cè)結(jié)腸癌預(yù)后的穩(wěn)健性,作者使用另一個(gè)數(shù)據(jù)集(GSE39582)作為驗(yàn)證隊(duì)列,結(jié)果發(fā)現(xiàn)在GLMS算法相同的情況下,高GLMS組患者的OS也較好。單因素及多因素分析也觀察到類似的結(jié)果。綜合來(lái)看,這些結(jié)果表明GLMS是結(jié)腸癌的獨(dú)立預(yù)后因素(圖2)。
3. GLMS與臨床特征的關(guān)系
作者接下來(lái)進(jìn)一步分析GLMS與年齡、性別、體重指數(shù)(BMI)、美國(guó)癌癥聯(lián)合委員會(huì)(AJCC)腫瘤分期、TNM分級(jí)、微衛(wèi)星狀態(tài)、血管浸潤(rùn)狀態(tài)、腫瘤部位、和consensus molecular subtypes (CMS)的關(guān)系(圖3)。結(jié)果發(fā)現(xiàn),左結(jié)腸癌的GLMS明顯高于右結(jié)腸癌(圖3),表明GLMS具有鑒別腫瘤部位的能力。此外,研究也發(fā)現(xiàn)腫瘤CMS亞型間GLMS分布存在顯著差異(圖3),而不同年齡、性別、BMI、腫瘤分期、微衛(wèi)星不穩(wěn)定狀態(tài)的患者GLMS分布相似(圖3C)。
4. 甘油脂代謝的潛在機(jī)制
接下來(lái)作者為了探索甘油脂代謝可能參與的通路,分析了GLMS與腫瘤標(biāo)志物的相關(guān)性。結(jié)果發(fā)現(xiàn)GLMS與膽汁酸代謝、異生物代謝、過(guò)氧化物酶體等通路呈顯著正相關(guān),與干擾素γ反應(yīng)、異體排斥反應(yīng)、細(xì)胞凋亡、炎癥反應(yīng)呈負(fù)相關(guān)(圖4)。此外,作者也對(duì)參與GLMS的42個(gè)基因進(jìn)行了分析。結(jié)果發(fā)現(xiàn)AGPAT4、AKR1B1和DGKI表達(dá)上調(diào)的樣本在膽固醇穩(wěn)態(tài)、膽汁酸代謝、炎癥反應(yīng)和NOTCH信號(hào)通路中均呈陽(yáng)性表達(dá)(圖4),而AGPAT4、AKR1B1、DGKI、和MGLL與蛋白分泌、IL2-STAT5信號(hào)轉(zhuǎn)導(dǎo)等通路呈負(fù)相關(guān)(圖4)。接下來(lái),作者利用R包xCell檢測(cè)免疫微環(huán)境,評(píng)估不同免疫細(xì)胞的浸潤(rùn)比例,并進(jìn)一步比較高GLMS組和低GLMS組的免疫微環(huán)境。結(jié)果發(fā)現(xiàn)如圖4所示,在高GLMS和低GLMS樣本中,共有33個(gè)免疫細(xì)胞或基質(zhì)細(xì)胞表現(xiàn)出明顯的浸潤(rùn)差異。大多數(shù)的免疫促進(jìn)細(xì)胞,包括B細(xì)胞,巨噬細(xì)胞、活化樹(shù)突狀細(xì)胞(aDC)、經(jīng)典樹(shù)突狀細(xì)胞(cDC)和未成熟樹(shù)突狀細(xì)胞(iDC)在低GLMS組中所占比例較高,而在高GLMS組中,NKT細(xì)胞等負(fù)調(diào)控免疫反應(yīng)的細(xì)胞顯著浸潤(rùn)。此外,作者還比較了兩組之間涉及免疫檢查點(diǎn)的14個(gè)基因的表達(dá),發(fā)現(xiàn)在低GLMS組樣本中,共有12個(gè)免疫檢查點(diǎn)分子上調(diào)(圖4),這表明低GLMS患者可能存在潛在的免疫治療獲益。
5. 藥物敏感
在文章的這一部分,作者考慮到GLMS較低與預(yù)后不良相關(guān),進(jìn)一步分析了GLMS與藥物敏感性的關(guān)系。作者基于腫瘤藥物敏感性基因組學(xué)(GDSC)數(shù)據(jù)庫(kù),獲取IC50值來(lái)預(yù)測(cè)治療反應(yīng)。作者在低、高GLMS組間有顯著反應(yīng)差異的96種藥物中,特別關(guān)注目前用于結(jié)腸癌治療的藥物(圖5)。進(jìn)一步作者分析了藥物IC50與甘油脂代謝相關(guān)基因表達(dá)的相關(guān)性,共識(shí)別出AKR1B1、DGKI、AGPAT2、gam、LCLAT、DGKZ、MGLL、DGKQ、AGPAT4、DGAT1、AKR1A1、DGKD、DGKH、AGK等14個(gè)基因(圖5),提示這些基因可能在藥物反應(yīng)中起關(guān)鍵作用。
6. 甘油脂代謝紊亂的起源
在文章的最后一部分,研究引入單細(xì)胞測(cè)序數(shù)據(jù)集GSE146771,探討甘油脂代謝紊亂的起源。作者從TISCH數(shù)據(jù)庫(kù)中獲得細(xì)胞注釋,以識(shí)別細(xì)胞的亞型(圖6)。接下來(lái)根據(jù)同一ssGSEA算法分配每個(gè)細(xì)胞樣本的GLMS(圖6)。結(jié)果發(fā)現(xiàn)其在惡性腫瘤細(xì)胞和基質(zhì)細(xì)胞以及在CD4Tconv CD8Tex中得分較高,當(dāng)涉及到復(fù)雜的類別時(shí),漿細(xì)胞也是如此。進(jìn)一步的統(tǒng)計(jì)分析顯示,不同細(xì)胞類型間評(píng)分分布有顯著差異(圖6)。作者根據(jù)各細(xì)胞亞群富集得分的log2FC值分析發(fā)現(xiàn)惡性細(xì)胞和Tprolif細(xì)胞顯著富集(圖6),表明這些細(xì)胞可能是甘油脂代謝紊亂的潛在靶點(diǎn)和來(lái)源。
到這里這篇文章的主要內(nèi)容就介紹完了,文章聚焦代謝,構(gòu)建風(fēng)險(xiǎn)評(píng)分,在經(jīng)典的預(yù)后思路中添加了單細(xì)胞數(shù)據(jù)進(jìn)行分析,文章邏輯清晰,方法簡(jiǎn)潔。預(yù)后文章很多,想要出彩就一定要有亮點(diǎn),這篇文章結(jié)合代謝與單細(xì)胞,是一個(gè)不錯(cuò)的學(xué)習(xí)思路。
參考文獻(xiàn):
1. Multi-Omics Characterization of a Glycerolipid Metabolism-Related Gene Enrichment Score in Colon Cancer;