代謝重編程是腫瘤細(xì)胞的主要特征。由腫瘤微環(huán)境惡化驅(qū)動(dòng)的葡萄糖、脂質(zhì)和氨基酸代謝重編程與腫瘤的發(fā)生發(fā)展存在密切聯(lián)系,近年來(lái)得到了越來(lái)越廣泛的關(guān)注。今天小編為大家解析的這篇文章就是以肺腺癌(lung adenocarcinoma, LUAD)轉(zhuǎn)移相關(guān)的代謝重編程為側(cè)重點(diǎn),基于生信信息學(xué)方法對(duì)公共數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行挖掘,進(jìn)一步揭示其潛在的細(xì)胞間的變化和可能的致病機(jī)理。這篇文章于今年3月發(fā)表于Communications Biology(IF = 6.268)。
一、摘要
本研究的主要目的是探究與肺腺癌(lung adenocarcinoma, LUAD)轉(zhuǎn)移相關(guān)的代謝重編程,揭示其潛在的細(xì)胞間的變化。基于TCGA數(shù)據(jù)庫(kù)中394例LUAD患者的基因表達(dá)譜數(shù)據(jù),作者鑒定出11個(gè)與轉(zhuǎn)移相關(guān)的代謝基因,這些基因涉及在糖酵解和脂質(zhì)代謝途徑中。并且,研究通過(guò)無(wú)監(jiān)督聚類(lèi)算法定義了3個(gè)代謝重編程表型:MP-I、MP-II、MP-III。在TCGA-LUAD隊(duì)列和6個(gè)GEO表達(dá)譜共計(jì)1235個(gè)樣本中,MP-III型樣本的糖解酶水平最高、脂質(zhì)代謝水平最低,并表現(xiàn)出較高的轉(zhuǎn)移能力和較低的生存率。分析結(jié)果表明,TP53和KEAP1基因的突變以及SETD2和PBRM1的缺失可能是導(dǎo)致MP-III型患者代謝重編程的主要因素。LUAD樣本單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)進(jìn)一步驗(yàn)證從正常到MP-II、MP-III,再到MP-I的代謝軌跡。細(xì)胞間通訊分析結(jié)果發(fā)現(xiàn),在ANGPTL通路中MP-III型細(xì)胞群與內(nèi)皮細(xì)胞和成纖維細(xì)胞具有獨(dú)特的相互作用,而在VEGF通路中其與內(nèi)皮細(xì)胞的相互作用更強(qiáng)。鑒于此,研究認(rèn)為,糖酵解-脂質(zhì)失衡模式能夠?qū)е屡c轉(zhuǎn)移相關(guān)的代謝重編程表型。該研究為進(jìn)一步了解致癌驅(qū)動(dòng)因子和腫瘤微環(huán)境之間的相互作用提供參考,對(duì)于LUAD轉(zhuǎn)移的治療提供策略。
二、材料與方法
1. 數(shù)據(jù)來(lái)源
本研究中,作者從TCGA、GEO和CPTAC數(shù)據(jù)庫(kù)共獲取10個(gè)LUAD隊(duì)列。兩個(gè)轉(zhuǎn)移性LUAD數(shù)據(jù)集(TCGA-LUAD和GSE11969)的患者類(lèi)型包括遠(yuǎn)端轉(zhuǎn)移、淋巴結(jié)轉(zhuǎn)移和非轉(zhuǎn)移性。其中,TCGA-LUAD隊(duì)列共包括394例LUAD患者樣本(25例遠(yuǎn)端轉(zhuǎn)移、160例淋巴結(jié)轉(zhuǎn)移以及209例非轉(zhuǎn)移性樣本)。此外,對(duì)于TCGA-LUAD和GSE11969這兩個(gè)數(shù)據(jù)集,作者分別下載了390和385個(gè)突變和拷貝數(shù)變異(CNV)數(shù)據(jù)。GSE11969數(shù)據(jù)集共包括18個(gè)遠(yuǎn)端轉(zhuǎn)移、15個(gè)淋巴結(jié)轉(zhuǎn)移和35個(gè)非轉(zhuǎn)移性LUAD樣本的mRNA表達(dá)譜數(shù)據(jù)。用于生存分析的5個(gè)LUAD表達(dá)譜,納入的標(biāo)準(zhǔn)為:手術(shù)切除后未接受輔助治療的I期患者樣本數(shù)要超過(guò)50例。
此外,作者選擇了2個(gè)LUAD單細(xì)胞表達(dá)譜數(shù)據(jù):GSE131907和GSE123902。在GSE131907數(shù)據(jù)集中,作者從11位tLung患者、10位腦轉(zhuǎn)移患者和11個(gè)正常肺組織中共提取了208506個(gè)細(xì)胞。在GSE123902數(shù)據(jù)集中,作者從7位tLung患者的原發(fā)性組織中提取了18511個(gè)細(xì)胞。
2. 數(shù)據(jù)預(yù)處理
TCGA-LUAD數(shù)據(jù)集,測(cè)序平臺(tái)為Illumina HiSeq 2000 platform,fpkm表達(dá)矩陣經(jīng)log2(x+1)轉(zhuǎn)換;對(duì)于單細(xì)胞表達(dá)譜(scRNA-seq)數(shù)據(jù),測(cè)序平臺(tái)為Illumina HiSeq 2500。將基因的Ensembl ID轉(zhuǎn)換成symbol。芯片數(shù)據(jù)GSE31210、GSE50081和GSE68465,測(cè)序平臺(tái)為Affymetrix;GSE42127數(shù)據(jù)集測(cè)序平臺(tái)為Illumina、GSE13213測(cè)序平臺(tái)為Agilent。體細(xì)胞突變數(shù)據(jù)從Illumina Genome Analyzer DNA Sequencing GAIIx平臺(tái)獲取,包含17821個(gè)非同義突變??截悢?shù)變異(CNV)數(shù)據(jù)使用GISTIC算法進(jìn)行處理。
3. 差異分析、富集分析
差異基因的鑒定使用student’s t-test,基于超幾何分布模型對(duì)差異基因進(jìn)行富集分析,數(shù)據(jù)集來(lái)源于KEGG數(shù)據(jù)庫(kù)(https://www.genome.jp/kegg/pathway.html)。
4. 代謝重編程表型的鑒定
首先,作者基于代謝相關(guān)基因的表達(dá)相關(guān)性使用層次聚類(lèi)的方法將患者分成不同的簇(或組)。在聚類(lèi)之前,去除掉表達(dá)量均為0的樣本或細(xì)胞,并對(duì)表達(dá)矩陣進(jìn)行歸一化處理。接下來(lái),作者通過(guò)公式計(jì)算MP-score以評(píng)估不同簇的患者之間糖酵解和脂代謝基因之間的表達(dá)差異。計(jì)算公式如下:
5. 相關(guān)性及生存分析
使用Wilcoxon秩和檢驗(yàn)來(lái)評(píng)估不同簇患者之間缺氧評(píng)分、干性評(píng)分、增殖評(píng)分、免疫評(píng)分和腫瘤突變負(fù)荷(TMB)的差異?;蜷g的表達(dá)相似性、突變情況、拷貝數(shù)變異(CNV)和蛋白表達(dá)情況使用Pearson相關(guān)系數(shù)進(jìn)行評(píng)估。生存時(shí)間被定義為從最初的手術(shù)切除到死亡或最近一次隨訪的時(shí)間。使用Kaplan–Meier法繪制生存曲線(xiàn)。使用單因素cox模型分析患者的生存狀態(tài)與臨床特性之間的相關(guān)性。
6. 單細(xì)胞轉(zhuǎn)錄組分析
基于前20個(gè)主成分,使用R package Seurat中的RunPCA和JackStraw函數(shù)來(lái)對(duì)上皮細(xì)胞進(jìn)行無(wú)監(jiān)督聚類(lèi)。使用RunUMAP函數(shù)對(duì)聚類(lèi)結(jié)果進(jìn)行可視化。使用Featureplot函數(shù)對(duì)每個(gè)細(xì)胞中mRNA的平均表達(dá)水平進(jìn)行可視化。使用SingleR對(duì)單細(xì)胞類(lèi)型進(jìn)行注釋。使用R package CellChat分析細(xì)胞間通訊。配體-受體互作及其相關(guān)的信號(hào)通路從CellChat數(shù)據(jù)庫(kù)(https://www.cellchat.org)下載。該方法是根據(jù)兩個(gè)細(xì)胞群間的基因表達(dá)、信號(hào)因子和細(xì)胞百分比來(lái)推斷配體-受體間的潛在相關(guān)作用強(qiáng)度。
三、結(jié)果
3.1 鑒定LUAD轉(zhuǎn)移相關(guān)的代謝重編程表型
首先,基于TCGA數(shù)據(jù)庫(kù)中的表達(dá)譜數(shù)據(jù),使用Student’s t-test方法進(jìn)行差異分析(篩選標(biāo)準(zhǔn)為:FDR < 0.05),在轉(zhuǎn)移和非轉(zhuǎn)移性LUAD樣本間共鑒定出431個(gè)差異基因,其中,顯著下調(diào)表達(dá)基因151個(gè),顯著上調(diào)表達(dá)基因280個(gè)。分析結(jié)果發(fā)現(xiàn),上調(diào)表達(dá)基因顯著富集到HIF-1信號(hào)通路,該通路是糖酵解途徑中的重要通路。先前的研究發(fā)現(xiàn),該通路能夠通過(guò)激活糖酵解基因的轉(zhuǎn)錄來(lái)增強(qiáng)糖酵解作用,在癌癥的發(fā)生發(fā)展過(guò)程中起關(guān)鍵作用。相比之下,下調(diào)表達(dá)基因顯著富集到脂代謝相關(guān)的生物途徑,包括甘油磷脂代謝(Glycerophospholipid metabolism)和醚脂代謝(Ether lipid metabolism)等。由此作者推測(cè),糖代謝和脂代謝可能在誘導(dǎo)LUAD轉(zhuǎn)移過(guò)程中扮演不同的角色(圖1 a-c)。
因此,作者將顯著富集到糖酵解/糖異生(Glycolysis/Gluconeogenesis)途徑的8個(gè)下調(diào)基因(ALDOA, ENO1, GAPDH, GPI, LDHA, PGAM1, PGM2, TPI1)以及顯著富集到甘油磷脂代謝(Glycerophospholipid metabolism)和醚脂代謝(Ether lipid metabolism)這兩個(gè)脂代謝通路的3個(gè)上調(diào)基因(PLPP1, GPD1L, PLD3)提取出來(lái),進(jìn)行更進(jìn)一步的研究。
首先,作者基于上述11個(gè)基因在全部LUAD患者樣本中的表達(dá)模式進(jìn)行無(wú)監(jiān)督聚類(lèi)。分析結(jié)果將全部LUAD患者劃分成3個(gè)簇(圖1 d),由于這些基因的表達(dá)模式與糖、脂代謝途徑顯著相關(guān),因此作者將這些簇定義為代謝重編程表型(metabolic reprogramming phenotypes, MPs)。接下來(lái),作者計(jì)算了每個(gè)簇的MP得分,并根據(jù)得分的由低到高將簇分別命名為:MP-I、MP-II、MP-III。通過(guò)構(gòu)建混淆矩陣,作者發(fā)現(xiàn),MP-I型樣本的患者類(lèi)型主要為轉(zhuǎn)移性,MP-II型樣本的患者類(lèi)型主要為淋巴結(jié)轉(zhuǎn)移性,而MP-III型樣本的患者類(lèi)型主要為遠(yuǎn)端轉(zhuǎn)移性(圖1 f)。此外,生存分析結(jié)果表明,MP-III患者的生存率顯著低于MP-I和MP-II患者(圖1 g)。
3.2 不同代謝表型的分子特性和臨床性狀差異
分析結(jié)果表明,MP-III型患者處于stage IV和stage III的比例顯著高于MP-I和MP-II。此外研究發(fā)現(xiàn),從MP-I ~ III,患者的缺氧評(píng)分、干性評(píng)分和增殖評(píng)分逐漸增加。MP-II型患者的免疫評(píng)分最高,而MP-III型患者的免疫評(píng)分最低,兩者之間的免疫評(píng)分存在顯著差異(p < 0.0001),見(jiàn)圖2。
3.3 LUAD代謝表型的驗(yàn)證
上述結(jié)果表明,MP-III型大多為未發(fā)生任何轉(zhuǎn)移的早期患者。由此推斷,這些患者可能會(huì)有較高的轉(zhuǎn)移風(fēng)險(xiǎn),進(jìn)而導(dǎo)致較差的預(yù)后。因此,作者首先基于11個(gè)代謝基因的表達(dá)譜數(shù)據(jù),對(duì)來(lái)自5個(gè)公共數(shù)據(jù)集的stage I患者進(jìn)行層次聚類(lèi)。分析結(jié)果發(fā)現(xiàn),stage I患者也可聚類(lèi)為3種表型(圖3 a-e)。生存分析結(jié)果表明,在GSE31210、GSE50081、GSE13213、GSE42127數(shù)據(jù)集中,MP-III型的stage I患者生存率均顯著低于MP-I和MP-II型。除此之外,作者發(fā)現(xiàn),在全部五個(gè)數(shù)據(jù)集中,MP-I和MP-II型的生存差異并不顯著,但是可以看出在GSE13213、GSE42127和GSE68465這3個(gè)數(shù)據(jù)集中,相較于MP-I型,MP-II型患者的生存率是偏低的,但差異并不顯著。
此外,研究從CPTAC數(shù)據(jù)庫(kù)中獲取了110例LUAD患者的表達(dá)譜數(shù)據(jù),從蛋白水平上評(píng)估11個(gè)代謝基因的表達(dá)模式。從分析結(jié)果中可以看到,基于11個(gè)代謝基因的蛋白表達(dá)譜,同樣將110例LUAD患者聚成了3個(gè)表型。此外,研究觀察到每個(gè)基因的mRNA表達(dá)水平和蛋白表達(dá)水平均呈顯著正相關(guān)(圖4)。
3.4 在單細(xì)胞水平上描述代謝表型的轉(zhuǎn)錄軌跡
基于單細(xì)胞數(shù)據(jù)集GSE131907,26436個(gè)上皮細(xì)胞被分成了14個(gè)簇,其中包括正常細(xì)胞簇(Cluster 1、11、13)、原代腫瘤細(xì)胞簇(Cluster 4、8、9、10)、腦轉(zhuǎn)移瘤細(xì)胞簇(Cluster 0、2、3、5、6、7、12),見(jiàn)圖5 a。圖5 b表現(xiàn)為每個(gè)細(xì)胞中11個(gè)代謝基因的平均表達(dá)水平。接下來(lái),作者基于11個(gè)基因的表達(dá)矩陣對(duì)樣本進(jìn)行聚類(lèi)以確定上皮腫瘤細(xì)胞的代謝表型,分析結(jié)果表明,MP-III型患者的腦轉(zhuǎn)移瘤細(xì)胞的比例顯著高于MP-I和MP-II型(圖5 e)。
接下來(lái),作者根據(jù)11個(gè)代謝基因的mRNA表達(dá)變化對(duì)上皮細(xì)胞進(jìn)行排序,以構(gòu)建代謝軌跡。軌跡中的7個(gè)轉(zhuǎn)錄狀態(tài)分別代表不同的細(xì)胞代謝軌跡。每個(gè)細(xì)胞狀態(tài)中各表型所占比例見(jiàn)圖5 f,可以很明顯的看出,正常上皮細(xì)胞顯著富集在state 1和state 4這兩個(gè)狀態(tài),然而,處于state 4階段的細(xì)胞11個(gè)代謝基因的表達(dá)水平普遍較低,這一點(diǎn)在TCGA數(shù)據(jù)集中并沒(méi)有觀察到。糖-脂質(zhì)代謝失衡的代謝軌跡似乎主要是從部分正常上皮細(xì)胞開(kāi)始的,主要在State 1末期分化成MP-I型腫瘤細(xì)胞,然后形成一個(gè)具有兩個(gè)主要細(xì)胞命運(yùn)的分支結(jié)構(gòu):Cell fate 1和Cell fate 2。通過(guò)追蹤C(jī)ell fate 1的代謝軌跡,作者發(fā)現(xiàn)MP-I型腫瘤細(xì)胞逐漸分化成MP-III型(state 3)。此外,對(duì)Cell fate 2代謝軌跡的追蹤結(jié)果表明,MP-II和MP-III型腫瘤細(xì)胞主要富集在State 6和State 7這兩個(gè)獨(dú)立的分支。
3.5 揭示代謝表型下潛在的細(xì)胞間通訊
在該部分分析中,作者從患者原發(fā)性腫瘤組織中提取6372個(gè)腫瘤上皮細(xì)胞、2373個(gè)干細(xì)胞和35506個(gè)免疫細(xì)胞。如圖5 a所示,作者在10個(gè)細(xì)胞群兩兩間共鑒定出41個(gè)具顯著意義的配體-受體對(duì)。正如所推斷的那樣,作者發(fā)現(xiàn)MP-III型細(xì)胞群表現(xiàn)出強(qiáng)烈的信號(hào)輸出,其次為MP-II和MP-I型細(xì)胞群(圖6 b)。
接下來(lái),與3種代謝表型相關(guān)的重要配體-受體對(duì)被進(jìn)一步劃分為15個(gè)信號(hào)通路(圖6 c)。各配體-受體對(duì)在信號(hào)通路中的相對(duì)貢獻(xiàn)率以及在各細(xì)胞群中的作用如圖6 b、c所示。此外,分析結(jié)果發(fā)現(xiàn),在3個(gè)MP細(xì)胞群中,MP-II是EGF信號(hào)通路的主要受體,可能單獨(dú)發(fā)揮作用,也可能是與髓細(xì)胞、MAST、NK和內(nèi)皮細(xì)胞共同作用(圖7 g-i)。
四、總結(jié)
在本研究中,分析結(jié)果表明在轉(zhuǎn)移性LUAD樣本中顯著上調(diào)和下調(diào)表達(dá)的差異基因分別富集在糖酵解和脂代謝途徑中,由此推測(cè)糖脂代謝的失衡可能會(huì)促進(jìn)LUAD的轉(zhuǎn)移。不足之處在于,(1)首先,本研究是基于11個(gè)代謝基因的mRNA表達(dá)譜來(lái)定義代謝表型的,因此,糖酵解和脂質(zhì)代謝活性需要通過(guò)估計(jì)其代謝物來(lái)驗(yàn)證;(2)其次,在本研究中發(fā)現(xiàn)的細(xì)胞間相互作用應(yīng)使用更多的方法來(lái)進(jìn)行驗(yàn)證,因?yàn)樗鼈兪峭ㄟ^(guò)配體及其受體的mRNA表達(dá)預(yù)測(cè)的;(3)盡管MP-III群體與其他群體的相互作用在另一個(gè)scRNA seq數(shù)據(jù)集中得到了驗(yàn)證,但想要獲得更可靠的結(jié)果仍需進(jìn)一步的實(shí)驗(yàn)驗(yàn)證;(4)此外,其他改變腫瘤微環(huán)境的代謝重編程模式,如代謝物等,仍待進(jìn)一步探究??偟膩?lái)說(shuō),研究鑒定了可能與LUAD轉(zhuǎn)移相關(guān)的三種代謝表型,發(fā)現(xiàn)這一代謝重編程背后的四種致癌事件及其與其他細(xì)胞間的相互作用(尤其是ANGPTL信號(hào)通路)為防止LUAD轉(zhuǎn)移提供了候選治療策略。