大家好!今天給大家分享的文獻是2021年11月發(fā)表在Frontiers in Oncology(IF 6.244)上的一篇純生信分析文章,全篇數(shù)據(jù)來源于公共數(shù)據(jù)庫,不涉及濕實驗。成本低,周期短(抓重點),一起來學(xué)習(xí)下吧。
識別頭頸部鱗狀細胞癌中神經(jīng)-癌cross-talk相關(guān)基因預(yù)后模型
學(xué)習(xí)文章之前,先了解一下基礎(chǔ)知識:
HNSC: Head and Neck Squamous cell Carcinoma 頭頸部鱗狀細胞癌
NCCGs : Nerve-Cancer Cross-talk-related Genes 神經(jīng)-癌cross-talk相關(guān)基因
nerve-cancer cross talk:神經(jīng)在腫瘤的發(fā)生發(fā)展中起著重要作用。神經(jīng)釋放的乙酰膽堿等神經(jīng)遞質(zhì)可以激活癌細胞、基質(zhì)細胞和免疫細胞的膜受體,并且癌細胞分泌的神經(jīng)營養(yǎng)因子也會促進神經(jīng)生長。這一現(xiàn)象稱為Nerve-Cancer Cross-talk。
數(shù)據(jù)來源和分析方法
數(shù)據(jù)來源
本文所使用數(shù)據(jù)全部來自TCGA和GEO公共數(shù)據(jù)庫,非常簡單方便易獲取。
TCGA獲取 501例HNSC的RNA-seq數(shù)據(jù)及臨床信息。GSE41613 獲取97例HNSC患者的RNA-seq數(shù)據(jù)和臨床信息。GSE103322 獲取HNSC的scRNA-seq數(shù)據(jù)。GBE52130, GSE38616獲取 14個口腔扁平苔蘚上皮和14個正??谇簧掀さ幕虮磉_數(shù)據(jù)。
分析方法
本篇文章分析方法主要分為以下幾個部分:
首先是42個NCCGs的概況描述,對42個NCCGs有一個landscape式的上帝視角全局全貌的認識。包括(1)突變分析,使用cBioPortal實現(xiàn)突變分析。(2)蛋白互作,使用String數(shù)據(jù)庫對42個NCCG進行了蛋白互作分析。(3)功能富集分析,使用R包Pathview 完成GO和KEGG分析。
之后是預(yù)后基因模型的構(gòu)建和驗證。(1)使用LASSO回歸算法,10倍交叉驗證構(gòu)建預(yù)后模型。(2)Log-rank檢驗進行K-M生存分析,time-ROC分析評估模型預(yù)后效能。R包forestplot繪制森林分布圖。R包rms構(gòu)建列線圖并預(yù)測1、3、5年生存率。該部分是文章的主體部分。
最后是探索模型關(guān)鍵基因與MSI,TMB等的關(guān)系,并探索關(guān)鍵基因的功能。使用TIMER探索基因表達與免疫浸潤之間的關(guān)系。R包ggstatsplot分析基因表達和腫瘤突變負荷TMB,微衛(wèi)星不穩(wěn)定性MSI的關(guān)系。使用GSCALite的CTRP藥物分析模塊分析NCCGs基因表達與泛癌藥物敏感性關(guān)系。
結(jié)果
HNSC中的NCCGs表達與突變
首先,在TCGA數(shù)據(jù)庫中探討了42個NCCGS在HNSC和正常組織中的表達。HNSC中共有23個基因表達上調(diào)或下調(diào)(圖1A),SEMA4F、ADRB2、ADRB3、NTRK 1、NTRK 3、LICAM、GDNF、GFRA 2、GRIN2B、GRIN2C、GRIN2D、GRIN3B、CHRM2、CHRM 4、CHRNA 5、CHRNA 6、CHRNA 9、CHRNB2和CHRNB 4上調(diào),而GFRA 1、Slit2、CHRM1、TACR1下調(diào)。之后總結(jié)了在HNSC中NCCGS的拷貝體突變和體細胞突變的發(fā)生率(圖1B)。在144份樣本中,100份(69.44%)的NCCG發(fā)生了改變。最常見的突變類型是錯義突變(藍帶)。突變率最高的基因有GRIN2A、GRIN2B、MAP 2、GRIN3A、NTRK 3、CHRM 3、LICAM、GFRA 1和CHRNG。
NCCGs功能富集
通過對NCCGs進行功能富集分析得知,42個NCCGs主要富集在膜電位調(diào)節(jié)、化學(xué)突觸、軸突形成等方面(圖2A)。此外,KEGC通路富集分析顯示,42個NCCGs主要參與神經(jīng)受體-配體相互作用、鈣信號通路等(圖2B)。最后,我們對42個NCGs進行了PPI分析,結(jié)果顯示這些基因之間存在復(fù)雜的相互作用(圖2C)。
預(yù)后基因模型的構(gòu)建與驗證
首先,使用K-M plotter在42個NCCG中尋找預(yù)后基因,10個基因預(yù)后效果顯著,如圖3所示。
結(jié)果表明,CHRNA 1、CHRNA 5、CHRNB 4、CHRND、CHRNG和LICAM的高表達以及CHRNA 6、GFRA 2、GRIN3A和NTRK 1在HNSC中的低表達與預(yù)后不良有關(guān)。接下來,在這10個預(yù)后基因的基礎(chǔ)上,使用LASSO回歸分析建立了一個預(yù)后基因模型(圖4)。共有7個基因被包括在模型中,風(fēng)險評分risk score=(-0.0117)*NTRK1+(0.057)*LICAM+(-0.5121)*GRIN3A+(0.1541)*CHRNA5+(-0.0146)*CHRNA 6+(0.0795)*CHRNB 4+(0.0564)*CHRND。計算每個HNSC患者的風(fēng)險評分,并將他們分為高分組和低評分組。風(fēng)險評分分布、生存狀況和7個基因的表達如圖4C所示。K-M plotter顯示高分組的預(yù)后比低評分組差(圖4D)。1-、3-和5年ROC曲線的AUC分別為0.605、0.64和0.634(圖4e).
最后,用GSE 41613中97例HNSC患者的數(shù)據(jù)進行了模型的有效性驗證。根據(jù)危險評分分為高分組和低評分組,用K-M plotter比較預(yù)后。結(jié)果表明,該模型能較好地判斷患者的預(yù)后(p=0.0235,圖4F)。
構(gòu)建列線圖
之后利用該模型的臨床特征和7個基因的表達,建立列線圖預(yù)測1年、3年、5年生存率。單因素和多因素分析顯示以下獨立預(yù)后因素:CHRNA5、LICAM、CHRND、GRIN3A、年齡、M期和N階段(圖5A,b)。列線圖如圖5,C指數(shù)為0.653。列線圖可以預(yù)測1、3、5年生存率,與理想模型接近(圖5D)。
NCCGs與免疫浸潤
神經(jīng)是腫瘤微環(huán)境的重要組成部分,神經(jīng)系統(tǒng)與免疫系統(tǒng)關(guān)系密切。在本研究中使用Timer來探討預(yù)后基因模型中7個基因與免疫浸潤的關(guān)系,如圖6A-G和表1所示。圖6A顯示CHRNA 5與腫瘤純度呈正相關(guān)(COR=0.189)。圖6B顯示CHRNA 6與B細胞(COR=0.321)、CD8+T(COR=0.365)、CD4+T(COR=0.553)、巨噬細胞(COR=0.424)、中性粒細胞(COR=0.487)、樹突狀細胞(COR=0.567)呈正相關(guān),與純度呈負相關(guān)(COR=-0.176)。圖6C顯示CHRNB 4與B細胞(COR 0.151)、CD8+T(COR=0.101)、CD4+T(COR=0.203)、巨噬細胞(COR=0.152)r和樹突狀細胞(COR=0.147)呈正相關(guān)。圖6D顯示CHRND與
CD4+T(COR=0.218)、巨噬細胞(COR=0.128)、中性粒細胞(COR=0.133)、樹突狀細胞(COR=0.127)呈正相關(guān),與純度呈負相關(guān)(COR=-0.112)。圖6E顯示GRIN3A與B細胞(COR=0.297)、CD8+T(COR=0.479)、CD4+T(COR=0.487)、巨噬細胞(COR=0.486)、中性粒細胞(COR=0.501)、樹突狀細胞(COR=0.6)呈正相關(guān),與純度呈負相關(guān)(COR=-0.153)。圖6F顯示LICAM與中性粒細胞(COR=0.125)和樹突狀細胞(COR=0.116)呈正相關(guān),且呈負相關(guān)。CD8+T(COR=-0.119),純度(COR=-0.107)。圖6G顯示NTRK 1與B細胞(COR=0.206)、CD8+T(COR=0.387)、CD4+T(COR=0.381)、巨噬細胞(COR=0.371)、中性粒細胞(COR=0.437)、樹突狀細胞(COR=0.484)呈正相關(guān),與純度呈負相關(guān)(COR=-0.256)。結(jié)果表明,NCCGS與免疫浸潤密切相關(guān)。
NCCGs與TMB, MSI和藥物敏感性
TMB和MSI是免疫治療的預(yù)測生物標(biāo)志物。如圖7A所示,CHRNA5和MSI兩者之間存在正相關(guān)。圖7B, E-G呈負相關(guān)在CHRNA6, GRIN3A, LICAM, NTRKI和MSL之間。其他CHRNB4、CHRND和MSI(圖7C, D)。如圖7H所示, CHRNA5、CHRNB4與TME呈正相關(guān),如(圖71,K, M, N), CHRNA6, CHRND, LICAM, NTRK1和TMB之間呈負相關(guān),但是沒有GRIN3A與TMB之間存在顯著關(guān)系(圖7L)。進一步探索上述基因的潛力在治療靶點上,探討了基因之間的關(guān)系泛癌的表達及藥物敏感性。數(shù)據(jù)顯示藥物敏感性與LICAM呈正相關(guān),與CHRND、NTRK1、CHRNA5、GRIN3A呈負相關(guān)(圖70)。CHRNA6、CHRNB4與藥物敏感性無顯著相關(guān)性
NCCGs與HNSC臨床分期
腫瘤基因表達與臨床進展密切相關(guān)。分析NCCGs與臨床分期的關(guān)系。數(shù)據(jù)顯示,GRIN3A, NTRK1,和CHRNB4與分期相關(guān)(圖8A-C)。但我發(fā)現(xiàn)CHRND、CHRNA5、LICAM、CHRNA6和分期無關(guān)(圖8D-G)。
腫瘤微環(huán)境中NCCGs的表達
研究表明,模型中的7個預(yù)后基因與正常組織相比,HNSC中有高表達。然而,目前還不清楚這些基因在哪些細胞中發(fā)揮作用。因此,利用單細胞測序數(shù)據(jù)探索基因表達在HNSC微環(huán)境中的不同細胞中。如圖9A, B所示,有肌成纖維細胞,惡性,血漿,成纖維細胞,肌細胞,單細胞/巨細胞,內(nèi)皮細胞,肥大細胞CD8T、CD8Tex和CD4Tconv在微環(huán)境中的作用。CHRNB4主要在惡性腫瘤中表達細胞(圖9)。NTRKI基因在肥大細胞中高表達在CD8+ T和成纖維細胞中有少量表達(圖9D)。因此,之后重點探討惡性細胞中存在CHRNB4,肥大細胞中存在NTRKI的功能。
識別CHRNB4在惡性腫瘤細胞中的功能
采用單細胞基因集富集分析,探討基因可能的功能。選擇高表達和低表達CHRNB4的惡性腫瘤細胞進行KEGG通路的基因集富集分析。結(jié)果表明,以下通路在高表達CHRNB4的細胞中被激活:戊糖-葡萄糖轉(zhuǎn)化,淀粉-蔗糖代謝,亞油酸代謝。不飽和脂肪酸生物合成,抗壞血酸和乳酸代謝,類固醇激素生物合成,藥物代謝,和外部物質(zhì)的P450代謝(圖10)。
識別NTRK1在肥大細胞中的功能
選擇NTRKI高表達和低表達的肥大細胞用于KEGG通路的基因集富集分析。結(jié)果顯示,在NTRKI高表達的肥大細胞中,以下途徑被激活:神經(jīng)酪氨酸信號通路、丁酸代謝、內(nèi)吞、凋亡、賴氨酸降解、造血系統(tǒng)譜系、甲狀腺癌、嗅覺傳導(dǎo)(圖11)。
到這里文章的主要內(nèi)容就介紹完了??偨Y(jié)一下,這項研究收集了42個NCCGs,基于這些基因構(gòu)建了預(yù)后模型。在模型構(gòu)建之外,又探索了關(guān)鍵基因與免疫浸潤、TMB、MSI和藥物敏感性的關(guān)系。最后,通過單細胞測序數(shù)據(jù)解釋了關(guān)鍵基因可能的功能。
這篇文章思路清晰,從基因集的選取到預(yù)后模型的構(gòu)建和驗證,以及與其他臨床特征的相關(guān)性分析,加入TME, MSI, TMB和藥物敏感性等分析,使得研究內(nèi)容豐富,分析全面;又使用單細胞研究關(guān)鍵基因功能,進一步補充研究結(jié)果。又有生信分析又有臨床結(jié)合,又有bulk RNA-seq又有單細胞測序,豐富的生信分析加上優(yōu)秀的結(jié)果,使得文章邏輯清晰,思路新穎,內(nèi)容詳實,可效仿性極強,值得各位老師參考。
參考文獻:
Identification of the Nerve-Cancer Cross-Talk-Related Prognostic Gene Model in Head and Neck Squamous Cell Carcinoma. PMID: 34912722