利用血源性外泌體中的轉(zhuǎn)錄組學(xué)信息和腫瘤微環(huán)境中的單細(xì)胞多組學(xué)數(shù)據(jù)構(gòu)建 KIRC 診斷模型
今天分享的文章, 于2023年4月19日發(fā)表在Frontiers in Immunology (IF: 8.786), 題為“Dissecting order amidst chaos of programmed cell deaths: construction of a diagnostic model for KIRC using transcriptomic information in blood-derived exosomes and single-cell multi-omics data in tumor microenvironment” 。
腎透明細(xì)胞癌 (KIRC) 是最常診斷的腎細(xì)胞癌 (RCC) 亞型; 然而,KIRC 的發(fā)病機(jī)制和診斷方法仍然不清楚。作者收集了 6 個(gè) 細(xì)胞死亡相關(guān)基因(CDRG) 類別,包括細(xì)胞凋亡、壞死性凋亡、自噬、細(xì)胞焦亡、鐵死亡和銅細(xì)胞凋亡。 利用 exoRBase 數(shù)據(jù)庫的血液外泌體的 RNA 測序 (RNA-seq) 數(shù)據(jù)、癌癥基因組圖譜 (TCGA)數(shù)據(jù)庫組織的 RNA-seq 數(shù)據(jù)聯(lián)合GTEx 數(shù)據(jù)庫的對照樣本,以及GEO數(shù)據(jù)庫中單細(xì)胞 RNA 測序 (scRNA- seq)的數(shù)據(jù)。 作者首先將來自 exoRBase 和 TCGA 數(shù)據(jù)庫的 KIRC 隊(duì)列的差異表達(dá)基因(DEGs)與從單細(xì)胞數(shù)據(jù)集中獲得的 CDRGs 和 DEGs 進(jìn)行交叉,然后, 進(jìn)一步使用臨床指標(biāo)和機(jī)器學(xué)習(xí)方法篩選出候選生物標(biāo)志物基因,從而構(gòu)建一個(gè) KIRC 的診斷模型。 最后,使用 scRNA-seq、用于轉(zhuǎn)座酶可及染色質(zhì)測序的單細(xì)胞分析 (scATAC-seq) 和空間轉(zhuǎn)錄組學(xué)測序 (stRNA-seq) 數(shù)據(jù)研究了關(guān)鍵基因的潛在機(jī)制及其在腫瘤微環(huán)境中的作用。本文證明13-基因診斷模型在KIRC篩查中具有較高的準(zhǔn)確性,而TRIB3high腫瘤上皮細(xì)胞可能是KIRC有前景的治療靶點(diǎn)。
一 背景
腎細(xì)胞癌 (RCC) 是最常見的腎臟腫瘤,占腎臟惡性腫瘤的 90% 和所有癌癥的 3% 。 腎透明細(xì)胞癌 (KIRC) 是最常診斷的病理分類,約占 RCC 的 80% 。 盡管 KIRC 預(yù)后相對良好,但近 30% 的局部晚期病例會因局部復(fù)發(fā)或遠(yuǎn)處轉(zhuǎn)移而復(fù)發(fā) 。關(guān)于該疾病的發(fā)病機(jī)制和潛在機(jī)制仍有許多問題有待闡明,而且對 KIRC 診斷方法的鑒定研究還處于起步階段。 構(gòu)建一個(gè)涵蓋篩查、診斷和預(yù)后預(yù)測的新型臨床模型對臨床環(huán)境具有巨大意義,并為精準(zhǔn)醫(yī)學(xué)治療決策提供新見解。本研究的數(shù)據(jù)集信息和工作流程如圖 1 所示。
二 結(jié)果
多個(gè)組織來源中KIRC的轉(zhuǎn)錄組信息
首先從GEO數(shù)據(jù)庫提供的五個(gè)獨(dú)立數(shù)據(jù)集中收集了48個(gè)KIRC樣本。樣本包含癌癥、癌旁組織和來自腎切除術(shù)或活檢檢查的健康組織。保留了來自五個(gè)獨(dú)立數(shù)據(jù)集的216,155個(gè)單細(xì)胞并用于以下分析。用Seurat包處理并去除批次效應(yīng)后,確定了54個(gè)細(xì)胞簇和10種主要細(xì)胞類型以及細(xì)胞類型的特定標(biāo)記和相對豐度(圖2A, 圖2B)。上皮細(xì)胞在所有細(xì)胞區(qū)中占主導(dǎo)地位,表達(dá)CA9的典型標(biāo)志物的腫瘤上皮細(xì)胞完全來自腫瘤組織和具有多種起源的正常上皮細(xì)胞。使用UMAP可視化了每種主要細(xì)胞的類型及其起源的分布(圖2C)。隨后,根據(jù)他們的表達(dá)譜探索了各種只要細(xì)胞類型的癌癥和對照樣本之間的DEG,條形圖顯示了上調(diào)和下調(diào)DEG的確切計(jì)數(shù),餅圖顯示它們在KEGG路徑中顯示其相應(yīng)類別(圖2D),其中大部分屬于“人類疾病”。有趣的是,腫瘤和正常上皮細(xì)胞之間的DEG數(shù)最高,其次是癌癥和對照樣本之間的Endo和Fib之間的DEG(圖2D),證明了轉(zhuǎn)錄組結(jié)構(gòu)細(xì)胞的顯著改變及其在腫瘤發(fā)生中的基本階段。接下來,根據(jù)TCGA隊(duì)列與GTEx中的健康樣本合并,進(jìn)一步解剖了KIRC的轉(zhuǎn)錄組景觀(圖2E),揭示了癌癥組織中4604,604個(gè)上調(diào)和2,073個(gè)下調(diào)DEG(圖2F)。
KIRC中CDRGs的表達(dá)模式
作者分析了細(xì)胞凋亡、壞死性凋亡、自噬、細(xì)胞焦亡、鐵死亡和銅死亡等六種 PCD 及其相關(guān)基因 CDRG,顯示出共性和特異性(圖 3A)。 可以看出鐵死亡和自噬共享的基因數(shù)量非常多。 圖 3B 所示,大多數(shù) CDRG 在單細(xì)胞和 RNA-seq 數(shù)據(jù)集中都是上調(diào)的 DEG,下調(diào)的 DEG 比例非常低,其中大部分屬于自噬、細(xì)胞凋亡和鐵死亡途徑。 這種現(xiàn)象提出了一個(gè)說明性的斷言:CDRGs 的表達(dá)水平有不同程度的增強(qiáng)。接下來,作者將 exoRBase KIRC 中上調(diào)(圖 4A)和下調(diào)(圖 4B)的 DEG 與從單細(xì)胞和 TCGA 數(shù)據(jù)集中獲得的 CDRG 和 DEG 相交,以篩選53個(gè)候選生物標(biāo)志物基因。其中, 20 個(gè)基因被上調(diào)(圖 4C),33 個(gè)基因在 KIRC 患者的血液來源外泌體中被下調(diào)。 同時(shí),候選生物標(biāo)志物基因的這種差異表達(dá)趨勢在 TCGA 數(shù)據(jù)集和上皮細(xì)胞、Endo 和 Fib(即結(jié)構(gòu)細(xì)胞)的單細(xì)胞數(shù)據(jù)集中基本一致。 這些發(fā)現(xiàn)表明外泌體在協(xié)調(diào)與腫瘤細(xì)胞的對話和深刻影響 TME 改變方面的關(guān)鍵作用。這 53 個(gè)候選生物標(biāo)志物基因與臨床標(biāo)志物之間的相關(guān)性表明,53 個(gè)基因中的 32 個(gè)與患者的臨床分期或生存結(jié)果密切相關(guān),在 KIRC 中作為風(fēng)險(xiǎn)或保護(hù)因素發(fā)揮雙重作用(圖 4D)。 此外,與鐵死亡和自噬相關(guān)的基因占32個(gè),其中一小部分基因?qū)儆诩?xì)胞凋亡和壞死性凋亡。 其中,32 個(gè)基因中有 13 個(gè)同時(shí)與 KIRC 的臨床分期和生存結(jié)果相關(guān)包括 PIP4K2C、FIS1、PSAT1、ERBB2、TRIB3、CLU、GABARAPL2、LRBA、PCK2、CDKN1A、 FKBP1A、MAP1LC3B 和 ITGA6基因。
13-基因診斷模型驗(yàn)證及機(jī)制探索
作者使用 13 個(gè)關(guān)鍵基因構(gòu)建了 KIRC 的診斷模型,首先, 將 exoRbase 數(shù)據(jù)庫中的所有樣本隨機(jī)分為兩組(訓(xùn)練集和測試集),比例為 3:2 以進(jìn)行交叉驗(yàn)證。 可以看出13- 基因診斷模型在 exoRbase 數(shù)據(jù)庫的 KIRC 數(shù)據(jù)集中表現(xiàn)出出色的鑒別能力(圖 5A),訓(xùn)練集和測試集的 AUC 值分別為 1 和 0.965。同樣,用 TCGA KIRC 隊(duì)列中的 13 個(gè)基因構(gòu)建的模型顯示出有希望的診斷結(jié)果,訓(xùn)練和測試集中的 AUC 值分別為 1 和 0.982(圖 5B)。 此外,由包含 656 個(gè) KIRC 病例的 GEO 數(shù)據(jù)庫提供的 GSE167093 被用作額外的驗(yàn)證隊(duì)列,表現(xiàn)出極高的診斷準(zhǔn)確性,AUC 值為 0.914。 研究結(jié)果明確表明,13- 基因診斷模型在檢測 KIRC 時(shí)非常穩(wěn)定和值得信賴,無論樣本是取自血液來源的外泌體還是實(shí)體組織,都確保了高靈敏度和特異性。作者根據(jù) scRNA 數(shù)據(jù)發(fā)現(xiàn)這些基因在不同細(xì)胞類型中的異常表達(dá)模式,尤其是 CLU、CDKN1A、PSAT1 和 MAP1LC3B,它們在幾乎所有細(xì)胞類型中都有差異表達(dá)。 隨后,作者分析了 KIRC 病例的 scATAC 數(shù)據(jù)集中的 63,489 個(gè)細(xì)胞,根據(jù)標(biāo)記基因識別了 15 種主要細(xì)胞類型(圖 5C、D)。 有趣的是,作者發(fā)現(xiàn) TRIB3 表達(dá)在腫瘤上皮細(xì)胞中高于正常上皮細(xì)胞。 同時(shí),與正常 PT 細(xì)胞簇(圖 5E)(腎臟中常見的上皮細(xì)胞類型)相比,其染色質(zhì)可及性顯著增加。
TRIB3high 腫瘤上皮細(xì)胞綜合描述
接下來,作者研究了 TRIB3 在 TME 及其相應(yīng)細(xì)胞亞群中的影響。 對 TRIB3 的分析表明,該基因與 KIRC 的 TNM 分期呈正相關(guān)(圖 6A-C),暗示其在 KIRC 的生存結(jié)果中起不利作用,這可能是癌細(xì)胞轉(zhuǎn)移的主要原因。 因此,作者側(cè)重于了解 TRIB3 在腫瘤上皮細(xì)胞特定表型中的作用,后者是從 scRNA 數(shù)據(jù)集中提取的,并在降維后進(jìn)一步可視化。 值得注意的是,TRIB3high 子集出現(xiàn)在分散的腫瘤上皮細(xì)胞中(圖 6D),并且與 PT 具有更高的相似性(R = 0.864)(圖 6E)。 此外,偽時(shí)序分析表明,這種細(xì)胞亞群可能是原始癌癥干細(xì)胞(圖 6F)。 細(xì)胞間通訊分析表明,TRIB3high 腫瘤細(xì)胞的相互作用比其他細(xì)胞類型更廣泛、更強(qiáng)烈,尤其是與 Mac 和 T 細(xì)胞的相互作用(圖 6G)。 同時(shí),甘油醛-3-磷酸脫氫酶 (GAPDH) 的高表達(dá)可能預(yù)示著這種細(xì)胞類型具有很強(qiáng)的外泌體組裝和聚集能力。 細(xì)胞-細(xì)胞相互作用網(wǎng)絡(luò)分析的結(jié)果揭示了 TRIB3high 腫瘤上皮細(xì)胞與其他細(xì)胞類型在某些特定區(qū)域具有更高的相互作用。與其他細(xì)胞簇相比,TRIB3high 腫瘤上皮細(xì)胞主要富集細(xì)胞凋亡、鐵死亡、核糖體和溶酶體信號通路(圖 7A、B)。 最后,空間轉(zhuǎn)錄組學(xué)分析證實(shí) TRIB3high 子集在腫瘤組織中高度富集(圖 7C)。
討論和結(jié)論
作者成功構(gòu)建具有 13 個(gè)基因的診斷模型, 并在血源性外泌體樣本和組織樣本中均顯示出高診斷效能。 基于單細(xì)胞組學(xué)的溯源分析表明,基因的表達(dá)和改變在TME中以多種細(xì)胞身份呈現(xiàn),尤其是在結(jié)構(gòu)細(xì)胞和巨噬細(xì)胞中。值得注意的是,癌細(xì)胞可以分泌外泌體誘導(dǎo)癌癥相關(guān)成纖維細(xì)胞和癌癥相關(guān)內(nèi)皮細(xì)胞的產(chǎn)生,從而促進(jìn) TME 的重塑。并且作者發(fā)現(xiàn)其中一個(gè)基因,TRIB3 的高表達(dá)與 KIRC 患者的晚期臨床分期和較差的預(yù)后密切相關(guān)。