研究腫瘤微環(huán)境及腫瘤異質(zhì)性,通常的方式是基于單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)。Nature communication近日的研究,介紹了基于拷貝數(shù)變異和斷點(diǎn)的檢測算法SCEVAN,該算法能夠自動(dòng)、準(zhǔn)確地區(qū)分惡性和非惡性細(xì)胞。將該算法應(yīng)用于來自不同腫瘤類型和測序技術(shù)的106個(gè)樣本,共計(jì)93,322個(gè)細(xì)胞的數(shù)據(jù)集,可證明該方法可表征腫瘤內(nèi)的異質(zhì)性和惡性腦腫瘤的空間演變。
論文標(biāo)題:A variational algorithm to detect the clonal copy number substructure of tumors from scRNA-seq data
論文地址:https://www.nature.com/articles/s41467-023-36790-9
1 SCEVAN 如何基于拷貝數(shù)及斷點(diǎn)進(jìn)行亞克隆判別
了解腫瘤內(nèi)異質(zhì)性和腫瘤細(xì)胞與免疫系統(tǒng)之間的相互作用是解釋腫瘤治療失敗,理解腫瘤生長和進(jìn)化的關(guān)鍵步驟。通常的研究套路,是將來自腫瘤活檢的大量未分選的細(xì)胞進(jìn)行全轉(zhuǎn)錄組分析,根據(jù)特定標(biāo)記的表達(dá)進(jìn)一步分亞群,然后將細(xì)胞分類為惡性腫瘤細(xì)胞,基質(zhì)細(xì)胞和免疫細(xì)胞。常用的標(biāo)記是轉(zhuǎn)化后細(xì)胞所具有的獨(dú)特性拷貝數(shù)變化。然而,之前的方法需要人工識(shí)別,適用于高覆蓋率和低維度的Smart-seq 數(shù)據(jù),而新方法SCEVAN能克服這些問題,在合成和真實(shí)數(shù)據(jù)上表現(xiàn)出更快和更準(zhǔn)確地識(shí)別出腫瘤的亞克隆。
SCEVAN的分類邏輯,是假設(shè)給定拷貝數(shù)的克隆中,對(duì)應(yīng)的所有細(xì)胞共享相同的斷點(diǎn)。因此,每個(gè)細(xì)胞的平滑表達(dá)譜構(gòu)成了判別每個(gè)亞克隆中拷貝數(shù)譜的證據(jù)。其具體流程如下圖所示,從原始的單細(xì)胞轉(zhuǎn)錄譜開始,去除低表達(dá)的基因和細(xì)胞(圖1a)。之后依次從留下的高表達(dá)細(xì)胞基線去除獲得的不同細(xì)胞的相對(duì)基因表達(dá)量(圖1b),對(duì)相對(duì)基因表達(dá)的邊緣進(jìn)行非線性擴(kuò)散濾波(圖1c),根據(jù)變分區(qū)域進(jìn)行分割(圖1d)。鑒定正常細(xì)胞,即包含大多數(shù)正常細(xì)胞的簇(圖1e)。對(duì)于腫瘤細(xì)胞,使用 Louvain 聚類的共享最近鄰圖鑒定可能的亞克?。▓D1f)。 應(yīng)用變分區(qū)域生長算法對(duì)每個(gè)亞克隆進(jìn)行分割(圖1g)。然后根據(jù)拷貝數(shù)狀態(tài)將腫瘤細(xì)胞分為五個(gè)亞克?。▓D1g)。 圖1H展示了亞克隆共享及特異的通路活性。
圖1 SCEVAN的任務(wù)流程及輸入輸出
2 SCEVAN在真實(shí)樣本惡性腫瘤細(xì)胞分類中的性能
對(duì)于三種不同癌癥類型的 scRNA-seq 數(shù)據(jù)(膠質(zhì)母細(xì)胞瘤(GBM) ,頭頸部鱗狀細(xì)胞癌(HNSCC) ,大腸癌)和來自不同測序技術(shù)(Smart-seq2,10X Chromium),共包含106個(gè)樣本和93,322個(gè)細(xì)胞,使用 SCEVAN和之前基于CNV的分類工具的CopyKAT對(duì)比分類準(zhǔn)確性,可以看到在三種癌種,大多數(shù)樣本中,SCEVAN的準(zhǔn)確性(F1值)都高于CopyKAT。具體來看,SCEVAN 在63% 的樣本中取得較佳的分類評(píng)分,而 CopykAT 在23% 的樣本中取得較佳的分類評(píng)分。所有樣本上,SCEVAN的 F1只為0.90,而用 CopyKAT 的 F1值為0.63。
圖2 在真實(shí)癌癥數(shù)據(jù),使用SCEVAN分類惡性細(xì)胞的F1值對(duì)比
3 使用SCEVAN可得到更準(zhǔn)確的拷貝數(shù)變異
將同樣本的bulk RNA數(shù)據(jù)及WGS數(shù)據(jù)檢測出的拷貝數(shù)作為金標(biāo)準(zhǔn),評(píng)價(jià)SCEVAN及其它同類軟件,如 inferCNV, CopyKAT 基于單細(xì)胞數(shù)據(jù)檢測拷貝數(shù)變異的準(zhǔn)確度。圖3a和b分別是不同軟件各染色體中檢出的拷貝數(shù)變異,圖3c和d是對(duì)應(yīng)的皮爾森相關(guān)系數(shù)。可以從圖3a和b中最上的圖(金標(biāo)準(zhǔn))與之下不同方法的圖檢出的拷貝數(shù)變異結(jié)果對(duì)比,可以看到SCEVAN檢出的變異更多且更準(zhǔn),而圖3c和d對(duì)應(yīng)的相關(guān)系數(shù),SCEVAN最高,也反映了這一情況。同樣的結(jié)果,在模擬數(shù)據(jù)中也會(huì)出現(xiàn),這些結(jié)果說明SCEVAN能夠從單細(xì)胞數(shù)據(jù)中得到準(zhǔn)確度拷貝數(shù)變異譜。
圖3,對(duì)比不同軟件對(duì)單細(xì)胞拷貝數(shù)變異檢測的準(zhǔn)確度
而執(zhí)行時(shí)間上,SCEVAN 的執(zhí)行時(shí)間,在惡性和非惡性細(xì)胞的區(qū)分任務(wù)上,相比InferCNV快2-7倍,在腫瘤區(qū)域分割任務(wù)上,相比CopyKAT 快2倍,比Infer CNV 快5倍。對(duì)于來自10X的單細(xì)胞數(shù)據(jù),由于其包含的細(xì)胞數(shù)偏多,CopyKAT顯得尤其慢,此時(shí)SCEVAN 比Infer CNV 快11倍,比 CopyKAT 快19倍。這說明了SCEVAN 在計(jì)算上更有效率。
4 使用SCEVAN研究膠質(zhì)母細(xì)胞瘤的腫瘤微環(huán)境
膠質(zhì)母細(xì)胞瘤(GBM)是最具侵襲性的腦腫瘤,具有高度異質(zhì)性,包括幾種克隆和亞克隆腫瘤細(xì)胞群,膠質(zhì)瘤干細(xì)胞,以及免疫抑制性腫瘤微環(huán)境。SCEVAN 可以通過分析顯示出具有顯著不同基因組改變的 CNA 基質(zhì)簇,從單細(xì)胞數(shù)據(jù)中自動(dòng)推斷克隆亞結(jié)構(gòu)。
為了論證SCEVAN的準(zhǔn)確性,選擇MGH105樣本,該樣本已經(jīng)過甲基化數(shù)據(jù),驗(yàn)證其存在4個(gè)亞克隆。經(jīng)過單細(xì)胞數(shù)據(jù),SCEVAN 揭示了三個(gè)腫瘤細(xì)胞亞群的存在,如圖4a,聚類結(jié)果見圖4b??寺涞南到y(tǒng)發(fā)育重建顯示兩個(gè)緊密克隆(亞克隆1和2)和顯著遠(yuǎn)的第三個(gè)亞克隆(圖4c),與聚類結(jié)果相符。圖4d展示了不同亞克隆之間共有(例如Chr 10上的缺失(q22.1-q26.3))及特異的拷貝數(shù)變異。通過通路特異性分析,發(fā)現(xiàn)亞克隆1(淺藍(lán)色)富集神經(jīng)元亞型特征的途徑,亞克隆2(藍(lán)色)具有屬于線粒體的細(xì)胞,亞克隆3(綠色)含有具有增殖/祖細(xì)胞亞型的細(xì)胞(圖4e)。為了確定不同細(xì)胞狀態(tài)的驅(qū)動(dòng)因素,我們對(duì)亞克隆特異性改變區(qū)域中具有基因組坐標(biāo)的基因進(jìn)行了差異分析。位于亞克隆3特異性改變中的最高差異表達(dá)基因是泛素綴合酶 E2T (UBE2T)基因,其表達(dá)顯著上調(diào),該基因位于DNA 修復(fù)通路上,這可以部分解釋該亞克隆的致癌成因。
圖4,使用SCEVAN發(fā)現(xiàn)膠質(zhì)母細(xì)胞瘤的異質(zhì)性
此外,拷貝數(shù)亞結(jié)構(gòu)的分析可以表征特定腫瘤相關(guān)基因的克隆狀態(tài)。在樣品 BT1160和 MGH102中,SCEVAN 顯示腫瘤抑制基因 CDKN2A 和 PTEN 的改變只發(fā)生在部分亞克隆中(圖5)。在樣本BT1160中,含有 PTEN (10q23.31)的 Chr 10(q22.1-q26.3)上的缺失在三個(gè)亞克隆中的兩個(gè)之間共享,而在其余的亞克隆中,該缺失不存在。這些結(jié)果表明,SCEVAN 可以從 scRNA-seq 數(shù)據(jù)中解析腫瘤中的克隆拷貝數(shù)亞結(jié)構(gòu),并識(shí)別亞克隆差異和膠質(zhì)瘤特異性癌癥狀態(tài)。
圖5,SCEVAN基于單細(xì)胞轉(zhuǎn)錄組對(duì)兩個(gè)膠質(zhì)母細(xì)胞瘤區(qū)分亞克隆之后的拷貝數(shù)變異
4 使用SCEVAN研究腫瘤的進(jìn)化與轉(zhuǎn)移
圖6展示了在多次活檢數(shù)據(jù)中,使用 SCEVAN進(jìn)行推測的結(jié)果。有七個(gè)膠質(zhì)母細(xì)胞瘤活組織檢查,兩個(gè)在腫瘤周邊,其余在腫瘤的核心。用 SCEVAN 對(duì)每個(gè)樣品進(jìn)行克隆分析,可以推斷出克隆的進(jìn)化樹(圖6)。拷貝數(shù)改變沿著幾個(gè)分支發(fā)展,腫瘤周圍樣品(P2/P3)位于與核心樣品分離的分支中,其中4號(hào)和8號(hào)染色體沒有擴(kuò)增。此外,存在于 Chr 2上的擴(kuò)增在外周樣品中是完全出現(xiàn),而在中間的部分只是部分出現(xiàn),這說明了該突變的演化順序。
圖6,對(duì)多次活檢樣本使用SCEVAN進(jìn)行時(shí)序分析得到的進(jìn)化樹
SCEVAN還可以鑒別原發(fā)腫瘤和轉(zhuǎn)移之間的相似性,針對(duì)原發(fā)性 HNSCC 腫瘤和相應(yīng)的淋巴結(jié)轉(zhuǎn)移。SCEVAN發(fā)現(xiàn)患者(HNSCC5)在原發(fā)腫瘤和淋巴結(jié)轉(zhuǎn)移之間呈現(xiàn)不同的克隆結(jié)構(gòu),特別是在淋巴結(jié)轉(zhuǎn)移中沒有擴(kuò)增7號(hào)染色體(p22.3-p13) ,如圖7所示。只在一個(gè)樣本中,轉(zhuǎn)移和原發(fā)腫瘤細(xì)胞的拷貝數(shù)之間存在差異,不同的淋巴結(jié)轉(zhuǎn)移細(xì)胞中下調(diào)的GPNMB基因, 在多種情況下被證明增加腫瘤生長和轉(zhuǎn)移。而對(duì)于其余患者(HNSCC20,HNSCC25,HNSCC26,HNSCC28) ,淋巴結(jié)轉(zhuǎn)移的克隆結(jié)構(gòu)似乎與原發(fā)腫瘤相同。轉(zhuǎn)移和原發(fā)腫瘤細(xì)胞的拷貝數(shù)之間高度相關(guān)性(皮爾遜相關(guān)系數(shù)在0.79和0.89之間)表明 SCEVAN 可用于研究轉(zhuǎn)移癌的克隆進(jìn)化。
圖7:使用SCEVAN在4個(gè)原發(fā)腫瘤和淋巴結(jié)轉(zhuǎn)移鑒定拷貝數(shù)變異并發(fā)現(xiàn)存在高度相關(guān)性
5 總結(jié)
使用大量不同腫瘤類型,不同的單細(xì)胞技術(shù)的注釋數(shù)據(jù)集,該研究證實(shí) SCEVAN 比最先進(jìn)的方法能更準(zhǔn)確、更快的基于單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)檢測拷貝數(shù)變異(CNA),并根據(jù)CNA差異描繪實(shí)體腫瘤中的克隆亞結(jié)構(gòu),以及研究腫瘤的時(shí)間和亞克隆之間的演化。亞克隆的功能分析揭示了細(xì)胞狀態(tài)的驅(qū)動(dòng)因素,以及原發(fā)性和轉(zhuǎn)移性腫瘤之間差異的驅(qū)動(dòng)基因。使用SCEVAN可擴(kuò)展單細(xì)胞數(shù)據(jù)的分析范圍,通過找到的拷貝數(shù)差異,可結(jié)合甲基化等數(shù)據(jù),進(jìn)行多組學(xué)分析,從而進(jìn)一步研究腫瘤的微環(huán)境及異質(zhì)性。