單細胞RNA測序(scRNA-seq)可以識別組織內(nèi)的細胞亞群。scRNA-seq技術(shù)的出現(xiàn),使得人們可以對細胞的基因組學(xué)、轉(zhuǎn)錄組學(xué)以及表觀基因組學(xué)進行精準的研究。但不能捕捉它們的空間分布,也不能揭示細胞間通訊的局部網(wǎng)絡(luò)。而空間轉(zhuǎn)錄學(xué)方法正好相反,于是單細胞測序聯(lián)合空間轉(zhuǎn)錄組測序分析就這樣誕生了。同時,一個關(guān)鍵問題誕生——如何將這兩者整合?
☆本文看點☆
一、單細胞測序聯(lián)合空間轉(zhuǎn)錄組測序一般流程
二、單細胞測序聯(lián)合空間轉(zhuǎn)錄組整合方法
三、Cell2location介紹
四、小編總結(jié)
一、單細胞測序聯(lián)合空間轉(zhuǎn)錄組測序一般流程
Nature雜志及其子刊每年都會總結(jié)一年中的研究成果,根據(jù)每個領(lǐng)域的重大發(fā)現(xiàn),推選出最有價值的技術(shù)為年度技術(shù)。2018年的“單細胞轉(zhuǎn)錄組技術(shù)”、2019年的“單細胞多組學(xué)技術(shù)”以及2020年年度技術(shù)方法“空間轉(zhuǎn)錄組技術(shù)”無疑不證明了單細胞和空間分辨率轉(zhuǎn)錄組技術(shù)應(yīng)用的重要性。在轉(zhuǎn)錄組技術(shù)的發(fā)展的歷程中,我們已經(jīng)有了bulk RNA-seq、scRNA-seq、ST RNA-seq(空間轉(zhuǎn)錄組測序)。bulk RNA-seq對大量混合細胞進行轉(zhuǎn)錄組測序,但是該方法只能獲得基因平均表達水平。scRNA-seq對細胞基因表達的認識推進到單細胞的層面,目前已在發(fā)現(xiàn)新的細胞類型、揭示細胞異質(zhì)性等方面展現(xiàn)出優(yōu)勢。但單細胞測序會失去了組織空間位置信息。ST RNA-seq可以同時獲得細胞的空間位置信息和基因表達數(shù)據(jù),但目前還達不到單細胞精度。在這里,作者提出了一種結(jié)合單細胞RNA序列(scRNA-seq)和ST(空間轉(zhuǎn)錄組)法來研究的方法。在這種方法中,首先對腫瘤(處理組)組織進行分割,從其中一部分產(chǎn)生單細胞懸浮液,并對其進行scRNA-seq處理,以識別組織中存在的細胞群體。從剩余的組織中,冷凍切片使用ST方法進行處理,以提供整個組織中表達的轉(zhuǎn)錄本的無偏圖譜。然后,就是本文關(guān)注的重點:通過引入什么樣的方法來整合這兩個數(shù)據(jù)集。
二、單細胞測序聯(lián)合空間轉(zhuǎn)錄組整合方法
鑒于空間轉(zhuǎn)錄組學(xué)方法還不能在組織中產(chǎn)生深層單細胞分辨率的轉(zhuǎn)錄組圖譜,能夠成功整合單細胞和空間轉(zhuǎn)錄組數(shù)據(jù)的分析將有助于理解細胞類型分布的結(jié)構(gòu)以及構(gòu)成這種結(jié)構(gòu)的細胞間通訊的假定機制。整合scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)有兩種主要方法:去卷積(Deconvolution)和映射(Mapping)。去卷積旨在根據(jù)單細胞數(shù)據(jù),從每個捕獲點的mRNA轉(zhuǎn)錄物的混合物中分離出離散的細胞亞群;映射有兩方面:將指定的基于scRNA的細胞亞型定位到HPRI(high-plex RNA imaging)圖譜上的每個細胞和將每個scRNA-seq細胞定位到組織的特定區(qū)域。
去卷積:從單個捕獲點中分離出離散的細胞亞型。去卷積有兩種主要方法:推斷一個特定spot的細胞亞型比例和對一個特定的空間轉(zhuǎn)錄組spot進行評分,以確定它與單個細胞亞型的對應(yīng)程度。
Inference-based的去卷積技術(shù)估計每個細胞類型在特定捕獲點的比例。這種形式的去卷積的方法之一是采用基于統(tǒng)計回歸的模型,并使用scRNA-seq數(shù)據(jù)矩陣來去卷積每個捕獲點的mRNA混合物。估計每個細胞類型在給定捕獲點中的確切比例的補充方法是通過貝葉斯統(tǒng)計框架,將概率分布與scRNA-seq數(shù)據(jù)的基因計數(shù)分布相適應(yīng)。如:Spotlight的基準策略是最徹底的:評估細胞類型檢測的準確性、敏感性和特異性,以及與ground truth的總體相關(guān)性。
有許多基于富集分數(shù)的去卷積技術(shù),例如Seurat 3.0通過從該細胞類型的基因組的平均相對表達量中減去對照基因組的平均相對表達量,計算給定捕獲點的細胞類型的相對表達量分數(shù)。多模態(tài)交叉分析(MIA)根據(jù)scRNA-seq建立的細胞類型基因程序和根據(jù)空間條形碼數(shù)據(jù)建立的組織類型基因程序之間的重疊,以闡明在每個區(qū)域中某些細胞類型的富集或減少程度。
映射:以單細胞分辨率創(chuàng)建空間分辨率的細胞類型映射。就像去卷積一樣,繪制圖譜的第一步是基于scRNA-seq數(shù)據(jù)建立細胞亞型。然后,映射的主要挑戰(zhàn)是將基于scRNA-seq的細胞類型從HPRI數(shù)據(jù)分配到每個細胞上。對14種已發(fā)表的算法進行系統(tǒng)評估,這些算法通過基于聚類的分析實現(xiàn)了映射的批量校正策略,確定了三種最有效地將scRNA-seq數(shù)據(jù)與單細胞分辨率空間數(shù)據(jù)集成的算法:LIGER、Seurat Integration(來自Seurat 3.0)和Harmony。這三種算法最終都是使用不同的方法將聚類集成到低維空間中,通過對聚類的群體檢測得到細胞類型2。
三、Cell2location介紹
下面我就來具體介紹Cell2location這項整合方法。為什么選擇這個方法呢?因為我覺得這個方法有潛力,作者通過比較當前其他主流的方法,證明Cell2location方法在繪制細粒度細胞類型上具有優(yōu)勢。簡單來說fine-grained指的就是細粒度,fine-grained classification是細粒度的圖像分類。與之相對應(yīng)的是coarse-grained classification(粗粒度)。我舉個栗子。粗粒度就是可以在水果中分辨這是蘋果,但是細粒度可以分辨這是哪一種蘋果。
首先,因為基于陣列的mRNA捕獲目前與組織中的細胞邊界不匹配。因此,每個空間位置對應(yīng)于幾種細胞類型或多種細胞類型的不同部分。其次,空間RNA-Seq測量因不同的變異源而混亂。因為
1)不同組織位置的細胞數(shù)量不同。
2)不同細胞和細胞類型的總mRNA含量不同。
3)薄組織切片捕獲每個細胞體積的不同部分。
計算方法需要對所有這些因素進行適當?shù)慕:涂紤]。在這里,作者介紹了cell2location,一個原則性和通用性強的貝葉斯模型,用于在空間轉(zhuǎn)錄數(shù)據(jù)中全面繪制細胞類型圖。Cell2location通過整合來自特定組織的單細胞或細胞核RNA-seq和空間轉(zhuǎn)錄數(shù)據(jù)來繪制細胞類型的空間分布圖。
本篇文章3發(fā)表在期刊: Nature Biotechnology 該期刊在最近一年的影響因子: 54.908,水平很高。
Cell2location工作流程的第一步是根據(jù)單細胞和單核RAN-seq圖譜估計參考細胞類型簽名。
在第二步中,cell2location使用這些參考簽名和一個或多個空間轉(zhuǎn)錄數(shù)據(jù)集作為輸入,將各個空間位置的mRNA計數(shù)分解為參考細胞類型
Cell2location軟件在計算上和識別位于同一位置的細胞類型上是高效的,并且與scvi-tools框架集成在一起,并附帶一套下游分析工具。為了驗證Cell2location,作者最初考慮了生成的模擬數(shù)據(jù),這些數(shù)據(jù)反映了ubiquitous、regional細胞類型之間的不同細胞豐度模式。然后,作者使用Cell2location來估計各個位置不同細胞類型的細胞類型比例。將這些估計值與模擬的細胞類型比例進行比較。結(jié)果顯示,無論細胞豐度模式如何,Cell2location都能高精度地繪制細胞類型,包括低豐度和區(qū)域性細胞類型。接下來,作者將Cell2location與最近提出的從空間轉(zhuǎn)錄數(shù)據(jù)中估計相對細胞類型豐度的方法進行了比較(Stereoscope, Seurat, RCTD, NNLS(AutoGeneS) 和 SpotLIGHT)。在考慮的細胞豐度模式中,作者發(fā)現(xiàn)Cell2location比其他方法能更準確地估計不同位置的細胞類型比例4。
作者首先將該模型應(yīng)用于來自小鼠大腦的數(shù)據(jù),其特征是不同類型的神經(jīng)細胞在大腦區(qū)域之間組織成具有良好特征的空間結(jié)構(gòu),從而是測試空間基因組學(xué)的典型用例。作者從端腦和間腦多個區(qū)域的相鄰小鼠腦切片中生成了匹配的單核(sn)和空間RNA-seq圖譜。為了評估空間圖譜中的生物學(xué)和器官內(nèi)技術(shù)差異,作者分析了兩個小鼠大腦的連續(xù)組織切片(兩個來自兩個動物的匹配切片,以及一個額外的snRNA-seq切片),創(chuàng)建了一個豐富的轉(zhuǎn)錄數(shù)據(jù)集。在這些細胞中,44個簇被識別為大腦中預(yù)期的細胞類型,包括星形膠質(zhì)細胞、興奮性或抑制性神經(jīng)元或膠質(zhì)細胞亞型。作者應(yīng)用cell2location將這些細胞類型繪制到小鼠大腦的空間位置。由此得到的細胞類型圖譜與先前文獻中預(yù)期的解剖位置明顯一致。并且,作者的結(jié)果捕捉到了不同的細胞類型,分辨了廣泛的區(qū)域性細胞類型,如丘腦的興奮性神經(jīng)元、白質(zhì)的少突膠質(zhì)細胞,皮質(zhì)中間神經(jīng)元等罕見亞型以及次區(qū)域亞型,如跨皮層的興奮性神經(jīng)元。在相鄰的組織切片和復(fù)制動物之間,細胞類型豐度的估計高度一致。接下來,為了評估Cell2Location方法與其他方法的特異性,作者繪制了一個現(xiàn)有的大型scRAN-seq數(shù)據(jù)集,其中包括來自多個腦區(qū)的細胞類型。
當作者將這些細胞類型映射到軀體感覺(SSp)皮層數(shù)據(jù)時,作者預(yù)計陰性細胞類型被排除在外,只有陽性細胞類型被分配了相當大的細胞類型比例。結(jié)果證明,與陽性細胞類型相比,Cell2Location給出的陰性細胞比例要低得多。相比之下,其他方法顯得比較弱。這表明cell2location準確地排除了不應(yīng)該出現(xiàn)在空間數(shù)據(jù)集中的參考單元類型。最后,為了展示cell2location在空間轉(zhuǎn)錄技術(shù)中的多功能性,作者將鼠腦snRNA-seq參考映射到(10-μm空間分辨率)Slide-seq數(shù)據(jù)集。Cell2location在Slide-Seq空間數(shù)據(jù)中解析細胞類型,包括跨越海馬分區(qū)和皮質(zhì)層的精細解剖亞型。
總而言之,作者的結(jié)果表明,Cell2location在描繪不同的腦細胞類型上具有很高的準確性和重復(fù)性,并且該方法廣泛適用于空間轉(zhuǎn)錄技術(shù)。
與小鼠腦不同,人類淋巴結(jié)的特征是動態(tài)的微環(huán)境,有許多空間上相互交錯的細胞群體。作者分析了來自10x Genomics公開的人類淋巴結(jié)的空間數(shù)據(jù)集,并通過整合來73,260個細胞組成的人類次級淋巴器官的scRNA-seq數(shù)據(jù)集,繪制了包含34種參考細胞類型的綜合圖譜。淋巴結(jié)標本的組織學(xué)檢查顯示有多個生發(fā)中心(GC)。相應(yīng)地,用Cell2location后,可以很容易地識別淋巴結(jié)組織中預(yù)期的主要區(qū)域,包括T細胞區(qū)和B細胞區(qū),以及帶有濾泡樹突狀細胞((FDCs)的生發(fā)中心(GC)。作者對來自Cell2location的細胞類型豐度估計進行了非負矩陣分解(NMF)。作者觀察到,NMF鑒定的細胞類型組與已知的功能相關(guān)的淋巴結(jié)細胞隔間相對應(yīng)。綜上所述,作者的結(jié)果表明,cell2location可以定位以空間交錯的細胞類型為特征的復(fù)雜組織。
三、cell2location用來繪制精細免疫細胞
細胞圖譜研究極大地擴展了人體組織中細粒度細胞類型的目錄,這通常是理解組織功能和病理學(xué)的關(guān)鍵興趣。作者考慮了兩種人體組織中的免疫細胞群,在這兩種組織中可以識別出許多具有特殊免疫功能的優(yōu)良亞型。最初,作者檢查了人體淋巴結(jié)中GC特異性免疫細胞類型。作者利用Visium組織學(xué)圖像對GC的解剖位置進行了注釋,并評估了將六種GC細胞類型映射到預(yù)期GC位置的準確性。盡管所有方法對于映射不同的細胞類型(如FDC)都達到了很高的精度,Cell2location在定位細粒度細胞類型(如GC T濾泡輔助細胞)方面明顯更準確(圖3)。
作者還檢查了人類腸道中的免疫細胞群。人類腸道為空間圖譜提供了一個極具挑戰(zhàn)性的應(yīng)用,因為它包含了大量轉(zhuǎn)錄上細粒度的免疫和非免疫細胞類型,免疫細胞在相對較小的淋巴濾泡的組織區(qū)域中富集。作者通過結(jié)合兒童和成人腸道的scRNA-seq數(shù)據(jù)集定義了全面的細胞類型參考特征,該數(shù)據(jù)集富含免疫(CD45+)細胞和同等比例的非免疫(CD45?)亞型,總共跨越153,901個細胞的76種細胞類型。作者將這些參考細胞類型映射到兩個成人結(jié)腸的空間數(shù)據(jù)集,在該數(shù)據(jù)集中,作者使用組織學(xué)和Visium數(shù)據(jù)中的標記基因表達來注釋淋巴濾泡的位置。相應(yīng)地,在用Cell2location后,可以很容易地識別出結(jié)腸內(nèi)預(yù)期的主要區(qū)域。同上,盡管其他的方法對于不同的細胞類型,如循環(huán)B細胞,都達到了很高的精度,但細胞定位在繪制細粒度細胞類型方面再次獲得了明顯更高的精度。其他的方法要么無法定位幾種細致的免疫細胞類型,如Viium數(shù)據(jù)中的FCRL4+記憶B細胞和Tfh細胞,要么映射它們的特異性較低。綜上所述,這些結(jié)果表明,在繪制復(fù)雜組織中轉(zhuǎn)錄細粒細胞類型的圖譜方面,cell2location優(yōu)于其他方法。
四、小編總結(jié):
基于單細胞組學(xué)在近三年發(fā)展起來的新興領(lǐng)域,“單細胞多組學(xué)技術(shù)”和“空間轉(zhuǎn)錄組技術(shù)”先后在2019年和2020年被Nature Methods評為年度技術(shù)方法。時間和空間維度多維研究技術(shù)結(jié)合,將以全新研究思路出發(fā),既能夠獲得單個細胞間異質(zhì)性,又能獲得細胞在組織空間上的結(jié)構(gòu)位置信息,發(fā)現(xiàn)更多未知且精細化結(jié)果??偠灾?,單細胞測序+空間轉(zhuǎn)錄組測序:優(yōu)勢互補,同時獲得細胞類型群體,以及基因表達和細胞的空間位置信息。如果喜歡本文就mark一下“在看”,順便給小編一個贊吧~
參考文獻
1. Moncada R, Barkley D, Wagner F, et al. Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. Nat Biotechnol. 2020;38(3):333-342.
2. Longo SK, Guo MG, Ji AL, et al. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics. Nat Rev Genet. 2021;22(10):627-644.
3. Kleshchevnikov V, Shmatko A, Dann E, et al. Cell2location maps fine-grained cell types in spatial transcriptomics. Nat Biotechnol. 2022.
4. Kleshchevnikov V, Shmatko A, Dann E, et al. Comprehensive mapping of tissue cell architecture via integrated single cell and spatial transcriptomics. bioRxiv. 2020:2020.2011.2015.378125.