導讀:了解不同組織在空間結(jié)構(gòu)上的細胞異質(zhì)性和發(fā)育動態(tài),對生命科學意義深遠??臻g轉(zhuǎn)錄組技術(shù),使得研究者可以生成并驗證假設(shè),并和其它類型的數(shù)據(jù)結(jié)合。8月Nature的綜述,先講了評估不同空間轉(zhuǎn)錄組技術(shù)的6個指標,3種技術(shù)路線。之后分別在發(fā)育,疾病和生理上,論述空間組的應(yīng)用。之后重點談?wù)撛谔剿餍缘臄?shù)據(jù)分析中,5個不同的分析目標策略和3種策略。最后探討了如何將空間組數(shù)據(jù)和其它類型的數(shù)據(jù)整合。
https://www.nature.com/articles/s41586-021-03634-9
1)空間組技術(shù)概述及應(yīng)用方向
從技術(shù)路線上,空間組測序分為基于二代測序,通過加ployT和代表空間信息的接頭的方法,以及原位測序,原位雜交之后,分別比對,從而得到各個方格的基因表達量矩陣三種方法。
圖1 三種空間轉(zhuǎn)錄組的實驗策略
評價不同技術(shù)有六個指標,依次是通量(一次能檢測的基因數(shù))測序信息(是否能檢測全長轉(zhuǎn)錄本,從而檢測基因融合,剪切同構(gòu)體及單堿基突變)敏感性(相同大小的方格內(nèi),能夠檢測到的基因數(shù),例如基于NGS的技術(shù),其敏感度就不如原位測序),分辨率(每個方格的大小,光學成像的方法,有對應(yīng)的最小分辨率極限),切片大?。繌埱衅拿娣e越大,能夠考察的組織越大),可行性(技術(shù)能否被廣泛地使用)。
基于NGS的方法,目前是發(fā)展最快的,潛力最大的。其在單細胞測序的基礎(chǔ)上研發(fā),其主要代表是10X,其中每個區(qū)域有對應(yīng)的barcode,通過比對得到該序列的來源。其當前的分辨率在55um,每個方格可以檢出上萬個基因,切片面積在10平方毫米,而新推出的Stereo-seq,其分辨率在納米級。而另外兩種基于影像的方法,在得出表達量矩陣后,需要手動或用算法分出細胞邊界。
在發(fā)育上,不同時間的空間轉(zhuǎn)錄數(shù)據(jù),可以闡明各組織的正常情況的發(fā)育地圖和動態(tài),指出每個階段,不同相對位置的關(guān)鍵基因;對于患病組織,可以找出治病基因出現(xiàn)的時間和空間順序;指出癌變組織和正常組織間的邊界;對于神經(jīng)退行疾病,炎癥和感染等生理過程,空間轉(zhuǎn)錄也可以指出其發(fā)生過程中何時何處哪些關(guān)鍵基因發(fā)生了變化。
2)空間轉(zhuǎn)錄組的分析套路
空間轉(zhuǎn)錄組的生信分析,起點是不同位置的各基因的表達矩陣,其第一步是去除低質(zhì)量的數(shù)據(jù),提高信噪比,常用的方法包含Giotto,Seurat,STutility等包,對數(shù)據(jù)質(zhì)量的評估,包括檢測到的基因總數(shù),以及每個區(qū)域檢測出的平均基因數(shù)。由于臨近的區(qū)域內(nèi)基因表達量相近,可以通過滑動窗口,來提升每個區(qū)域檢測的基因數(shù)(靈敏度),通過除以轉(zhuǎn)錄本總量,或負二項回歸的方法進行標準化,再通過數(shù)據(jù)縮放,使得每個方格的平均值和方差相等。
歸一化的基因表達矩陣,是接下來各類探索性分析的統(tǒng)一輸入(下圖中間的部分),由于空間轉(zhuǎn)錄數(shù)據(jù)的高維度,在分析前,難以預(yù)設(shè)計劃,需要根據(jù)分析的結(jié)果,調(diào)整下一步的分析計劃,因此這樣的分析是探索性的。
圖2 五種探索性分析的套路
聚類是識別成一組具有相似轉(zhuǎn)錄組的點在空間上的聚集情況。通過聚類(例如UMAP,tsne或針對空間數(shù)據(jù)開發(fā)的聚類算法,如BayesSpace),可以識別共表達的區(qū)域,以及與細胞類型或細胞狀態(tài)相對應(yīng)的基因模塊。
識別高度可變的基因,通常是可以根據(jù)它們在組織中的分布情況,對其空間自相關(guān)情況進行評分,例如SpatialDE ,利用高斯過程回歸,可將給定基因的表達變異性分解為空間變異性和非空間分量。
由于基因是共同表達的,通過打分函數(shù),可以將一組表達量相似基因,作為一個單基因表達譜,從而以這種方式,相比單基因的分析方法,更好地總結(jié)組織在空間上的功能特性,最簡單的可通過對集合內(nèi)的基因取平均值,或者結(jié)合單細胞數(shù)據(jù),進行打分。
要想解釋空間組發(fā)現(xiàn)的數(shù)據(jù),需要和單細胞或其它來源的先驗知識進行整合,這就需要根據(jù)轉(zhuǎn)錄信息,對于不具備單細胞分辨率的方法,這意味著預(yù)估各個方格內(nèi)的細胞類型及分布。而對于亞細胞級的方法,難點在于將細胞圈出,并確定不同細胞器對應(yīng)的方格。
關(guān)聯(lián):空間轉(zhuǎn)錄組學是非常適合鑒定基因和組織區(qū)域的轉(zhuǎn)錄的相似性、差異性,不同區(qū)域間的空間重疊,或者發(fā)育或者功能上的相關(guān)性。當標注細胞后,還可以檢出受體和配體之間的信號傳遞和相互作用。
圖3 假設(shè)驅(qū)動的空間組研究范例
在實驗設(shè)計上,空間組即可以用來健康組織,期望能揭示意想不到的變化和描述新的假設(shè),如圖2所示,也可以去傳統(tǒng)的假設(shè)驅(qū)動行,用以驗證假設(shè),如圖3所示。例如通過聚類識別協(xié)同變異基因,并根據(jù)它們的所在細胞的特征,找出受體和配體對的高表達子集用于分析細胞間的通信;通過聚類,之后對同類基因打分后,得到不同區(qū)域的得分,說明不同區(qū)域的基因表達存在差異;或者找出不同區(qū)域的細胞類型的差異。
圖4 探索性的空間組研究全流程
以上兩種分析,其各自對應(yīng)完整的實驗設(shè)計,如上圖所示。對于探索性的研究,通過不同位置,不同時間的切片(發(fā)育),或者受到藥物,基因編輯或感染影響前后的組織。通過生信分析,找出差異基因,之后通過染色或原位雜交進行驗證。
圖5 假設(shè)驗證型的空間組研究全流程
另一類假設(shè)驗證型,需要收集多份時間組和對照組在相近條件下的組織切片,測序后找出統(tǒng)計顯著的差異,之后的驗證可以通過臨床數(shù)據(jù),體外或體內(nèi)干預(yù)的方式進行。
3)未來技術(shù)前景的展望
隨著空間轉(zhuǎn)錄技術(shù)的分辨率和靈敏度的提高,通過高分辨率影像數(shù)據(jù)的融合,可以進一步提升分辨率。在亞細胞分辨率,染色質(zhì)的空間組織可能提供了在不同情況下,其是如何調(diào)節(jié)基因表達的線索。而結(jié)合深度學習,可提升組織病理學切片的可解釋性,增強其在臨床決策中的應(yīng)用。
另一個方向,是集成原位基因組和原位組蛋白標記的空間分布數(shù)據(jù)。通過對特定位置的細胞進行全基因組測序,并檢測其蛋白質(zhì)組成,可以加深我們對基因組組織和功能,以及翻譯后蛋白質(zhì)修飾及其在疾病中發(fā)揮功能的了解。
每個細胞都和其相鄰的細胞最相似,但多細胞卻能產(chǎn)生復雜多變的時空模式。隨著技術(shù)進步,系統(tǒng)地分析更大的組織區(qū)域成為可能,可用于重建3D 器官或生物體層面的細胞表達譜,并可視化轉(zhuǎn)錄組的變化,最終解決多細胞空間模式是如何從細胞水平的特性中涌現(xiàn)出來的這一問題。