將空間組數據和單細胞數據聯(lián)合分析的關鍵步驟,是判斷出空間不同位置對應那類細胞。這被稱為解卷積。雖然已有多種解卷積的方法,然而這些方法,都忽略了空間轉錄組,其實是帶空間坐標的bulk轉錄組,一個位置上包含了多個細胞,也有可能屬于多種不同的細胞類型。然而現有的解卷積方法,只會將一個位置標記為唯一的細胞類型。
而Nature Biotechnology 4月的論文,提出的DestVI則可以避免該問題,通過對每一個細胞類型構建生成模型,該方法可以算出空間每個位置點上不同類型細胞出現的比例。相比之前的方法,在10x Visuim數據上,該方法可以使基因表達量填充效果更好。通過將該方法應用于小鼠的淋巴和腫瘤組織,揭示了腫瘤異質性以及免疫系統(tǒng)對相對位置不同的腫瘤,產生了不同的反應。
圖1 DestVi的方法學示意圖
對組織切片進行空間組測序的同時,對臨近的樣本進行單細胞測序,通過對單細胞數據進行聚類,可以知道該空間組樣本中的細胞類型。之后對每一個細胞類型,通過自編碼器,在隱空間中構建低維表征。同時,對于空間組中每個位點,也進使用自編碼器構建每個位置,代表細胞狀態(tài)的低維表征。之后根據貝葉斯推斷,使用單細胞得出的低維表征,來擬合空間位置上每個點得到的低維表征,得到每個位點上不同細胞類型的比例,并根據空間位置的低維表征,對每個細胞類型分別進行基因表達量填充,根據周圍細胞的表達量,去推算該細胞的表達量,并將由于捕獲不完全而表達量為0的基因改為非零,避免表達量矩陣過于稀疏。
2)DestVi的方法學優(yōu)勢
圖2:模擬數據的構建方法
之后的方法學驗證,在構建模擬數據時,該方法也更符合真實情況。之前的方法,是將已標記的真實單細胞數據,按照已知比例在空間不同位置組合,形成模擬的空間組數據。新方法在這基礎之上,構建過程中增加了對單細胞數據的隨機抽樣,這樣模擬了真實的空間組測序中,不是每個位點都能捕獲該位置細胞表達的所有基因,這使得模擬數據更為真實。
圖3:模擬數據上,和其它方法的對比柱狀圖
之后通過和已知標簽的斯皮爾曼相關系數,來衡量不同解卷積方法的性能,圖d縱軸相關系數越高,細胞類型的判別越準確;而圖e展示的,基于不同解卷積方法得出的結果,進行表達量填充后的斯皮爾曼相關系數,可以看到兩者都是DestVI效果最佳。
針對下游分析,作者提出了兩種自動化的分析流程,可針對單切片,也可在多切片之間比較。第一部分是在細胞類型的層面,根據GearyC自相關統(tǒng)計量,找出在空間上分布于特殊的位置的細胞類型(例如那些沒有均勻分布的細胞類型)。第二階段的分析精度更高,關注每個空間位置內細胞類型的可變性,這是現有方法無法實現的功能。首先選擇每種類型的細胞比例足夠高的空間位置,之后DestVi會提出了一種自動估計該過程中特定于細胞類型的閾值的方法,當然這個閾值也可以手動調節(jié)。之后考慮每個空間位置上,不同細胞類型的不同閾值,并計算各自的Geary‘s C統(tǒng)計量,只考慮比例高于的點。之后算法來會計算這些空間位置上細胞類型的變化情況。這一分析有助于突出和可視化每一種細胞類型中最占主導地位的轉錄程序,并探索它們對細胞位置的依賴性。為此,DestVi通過加權PCA推斷空間不同位置點的狀態(tài),還可識別了與每個加權主成分相關的基因,并報告了富集的基因簽名。
DestVI還提供了一種自然的方法來評估不同條件樣本間,或在同一組織切片之間差異的重要性。具體來說,對于每種細胞類型,我們可以通過比較各自的Geary‘s C統(tǒng)計量,來比較一種特定類型的細胞傾向于在特定的生態(tài)位中共定位的程度。在基因水平上,我們可以比較不同的條件或不同的組織區(qū)域,以識別細胞類型特異性的差異表達。這種分析直接來自于我們對數據的概率表示,允許不確定性量化和假設檢驗。
3) DestVi在小鼠淋巴結和腦腫瘤上的應用
之后在真實數據上,使用DestV。測試數據是在小鼠的淋巴結中注入單核細胞或PBS,來模擬免疫系統(tǒng)應對病原菌入侵的情況。圖b展示的是空間轉錄組的情況,圖c對應的是單細胞聚類的情況,之后對每個位置不同細胞,計算其自相關系數,系數越高說該類細胞的空間表達的特征越具有空間相似性,圖E對應的是每個細胞在空間不同位置上的含量分布。可以看到B細胞,單核細胞的自相關系數最大,其對應的空間表達模式也越明顯(例如B細胞聚集于淋巴結外緣,單核細胞的分布不對稱)。由此通過DestVI,可以確定要關注的細胞。之后將單細胞和空間組的低維表征合在一起進行表征(圖J和K),并通過設色熱圖對IFN-1基因的表達量進行可視化,發(fā)現B細胞對應的區(qū)域,IFN-1基因表達量高,而在單細胞數據的UMAP數據中,存在細胞間差異。之后對比不同類型的樣本B細胞上有哪些基因的表達量存在差異,得到圖L,其中差異顯著的基因經過免疫熒光(圖M)可加以驗證。
圖3 DestVI在小鼠淋巴結數據上的應用
之后對小鼠移植腫瘤后的免疫反應,進行單細胞和空間組測序后,使用DestVI進行解卷積。聚類之后發(fā)現腫瘤細胞,單核和巨噬細胞的空間自相關系數都接近1(圖4,d),說明這兩種細胞的分布很均勻。從圖E也可以看到,NK細胞和巨噬細胞均勻的進入腫瘤組織,試圖殺死腫瘤。而抗原呈遞的DC細胞和輔助T細胞受體的CD8細胞都位于腫瘤邊緣,標志了腫瘤的邊界(圖e)。
圖4:在小鼠植入腫瘤中應用DestVI
由于對抗腫瘤的主要是單核細胞和巨噬細胞,之后對其進行了進一步研究,發(fā)現了其根據基因表達通路,可以分為3個亞群,在單細胞降維上,可以看出其對應通路的基因表達量存在差異,但無法通過聚類分開(圖4.J),在空間分布上,這三類巨噬細胞也存在空間差異。這說明相比之前的解卷積方法,DestVI不會遺漏由于細胞亞群的存在,而被忽略的空間表達模式。同時結合在免疫和腫瘤這兩種差異明顯的組織樣本,說明該方法的魯棒性,適合不同來源的樣本。
總結
通過深度生成模型,DestVI可以生成連續(xù)的細胞類型梯度,相比之前離散的解卷積方法,其準確性更高,由于利用了臨近位置細胞類型的消息,表達量填充更準確。通過低維表征,DestVI還可以考察單細胞聚類無法區(qū)分,但在空間上呈現表達量差異的細胞亞群,找出比較同類細胞內部那些基因的表達量差異。由于存在上述優(yōu)勢,預期DestVI將為空間轉錄數據提供必要的分辨率水平,并有助于我們進一步理解局部信號環(huán)境,以及它們如何影響細胞功能和空間線索,如特定細胞亞群之間的相互作用,化學梯度和代謝物互作。