NGS技術未來的一大方向,就是在對堿基進行測序的同時,記錄下檢測到的堿基來自的位置,通常是二維坐標系上的位置,有時還包括z軸這第三個維度。2021年12月15日,Nature主刊的論文,介紹了slide-DNA-seq技術,該技術可同時對DNA和mRNA進行原位測序的技術,并用其來研究癌組織的異質性。
細胞和組織的分化,受到其內(nèi)部DNA和RNA差異,以及由周圍細胞組成的環(huán)境因素這兩者的共同影響。對于腫瘤組織,其形成的原因,更是歸因于細胞內(nèi)的基因變異(例如單堿基突變,拷貝數(shù)變異,染色體級別的基因重組),以及腫瘤微環(huán)境。如能同時對腫瘤組織的表型,以及其不同位置的基因進行檢測,就能量化地研究基因和環(huán)境的因素是如何影響腫瘤組織的生成的,并了解腫瘤組織的異質性和轉移,復發(fā)和抗藥性之間的關系。
之前的研究腫瘤異質性,要么是對不同階段的腫瘤組織,進行高深度測序,根據(jù)突變頻率的差異,來估算不同階段腫瘤的演化;要么在晚期的腫瘤組織中,用激光切除一小塊,對其進行測序。相比來說,新推出的slide-seq,可以在一個直徑3毫米的視野內(nèi),以10微米的分辨率,對每不同位置的聚苯乙烯珠子,添加對應空間位置的條形碼,標記空間位置,之后通過PCR擴增,實現(xiàn)DNA原位測序。在每個陣列中,包含2萬到4萬個柱子,每個珠子中,可以檢測到的DNA序列,約為165-421個。
slide-dna-seq的實驗流程
拿到slide dna-seq數(shù)據(jù)之后,標準的分析流程是怎樣了?該研究給出了可以兩種借鑒的套路,一是結合原位轉錄組數(shù)據(jù),一是結合單細胞全基因組測序。在第一種套路下,對腫瘤組織的相鄰切片,分別進行原位RNA測序,染色和免疫熒光檢測和slide dna-seq。對得到的帶有位置信息的DNA覆蓋度數(shù)據(jù),仿照空間轉錄組的模式,進行PCA降維,之后使用K-means聚類,將腫瘤組織分為幾個子類,如下圖所示的,該切片被分為了正常組織,以及兩種不同的腫瘤子克隆。
slide dna-seq分析方法:數(shù)據(jù)降維和聚類
為了說明對腫瘤組織分為兩個子類是有根據(jù)的,對不同類之間,不同位置上,染色體不同段之間的覆蓋度,使用雙邊置換檢驗計算P值,在不考慮多重比較的時候,將不同位置的p值以熱圖的形式展現(xiàn),如下圖,可以看到分出的兩個子克隆,在特定的染色體上的覆蓋度,存在顯著的差異,且出現(xiàn)差異的位置,和不同分類的邊界一致。將全部染色體的覆蓋度繪制為散點圖,其中藍色代表正常組織,紅色和綠色代表兩種腫瘤組織的亞克隆,將顯著差異的部分區(qū)分開,可以看出其的確存在顯著的差異。由于檢測的是Kras誘導的肺腫瘤,因此其特有的6號染色體的擴增差異顯著,而在其它區(qū)域的覆蓋度則是正常的。
不同聚類的染色體覆蓋的散點圖和差異區(qū)域的p值在空間上的熱圖
在對相鄰的組織切片,使用slide-RNA-seq進行原位RNA檢測后,通過使用單細胞轉錄組的數(shù)據(jù)進行投影,同樣可以將進行組織聚類,得到的結果,和slide dna-seq的數(shù)據(jù)是相似的。將不同亞克隆中,各個基因的表達量差異(橫軸)和這種差異事虛假的可能性(縱軸),以火山圖的方式展示(圖f),可以找出不同亞克隆之間的差異基因,通過將這些基因的表達量以熱圖形式展示,可以看到在兩個亞克隆之間,找出的差異基因在空間上是有顯著差異的。
對相鄰腫瘤切片,進行原位轉錄組測序,得出的聚類圖,差異基因火山圖
接下來,要回答的問題,是確定每個腫瘤克隆中的RNA的特征。對相鄰的slide-dna-seq和slide-rna-seq,分別聚類后,繪制不同聚類的結果,以及腫瘤組織的癌細胞密度圖。之后將不同亞群(橫軸)及不同密度的癌細胞中,關鍵基因能解釋多少差異以熱圖展示,可以發(fā)現(xiàn)兩個亞克隆,存在著不同的進化路徑。而不同位置的腫瘤組織中癌細胞密度的差異,也可以歸因于LGALS3,這個在腫瘤抑制中發(fā)揮作用的基因,以及PROMI基因,其和腸道內(nèi)平衡,再生和腫瘤生成有關。
另一種套路,是將原位轉錄組測序換成單細胞dna測序。由于在10微米的分辨率上,是存在多個細胞的,因此該套路的最初步驟,和前面描述的類似。對短序列進行比對后得到1兆區(qū)域內(nèi)的覆蓋度信息(平滑處理,去除實驗帶來的波動),PCA聚類后找出差異的區(qū)域。但區(qū)別在于,對單細胞DNA測序的數(shù)據(jù),同樣比對后計算不同區(qū)域的覆蓋度,之后距離,再將使用單細胞DNA測序得到的聚類投影到slide dna-seq上,
使用slide dna-seq和單細胞WGS對腫瘤異質性進行多組學分析的套路
從圖e和f可以看出,使用單細胞wgs和slide dna-seq,對相鄰組織切片可以得出相近的結果,即都是chr8上,不同腫瘤組織間存在顯著差異,這也可以從圖g的平均覆蓋度散點圖中看出,藍色代表的亞型,其在chr8上的覆蓋深度更高,意味著其中的拷貝數(shù)更多。而從圖c的染色切片和聚類結果的對比,可以看出兩者有類似的空間模式。
總結dna-slide-seq技術,通過提供高分辨率,高敏感度的原位dna測序,該方法適合對具有異質性的腫瘤組織,結合原位轉錄組,進行多組學分析,可采用于最直接的基因組覆蓋度的差異,以描述不同位置腫瘤的染色體拷貝數(shù)差異,是如何于差異位置的基因表達量差異相一致的。而結合單細胞全基因數(shù)據(jù),則可以將相鄰部分的數(shù)據(jù)整合,考察不同位置腫瘤組織中,癌細胞雜合缺失程度的變化。
未來,使用dna-slide-seq可以構建描述腫瘤組織隨時間演化過程的數(shù)據(jù)庫,或將該技術應用于臨床診斷,通過判別腫瘤亞型,找出和生產(chǎn)率,轉移及復發(fā)有關的亞型,并定位關鍵基因。該技術不僅僅適用于腫瘤組織,其實驗的關鍵,即在擴增前,在組織原位加上標記序列,可用于空間宏基因組,或檢測空間不同位置的甲基化或染色質開放性水平。
Tongtong Zhao, Zachary D. Chiang et al.Spatialgenomics enables multi-modal study of clonal heterogeneity in tissues