癌癥分型一直是生信的研究熱點(diǎn),在各種期刊上大家都可以看到癌癥分型類的文章。今天小編給大家?guī)?lái)的這篇文章是今年6月30日發(fā)表在Nature Genetics(IF=41.307)上的結(jié)直腸癌分型文章,作者通過(guò)結(jié)腸癌單細(xì)胞數(shù)據(jù),專注于上皮細(xì)胞,對(duì)結(jié)直腸癌CMS分類進(jìn)行了細(xì)化。文章內(nèi)容豐富,快來(lái)和小編一起看看作者是如何將癌癥分型發(fā)表在41分神刊上的吧!
一.研究背景
結(jié)直腸癌(CRC)是一種異質(zhì)性疾病?;赽ulk轉(zhuǎn)錄組基因表達(dá)譜,國(guó)際聯(lián)盟在2015年確定了四種結(jié)腸直腸癌的共識(shí)分子亞型(CMS)分類(CMS1-4),分別以豐富的免疫浸潤(rùn)、典型WNT和Myc激活、代謝失調(diào)和間充質(zhì)纖維化反應(yīng)為特征,并在今后的多個(gè)研究中反復(fù)出現(xiàn)。由于bulk轉(zhuǎn)錄組測(cè)序測(cè)量組織內(nèi)基因的總表達(dá),細(xì)胞的轉(zhuǎn)錄狀態(tài)以及細(xì)胞比例和腫瘤微環(huán)境的相互作用是模糊的。因此,作者通過(guò)分析了63例患者的373,058個(gè)單細(xì)胞轉(zhuǎn)錄組(scRNA-seq),重點(diǎn)關(guān)注49,155個(gè)上皮細(xì)胞?;诓煌幕虮磉_(dá)、DNA拷貝數(shù)和基因調(diào)節(jié)網(wǎng)絡(luò),作者確定了惡性細(xì)胞的普遍存在的遺傳和轉(zhuǎn)錄組二分類,細(xì)化了CRC的CMS分類,并在bulk轉(zhuǎn)錄組中概括了這些亞型。
二.主要結(jié)果
1.細(xì)胞類型注釋
作者scRNA-seq數(shù)據(jù)進(jìn)行過(guò)濾,以丟棄低質(zhì)量的細(xì)胞和雙細(xì)胞,定義了11種主要的細(xì)胞類型。為了識(shí)別上皮細(xì)胞亞型,作者使用DUBStepR對(duì)CRC-SG1隊(duì)列的上皮細(xì)胞進(jìn)行從頭聚類以進(jìn)行特征選擇,然后使用初始聚類之間的差異表達(dá)基因(DEGs)重新聚類細(xì)胞。其中一個(gè)cluster包含了正常樣本的所有上皮細(xì)胞和少部分(23.4%)來(lái)自腫瘤樣本的細(xì)胞,這少部分細(xì)胞為腫瘤樣本中的正常上皮細(xì)胞;來(lái)自腫瘤樣本的惡性細(xì)胞形成了患者特異性cluster,每個(gè)cluster都包括來(lái)自同一腫瘤不同部位的細(xì)胞(圖2a)。因此,腫瘤上皮細(xì)胞形成的患者特異性cluster并不是批次效應(yīng),可能代表了患者之間真實(shí)的生物學(xué)差異。主成分分析(PCA)劃分了兩個(gè)不同的上皮亞群(圖2b)。然后,作者將五個(gè)隊(duì)列(189個(gè)樣本,63例患者)結(jié)合起來(lái),使用主成分劃分的兩個(gè)不同上皮細(xì)胞亞群間的DEGs對(duì)上皮細(xì)胞聚類分群,再次聚類出兩種主要的腫瘤亞型iCMS2和iCMS3(下面簡(jiǎn)稱i2和i3)(圖2c)。
接下來(lái)作者使用inferCNV在所有5個(gè)隊(duì)列的上皮細(xì)胞轉(zhuǎn)錄組中推斷拷貝數(shù)變異(CNVs),并觀察到:盡管iCMS2中存在大量的患者間差異,7pq, 8q, 13q和20pq頻繁擴(kuò)增,而1p, 4pq, 8p, 14q, 15q, 17p和18pq頻繁缺失(圖2d);相比之下,iCMS3的腫瘤細(xì)胞多為二倍體,或表現(xiàn)出不頻發(fā)的和與iCMS2不一致的拷貝數(shù)改變。通過(guò)對(duì)CNV情況在UMAP圖上進(jìn)行可視化,也觀察到i2和i3腫瘤的分離(圖2e),這表明拷貝數(shù)的改變促成了CRC上皮轉(zhuǎn)錄組中觀察到的二分類。然后作者將上皮單細(xì)胞表達(dá)譜轉(zhuǎn)為偽bulk數(shù)據(jù),通過(guò)DEseq2進(jìn)行分組間上皮細(xì)胞的差異表達(dá)分析,確定了715個(gè)內(nèi)在上皮性癌signature(圖2f)。通過(guò)SCENIC推斷347個(gè)轉(zhuǎn)錄因子的調(diào)控子的單細(xì)胞活性評(píng)分,作者使用這些評(píng)分對(duì)61例患者的上皮細(xì)胞進(jìn)行聚類。同樣的,兩種上皮細(xì)胞亞型再次出現(xiàn),且多種調(diào)控子在兩組間存在顯著差異(圖2g、h)。
為了描述這兩種惡性細(xì)胞亞群的不同轉(zhuǎn)錄組狀態(tài),作者將同一iCMS組內(nèi)的715個(gè)iCMS標(biāo)記基因取平均值(圖2f),計(jì)算了i2和i3 metagene表達(dá)評(píng)分。作者發(fā)現(xiàn)metagene評(píng)分呈雙峰分布,一種模式對(duì)應(yīng)于i2樣轉(zhuǎn)錄組,另一種模式對(duì)應(yīng)于i3樣轉(zhuǎn)錄組,支持不同的i2和i3上皮細(xì)胞狀態(tài)。通過(guò)i2和i3 metagene評(píng)分,作者發(fā)現(xiàn)在63個(gè)腫瘤樣本中,54個(gè)樣本(86%)的超過(guò)80%細(xì)胞被優(yōu)先定義為i2或i3。因此,在大多數(shù)腫瘤中,絕大多數(shù)細(xì)胞屬于單一iCMS類型,混合腫瘤并不常見(jiàn)。進(jìn)一步,作者通過(guò)轉(zhuǎn)錄組、CNV和調(diào)控子分析發(fā)現(xiàn)(圖2i),一組微衛(wèi)星穩(wěn)定(MSS)的上皮細(xì)胞與微衛(wèi)星高度不穩(wěn)定(MSI-H)的細(xì)胞在i3簇中混合,表明i3_MSS更類似于MSI-H腫瘤,i2更類似于MSS腫瘤(圖2j)。
2.在bulk轉(zhuǎn)錄組中進(jìn)行分類及臨床分子特征分析
作者接下來(lái)使用715個(gè)iCMS Marker基因?qū)?lái)自15個(gè)腫瘤數(shù)據(jù)集(TCGA、SG-Bulk和13個(gè)CMS隊(duì)列數(shù)據(jù)集)的3,614個(gè)腫瘤bulk轉(zhuǎn)錄組進(jìn)行了分類,并觀察到類似的i2 signature高或i3 signature高的兩組(圖3a)。采用NTP(nearest template prediction)算法,在Q值< 0.05時(shí),47%的腫瘤樣本被歸為i2,42%的腫瘤樣本被歸為i3(圖3b)。這表明,固有的上皮signature可以有效地識(shí)別bulk腫瘤轉(zhuǎn)錄組中的上皮亞型。
接下來(lái),作者詳細(xì)分析了iCMS亞型的臨床和分子特征(圖3a-c)。與單細(xì)胞的結(jié)果一致,作者發(fā)現(xiàn)幾乎所有的微衛(wèi)星高度不穩(wěn)定(MSI-H)腫瘤都被歸為iCMS3,iCMS3_MSS腫瘤亞組也被歸為iCMS3。CMS1(97%)和CMS3(98%)腫瘤以i3為主,而CMS2(96%)腫瘤以i2為主。然而,CMS4腫瘤可以是i2或i3,且比例相等(圖3c、d)。
通過(guò)以單細(xì)胞中主要細(xì)胞(免疫細(xì)胞、上皮細(xì)胞、內(nèi)皮細(xì)胞、成纖維細(xì)胞)的Marker基因表達(dá)對(duì)bulk樣本分層(圖3e),作者觀察到腫瘤根據(jù)iCMS、MSI狀態(tài)和bulk CMS分類進(jìn)行分組,這表明iCMS、MSI和CMS共同決定了結(jié)直腸癌的分子分類。通過(guò)生存分析顯示(圖3f、g),CMS4的無(wú)復(fù)發(fā)生存期(RFS)較差,RFS較差是CMS4/iCMS3亞組的一個(gè)特殊特征,這種差異也體現(xiàn)在總生存率上。i3型癌癥復(fù)發(fā)后的生存期較i2型更差,總體生存期也是如此。
3. 基因組特征和功能與分子分型的關(guān)聯(lián)
作者基于來(lái)自TCGA和SG-Bulk隊(duì)列的659個(gè)腫瘤樣本研究了iCMS3_MSI、iCMS3_MSS和iCMS2_MSS腫瘤的拷貝數(shù)結(jié)構(gòu),作者發(fā)現(xiàn)i3為微衛(wèi)星高度不穩(wěn)定(MSI-H)和二倍體腫瘤細(xì)胞或微衛(wèi)星穩(wěn)定(MSS)腫瘤,其拷貝數(shù)變化小于i2 (圖4a)。TP53突變?cè)趇2型MSS腫瘤中比在i3型MSS腫瘤中更普遍,這可能是導(dǎo)致前者整體基因組不穩(wěn)定的原因(圖4c),這與單細(xì)胞inferCNV的結(jié)果一致。
腫瘤突變負(fù)荷(TMB)在i3_MSI腫瘤中較高,在i3和i2 微衛(wèi)星穩(wěn)定(MSS)腫瘤中相似(圖4b)。在微衛(wèi)星高度不穩(wěn)定(MSI-H)腫瘤中,較高的TMB意味著更多的突變基因。即使具有相似的TMB,在MSS組中,i3腫瘤富集KRAS和PIK3CA突變,而i2腫瘤富集APC和TP53突變(圖4c)。
作者認(rèn)為i2和i3上皮細(xì)胞之間的一些表達(dá)差異可能直接歸因于DNA拷貝數(shù)的差異。在715個(gè)DEGs中,有382個(gè)與上述i2腫瘤中普遍擴(kuò)增或缺失的染色體臂相吻合(圖4d)。i2腫瘤中上調(diào)的基因在MYC和E2F靶基因上富集(圖4e),與此一致,由SCENIC定義的MYC調(diào)控子在i2上皮細(xì)胞中表達(dá)較高(圖2h);i3細(xì)胞中基因上調(diào)與上皮相關(guān)間充質(zhì)轉(zhuǎn)化(EMT),炎癥途徑和交匯代謝紊亂相關(guān)(圖4e)。
4.不同亞型間癌癥通路的差異
在這一部分,作者分析了在結(jié)直腸癌中常見(jiàn)的失調(diào)的信號(hào)通路:WNT, MAPK和TGF-beta(圖5a-c)。WNT通路內(nèi)的基因在i2 bulk腫瘤轉(zhuǎn)錄組中傾向于上調(diào),可能與它們?cè)趇2上皮細(xì)胞中的上調(diào)有關(guān)(圖4e), 這也可能是由于調(diào)節(jié)WNT信號(hào)的轉(zhuǎn)錄因子(TCF7, ASCL2)活性增加。
接下來(lái),作者評(píng)估了在癌癥中與MAPK通路上調(diào)相關(guān)的改變。i3型癌癥的KRAS、PIK3CA和BRAF突變發(fā)生率更高(圖5b)。BRAF V600第1類突變僅見(jiàn)于i3型癌癥,KRAS第3外顯子突變?cè)趇3型癌癥中富集(圖5d、e)。TGF-β信號(hào)的上調(diào)在i3型癌癥中更為顯著。TGF-β信號(hào)通路中的基因,包括SMAD4,在i3型癌癥中突變頻率更高(圖5c)。在i3腫瘤中SMAD2/3/4的表達(dá)增加,但與TGF-β活性相關(guān)的基因signature在i3和i2腫瘤細(xì)胞中沒(méi)有差異。
5. 腫瘤微環(huán)境的組成
為了比較不同腫瘤分型的細(xì)胞類型豐度,作者從CRC-SG1單細(xì)胞數(shù)據(jù)中確定了9種主要成纖維細(xì)胞、免疫細(xì)胞和內(nèi)皮細(xì)胞類型的標(biāo)記基因,并通過(guò)對(duì)bulk轉(zhuǎn)錄組中每種細(xì)胞類型的Marker取平均值來(lái)計(jì)算每種細(xì)胞類型的基因表達(dá)評(píng)分。作者在微衛(wèi)星高度不穩(wěn)定(MSI-H)腫瘤中觀察到較高的NK細(xì)胞評(píng)分,在纖維化(CMS4)腫瘤中觀察到較高的成纖維細(xì)胞、內(nèi)皮細(xì)胞和單核細(xì)胞/經(jīng)典樹(shù)突狀細(xì)胞(McDC)評(píng)分(圖6a)。
接下來(lái),作者研究了腫瘤上皮細(xì)胞與免疫細(xì)胞、內(nèi)皮細(xì)胞和成纖維細(xì)胞之間的信號(hào)傳導(dǎo)(圖6c、d)。作者發(fā)現(xiàn)在i2中更強(qiáng)的差異相互作用包括從上皮腫瘤細(xì)胞到上皮腫瘤細(xì)胞(自分泌)和成纖維細(xì)胞(旁分泌)的EGFR-EGFR信號(hào)傳導(dǎo)。上皮細(xì)胞的基因集富集分析(GSEA)發(fā)現(xiàn)了i3細(xì)胞中上調(diào)多個(gè)免疫通路,通過(guò)計(jì)算三個(gè)與炎癥相關(guān)的主要通路GSEA評(píng)分(圖6e),作者發(fā)現(xiàn)MSI-H和纖維性(CMS4)腫瘤中炎癥相關(guān)通路的表達(dá)較高。
下面作者假設(shè)iCMS分類可以進(jìn)一步證實(shí)微衛(wèi)星穩(wěn)定(MSS)腫瘤中免疫活性的增加。在TCGA轉(zhuǎn)錄組中,作者定量了兩種具有抗腫瘤反應(yīng)和效應(yīng)功能的T細(xì)胞程序(“CXCL13 T細(xì)胞”和“細(xì)胞毒性”程序)的表達(dá),確定這兩種T細(xì)胞程序在微衛(wèi)星高度不穩(wěn)定(MSI-H)和MSS CRC之間具有不同的活性(圖6f)。綜上,作者的單細(xì)胞和bulk數(shù)據(jù)分析表明,iCMS3_MSS是MSS CRC的一個(gè)獨(dú)特亞群,與MSI-H腫瘤相似,免疫激活增加,T細(xì)胞和髓系細(xì)胞浸潤(rùn)和抗腫瘤細(xì)胞毒性特征更高。
6.CRC的IMF細(xì)化分類
綜合上述的結(jié)果,作者提出了一個(gè)基于上皮細(xì)胞狀態(tài)(I)、微衛(wèi)星狀態(tài)(M)和纖維化(F)這三個(gè)生物學(xué)層的對(duì)CMS分類的改進(jìn),稱為“IMF”(圖7)。IMF將腫瘤分為五類:iCMS2_MSS_NF、iCMS2_MSS_F、iCMS3_MSS_NF、iCMS3_MSS_F和iCMS3_MSI。五類樣本在生存狀態(tài)及藥物響應(yīng)等均存在差異,對(duì)CRC的研究起源、演變以及對(duì)治療的反應(yīng)具有重要意義。
至此,這篇文章就介紹完啦,是不是收獲頗豐?總結(jié)起來(lái),這篇文章和我們常看到的癌癥分型文章在結(jié)構(gòu)上并無(wú)太大差異:第一步聚類分群;第二步多數(shù)據(jù)集驗(yàn)證;第三步分析不同亞型間基因組、轉(zhuǎn)錄組、微環(huán)境、生存及用藥差異。為什么大佬可以發(fā)41分呢?小編認(rèn)為首先得益于作者超大的數(shù)據(jù)量,我一直相信一句話:數(shù)據(jù)的廣度可以提升文章的高度。其次作者使用的分型特征不局限于轉(zhuǎn)錄組表達(dá)數(shù)據(jù),結(jié)合MSI狀態(tài)等使分群更加可靠!做癌癥分型的小伙伴快快學(xué)起來(lái)!