在當(dāng)前的癌癥研究領(lǐng)域里,我們看到的關(guān)于腫瘤分型的研究,絕大部分是基于單個(gè)腫瘤類型、單個(gè)數(shù)據(jù)中心的,如果有額外數(shù)據(jù)集,也只是作為獨(dú)立驗(yàn)證集。而單癌分型的研究,通常用于一些常規(guī)分析。今天給大家介紹基于大樣本量識(shí)別一致性或保守性亞型的研究。研究策略主要分為兩種類型:1). 同癌型,多中心。2). 泛癌分型的保守性。下面我們以幾個(gè)案例進(jìn)行詳細(xì)說(shuō)明。
一、同癌型,多中心
【案例1】結(jié)直腸癌的一致性分子亞型
Ref: The consensus molecular subtypes of colorectal cancer. Nature Medicine. 2016
這篇文章為結(jié)直腸癌(CRC)提供了迄今為止最穩(wěn)健的分類體系。CRC是一種致死性很高的癌癥類型,并且表現(xiàn)出臨床結(jié)局和藥物應(yīng)答的異質(zhì)性。該研究的主要目的是解決已報(bào)道的基于基因表達(dá)譜的CRC分型系統(tǒng)的不一致性,并促進(jìn)臨床轉(zhuǎn)化。
在這篇研究中,作者首先通過(guò)已知關(guān)于CRC分型的研究文章中,搜集到了18套CRC數(shù)據(jù):包括1套TCGA、10套GEO數(shù)據(jù)以及一些未公開的數(shù)據(jù)(共4,151個(gè)樣本)。其中涉及到有分類標(biāo)簽的3,962個(gè)(共涉及到6種聚類方式:方式A-方式F,形成27個(gè)類標(biāo)簽)。然后作者通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化以及主成分分析等步驟去除掉離群樣本。對(duì)剩下的3,104個(gè)樣本,作者借助Jaccard系數(shù),構(gòu)建27x27的一致性矩陣,值越大表明兩個(gè)cluster越相似,進(jìn)而構(gòu)建27個(gè)類標(biāo)簽的一致性網(wǎng)絡(luò)(圖1)。網(wǎng)絡(luò)中線段粗細(xì)表示Jaccard系數(shù)大小,顏色表示顯著性水平,點(diǎn)的大小表示該cluster所包含的樣本量(圖1)。
接下來(lái)作者借助馬爾科夫聚類算法檢測(cè)圖1中一致性網(wǎng)路的魯棒性。根據(jù)膨脹因子(即類別數(shù)目k=2-10)比較分類性能。發(fā)現(xiàn)當(dāng)大類數(shù)目為4類的時(shí)候, “weighted silhouette width”最大,分類性能最佳。因此,作者將這27個(gè)亞型歸結(jié)為4類一致性分子亞型(Consensus Molecular Subtypes, CMS):CMS1-CMS4(圖1)。通過(guò)與已知亞型進(jìn)行對(duì)比,發(fā)現(xiàn)CMS1-CMS4與已知亞型很強(qiáng)的一致性(超幾何檢驗(yàn),圖2b)。這個(gè)方法很好地規(guī)避了基于不同方式的聚類方法產(chǎn)生類標(biāo)簽的差異性,而是以一種統(tǒng)一的方式總結(jié)了已知多中心來(lái)源的亞型。作者通過(guò)全局性患者網(wǎng)絡(luò),刻畫CMS亞型的聚集性(圖2c),圖中點(diǎn)的顏色表示患者所屬的CMS,連線表示兩個(gè)患者在6種聚類方式中有5種以上是一致的,表明高度一致性(圖2c)。
接下來(lái),作者刻畫了4個(gè)CMS患者的基因組特征,包括突變數(shù)量(圖3a),拷貝數(shù)變異數(shù)目(圖3b),超突變數(shù)目、MSI信息、已知甲基化表型(圖3c)以及特定的基因組突變比較,包括KRAS, BRAF, APC, TP53(圖3d)。此外,作者展示了4個(gè)CMS患者的拷貝數(shù)變異數(shù)據(jù)熱圖(圖3e)、DNA甲基化熱圖(圖3f)、蛋白質(zhì)表達(dá)水平熱圖(圖3g)、以及miRNA表達(dá)熱圖(圖3h)。
此外,作者分別在mRNA水平以及蛋白質(zhì)水平下刻畫了CMS亞型間特定signature的活性。mRNA水平包括CRC相關(guān)的signature、標(biāo)準(zhǔn)癌癥相關(guān)通路、基質(zhì)評(píng)分和免疫評(píng)分、免疫相關(guān)signature、代謝相關(guān)通路(圖4i)。蛋白質(zhì)水平包括免疫相關(guān)signature和促癌反應(yīng)(圖4j)。
接下來(lái),作者分別刻畫了CMS亞型與臨床特征以及臨床結(jié)局的相關(guān)性。值得注意的是,生存分析處,除了刻畫CMS亞型間的OS和RFS,作者還刻畫了一個(gè)生存指標(biāo),即復(fù)發(fā)后生存時(shí)間(survival after relapse)。這個(gè)復(fù)發(fā)后生存時(shí)間指的是只挑選復(fù)發(fā)的樣本,做OS(圖5)。
最后,作者根據(jù)以上基因組特征、基于mRNA/蛋白質(zhì)水平signature活性、臨床特征與臨床結(jié)局,總結(jié)了4個(gè)CMS亞型(圖6)。
泛癌分型的保守性
【案例1】保守性泛癌微環(huán)境亞型預(yù)測(cè)免疫治療
Ref: Conserved pan-cancer microenvironment subtypes predict response to immunotherapy. Cancer Cell. 2021
與上面一篇研究類似,這篇文章也是通過(guò)大量樣本,來(lái)對(duì)患者進(jìn)行聚類分析。不一樣的是,這篇文章在泛癌中基于一些生物學(xué)特征刻畫亞型的保守性。
首先,作者手動(dòng)搜集了29個(gè)腫瘤微環(huán)境相關(guān)的特征signature,稱為29Fges(包括20個(gè)免疫細(xì)胞特征和9個(gè)促癌特征)。通過(guò)ssGSEA計(jì)算了29Fges在泛癌水平(20種癌癥類型,8,024個(gè)樣本)的活性值。為了避免亞型特異性帶來(lái)的影響,作者基于中值對(duì)活性值進(jìn)行標(biāo)化。
接下來(lái),作者使用無(wú)監(jiān)督層次聚類方式,將8,024個(gè)樣本聚為4類(稱為保守性的TME subtype):其中一類亞型免疫相關(guān)特征和癌癥相關(guān)成纖維細(xì)胞活性水平都比較高,故命名為“Immune-Enriched, Fibrotic”;另一個(gè)亞型免疫相關(guān)特征活性水平較高,但并未富集到癌癥相關(guān)成纖維細(xì)胞,故命名為“Immune-Enriched, Non-Fibrotic”;第三個(gè)亞型免疫相關(guān)特征活性水平較低,癌癥相關(guān)成纖維細(xì)胞活性較高,故命名為“Fibrotic”;最后一個(gè)亞型,這些特征活性水平均比較低,故命名為“Depleted”(圖7)。并且發(fā)現(xiàn),這些亞型所占比例,在各個(gè)癌癥類型中比較相似,特別是在黑色素瘤中(圖7C)。
接下來(lái),作者連同本研究的4個(gè)保守性的TME亞型、免疫表型score組別(特定免疫基因集合的Z-score中值分組)、TCGA已知免疫Cluster(C1-C6),在泛癌水平比較了不同亞型間對(duì)患者生存的風(fēng)險(xiǎn)比(圖8E)。并且在一些特定的癌癥類型中展示了4個(gè)TME亞型、免疫表型score組別、TCGA已知免疫Cluster的生存分析(圖8F),用于說(shuō)明TME亞型的分型方式要優(yōu)于免疫表型score分組和TCGA已知免疫Cluster。
結(jié)合一些基因組特征和免疫特征,總結(jié)4個(gè)保守性TME亞型(圖9)。
最后,作者在不同的經(jīng)免疫治療的驗(yàn)證集數(shù)據(jù)中,表明保守性TME亞型與免疫治療效益有關(guān)(圖10)。
【案例2】基于基因組變異協(xié)同事件揭示泛癌的分子分型
Ref: Cooperative genomic alteration network reveals molecular classification across 12 major cancer types. Nucleic Acids Res. 2017
這篇文章也是在泛癌層面做的,只不過(guò)用的特征是基因組變異的協(xié)同事件。所謂協(xié)同事件,就是兩個(gè)基因的基因組變異(包括拷貝數(shù)變異和體突變)同時(shí)在樣本中出現(xiàn)。當(dāng)然,作者通過(guò)二項(xiàng)分布檢驗(yàn)識(shí)別出了泛癌中顯著出現(xiàn)的協(xié)同事件。
通過(guò)所有的協(xié)同事件,作者利用K-均值聚類,將泛癌患者(共2,303個(gè)樣本)分為17類(圖11左),并展示了top10協(xié)同事件。研究發(fā)現(xiàn),這些協(xié)同事件相關(guān)的分子分型具有顯著的預(yù)后差異(圖11右)。
此外,作者刻畫了特定協(xié)同事件在泛癌中的預(yù)后效能(圖12)。
接下來(lái),作者以Case study的形式刻畫了這些協(xié)同事件在特定癌癥類型中(GBM)所確定的亞型(圖13)。
(圖13)
將GBM中協(xié)同事件亞型的預(yù)后效能與其他亞型進(jìn)行比較,包括與GBM之前已定義好的亞型進(jìn)行對(duì)比、以及去除甲基化表型后的對(duì)比(圖14)。以此表明協(xié)同事件揭示的分子亞型不受甲基化表現(xiàn)的影響,且優(yōu)于GBM之前定義的亞型。
結(jié)語(yǔ):
分子分型的目的是分層管理患者,進(jìn)而促進(jìn)患者的個(gè)性化治療和臨床轉(zhuǎn)化。大樣本量分子分型的一致性/保守性識(shí)別,可驗(yàn)證分型的魯棒性和準(zhǔn)確性,主要包括來(lái)自多中心樣本的亞型一致性刻畫和泛癌亞型保守性刻畫。分子分型的一致性/保守性刻畫能夠進(jìn)一步幫助我們?cè)趶?fù)雜疾病中尋找相似的分子特征,進(jìn)而在臨床治療上提供有價(jià)值的指導(dǎo)。