今天給大家分享一篇發(fā)表在Nature Communications(IF: 17.694)上的文章:
DNA methylation-based epigenetic signatures predict somatic genomic alterations in gliomas
基于 DNA 甲基化的表觀遺傳特征預(yù)測神經(jīng)膠質(zhì)瘤的體細胞基因組改變
一.研究背景
表觀遺傳學(xué)在癌癥中起著至關(guān)重要的作用,并通過DNA甲基化、組蛋白變異和非編碼RNA表現(xiàn)出廣泛的重編程。DNA甲基化是一種穩(wěn)定的特征,反映了腫瘤間和腫瘤內(nèi)的異質(zhì)性,并且已用于分類不同類型的腫瘤。例如,最近發(fā)表的基于DNA甲基化的中樞神經(jīng)系統(tǒng)(CNS)腫瘤組織病理學(xué)分類(無監(jiān)督CNS分類)挑戰(zhàn)了傳統(tǒng)的組織學(xué)分類和腫瘤分級。這種無監(jiān)督的CNS分類使用無監(jiān)督學(xué)習(xí)方法來識別具有不同DNA甲基化譜的CNS腫瘤類別。浸潤性膠質(zhì)瘤,包括世界衛(wèi)生組織II-IV級膠質(zhì)瘤,是最常見和致命的原發(fā)性腦腫瘤。先前的研究已經(jīng)確定了膠質(zhì)瘤的一些關(guān)鍵分子特征,這些特征在膠質(zhì)瘤的發(fā)生、發(fā)展、診斷和治療中起著關(guān)鍵作用。例如,異檸檬酸脫氫酶(IDH)突變與年輕和更長的生存時間正相關(guān)。染色體1p/19q聯(lián)合缺失對提高生存率和預(yù)測化療反應(yīng)有預(yù)測作用。IDH突變和染色體1p/19q聯(lián)合缺失是世界衛(wèi)生組織當(dāng)前膠質(zhì)瘤診斷標(biāo)準(zhǔn)的一部分。TERTp突變和ATRX突變是膠質(zhì)瘤中相互排斥的改變,兩者在功能上與端粒長度維持相關(guān)。端粒酶抑制療法、異染色質(zhì)沉默機制靶向療法和G4失穩(wěn)療法是具有ATRX或TERTp突變的膠質(zhì)瘤的有希望的治療靶點。O6-甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶(MGMT)啟動子甲基化狀態(tài)是預(yù)后和烷基化化療預(yù)測生物標(biāo)志物??梢允褂靡呀⒌幕诩谆嚵械乃惴∕GMT-STP2713進行預(yù)測。在轉(zhuǎn)錄水平上,膠質(zhì)母細胞瘤(GBM)已根據(jù)分為CL、PN和MES的特征基因表達特征分為三個亞型。CL-GBMs以表皮生長因子受體(EGFR)擴增為特征,而MES-GBMs富集神經(jīng)纖維蛋白1(NF1)缺失和突變。
上述所有體細胞突變對診斷、治療決策和患者預(yù)后至關(guān)重要。然而,通常需要單獨的測序分析來獲得這些體細胞改變。體細胞突變的檢測,如IDH、ATRX和TERTp狀態(tài),通常依賴于NGS。熒光原位雜交(FISH)或雜合性缺失(LOH)分析通常用于獲得染色體1p/19q狀態(tài)。甲基化特異性PCR(MS-PCR)或焦磷酸測序分析通常用于獲得MGMT啟動子狀態(tài)。目前還沒有臨床試驗根據(jù)基因表達對腫瘤進行分類。這是因為膠質(zhì)瘤切除術(shù)后最常用的分析物是FFPE組織。FFPE組織中的RNA經(jīng)過高度降解和化學(xué)修飾,因此,其轉(zhuǎn)錄測序質(zhì)量較低,可能會受到人為因素和技術(shù)差異的影響??傊?,這些單獨檢測的成本、時間和組織要求經(jīng)常導(dǎo)致延遲或不完整的分子診斷,導(dǎo)致治療不理想和不合格的臨床試驗。事實上,迫切需要開發(fā)一種快速、經(jīng)濟有效的檢測方法,為浸潤性膠質(zhì)瘤患者提供最少量的FFPE組織。
二.研究方法
研究者旨在開發(fā)一種基于DNA甲基化的分類器,準(zhǔn)確確定浸潤性膠質(zhì)瘤的IDH、TERTp和ATRX突變狀態(tài)、染色體1p/19q編碼狀態(tài)和基因表達亞型。根據(jù)其狀態(tài),上述分子特征可分為兩類:二元類,包括IDH、TERTp和ATRX突變或野生型、染色體1p19q缺失編碼或完整以及基因表達亞型,包括CL、PN或MES。使用嚴(yán)格的機器學(xué)習(xí)方法,開發(fā)了用于預(yù)測每個二元類(IDH、TERTp等)和預(yù)測基因表達亞型的單獨分類器。二元基因組改變分類器在TCGA的低級別和高級別膠質(zhì)瘤樣本中進行了訓(xùn)練和驗證,而基因表達亞型分類器僅在TCGA膠質(zhì)母細胞瘤樣本中訓(xùn)練,因為這些亞型最初是使用高級膠質(zhì)瘤數(shù)據(jù)集描述的。所有分類器的性能均通過多中心III期隨機試驗的獨立隊列(NOA-04)進行驗證,該試驗包括低級別和高級別膠質(zhì)瘤。
三.研究結(jié)果
1、預(yù)測模型
對于二元遺傳變異,所有預(yù)測模型都達到了較高的預(yù)測精度,如圖1A所示。在測試集中,模型對IDH、TERTp和ATRX突變以及染色體1p/19q編碼狀態(tài)的預(yù)測準(zhǔn)確率分別為100%、98.31%、90.48%和99.21%,AUC分別為1.0、1.0、0.9952和0.9974。對于基因表達亞型預(yù)測,按照方法中所述處理具有HM450K和HM27K數(shù)據(jù)的GBM樣本。最終的隨機森林模型用訓(xùn)練集(n=212)和驗證集(n=72)重新調(diào)整,在測試集中達到72.2%(52/72)的預(yù)測精度。
2. 預(yù)測特征分析
對于二元遺傳變異,研究者對所有可用樣本進行聚類分析(圖1B)。樣本被分為兩個亞組,與已知的基因組改變高度一致。通過比較IDH、TERTp、ATRX和染色體1p/19q 聯(lián)合缺失的特征探針與膠質(zhì)母細胞瘤CpG島甲基化表型(G-CIMP)特征,研究者發(fā)現(xiàn)這五種探針特征之間沒有明顯重疊(圖1C)。ATRX和TERTp突變特征之間缺乏重疊,這與端粒維持中ATRX與TERTp的互斥性質(zhì)一致。
3. 預(yù)測結(jié)果與分析
根據(jù)DNA-seq based的ATRX狀態(tài)、methyl-based的ATRX狀態(tài)和單核苷酸變異(SNV)信息形成了五個樣本子集(集合1-5)(圖2A)。25個樣本根據(jù)DNA-seq分類為野生型,但根據(jù)methyl-based的模型分類為突變型。在這25個樣本中,17個樣本(集合2)顯示了至少一個突變,8個樣本(集合3)根據(jù)SNV沒有突變(圖2B)。對于集合4, 具有TERTp突變狀態(tài),3/8樣本為TERTp 突變和ATRX野生型。所有被methyl-based的模型誤分類為ATRX突變體的樣品都含有IDH突變,而所有被methyl-based的模型誤分類為野生型的樣品都是IDH野生型(圖2B)。有趣的是,當(dāng)甲基化結(jié)果不一致時,即使測序結(jié)果一致,也觀察到表達存在顯著差異(圖2C-D)。位于ATRX上的探針的DNA甲基化水平在三個亞組(set2、set3和set4)之間沒有顯示出顯著差異,只有一個探針除外。對于染色體1p/19q編碼狀態(tài)預(yù)測,當(dāng)比較methyl-based的狀態(tài)和SNP6-based的狀態(tài)時,五個樣本被錯誤分類(圖2E)。使用HM450K甲基化數(shù)據(jù)計算的chr1和chr19的CNV譜(圖2F)。通過甲基化模型,五分之四的樣本被誤分類為聯(lián)合缺失,一個樣本被誤歸類為非聯(lián)合缺失??梢郧宄赜^察到TCGA-CS-5394和TCGA-FG-7637中的缺失,這與methyl-based的模型預(yù)測相匹配。對于基因表達亞型預(yù)測,測試集中的樣本(n=72)按methyl-based和transc-based的基因表達亞類型進行分類(圖3A)。與具有一致亞型的樣本相比,兩種方法之間的不一致樣本在拷貝數(shù)變異和基因表達水平上顯示出顯著差異。研究者檢查了不一致樣本中特定亞型的變化,以確定哪種分類方法與這些特征變化的相關(guān)性最高(圖3B-C)。
4. 模型驗證
NOA-04隊列中每個二元基因組改變的預(yù)測準(zhǔn)確率為:對于IDH突變,通過PCR-seq的89.9%(98/109)和通過HM450k DNA甲基化譜的無監(jiān)督聚類分析的99.10%(114/115);對于TERTp突變,通過PCR-seq分析,82.8%(82/99)免疫組織化學(xué)(IHC)檢測ATRX突變率為92.7%(89/96);而對于染色體1p/19q狀態(tài),MLPA為88.89%(88/99),基于HM450K產(chǎn)生CNV分布為95.65%(110/115)(圖3D)。根據(jù)IDH突變狀態(tài),11個樣本通過methyl-based的預(yù)測被錯誤分類:9/11通過PCR-seq預(yù)測為野生型,但通過methyl-based模型預(yù)測為突變型。在TCGA-LGG樣品中,通過methyl-based和transc-based的算法預(yù)測的基因表達亞型在PN亞型的分類結(jié)果中顯示出很大差異(圖3E):422/486(86.8%)個樣本通過基于甲基的亞型被分類為PN,而只有228/48(46.9%)通過transc-based亞型被歸類為PN。圖3F中的熱圖將methyl-based的亞型和transc-based的亞型與膠質(zhì)瘤的其他關(guān)鍵特征對齊,包括組織學(xué)、染色體1p/19q編碼狀態(tài)、MGMT啟動子甲基化狀態(tài)以及關(guān)鍵基因的突變和CNV狀態(tài)。很明顯,幾乎所有的IDH1/IDH2突變和大多數(shù)TP53和ATRX突變與methyl-based的PN亞型匹配。在PN亞型中幾乎沒有觀察到EGFR擴增。這些觀察結(jié)果遵循PN亞型的已知特征,并支持methyl-based的分類。
5. UniD與無監(jiān)督CNS分類比較
根據(jù)UniD預(yù)測的分子特征狀態(tài),將膠質(zhì)瘤(n=644)分為九組??偨Y(jié)了這些組及其基于無監(jiān)督CNS分類的分類。在圖4A中。大多數(shù)膠質(zhì)瘤分為五組(Grp1、2、3、7和8)。Grp8中的膠質(zhì)瘤在ATRX和TERTp中均顯示野生型狀態(tài),這表明可能存在替代機制來維持其端粒長度。圖4B中描述了兩個分類系統(tǒng)之間的不一致樣本。第一行:40/644例膠質(zhì)瘤被分類為對照類(正常樣本),根據(jù)無監(jiān)督CNS分類為正常腦組織,其余病例被分類為“腫瘤”類(腫瘤樣本)。通過比較分類的正常和分類的腫瘤樣品之間的絕對腫瘤純度(圖4C),許多分類的正常樣本顯示出高腫瘤純度,48個分類的正常樣本顯示出高的腫瘤純度和分類的正常標(biāo)本的中位腫瘤純度。第二行:第1至4亞組中的所有CONNTR和HEMI均被預(yù)計為IDH野生型,而通過DNA測序檢測到了所有的IDH突變。第三行:Grp2中的12個樣本被分類為正常腦正常組織或IDH野生型膠質(zhì)瘤,無染色體1p/19q聯(lián)合缺失,而SNP6的CNV圖譜顯示清晰的染色體1p/19q聯(lián)合缺失(圖4D)。第四行:SFT、HMPC樣本預(yù)計具有整倍體基因組,而Grp7中的TCGA-19-5951顯示出顯著的chr10缺失以及chr19p和chr20擴增(圖4E)。第五行,根據(jù)無監(jiān)督的CNS分類,Grp8被預(yù)測為IDH突變體,但實際上通過測序為野生型。第六行:來自成年患者的兩個樣本(TCGA-06-5858和TCGA-2006-6698)被無監(jiān)督CNS分類為IHG。在主要的五組(Grp 1、2、3、7、8)中,任何兩組之間的Kaplan-Meier分析如圖4F、G所示。Grp1、Grp2和Grp3之間未觀察到顯著差異。這表明所有IDH突變腫瘤患者無論其腫瘤的ATRX、TERTp、ATRX或ATRX水平如何,與IDH突變型膠質(zhì)瘤相比,染色體1p/19q狀態(tài)和IDH野生型膠質(zhì)瘤(Grp7和Grp8)的生存率顯著降低。此外,與Grp8相比,Grp7表現(xiàn)出較差的存活率,Grp8的樣本含有TERTp突變,這表明在缺乏IDH或者ATRX突變時,TERTp突變具有負面的預(yù)后意義。
四、總結(jié)
分子分類改善了惡性膠質(zhì)瘤患者的診斷和治療。然而,分類依賴于成本高且速度慢的單獨檢測,導(dǎo)致治療經(jīng)常延遲。在這里,研究者建議使用DNA甲基化作為一個新興的臨床診斷平臺,根據(jù)主要基因組改變對膠質(zhì)瘤進行分類,并提供對亞型特征的洞察。研究表明,使用機器學(xué)習(xí)模型,DNA甲基化特征可以準(zhǔn)確預(yù)測體細胞的改變,并比現(xiàn)有分類器有改進。研究者開發(fā)的UniD對于早期臨床階段的基因組改變和基因表達亞型診斷來說是快速且經(jīng)濟的,并且比目前臨床使用的單個檢測方法有所改進。遺傳改變和表觀遺傳特征之間的顯著關(guān)系表明該方法廣泛適用于其他惡性腫瘤。