《Cell》上的生信分析?。。?/strong>
這篇文章發(fā)表在期刊《Cell》上的,文章的質(zhì)量不言而喻。在最近一年的影響因子為41.582。中科院大類: 生物學(xué) 1區(qū),中科院小類: 1區(qū) 生化與分子生物學(xué)。這項(xiàng)研究證實(shí)了主調(diào)節(jié)蛋白提供的分子邏輯整合了許多不同的和患者特異性突變的影響,以實(shí)現(xiàn)特定腫瘤亞型的轉(zhuǎn)錄狀態(tài),從而極大地?cái)U(kuò)大了可能對(duì)相同治療做出反應(yīng)的患者的比例。更具體地說(shuō),這項(xiàng)新的研究表明,更大比例的患者可能對(duì)靶向主調(diào)節(jié)蛋白的新藥物有反應(yīng),而不是尋找靶向與越來(lái)越小的患者亞群相關(guān)的突變基因的藥物。
背景知識(shí):
綜合基因組分析,利用基于網(wǎng)絡(luò)的方法,確定了407個(gè)主調(diào)節(jié)蛋白(MR),這些蛋白質(zhì)負(fù)責(zé)將癌癥基因組圖譜(TCGA)中20個(gè)隊(duì)列的個(gè)體樣本的遺傳學(xué)歸入112個(gè)轉(zhuǎn)錄上不同的腫瘤亞型。MR蛋白可以進(jìn)一步組織成24個(gè)泛癌,主調(diào)節(jié)模塊(MRB),每個(gè)模塊都調(diào)節(jié)關(guān)鍵的癌癥標(biāo)志,并在多個(gè)隊(duì)列中預(yù)測(cè)患者的結(jié)果。
結(jié)果解讀:
(A).主調(diào)節(jié)蛋白(MR)蛋白(如MR1-MR12)在上游途徑蛋白(如P1-P5)中整合了基因組改變(小紅球)和異常旁分泌和內(nèi)分泌信號(hào)(小藍(lán)球)的影響。此外,它們還通過(guò)激活和抑制的靶標(biāo)(分別為紅色和藍(lán)色邊緣)調(diào)節(jié)細(xì)胞的“下游”轉(zhuǎn)錄特性--表現(xiàn)為基因表達(dá)特征,基因表達(dá)從最低(藍(lán)色)到最高(紅色)。Passenger改變(小黑球)和不影響細(xì)胞轉(zhuǎn)錄特性的改變發(fā)生在下游效應(yīng)器(例如P7)中,這不影響MR活性的蛋白質(zhì)(例如P6)。MR蛋白形成嚴(yán)格自動(dòng)調(diào)節(jié)的模塊化結(jié)構(gòu)(腫瘤檢查點(diǎn)),負(fù)責(zé)控制癌細(xì)胞轉(zhuǎn)錄特性的動(dòng)態(tài)平衡。
(B).腫瘤檢查點(diǎn)由多個(gè)子模塊結(jié)構(gòu)組成,稱為MR塊(MRB),它們調(diào)節(jié)特定的腫瘤標(biāo)志,并在不同的亞型中被反復(fù)檢測(cè)到。作為說(shuō)明性示例,示出了包括三個(gè)不同MRB的腫瘤檢查點(diǎn)。
(C).MOMA算法的概念性工作流程圖。
在每個(gè)隊(duì)列中,通過(guò)使用集群可靠性分?jǐn)?shù)(CRS)來(lái)確定最佳集群數(shù)量。當(dāng)然,腎透明細(xì)胞癌(KIRC)的五組解決方案是一個(gè)說(shuō)明性的例子,包括第5組(最差)和第3組(最佳)的不同結(jié)果。
(A).MOMA確定的隊(duì)列亞型,從最低的子宮內(nèi)膜癌(UCEC)到最高的結(jié)腸腺癌(COAD),最佳亞型的數(shù)量(x軸)。解決方案的最佳性由網(wǎng)點(diǎn)的大小和顏色表示,較大、較紅的網(wǎng)點(diǎn)代表較高的平均CRSS。選定的解決方案用黑色十字標(biāo)記。通過(guò)Kaplan Meier分析,最好和最差星團(tuán)之間的存活間隔的統(tǒng)計(jì)意義顯示在代表-Log10p的藍(lán)色條旁邊。虛線表示p=0.05。
(B).小提琴曲線圖,表示通過(guò)基于MR(藍(lán)色)或基于表達(dá)式(紅色)的聚類分析推斷的用于最佳聚類解決方案的20個(gè)TCGA組織類型(x軸)中的每一個(gè)的輪廓得分概率密度(y軸)。紅線虛線表示標(biāo)準(zhǔn)統(tǒng)計(jì)顯著性閾值(SS=0.25)。
(C).TCGA腎透明細(xì)胞癌隊(duì)列(KIRC)基于MR的聚類熱圖。行代表腫瘤檢查點(diǎn)MR蛋白,而列代表單個(gè)樣本。色標(biāo)與蛋白質(zhì)活性成正比(紅色激活,藍(lán)色失活)。
(D).S5亞型(紅線)與S3亞型(綠線)患者生存的Cox比例風(fēng)險(xiǎn)分析(p=1.1310×10-16)。
腫瘤檢查點(diǎn)被定義為具有最小MR譜系的模塊,通過(guò)引導(dǎo)上游通路中的基因組事件來(lái)實(shí)現(xiàn)腫瘤的轉(zhuǎn)錄識(shí)別。因此,自拍者使用飽和度分析將MOMA分析產(chǎn)生的亞型特異蛋白的初始排序列表提煉為一小部分候選MRs,這些候選MRs最好地解釋了亞型的遺傳格局。
單獨(dú)的曲線顯示了當(dāng)n從1增加到100時(shí),在nMOMA推斷的MR蛋白頂端上游確定的每個(gè)樣本中每個(gè)亞型的功能基因組事件的平均比例。零假設(shè)(即,從1253個(gè)無(wú)統(tǒng)計(jì)學(xué)意義的調(diào)控蛋白(所有MOMA排序的蛋白的下半部分)中隨機(jī)選擇n個(gè)MRS)產(chǎn)生的飽和曲線顯示為灰色。按腫瘤檢查點(diǎn)MRS所占遺傳事件比例的降序?qū)﹃?duì)列進(jìn)行排序。為保持視覺(jué)清晰度,最后五組以擴(kuò)展的y軸比例顯示(0%-50%)
這幅圖展示了37個(gè)最頻繁激活的MR蛋白,根據(jù)飽和分析,這些蛋白使mR15 MOMA推斷的亞型(黑色細(xì)胞)的基因改變效應(yīng)變得通道化。行表示按其亞型特異性活性聚類的MR蛋白,以突出在相同聚類(例如,F(xiàn)OXM1和CENPF)中共激活的MRS,而列中顯示MOMA推斷的亞型,按腫瘤類型分組。矩陣的左側(cè)顯示了每個(gè)MR基于其異常激活的子類型的數(shù)量的重復(fù)排名,而子類型的數(shù)量顯示在右側(cè),以條形圖的形式顯示。在矩陣的左側(cè)顯示每個(gè)MR的重復(fù)等級(jí),在矩陣的左側(cè)顯示其異常激活的子類型的數(shù)量,在右側(cè)以條形圖的形式顯示子類型的數(shù)量。
與從2,506個(gè)調(diào)控蛋白中隨機(jī)選擇的相同大小的蛋白質(zhì)集進(jìn)行比較,對(duì)現(xiàn)有分子相互作用網(wǎng)絡(luò)的分析證實(shí),腫瘤檢查點(diǎn)代表著超連接模塊。
(A-D).OncoPrint圖顯示了COAD中S2/S3(MSIHigh)(A和 B)和S5/S6(MSS)(C和D)亞型上游的基因組改變。僅顯示SCNA焦點(diǎn)事件。水平直方圖和百分比顯示出包含特定事件類型的樣本的比例。垂直直方圖顯示在每個(gè)樣本中檢測(cè)到的事件數(shù)量。對(duì)于SCNAs,每一行對(duì)應(yīng)于一個(gè)獨(dú)立的細(xì)胞帶,由功能上確定的癌蛋白/腫瘤抑制因子(STAR方法)識(shí)別。藍(lán)色標(biāo)記只在一個(gè)亞型中檢測(cè)到基因改變,而在另一個(gè)亞型中沒(méi)有檢測(cè)到(即S2對(duì)S3或S5對(duì)S6),橙色標(biāo)記顯示不成比例的改變?cè)诓煌膩喰椭谐霈F(xiàn),而紅色標(biāo)記顯示S2中的錯(cuò)配修復(fù)基因。
(E).S5中變化的OncoPrint圖,包括地區(qū)性(即非重點(diǎn))SCNA中的變化,多數(shù)受影響的事件用紅色標(biāo)簽顯示。
(F).基因組事件類型的圖例
(G-J).Coad亞型S2(G)、S3(H)、S5(I)和S6(J)的基因組飽和曲線。垂直虛線表示飽和閾值。
作者根據(jù)Achilles計(jì)劃的數(shù)據(jù)進(jìn)一步評(píng)估了推斷的腫瘤檢查點(diǎn)MRS是否富含必要的蛋白質(zhì)。具體地說(shuō),通過(guò)蛋白質(zhì)活性分析鑒定了與MOMA推斷的亞型最佳匹配的細(xì)胞系。然后根據(jù)匹配細(xì)胞系中的Achilles評(píng)分來(lái)評(píng)估其重要性。
為了評(píng)估MRB是否可以對(duì)患者的預(yù)后進(jìn)行分層,作者使用了以MRB活動(dòng)為預(yù)測(cè)因子的Lasso Cox比例風(fēng)險(xiǎn)回歸模型。這20個(gè)TCGA隊(duì)列中有16個(gè)可以有效地分層,與腫瘤檢查點(diǎn)分層相比,p值通常有很大的改善。
按腫瘤類型分組,熱圖顯示MOMA陰性轉(zhuǎn)錄亞型的MRBS激活(ON)和失活(OFF)有統(tǒng)計(jì)學(xué)意義(P<10-3)。顏色飽和度與統(tǒng)計(jì)學(xué)意義成正比(MRB MRS的平均蛋白質(zhì)活性),參見(jiàn)色標(biāo)圖例。乳腺癌(BRCA)和黑色素瘤(SKCM)亞型分別被標(biāo)記為突出MRB:7和MRB:24的差異激活,也被突出顯示。水平直方圖顯示具有顯著激活(紅色)和非激活(藍(lán)色)塊的子類型的總數(shù),也顯示數(shù)值以便于清晰。
.MRB MRS及其轉(zhuǎn)錄靶點(diǎn)(Benjamini-Hochberg和超幾何檢驗(yàn)的假發(fā)現(xiàn)率[FDR]<0.05)中腫瘤標(biāo)志物的豐富確定了與每個(gè)MRB顯著相關(guān)的標(biāo)志物。順序基于行和列之間的共同聚類,以突出相關(guān)特征。
.MRB:7活動(dòng)對(duì)Metabric乳腺癌隊(duì)列中的生存進(jìn)行分層(p=3.53×10-8;Kaplan Meier)。
.在TCGA黑色素瘤隊(duì)列中,MRB:24活性顯著影響患者的生存(p<1.93×10-5)。與MRB:7相比,MRB:24的活性越高,預(yù)后越好,這與其作為炎癥和免疫感應(yīng)標(biāo)志物的作用一致。
為了驗(yàn)證基因改變對(duì)MRB活性的影響,作者選擇了MRB:2,它是所有亞型中最頻繁激活的。通過(guò)正則化Cox回歸,MRB:2在TCGA中產(chǎn)生了一些最大的結(jié)果回歸系數(shù),成為不良結(jié)果的最重要的預(yù)測(cè)因子之一。
A)熱圖顯示TCGA前列腺癌隊(duì)列(PRAD)基于MR的聚集性,分為7個(gè)分子上不同的亞型,如圖2C所示。
(B)Gleason評(píng)分頻率按亞型分層。
(C)按亞型劃分的生化復(fù)發(fā)情況。
(D)MRB基因富集:2個(gè)在S1和S6亞型間差異表達(dá)的標(biāo)志性基因,經(jīng)t檢驗(yàn)分析排序。每個(gè)標(biāo)記中的基因以黑色刻度表示,統(tǒng)計(jì)顯著性由基因集富集分析計(jì)算(p<2.23×10-16,即低于最小可計(jì)算顯著性)。
然后,作者想探索MRB活性和相關(guān)功能是否可能受到藥物調(diào)節(jié)。作者重點(diǎn)研究了MRB:14,它的活性在建立和維持激素介導(dǎo)的腔上皮特性和細(xì)胞黏附表型方面起著至關(guān)重要的作用。
(A).功能驗(yàn)證分析的概念圖。用慢病毒非靶向?qū)φ蛰d體和含有shRNA發(fā)夾的慢病毒載體感染雄激素非依賴性22Rv1前列腺癌細(xì)胞,沉默MRB:2上游有預(yù)測(cè)的、反復(fù)發(fā)生的基因組事件的基因。然后用穩(wěn)定沉默的克隆細(xì)胞進(jìn)行體外和體內(nèi)實(shí)驗(yàn)。
(B).對(duì)每個(gè)沉默條件(列)中的8個(gè)MRB核心組蛋白(行)進(jìn)行VIPER分析??傮wMRB:2差異活性的意義如上所示。
(C).在創(chuàng)傷愈合實(shí)驗(yàn)中評(píng)估22Rv1細(xì)胞的遷移情況,分別于傷后24小時(shí)(對(duì)照組)、48小時(shí)和72小時(shí)觀察對(duì)照細(xì)胞對(duì)22Rv1細(xì)胞的沉默,一式三份。
(D).遷移試驗(yàn)的定量。條形表示遷移百分比(空隙面積與T=24小時(shí)相比)±平均值的標(biāo)準(zhǔn)誤差(SEM)。兩個(gè)發(fā)夾的P值經(jīng)Fisher‘s法積分(*p<0.0 5,**p<0.001,經(jīng)單尾t檢驗(yàn))。
(E).Boyden小室侵襲實(shí)驗(yàn)定量,一式三份。條形代表浸潤(rùn)細(xì)胞的比例。兩個(gè)發(fā)夾的掃描電鏡p值用Fisher‘s法進(jìn)行積分(**p<0.001,單尾t檢驗(yàn))。
(F).功能性,用于腫瘤致癌效應(yīng)的活體驗(yàn)證。移植了對(duì)照組和沉默的22Rv1細(xì)胞的小鼠的腫瘤生長(zhǎng)曲線最長(zhǎng)可達(dá)35天。在活體分析中,三個(gè)重復(fù)和誤差條代表±SEM;*p<0.001和**p<0.001,用雙尾、雙向方差分析。
(G).顯示選定藥物擾動(dòng)(列)對(duì)MRB活性影響的熱圖:24小時(shí)的14個(gè)MR蛋白(行)。根據(jù)劑量反應(yīng)曲線,藥物名稱后面是其EC20濃度。熱圖頂部的顏色條表示平均MRB:14差異活動(dòng)的重要性。
(H).藥物治療后DU145細(xì)胞遷移實(shí)驗(yàn)的改良,以激活MRB:14,在藥物治療后24小時(shí)進(jìn)行評(píng)估。
(I).在減去DMSO處理的細(xì)胞中的任何剩余間隙面積后,通過(guò)沿間隙積分測(cè)量R3圖像來(lái)定量平均間隙面積(間隙剩余)。剩余間隙百分比是相對(duì)于0小時(shí)時(shí)的圖像計(jì)算的。誤差條表示±SEM。
全文小結(jié):
本篇范文作者通過(guò)使用整合多組學(xué)數(shù)據(jù)的MOMA算法,在調(diào)節(jié)腫瘤特性的蛋白質(zhì)和誘導(dǎo)其異?;顒?dòng)的基因組改變之間建立更直接的聯(lián)系。從分析中發(fā)現(xiàn)的細(xì)粒度亞型結(jié)構(gòu)揭示了一種高度模塊化和重復(fù)性的調(diào)控結(jié)構(gòu)。最終通過(guò)亞型特異性、組合激活或失活24個(gè)主調(diào)控模塊(MRB)來(lái)實(shí)現(xiàn)。