腫瘤分型對于惡性腫瘤生物學行為和預后評估至關重要,同時也有助于個體化治療,因此一直是腫瘤研究的一個熱點方向。在分型研究中,選好關注角度,對后續(xù)研究,以及結果刻畫至關重要。生信人也介紹了多個腫瘤分型相關的文章及思路,小編今天就再和大家分享一篇今年7月8日剛剛發(fā)表在Genome Medicine(IF:15.266)雜志上的關于肺鱗癌分型與免疫治療的文章。文章采用的分型方法是經(jīng)典的非負矩陣分解(NMF),但關注了免疫治療耐藥性,并結合多組學數(shù)據(jù),使文章思路新穎,內(nèi)容豐富。做分型的小伙伴一定不要錯過這篇文章呀。
Identifcation of a cytokine-dominated immunosuppressive class in squamous cell lung carcinoma with implications for immunotherapy resistance
識別鱗狀細胞肺癌中以細胞因子為主的免疫抑制類與免疫治療耐藥性的關系
一.研究背景
肺癌是世界范圍內(nèi)最常見的癌癥,也是癌癥相關死亡的主要原因。其中非小細胞肺癌(Non-smallcell lung cancer, NSCLC)約占肺癌患者的85%。除肺腺癌外,肺鱗癌(lung squamous carcinoma, LUSC)是NSCLC最常見的組織學亞型。目前免疫檢查點阻斷(ICB)療法顯著改善了肺鱗癌(LUSC)的治療。然而,仍然存在相當一部分高PD-L1表達患者對免疫檢查點抑制劑具有耐藥性。因此,進一步了解潛在的耐藥機制,刻畫免疫抑制腫瘤微環(huán)境和識別生物標志物對預測患者耐藥來說十分有必要。
二.文章摘要
該研究對624例LUSC樣本的RNA測序數(shù)據(jù)進行了分析。作者通過無監(jiān)督聚類分析腫瘤微環(huán)境中的基因表達模式,并將表達模式與一組T細胞耗竭特征、免疫抑制細胞、臨床特征和免疫治療反應聯(lián)系起來。使用內(nèi)部和外部測試數(shù)據(jù)集來驗證耗竭免疫狀態(tài)的存在。結果觀察到大約28 - 36%的LUSC患者表現(xiàn)出顯著的T細胞耗竭特征富集、免疫抑制細胞比例高、抑制檢查點的共同上調(diào),以及抗炎細胞因子的表達增強。作者將這一免疫抑制組患者定義為耗竭免疫類(EIC),作者也觀察到EIC表現(xiàn)出腫瘤浸潤淋巴細胞密度高,與不良預后相關的特征,且盡管EIC PD-L1表達相對升高,但對ICB治療有潛在的耐藥性。作者也開發(fā)了一個web應用程序,以便研究人員根據(jù)多組學分析數(shù)據(jù)進一步探索ICB耐藥性的潛在關聯(lián)。
三.數(shù)據(jù)及方法
1. LUSC數(shù)據(jù)集和資源:作者從TCGA(497個RNA測序[RNAseq]數(shù)據(jù)集)和GEO(127個芯片數(shù)據(jù)集)中檢索到624個人類LUSC樣本的基因表達譜。由于腫瘤分期的不同會影響臨床特征和治療方案,因此作者將497例TCGA LUSC患者分為晚期組(IIA - IV期,250例患者)進行訓練和早期組(i - II期,247例患者)進行內(nèi)部驗證。其他突變、拷貝數(shù)變異、甲基化、臨床病理等相關數(shù)據(jù)也均從TCGA獲取。同時作者對蛋白編碼基因數(shù)據(jù)進行NMF分析。另外來自GEO的兩個獨立數(shù)據(jù)集用作外部驗證。作者也從GEO數(shù)據(jù)庫獲取28例黑色素瘤患者樣本(GSE78220)經(jīng)抗PD -1治療后的臨床結果和基因表達情況數(shù)據(jù),并基于irRECIST識別應答模式。
2. 無監(jiān)督聚類識別耗竭免疫類:作者基于250名訓練隊列的樣本的RNA-seq數(shù)據(jù)使用非負矩陣分解(NMF)進行分析。作者也通過單樣本基因集富集分析(ssGSEA)計算免疫和基質(zhì)富集評分來揭示免疫和基質(zhì)相關的表達模式。接著作者將免疫和基質(zhì)富集分數(shù)與NMF識別的簇結合,觀察到,與其他簇相比簇2具有更高的富集分數(shù),因此,作者將第2類稱為“免疫基質(zhì)類”。接下來作者分析了免疫基質(zhì)簇腫瘤中特異性免疫細胞的豐度,并收集了許多代表各種免疫細胞的特征,用于ssGSEA計算富集分數(shù)。然后將免疫細胞的富集分數(shù)與簇結合,以確定免疫基質(zhì)簇中特異性免疫細胞的豐度。另外,作者也從TIMER數(shù)據(jù)庫中下載了基于基因表達譜的CIBERSORT算法推斷的22個浸潤免疫細胞數(shù)據(jù)。此外,作者從先前研究中下載了樣本的白細胞分數(shù)及腫瘤浸潤淋巴細胞(TIL)百分數(shù)。然后,作者提取TCGA LUSC患者22類浸潤免疫細胞的分數(shù)、白細胞分數(shù)和TIL百分比,比較免疫基質(zhì)簇與其余簇之間的差異。最后,作者對多個抑制受體進行表達譜分析,并對代表T細胞耗竭的基因特征進行ssGSEA評分,結果觀察到免疫基質(zhì)簇過表達多個抑制受體,并具有高T細胞耗竭相關的特征富集分數(shù)。因此,作者將免疫基質(zhì)簇群體定義為耗竭免疫類別(EIC),其余群體定義為剩余類別,并使用NMF包裝的extractFeature方法提取相關基因(宏基因特異性基因)來刻畫EIC的表達模式。
3. 耗竭免疫類的分子特征:作者采用GSEA和ssGSEA分析EIC中分子通路的富集情況和基因表達特征。作者從MSigDB獲取hallmark基因集和KEGG通路特征,并利用Cytoscape插件ClueGO生成KEGG通路的功能分組網(wǎng)絡來分析宏基因特異性基因的生物學作用。接著為識別EIC組和其他組的差異表達基因,作者采用DESeq2進行基因差異表達分析,并在宏基因特異性基因中,將EIC與其他類之間的差異表達基因定義為TCGA訓練隊列中用于識別EIC的耗竭免疫分類基因,同時使用GSEA識別EIC中富集的激活通路和hallmark基因集。
4. EIC的早期TCGA LUSC內(nèi)部驗證:作者為了證實早期LUSC中存在免疫衰竭狀態(tài),使用上述方法對247個早期樣本的表達譜進行了NMF和ssGSEA分析。同樣,也獲得了4個早期LUSC簇。當整合早期樣本中用于晚期LUSC隊列的特征富集分數(shù)時,作者觀察到簇2具有更高的免疫細胞、基質(zhì)和TEX相關的特征富集分數(shù)。因此,簇2在早期被識別為早期LUSC的EIC。作者同樣比較EIC組與其他組的免疫細胞比例、白細胞比例、TIL比例和多重抑制受體表達,并通過GSEA識別hallmark富集和KEGG通路。此外,作者使用ssGSEA計算訓練階段獲得的167個耗竭免疫分類基因的富集分數(shù),定義為EIC分數(shù),并采用ROC分析評價其預測能力。
5. EIC的ICB治療預測:作者用TIDE算法預測潛在的ICB治療反應。作者還分析了黑素瘤腫瘤表達的公開數(shù)據(jù)和使用抗PD-1治療的患者的臨床結果,來驗證ICB治療耐藥性與167個耗竭的免疫分類基因之間的關聯(lián),即利用167個耗竭免疫分類基因,通過ssGSEA計算黑色素瘤腫瘤樣本的EIC評分,并比較應答者和無應答者。
6. EIC的基因組突變、染色體變異和甲基化分析:作者采用Maftools對體細胞突變進行分析,并統(tǒng)計體細胞突變總數(shù),還從先前研究獲取LUSC患者新抗原的統(tǒng)計信息。作者從cBioPortal for Cancer Genomics數(shù)據(jù)庫中獲取GISTIC2.0生成的TCGA LUSC樣本拷貝數(shù)數(shù)據(jù)。然后,作者評估了EIC與其他類在體細胞突變、新抗原數(shù)量和拷貝數(shù)變化方面的差異。此外,作者也使用limma包識別EIC和其他類別之間差異甲基化的顯著CpG位點。最后,計算了啟動子區(qū)域甲基化水平與相應基因表達的相關性。
7. EIC的獨立數(shù)據(jù)集驗證:作者利用無監(jiān)督隨機森林方法評估免疫分類基因的魯棒性?;谶@些基因的表達值,使用randomForest R包對訓練隊列進行了無監(jiān)督學習,然后利用NMF在另外兩個數(shù)據(jù)集上驗證了耗竭免疫分類基因預測耗竭免疫狀態(tài)的能力。
8. 高度可視化的交互式web應用程序:基于研究的分析數(shù)據(jù),作者使用R中的' shiny '構建了一個交互式的web應用程序,以供其他研究者在多組學水平上探索免疫治療耐藥性的潛在機制。web應用程序包括幾個免疫治療耐藥相關分析模塊,如耗竭免疫分類模塊、特征表達模塊、體細胞突變模塊、臨床預后模塊、microRNA模塊和甲基化模塊。
9. 蛋白表達分析:作者為研究EIC蛋白表達的變化,從TCGA下載了319例LUSC患者的蛋白表達數(shù)據(jù),來比較EIC組與其余組的蛋白表達。此外,作者通過Human protein Atlas的病理切片探索了蛋白的表達。
四.研究的主要內(nèi)容與結果
1. 識別及刻畫晚期LUSC的耗竭免疫類
在文章的第一部分,作者對訓練隊列中250個晚期LUSC樣本進行了NMF分析,訓練隊列的數(shù)據(jù)集被分為四個表達簇(圖1A)。作者通過ssGSEA計算發(fā)現(xiàn)簇2的LUSC患者具有較高的免疫和基質(zhì)富集分數(shù),表明免疫細胞和基質(zhì)成分基因表達特征顯著富集,作者將這一簇命名為免疫基質(zhì)簇(Fig. 1B),作者發(fā)現(xiàn)免疫基質(zhì)簇具有顯著富集的免疫細胞特征(圖1C)。接下來,作者為了進一步驗證這些免疫細胞在免疫基質(zhì)簇中的富集,比較了CIBERSORT估算的免疫細胞在免疫基質(zhì)簇和其他簇之間的絕對比例。結果發(fā)現(xiàn)與ssGSEA富集分析一致(圖1D)。此外,作者也觀察到免疫基質(zhì)簇中DNA甲基化評估的白細胞比例明顯高于其他簇(圖1E)。同樣,作者通過病理圖像評估的腫瘤浸潤淋巴細胞(TILs)發(fā)現(xiàn)在免疫基質(zhì)簇中明顯高于其他簇(圖1F)。接下來為了探索LUSC中的TEX,作者對多種抑制受體進行了表達譜分析,結果發(fā)現(xiàn)這些抑制受體在免疫基質(zhì)簇的樣本中顯著上調(diào)(圖1G),且免疫基質(zhì)簇的患者也表現(xiàn)出了多個基因集的顯著富集(圖1H)?;谏鲜鲆种剖荏w的表達分析和TEX信號基因集的富集得分,作者識別出了一個新的群體亞群,屬于免疫基質(zhì)群,占訓練隊列的36.4%,并稱為耗竭免疫類(EIC)(圖1H)。作者將訓練隊列中的剩余亞群定義為剩余類。為了進一步驗證EIC的T細胞耗竭,作者收集了三種參與TEX調(diào)控的免疫抑制細胞類型(NK細胞、巨噬細胞和CD4_Treg_cells)的3個基因特征,以及促進TEX的細胞因子的4組hallmark基因(圖1H),印證EIC的免疫抑制TME。以上結果表明,作者識別出了一個耗竭的免疫類群,該免疫類群在TME中顯著富集了耗竭的T細胞和其他免疫抑制細胞的基因表達特征。
2. 細胞因子富集是EIC特有的分子特征
在這一部分,作者為了刻畫EIC的分子特征,在訓練隊列使用基因集富集分析(GESA)識別了KEGG通路和hallmark基因集在EIC中富集情況,結果觀察到細胞因子相關的通路和hallmark在EIC中顯著富集(圖1I)。作者使用ClueGO將NMF提取的253個代表EIC表達模式的宏基因特異性基因分組成KEGG通路網(wǎng)絡,進一步揭示它們的分子功能(圖1J)。 上述分子功能刻畫表明,細胞因子相關的表達信號在LUSC的耗竭免疫狀態(tài)中起主導作用。
3. EIC的早期TCGA LUSC內(nèi)部驗證
在這一部分作者為了驗證早期LUSC是否存在耗竭的免疫類,對另外247個TCGA早期LUSC樣本進行了NMF,獲得了4個簇(圖2A),并通過ssGSEA分析觀察到簇2的基質(zhì)和免疫富集分數(shù)高于其他簇(圖2B)。此外,簇2還表現(xiàn)出與TEX相關的免疫細胞基因表達特征和其他細胞因子hallmark的顯著富集(圖2B)。因此,在TCGA早期LUSC樣本中,作者將簇2定義為耗竭的免疫類。作者也觀察到與LUSC晚期EIC相一致的是,早期LUSC 的EIC中CIBERSORT評估的的浸潤免疫細胞、白細胞及腫瘤浸潤淋巴細胞的比例都較高(圖2C-E)。作者也在早期LUSC的EIC中觀察到多個抑制受體共同上調(diào)(圖2F)。不過在早期LUSC的 EIC中未觀察到凋亡hallmark的富集,這表明早期LUSC的EIC的TEX水平低于晚期。此外,ROC曲線(圖2H)也表明耗竭免疫分類基因對EIC具有良好的預測性能。
4. EIC在LUSC晚期預后較差
在這一部分作者通過與臨床病理變量相關的分類來研究耗竭免疫狀態(tài)的預后價值。結果發(fā)現(xiàn)在晚期和早期LUSC的EIC中TILs的比例均高于其余類(圖1F和2E),不過LUSC晚期的Kaplan-Meier分析表明EIC患者的OS和PFS明顯較差(圖3A,D),且Cox多因素分析也顯示EIC仍是LUSC晚期OS的獨立預后因素(圖3G)。作者也發(fā)現(xiàn)對于早期LUSC, EIC組與其他組的OS和PFS均無差異(圖3 B,E)。最后,作者分析了所有階段LUSC患者的預后價值發(fā)現(xiàn)EIC患者的OS和PFS比其他類更差(圖3 C,F)。這些結果證實,雖然EIC中存在大量的T細胞,但大部分T細胞處于免疫抑制狀態(tài),失去了控制腫瘤進展的效應細胞功能,導致預后較差。
5. EIC與免疫治療抵抗有關
在這一部分,作者為了研究EIC對ICB治療的反應,比較了EIC和其余類患者的PD-L1表達,發(fā)現(xiàn)在早期和晚期LUSC中,EIC的PD-L1表達水平均高于其余類患者(圖4A,B)。作者還使用TIDE算法來預測ICB治療反應,結果觀察到在早期和晚期LUSC中,EIC的TIDE預測得分都高于其他類別(圖4A,B)。TIDE預測得分越高,ICB反應越差,這些結果表明,雖然EIC患者有高PD - L1表達,但他們可能對ICB治療有耐藥性。作者為了進一步驗證EIC的免疫治療耐藥性,計算了28例經(jīng)抗PD-1治療的轉移性黑色素瘤患者和497例TCGA所有腫瘤分期的LUSC患者的167個耗竭免疫分類基因的富集評分。結果發(fā)現(xiàn)對ICB治療無反應的黑色素瘤患者比對ICB治療有反應的黑色素瘤患者有更高的富集分數(shù)(圖4C)。且EIC內(nèi)的患者也顯示出比其他組更高的富集分數(shù),進一步證明了EIC的耐藥性(圖4D)。作者也觀察到TGFB1在EIC中的表達水平高于其他類(圖4E)。
6. EIC具有獨特的甲基化模式
在這一部分作者為了探索EIC中與調(diào)控基因相關的表觀遺傳改變,對所有腫瘤分期的TCGA隊列進行了全基因組甲基化分析,發(fā)現(xiàn)與其他類型相比,EIC中位于162個免疫相關基因啟動子區(qū)域的216個CpG位點發(fā)生了差異甲基化(圖5A,B)。作者也觀察到,與其他類相比,ARTN的啟動子區(qū)甲基化水平更高,EIC的基因表達水平更低,相反,轉錄因子SMAD7在EIC中甲基化水平較低,表達較高(圖5C-E)。
7. EIC在腫瘤突變負荷或新抗原數(shù)量上沒有差異但在拷貝數(shù)負荷上有改變
腫瘤的基因組突變與免疫治療結果密切相關,因此在這一部分作者描繪了在晚期和早期LUSC的EIC和其他類之間的基因突變景觀。結果發(fā)現(xiàn)EIC組與其他組個體基因突變無顯著差異(圖6A,D)。作者還將體細胞突變負荷和突變的新抗原與LUSC的耗竭免疫狀態(tài)聯(lián)系起來,結果也沒有觀察到顯著改變(圖6B-E)。作者進一步研究了EIC評分與TMB之間的相關性,結果如圖6G所示,EIC評分和TMB之間沒有顯著的相關性,表明EIC評分可獨立預測免疫治療耐藥性。另一方面,作者也發(fā)現(xiàn)EIC樣本有較低的拷貝數(shù)改變負荷(圖6 H-O)。
8. 新耗竭免疫類在兩個獨立數(shù)據(jù)集上的外部驗證
作者在這一部分為了驗證LUSC樣本訓練隊列中存在耗竭免疫狀態(tài),使用167個耗竭的免疫分類基因,在另外兩個獨立的測試數(shù)據(jù)集中估計了免疫分類基因預測免疫耗竭狀態(tài)的能力。結果發(fā)現(xiàn)與訓練隊列相似,大約30-35%的LUSC樣本在測試數(shù)據(jù)集中被識別為EIC。接著作者基于基因表達譜,對測試數(shù)據(jù)進行分子識別,也證實EIC具有較高的免疫和基質(zhì)富集得分。
9. EIC中IDO蛋白表達較高
在文章的最后一部分,作者利用LUSC的RPPA數(shù)據(jù)研究EIC與其他類的蛋白表達差異。結果觀察到早期和晚期LUSC的EIC中PD-L1和IDO蛋白的表達均高于其他類(圖7A,B)。由于在選擇NSCLC患者進行抗PD -1抑制劑治療時,會采用免疫組化的方法來評估PD-L1蛋白的表達。因此,作者研究了不同的IDO蛋白表達HPA免疫組化染色的LUSC患者組織圖像,結果觀察到LUSC患者IDO免疫組化表達量不同(圖7C)。這些證據(jù)表明,在LUSC患者的轉錄組、蛋白組和染色組織中IDO的表達水平存在差異,表明IDO免疫組化表達可能是PD-L1高表達的LUSC免疫治療耐藥的潛在生物標志物。
到這里這篇文章的主要內(nèi)容就介紹完了,文章整合多個平臺的多組學數(shù)據(jù),采用非負矩陣分解的方法識別了LUSC患者中的免疫抑制類,并分析了其與ICB治療的潛在耐藥性關聯(lián),同時對這一免疫抑制類從表達、功能、表觀等多個層面進行了分析。文章的核心方法包括非負矩陣分解及ssGSEA等經(jīng)典的生物信息方法,數(shù)據(jù)也來自公共數(shù)據(jù)庫,這一篇公共數(shù)據(jù)庫的純生信分型文章能發(fā)到15+,小編認為其亮點在于內(nèi)容豐富、邏輯清晰、關注熱點。