隨著單細胞轉錄組(scRNAseq)測序成本的降低和分析流程的優(yōu)化,scRNAseq在各類研究中的出鏡頻率越來越高。在pubmed中以“single cell RNA sequencing”為關鍵詞進行檢索,發(fā)現(xiàn)高達2.6萬條記錄(其中IF > 20的文章約1400篇),僅2022年就已發(fā)表1800多篇相關文章。scRNAseq普及之前,絕大多數(shù)實驗室只能依賴TCGA bulk RNAseq進行泛癌分析,而如今海量的scRNAseq數(shù)據(jù)為更高精度的泛癌分析提供了數(shù)據(jù)基礎,bulk+scRNAseq泛癌分析已成為切實可行的新思路。本篇推文中,編者選取最新發(fā)表在遺傳學Top期刊《Genome Medicine》雜志上的一篇泛癌基因標簽(gene signature)分析,對主要結果進行解讀,并結合兩篇同類型的文章進行總結,以供讀者參考。
背景
免疫檢查點抑制劑(Immune checkpoint inhibitor,ICI)療法開啟了腫瘤治療的新紀元。然而,只有少量病人對治療有反應,表明仍需挖掘新的biomarkers用于病人的精準分群,進而輔助治療方案的選擇。傳統(tǒng)的biomarker研究多基于完整腫瘤組織的bulk RNAseq,很難精準區(qū)分腫瘤內部的細胞亞群,對ICI治療的指示價值有限。而scRNAseq的高分辨率特性恰好可以彌補這一缺陷,可更加精準地表征腫瘤細胞的異質性,從而開發(fā)表征性能更好的biomarkers。
腫瘤干細胞(Cancer stem cells,CSCs)是一類具有自我更新能力的的癌細胞,可以促進腫瘤發(fā)生、發(fā)展和轉移。多項研究證實腫瘤細胞干性(stemness)與腫瘤免疫逃避及治療抵抗密切相關。一項基于21種實體瘤的泛癌研究發(fā)現(xiàn),腫瘤細胞干性與免疫細胞排斥相關,但其與臨床ICI結果之間的負相關關系尚無直接證據(jù)。利用CytoTRACE包,作者可以預測scRNA-seq數(shù)據(jù)種每個細胞的分化狀態(tài),量化其stemness,進而鑒定與stemness密切相關的基因。
文中,作者首先在兩個ICI scRNAseq數(shù)據(jù)中證實干性和ICI效果之間的負相關關系;隨后基于34個scRNAseq數(shù)據(jù)集(17種腫瘤類型,345個病人,66萬個細胞)構建干性特征標簽(Stem.Sig),并在TCGA(>1萬個病人,30種腫瘤類型)、CRISPR數(shù)據(jù)集(4種腫瘤類型)和10個獨立的ICI數(shù)據(jù)集種進行了驗證;比較發(fā)現(xiàn)Stem.Sig能比以往報道的signatures更好地預測病人對ICI治療的反應。
結果一 腫瘤細胞干性與ICI抗性相關
基于兩個ICI scRNAseq數(shù)據(jù)集(SKCM,BCC),作者利用CytoTRACE量化了每個細胞的干性,結合治療結果發(fā)現(xiàn) non-respond(NR)患者中的腫瘤細胞干性更強。
結果二 基于泛癌scRNAseq數(shù)據(jù)構建Stem.Sig
作者收集了34個scRNAseq數(shù)據(jù)集用以構建Stem.Sig。Stem.Sig候選基因的條件為:1)在腫瘤細胞中顯著上調(logFC ≥ 0.25且FDR < 1e-5);2)與CytoTRACE scores顯著正相關(Spearman R > 0 and FDR < 1e?05);3)在34個數(shù)據(jù)集中的相關性(R)幾何平均數(shù)大于0.4。功能富集發(fā)現(xiàn)Stem.Sig中的基因顯著參與hypoxia、glycolysis、 ubiquitination、EPH-ephrin signaling、WNT Signaling及nucleotide excision repair等通路,這些通路均與腫瘤干細胞的干性維持和抗性密切相關(詳見討論部分)。且一些已報道的與ICI治療不良預后相關的基因如EPHA3、EPHA7、ENO1及ACTG1等也包含在Stem.Sig當中。
結果三 基于TCGA泛癌轉錄組數(shù)據(jù)分析Stem.Sig與免疫抑制之間的潛在聯(lián)系
為了解析Stem.Sig與免疫特征之間的關系,作者分別從代表性基因、通路和標簽(signature)等多個方面,探究它們與Stem.Sig之間的聯(lián)系。首先,作者鑒定了Stem.Sig與75個免疫相關基因之間在泛癌水平的負相關關系,并發(fā)現(xiàn)它與細胞毒性免疫細胞的浸潤水平也呈負相關,暗示了Stem.Sig與抗癌免疫之間的負調控關系。隨后,作者發(fā)現(xiàn)代謝通路、DNA repair和MYC signaling等與低水平免疫應答相關的通路,在Stem.Sig高的腫瘤中顯著富集。此外,對于一些知名的免疫抑制相關特征如腫瘤內異質性(Intra-tumoral heterogenicity, ITH),作者發(fā)現(xiàn)其與Stem.Sig顯著正相關。而對于腫瘤突變負荷(Tumor mutation burden, TMB),它也與Stem.Sig顯著正相關。與之似乎沖突的是,高水平的TMB通常與免疫應答相關。為此,作者將病人分為四組:high Stem.Sig/high TMB (HSHT)、high Stem.Sig/low TMB (HSLT)、low Stem.Sig / high TMB(LSHT)和low Stem.Sig / low TMB (LSLT)。通過比較不同組間免疫浸潤水平發(fā)現(xiàn),抗癌免疫水平由高到低依次為:LSHT > LSLT > HSHT > HSLT,表明Stem.Sig水平低的腫瘤有更好的免疫水平。
結果四 利用Stem.Sig預測免疫治療效果
為了評估Stem.Sig對免疫治療的預測水平,作者收集了三類免疫治療(anti-PD(L)-1、anti-CTLA-4、anti-PD(L)-1和anti-CTLA-4聯(lián)合)共10個bulk RNAseq數(shù)據(jù),以及相應的臨床信息。隨后,作者從7中機器學習算法中,挑選AUC值最高的Na?ve Bayes模型用于后續(xù)預測。在訓練集、驗證集和測試集三類數(shù)據(jù)中,均表明Stem.Sig是一個風險因子,高水平的Stem.Sig與病人不良預后顯著相關。最后,作者比較了Stem.Sig與已報道的泛癌signatures的預測水平,發(fā)現(xiàn)Stem.Sig表現(xiàn)普遍優(yōu)于已報道的泛癌signatures(更高的AUC值)。
結果五 基于CRISPR數(shù)據(jù)挖掘Stem.Sig中的潛在治療靶點
作者收集了7個免疫應答相關的CRISPR數(shù)據(jù)集用于該部分分析。對數(shù)據(jù)集包含的22505個基因根據(jù)z-score進行排序,Top-ranked的為免疫抵抗相關基因,在敲除后會促進抗腫瘤免疫反應;Bottom-ranked的為免疫敏感基因,敲除后會抑制抗腫瘤免疫反應。隨后,作者統(tǒng)計了Top-ranked與Stem.Sig以及其他泛癌signatures中基因的交集情況,發(fā)現(xiàn)Top-ranked基因與Stem.Sig有顯著交集,且比率顯著高于其他幾個signatures。該結果一方面挖掘了作為交集的潛在治療靶點,另一方面再次印證Stem.Sig的預測能力要優(yōu)于其他幾個signatures。
小結
該篇文章遵循“提出假說—建立模型—驗證模型”的思路,框架和結果清晰簡潔。作者從兩個scRNAseq數(shù)據(jù)集入手,初步建立腫瘤細胞干性和ICI治療抵抗之間的聯(lián)系,隨后基于大規(guī)模泛癌scRNAseq數(shù)據(jù)建立干性標簽Stem.Sig,并在TCGA泛癌數(shù)據(jù)中驗證Stem.Sig和多種免疫指標之間的關系。為了檢測Stem.Sig對ICI治療效果的預測能力,作者從7種不同的機器學習模型中挑選最優(yōu)模型,發(fā)現(xiàn)Stem.Sig能有效預測ICI病人預后,且效果優(yōu)于已報道的一些signatures。最后,作者還整合CRISPR數(shù)據(jù),進一步精細定位到少數(shù)可作為潛在治療靶點的基因。
仔細閱讀這篇文章可有以下幾點收獲:1)對于分析為主的老師/學生,對數(shù)據(jù)一定要有敏感性,比如文章中提到的ICI數(shù)據(jù)集、scRNAseq數(shù)據(jù)以及CRISPR數(shù)據(jù),要及時整理收藏做好記錄,不能等哪天需要了再去檢索;2)同理,文中提到了大量的signatures,比如各種泛癌signatures、免疫相關標志物/通路,也包括Stem.Sig本身,以后但凡涉及到解析不同組間免疫差異或分子機制,都可以活學活用,從多角度提供數(shù)據(jù)來支持自己的假說;3)由scRNAseq出發(fā),結合TCGA泛癌數(shù)據(jù)進行挖掘,一方面提高了內容的精準度,為文章增色,另一方面也是充分利用公共數(shù)據(jù),多角度證實假說的可行途徑。
現(xiàn)在scRNAseq課題的門檻和數(shù)年之前相比已經大幅度降低,提供了bulk RNAseq整合scRNAseq進行分析的數(shù)據(jù)基礎,因此對于分析為主的課題,都可以將scRNAseq數(shù)據(jù)考慮進去,提升課題質量。在“生信人”微信公眾號以往推文中,曾多次介紹過scRNAseq泛癌分析的相關內容, 現(xiàn)結合其中兩篇推文的內容,一并概括。兩篇推文中的文獻IF略高于6(cells,6.6;Cancers,6.1),均屬于純生信分析。
在第一篇文章(Single-Cell Transcriptomics Reveals the Expression of Agingand Senescence-Associated Genes in Distinct Cancer Cell Populations)中,作者收集了5類腫瘤的TCGA/GEO bulk RNAseq和scRNAseq數(shù)據(jù)。首先,基于TCGA/GEO數(shù)據(jù)鑒定與年齡和衰老相關的候選基因,并發(fā)現(xiàn)這些基因與在腫瘤中上調的基因之間有明顯交集??紤]到bulk RNAseq數(shù)據(jù)中非腫瘤細胞的影響,作者收集了相應的scRNAseq數(shù)據(jù),并在腫瘤細胞亞群中利用擬時分析,揭示了年齡和衰老相關基因在不同腫瘤細胞亞型中的表達特征。文章結構很簡單,在前兩個結果中鑒定出候選基因之后,后續(xù)結果就是簡單在5類腫瘤中重復多次分析,也沒有涉及更多角度的內容。此外,由于涉及的腫瘤類型很少,因此嚴格來講并不能算是泛癌分析。
第二篇文章(Cancer-Specific Immune Prognostic Signature in Solid Tumors and Its Relation to Immune Checkpoint Therapies)中,作者首先對5個不同類型腫瘤的scRNAseq數(shù)據(jù)進行分析,基于公開報道的免疫相關標志物(LM22、LM7、ImSig signature和NanoString)對細胞進行聚類分析,結果發(fā)現(xiàn)不同癌種的細胞均可分為2-3類免疫亞群,證實了腫瘤中主要免疫亞群的分群可靠性。隨后,作者基于同樣的標志物,對TCGA 20種腫瘤進行免疫分群,得到兩個不同的亞群,不同亞群之間有顯著的預后差異,但呈現(xiàn)出癌種特異性。為了構建預測模型,作者分別在每一類腫瘤中利用彈性網絡模型進行構建,最終得到155個與腫瘤預后相關的基因,基于這些基因進一步構建的Immune Score與病人預后顯著相關,但同樣呈現(xiàn)腫瘤特異性。此外,作者還結合ICI數(shù)據(jù),發(fā)現(xiàn)Immune Score可指示ICI治療后病人的應答狀況。該篇文章中,僅有第一部分涉及到scRNAseq內容,目的也僅僅是為了驗證免疫分群的猜想,因此盡管涉及癌種較多,但并算不上bulk RNAseq和scRNAseq“整合分析”。
綜上,大家在設計自己課題時,首先要做好數(shù)據(jù)調研,準備充實的數(shù)據(jù)基礎;其次,真正做到整合分析,而不是僅僅停留在使用了兩類數(shù)據(jù);最后的重中之重,就是結合多方位的數(shù)據(jù),講好自己的生物學故事。