大家好,今天給大家介紹一個(gè)數(shù)據(jù)庫(kù)網(wǎng)站,生物信息學(xué)文章日益增多,在線零代碼分析的腫瘤數(shù)據(jù)庫(kù)也越來(lái)越多,大部分都是連接到TCGA數(shù)據(jù)庫(kù)的癌癥數(shù)據(jù),從GEPIA到TIMER,涉及的方向也是越來(lái)越多,從基礎(chǔ)的表達(dá)量分析到生存分析,到近來(lái)的免疫浸潤(rùn)以及日益火爆的單細(xì)胞分析,簡(jiǎn)單直觀明了的操作界面幫助我們快捷方便的完成論文中的圖標(biāo)制作,圖片質(zhì)量也越來(lái)越高。
同時(shí),惡性腫瘤是機(jī)體正常細(xì)胞癌變的產(chǎn)物, 具有不斷增殖并有可能在體內(nèi)轉(zhuǎn)移的特點(diǎn)。為了生存和生長(zhǎng), 腫瘤細(xì)胞能夠采用不同策略抑制人體的免疫系統(tǒng), 使其不能正常地殺傷腫瘤細(xì)胞, 從而在抗腫瘤免疫應(yīng)答的各階段得以幸存。簡(jiǎn)單來(lái)說(shuō),免疫治療的目的其實(shí)就是通過(guò)調(diào)動(dòng)人體強(qiáng)大的免疫系統(tǒng)來(lái)對(duì)抗癌癥。通過(guò)分離獲取的患者自身免疫細(xì)胞, 在細(xì)胞因子的誘導(dǎo)下,大量擴(kuò)增出具有高度抗腫瘤活性的免疫細(xì)胞,回輸?shù)交颊唧w內(nèi)以恢復(fù)患者免疫的力量進(jìn)而攻擊腫瘤。漸漸的,免疫治療在癌癥治療領(lǐng)域不斷展現(xiàn)實(shí)力,逐漸成為癌癥治療炙手可熱的明星療法。在多個(gè)復(fù)發(fā)或難治性的惡性腫瘤中都展現(xiàn)了十分強(qiáng)勁的治療效果;那么今天我們來(lái)介紹一個(gè)與腫瘤免疫治療相關(guān)的在線數(shù)據(jù)庫(kù)——“TIGER”。
文章名稱:
TIGER: A Web Portal of Tumor Immunotherapy Gene Expression Resource
DOI:https://doi.org/10.1016/j.gpb.2022.08.004
雜志:Journal Pre-proofs ,if:7.614(一區(qū))
數(shù)據(jù)的來(lái)源與處理方法:
與其他很多癌癥數(shù)據(jù)庫(kù)類(lèi)似,TIGER數(shù)據(jù)庫(kù)也是與TCGA數(shù)據(jù)庫(kù)鏈接的,構(gòu)建數(shù)據(jù)庫(kù)的腫瘤和正常RNA-seq樣本數(shù)據(jù)來(lái)自于UCSC Xena數(shù)據(jù)庫(kù)(https://xena.ucsc.edu)。
通過(guò)搜索immunotherapy, programmed cell death protein 1 (PD-1) inhibitors, and cytotoxic, T-lymphocyte antigen 4 (CLTA4) inhibitors等關(guān)鍵詞,從GEO(https://ncbi.nlm.nih.gov/geo)和SRA (https://ncbi.nlm.nih.gov/sra)數(shù)據(jù)庫(kù)中收集具有臨床免疫治療信息的腫瘤樣本的bulk RNA-seq和基因表達(dá)芯片數(shù)據(jù)。但是在沒(méi)有原始數(shù)據(jù)的情況下,則會(huì)使用預(yù)處理數(shù)據(jù),小編認(rèn)為這將不可避免地造成一些數(shù)據(jù)上的誤差,但是影響不大。
另外人類(lèi)腫瘤的單細(xì)胞bulk RNA-seq是在GEO、Genome Sequence Archive (GSA) (https://bigd.big.ac.cn/gsa-human)、EMBL-EBI (https://www.ebi.ac.uk)、Single-Cell Portal數(shù)據(jù)庫(kù)中通過(guò)檢索single-cell、scRNA-seq、10x Genomics、inDrop、Smart-seq2等關(guān)鍵詞收集的。
單細(xì)胞數(shù)據(jù)的預(yù)處理方法是:
利用STAR將FASTQ格式的reads與人類(lèi)參考基因組(hg38, GRCh38)進(jìn)行比對(duì),然后利用Cell Ranger導(dǎo)出基因表達(dá)矩陣。使用Seurat (v3.1.3) R 包對(duì)每個(gè)單細(xì)胞bulk RNA-seq數(shù)據(jù)集進(jìn)行質(zhì)量控制。首先,線粒體RNA含量超過(guò)10%的細(xì)胞被認(rèn)為已經(jīng)死亡或正在死亡,并被移除。reads數(shù)小于200或大于3000的細(xì)胞也被排除。同時(shí)表達(dá)以上三種標(biāo)記物(CD2、CD79A和CD68)中一個(gè)或多個(gè)的細(xì)胞被定義為二聚體并去除。其次,將過(guò)濾后的每個(gè)樣本的基因表達(dá)矩陣用Seurat包的NormalizeData函數(shù)進(jìn)行歸一化,用FindVariableFeatures函數(shù)保留高變異基因;最后,利用FindVariableFeatures和Integratedata函數(shù)對(duì)所有樣本的基因表達(dá)矩陣進(jìn)行整合,并對(duì)不同樣本之間的批次效應(yīng)進(jìn)行校正。接下來(lái)則是常規(guī)的細(xì)胞聚類(lèi)和細(xì)胞亞群注釋。
隨后,對(duì)單細(xì)胞的腫瘤樣本與正常樣本進(jìn)行差異分析,通路富集分析,不同細(xì)胞類(lèi)型間基因?qū)Φ钠柹嚓P(guān)性分析,細(xì)胞軌跡分析,細(xì)胞通訊分析。
bulk基因表達(dá)數(shù)據(jù)分析:
去除低質(zhì)量的探針數(shù)據(jù),對(duì)探針進(jìn)行注釋?zhuān)?shù)據(jù)轉(zhuǎn)換為FPKM類(lèi)型。
接下來(lái)對(duì)數(shù)據(jù)進(jìn)行差異分析,生存分析,相關(guān)性分析,預(yù)測(cè)免疫治療的反應(yīng)。預(yù)測(cè)免疫治療反應(yīng)的特征基因從文獻(xiàn)中獲得,每個(gè)特征基因的得分根據(jù)原研究中使用的參數(shù)計(jì)算。我們采用RRA算法以無(wú)偏差的方式整合所有特征基因的得分。整合后的得分用于預(yù)測(cè)癌癥患者的免疫治療反應(yīng)。
最終以上的所有分析結(jié)果,以及TIGER中的所有數(shù)據(jù)都以MySQL表、JSON文件、Rds和RData文件的形式保存。Web接口已包括PHP、HTML、JavaScript和CSS。并使用ECharts和Rscripts生成統(tǒng)計(jì)圖。
數(shù)據(jù)庫(kù)首頁(yè):
TIGER是一個(gè)與腫瘤免疫相關(guān)的、可基于表達(dá)數(shù)據(jù)進(jìn)行多項(xiàng)分析的網(wǎng)站。TIGER包含來(lái)自TCGA的1508個(gè)具有免疫治療臨床結(jié)局的腫瘤樣本和11057個(gè)腫瘤/正常樣本的批量轉(zhuǎn)錄組數(shù)據(jù),以及655個(gè)樣本、2116945個(gè)細(xì)胞的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),其中63個(gè)樣本的119039個(gè)細(xì)胞具有免疫治療臨床數(shù)據(jù)。此外,作者還收集了8個(gè)CRISPR和2個(gè)shRNA screen數(shù)據(jù),這些數(shù)據(jù)來(lái)自于抗癌免疫反應(yīng)基因的研究。并從公共文獻(xiàn)中收集了11個(gè)可能用于預(yù)測(cè)免疫治療反應(yīng)的特征基因。
TIGER由四個(gè)主要模塊組成,包括免疫治療反應(yīng)模塊、反應(yīng)特征模塊、單細(xì)胞免疫模塊和快速搜索免疫篩選模塊。
1.快速搜索:當(dāng)用戶進(jìn)入網(wǎng)站時(shí),可以在頁(yè)面中間看到一個(gè)快速搜索欄。用戶可以通過(guò)搜索感興趣的基因Symbol,得到在所有數(shù)據(jù)集中具有顯著差異的結(jié)果,如不同細(xì)胞類(lèi)型下腫瘤組織與正常組織的差異,免疫治療反應(yīng)樣本與非反應(yīng)樣本的差異。
2.基因信息:內(nèi)含基因信息的總結(jié),包括基因信息(Gene Information)和通路信息(Pathway Information)。
3.單細(xì)胞免疫:在單細(xì)胞免疫模塊中,用戶可以懸停在圖中圓點(diǎn)上或?qū)Ρ砀衽判?,以發(fā)現(xiàn)不同癌癥的細(xì)胞類(lèi)型標(biāo)記基因。此外,用戶可以單擊表的選項(xiàng)卡來(lái)顯示數(shù)據(jù)集中這種細(xì)胞類(lèi)型的詳細(xì)圖像。
在表達(dá)相關(guān)性分析中,用戶可以計(jì)算一個(gè)感興趣的基因與其他基因的表達(dá)之間的相關(guān)性,也可以基于輸入基因計(jì)算不同細(xì)胞類(lèi)型中的表達(dá)相關(guān)性。在差異表達(dá)分析中,用戶可以點(diǎn)擊表格選項(xiàng)卡查看詳細(xì)信息,該詳細(xì)信息由UMAP圖和條形圖組成,用于可視化所選基因在不同組之間的差異表達(dá)。
4.免疫治療反應(yīng): TIGER會(huì)展示差異表達(dá)分析和生存分析。散點(diǎn)圖和表格將顯示每個(gè)數(shù)據(jù)集的具體差異分析結(jié)果。
5.反應(yīng)特征:在AUC Matrix和Survival Matrix中,用戶可以利用基因表達(dá)數(shù)據(jù)和免疫治療臨床信息,將自己的特征基因與已知的免疫治療響應(yīng)特征基因進(jìn)行比較
在Correlation Matrix中,用戶可以在沒(méi)有免疫治療臨床信息的情況下,使用TCGA基因表達(dá)數(shù)據(jù)來(lái)探索感興趣的基因是否與已知的免疫治療特征基因相關(guān)。
6.免疫篩選:CRISPR screen和RNAi Screen相關(guān)的基因信息將以表格的形式顯示,點(diǎn)擊表格即可獲得數(shù)據(jù)集相關(guān)信息。
小結(jié):
TIGER 可以對(duì)與癌癥免疫治療相關(guān)的基因或單細(xì)胞轉(zhuǎn)錄組的基因表達(dá)數(shù)據(jù)進(jìn)行綜合分析。與 TCIA、TIDE 和 TISCH 等其他現(xiàn)有工具相比,TIGER 具有多個(gè)優(yōu)勢(shì):
1. TIGER 是第一個(gè)整合了癌癥bulk RNA-seq、芯片數(shù)據(jù)和單細(xì)胞基因表達(dá)數(shù)據(jù),并用以發(fā)現(xiàn)癌癥免疫治療中的抗腫瘤免疫機(jī)制并反應(yīng)生物標(biāo)志物的在線數(shù)據(jù)庫(kù)。
2. TIGER 擁有最全面的癌癥免疫治療相關(guān)轉(zhuǎn)錄組基因表達(dá)數(shù)據(jù),包含了33 種癌癥類(lèi)型的 11,057 個(gè)腫瘤和正常樣本的非免疫療法基因表達(dá)數(shù)據(jù)、8 種癌癥類(lèi)型的 1508 個(gè)腫瘤樣本的免疫療法基因表達(dá)數(shù)據(jù),以及來(lái)自 25 種癌癥類(lèi)型的 655 個(gè)樣本的 2,116,945 個(gè)細(xì)胞的單細(xì)胞基因表達(dá)數(shù)據(jù)。
3. 與其他工具相比,TIGER 包含更多用于bulk RNA-seq和單細(xì)胞基因表達(dá)數(shù)據(jù)的分析和可視化功能。特別是,使用 scbulk RNA-seq在腫瘤和正常細(xì)胞之間以及不同細(xì)胞類(lèi)型之間進(jìn)行差異分析,使用戶能夠探索抗腫瘤免疫并開(kāi)發(fā)特定細(xì)胞類(lèi)型的基因特征。