張曉艷課題組建立病毒突變、整合及順式效應(yīng)數(shù)據(jù)庫(kù)ViMIC——用于病毒介導(dǎo)的發(fā)病機(jī)制研究
2021年9月,同濟(jì)大學(xué)生命科學(xué)與技術(shù)院張曉艷課題組在Nucleic Acids Research(中科院JCR分區(qū)1區(qū),IF=16.971)雜志上發(fā)表文章ViMIC: a database of human disease-related virus mutations, integration sites and cis-effects,建立了病毒突變、整合及順式效應(yīng)數(shù)據(jù)庫(kù)ViMIC(http://bm#cn/ViMIC/index.php)。
病毒的發(fā)病機(jī)制十分復(fù)雜,涉及與宿主相互作用的多個(gè)方面。研究表明,病毒可以通過(guò)將其基因組整合到人類染色體中來(lái)發(fā)揮順式效應(yīng)。病毒區(qū)域或基因突變也可能增加疾病進(jìn)展和耐藥性的風(fēng)險(xiǎn)。此外,某些病毒突變可能通過(guò)增加或減少病毒DNA整合到宿主細(xì)胞的發(fā)生率,在促進(jìn)疾病發(fā)生方面發(fā)揮重要作用。目前,PubMed上有數(shù)百萬(wàn)篇與病毒相關(guān)的研究,也已有相關(guān)的數(shù)據(jù)庫(kù)收集相關(guān)信息,如病毒整合站點(diǎn)數(shù)據(jù)庫(kù)VISDB、Dr.VIS、RID和ISDB,然而現(xiàn)有的數(shù)據(jù)庫(kù)沒(méi)有包含對(duì)公共資源中病毒突變和病毒整合位點(diǎn)進(jìn)行綜合、標(biāo)準(zhǔn)化和功能上的注釋。因此,如何快速瀏覽、可視化和利用已有的知識(shí)來(lái)研究病毒與宿主之間的相互作用,是研究人員面臨的挑戰(zhàn)。
目前為止,ViMIC數(shù)據(jù)庫(kù)從Pubmed、Cistrome data Browser、VISDB、NCBI Nucleotide和GEO數(shù)據(jù)庫(kù)收集了涵蓋了77種人類疾病的8種病毒(HBV,HPV,EBV,AAV2,MCV,HTLV1,HIV,XMRV)信息,包括31,712個(gè)病毒突變條目、105,624個(gè)整合位點(diǎn)、16,310個(gè)病毒靶基因和1,110,015條病毒序列信息。同時(shí),ViMIC可通過(guò)組蛋白修飾、轉(zhuǎn)錄因子結(jié)合與病毒整合位點(diǎn)上的染色質(zhì)可及性來(lái)探索病毒-宿主相互作用的順式效應(yīng),共包括了78個(gè)組蛋白修飾和1,358個(gè)轉(zhuǎn)錄調(diào)控因子的結(jié)合位點(diǎn)(表1)。
表 1
ViMIC包含三個(gè)主要模塊:病毒突變位點(diǎn)模塊(virus mutation site)、病毒整合位點(diǎn)模塊(viral integration site)和靶基因模塊(target gene)。病毒突變位點(diǎn)模塊包括突變位點(diǎn)注釋和序列信息統(tǒng)計(jì)。對(duì)每一個(gè)病毒突變位點(diǎn),ViMIC提供了突變水平、病毒基因/蛋白/區(qū)域、病毒相關(guān)疾病、基因型/亞型、是否免疫逃逸/耐藥、文獻(xiàn)支持證據(jù)等注釋信息。病毒整合位點(diǎn)模塊對(duì)病毒整合片段-Cistrome因子的重疊數(shù)進(jìn)行了計(jì)算,用于探索病毒整合位點(diǎn)是否參與宿主基因組的一個(gè)功能區(qū)域。對(duì)于每個(gè)病毒整合片段,如果與Cistrome因子存在重疊(重疊總和>0),ViMIC將給出詳細(xì)的結(jié)果,包括重疊數(shù)和每個(gè)Cistrome樣本相應(yīng)的GSMID、細(xì)胞系、細(xì)胞類型、組織類型和因子名稱的注釋。ViMIC使用熱圖和直方圖統(tǒng)計(jì)了人類染色體上所有的病毒整合位點(diǎn)和Cistrome因子的重疊情況。靶基因模塊提供了病毒插入或受病毒基因/蛋白質(zhì)/區(qū)域影響的靶基因信息,包括基因名、全名、別名、轉(zhuǎn)錄本、基因類型、基因位置信息、基因功能、基因id和相關(guān)藥物等信息。對(duì)于每個(gè)基因,ViMIC收集了部分病毒相關(guān)疾病患者的基因表達(dá)數(shù)據(jù),可查看其表達(dá)與免疫細(xì)胞浸潤(rùn)的關(guān)系。圖1為ViMIC數(shù)據(jù)庫(kù)的示意圖概述。
圖 1
在病毒突變界面首頁(yè),用戶通過(guò)選擇任何感興趣的病毒突變數(shù),可查看該病毒目前報(bào)道的所有致病突變,進(jìn)一步選擇病毒基因或者疾病,可以查看該病毒基因或疾病相關(guān)的突變。
以HBV為例,用戶可在病毒突變概覽頁(yè)面中單擊帶有HBV VM編號(hào)的綠色按鈕,如圖2A所示。ViMIC將返回一個(gè)包含人工校對(duì)的HBV突變位點(diǎn)信息的表格。用戶可按基因/蛋白質(zhì)/區(qū)域或疾病篩選突變,并在表格右上角的搜索框中輸入關(guān)鍵詞,點(diǎn)擊View按鈕查看搜索到的突變?cè)敿?xì)信息。
此外,用戶可以單擊Sequence按鈕瀏覽來(lái)自全球不同地區(qū)的HBV基因組序列的統(tǒng)計(jì)數(shù)據(jù)。病毒突變模塊將幫助用戶獲得HBV相關(guān)的進(jìn)展,并快速查找感興趣的突變。
在病毒整合界面首頁(yè),假設(shè)用戶希望獲得一個(gè)VIS條目的詳細(xì)因素列表,用戶可按照?qǐng)D2B中的步驟進(jìn)行操作。
以HBV第5號(hào)染色體的1000606條目為例,用戶點(diǎn)擊chr5并搜索1000606條目后,ViMIC將顯示該VIS與三類Cistrome因子的重疊結(jié)果。通過(guò)單擊TFBS(轉(zhuǎn)錄因子結(jié)合位點(diǎn))列中帶有數(shù)字的綠色按鈕并過(guò)濾生物來(lái)源,ViMIC顯示了與該VIS重疊的16個(gè)轉(zhuǎn)錄調(diào)節(jié)因子的排名。然后,用戶可通過(guò)點(diǎn)擊轉(zhuǎn)錄因子MYC的View按鈕查看Cistrome樣本,可發(fā)現(xiàn)三個(gè)樣本在5號(hào)染色體的位置(坐標(biāo):1295020,hg38)顯示了1000606和MYC之間的重疊。如果用戶想觀察VIS 1000606中是否存在突變,可點(diǎn)擊View VIS-VM association按鈕,在Mutation和Sequence面板中快速搜索DVID獲取關(guān)聯(lián)信息。
此外,用戶還可以在HBV的整合菜單中選擇chr5來(lái)查看5號(hào)染色體上三個(gè)因子和病毒整合片段的重疊分布。也可選擇因子瀏覽菜單來(lái)查看HBV VIS和MYC之間的所有重疊條目(圖2B)。由于TERT是VIS 1000606的靶基因,在病毒靶基因頁(yè)面,ViMIC還提供了基于CIBERSORT的TERT基因表達(dá)與22種免疫細(xì)胞之間的免疫分析。TERT的詳細(xì)信息頁(yè)面顯示了HBV感染疾病的熱圖和相關(guān)分析結(jié)果以及TERT基因的詳細(xì)信息,TERT基因表達(dá)分析結(jié)果進(jìn)一步顯示與HBV+樣本中CD8+T細(xì)胞呈正相關(guān)趨勢(shì)(圖2C)。
圖 2
ViMIC是一個(gè)綜合的人類疾病相關(guān)病毒的資源。該數(shù)據(jù)庫(kù)界面簡(jiǎn)潔友好,允許用戶快速查詢病毒突變、VIS-Cistrome相互作用、病毒序列、病毒感染性疾病中VIS-VM相關(guān)性及免疫細(xì)胞浸潤(rùn)水平與受整合事件或病毒基因/區(qū)域/蛋白影響的基因表達(dá)的相關(guān)性,有助于病毒致病機(jī)制的探索。
同濟(jì)大學(xué)生命科學(xué)與技術(shù)院張曉艷教授為該論文通訊作者,上海東方肝膽外科醫(yī)院實(shí)驗(yàn)診斷科王穎博士、同濟(jì)大學(xué)生命科學(xué)與技術(shù)院博士童袁桃、張澤宇為共同第一作者。
原文鏈接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab779/6368050