CellCall:整合配對配體-受體和轉(zhuǎn)錄因子活性以進(jìn)行細(xì)胞間通訊
大家好,在火熱的八月,小編迫不及待給大家分享一個(gè)超好用的工具,它是今年7月31號發(fā)表在Nucleic Acids Res[IF=16.971]期刊上的一篇文章。隨著scRNA-seq技術(shù)的快速發(fā)展,細(xì)胞間通訊的相關(guān)研究成為了當(dāng)下的研究熱點(diǎn)。目前已有的方法都存在著明顯的局限性,它們都不能預(yù)測連接細(xì)胞內(nèi)外的通訊通路。在這里,作者開發(fā)了CellCall,這是一個(gè)通過整合成對的配體-受體和轉(zhuǎn)錄因子(TF)活性來推斷細(xì)胞間和細(xì)胞內(nèi)通訊通路的工具包,目的是使研究人員能夠根據(jù)scRNA-seq數(shù)據(jù)破譯細(xì)胞間的通訊和相關(guān)的內(nèi)部調(diào)節(jié)信號。小編提示:CellCall的免費(fèi)獲取地址在文末噢~
L-R-TF軸和TF-TG互作數(shù)據(jù)的收集
首先,一個(gè)工具的開發(fā)顯然是少不了承載所用的數(shù)據(jù)。L-R指的是配體-受體,TG指的是配體-靶基因。L-R-TF軸數(shù)據(jù)集是從KEGG通路分析中提取的:(1) 作者首先從NATMI、Cellinker、CellTalkDB、CellChat和STRING數(shù)據(jù)庫中收集了人類的L-R互作對;(2) 接著從KEGG通路中提取L-R互作的下游TF,只有L-R互作和下游的TF在某一通路的同一分支才能認(rèn)定為定為一個(gè)L-R-TF軸,最終共獲得了19144個(gè)人類L-R-TF軸。
人類TF-TG互作對是從TRANSFAC, JASPAR, RegNetwork等16個(gè)數(shù)據(jù)庫獲得的,總共收集了587248個(gè)人類實(shí)驗(yàn)支持的互作。此外,還通過Cellinker獲得了12069個(gè)小鼠L-R-TF軸和554207個(gè)TF-TG互作數(shù)據(jù)。
推斷細(xì)胞間通訊
接下來,小編介紹的是工具的算法部分。為了推斷不同細(xì)胞類型之間的細(xì)胞間通訊,Sk被定義為細(xì)胞類型i和j之間的L-R互作k的通訊得分,它是通過整合L-R互作LRk的L2范數(shù)和下游TF的活性得分TFk來評估的。該公式如下:
其中TFk是L-R互作k下游TF的活性得分。LRk是由L-R互作k的配體和受體的歸一化表達(dá)值(通過softmax函數(shù)歸一化)表示的二維向量。
其中Li,k是配體在細(xì)胞類型i中的平均表達(dá)值,Rj,k是受體在細(xì)胞j中的平均表達(dá)值。此外,為了防止scRNA-seq數(shù)據(jù)丟失的影響,用戶還可以選擇配體/受體的分位數(shù)表達(dá)值(25%,50%和75%)來代表Li,k和Rj,k。如果配體是包含n個(gè)亞基的復(fù)合物,則定義L為所有亞基表達(dá)值的幾何平均值,其中l(wèi)g是配體復(fù)合物中亞基的表達(dá)值:
跟配體類似,如果受體是包含n個(gè)亞基的復(fù)合物,則R被定義為所有亞基表達(dá)值的幾何平均值,其中rh是受體復(fù)合物中亞基的表達(dá)值:
TF活性得分TFk是根據(jù)TF調(diào)節(jié)子的表達(dá)來評估的。根據(jù)SCENIC,調(diào)節(jié)子被定義為在單細(xì)胞表達(dá)譜中與TF共同表達(dá)的TG集合。
其中GTG是一個(gè)TF的所有TG基因集,Gcoexp是一個(gè)TF的所有共表達(dá)基因集。基因共表達(dá)是通過Spearman相關(guān)系數(shù)計(jì)算得到的。
然后,TFk是該調(diào)節(jié)子的基因集富集分析(GSEA)得到的富集分?jǐn)?shù)(ES)。其計(jì)算公式如下。
其中FC是所有TG在調(diào)節(jié)子中的倍數(shù)變化,adjust.p為GSEA的顯著性水平。如果adjust.p低于閾值α(默認(rèn)為0.05),則TFk等于GSEA的ES;否則,TFk等于0。
如果L-R互作k的下游有n個(gè)TF,活性得分TFk被定義為所有TF的加權(quán)和。其計(jì)算公式如下,其中M是通路中從TFk,i到受體k的最短路徑:
通路活性分析
CellCall包含了一個(gè)通路活性分析方法,它可以探索某些細(xì)胞之間通訊所涉及的主要通路。首先,CellCall根據(jù)Jaccard相似系數(shù)對通路i的活性進(jìn)行量化。通路活性分?jǐn)?shù)nPASi的公式如下:
其中nPASi是z得分歸一化的PASi,PASi的計(jì)算方法如下:
其中CLR是通過細(xì)胞間通訊分析推斷的特定細(xì)胞類型之間的L-R互作,PLR是通路中的L-R互作,CellCall還通過超幾何檢驗(yàn)估計(jì)了通路活性的顯著性。公式如下:
其中,m是所有L-R互作的數(shù)量,t是細(xì)胞間通訊分析推斷出的L-R互作的數(shù)量,n是一條通路中L-R互作的數(shù)量,q是t和n的重疊數(shù)。
scRNA-seq數(shù)據(jù)集的數(shù)據(jù)收集和處理
作者從先前研究中收集了包含2532個(gè)人類睪丸細(xì)胞的scRNA-seq數(shù)據(jù),還從TISCH數(shù)據(jù)庫中獲得了10個(gè)TIME(腫瘤免疫微環(huán)境) scRNA-seq數(shù)據(jù)集。基于MAESTRO的標(biāo)準(zhǔn)流程進(jìn)行了質(zhì)控,去除批次效應(yīng),細(xì)胞聚類和基于表達(dá)矩陣的細(xì)胞類型注釋。
統(tǒng)計(jì)分析
作者使用R包“psych”中的Spearman相關(guān)分析來評估TF和靶基因之間的相關(guān)性?!皊urvival”包中的Kaplan-Meier,log-rank檢驗(yàn)和單變量Cox回歸被用來評估TF表達(dá)和生存時(shí)間之間的關(guān)系。使用“stats”包進(jìn)行了超幾何檢驗(yàn)和Fisher精確檢驗(yàn),“clusterProfiler”包用來做富集分析,“pROC”包用來畫ROC曲線。
CellCall概述
小編在這里總結(jié)一下該工具的原理和特性。圖1顯示了CellCall的核心算法和細(xì)胞間通訊模型,具體來說就是細(xì)胞信號通過細(xì)胞間的L-R互作從發(fā)送方細(xì)胞傳遞到接收方細(xì)胞,然后信號通過一個(gè)特定的信號傳導(dǎo)通路傳遞到接收方細(xì)胞內(nèi)部,通常會導(dǎo)致下游TF和GRN(基因調(diào)控網(wǎng)絡(luò))活性的變化(圖1A,B)。根據(jù)這個(gè)生物學(xué)模型,作者建立了一個(gè)細(xì)胞間通訊的統(tǒng)計(jì)模型,它由兩部分組成,一個(gè)是L-R對(細(xì)胞間信號傳遞),另一個(gè)是調(diào)節(jié)子(細(xì)胞內(nèi)信號傳遞)(圖1C)。L-R對被定義為由配體和受體的表達(dá)值表示的二維向量,調(diào)節(jié)子被定義為與TF共同表達(dá)的TG集合。然后,通過整合細(xì)胞間信號傳導(dǎo)(配體和受體的表達(dá))和細(xì)胞內(nèi)信號傳導(dǎo)(下游TF的活性得分)來計(jì)算L-R對的細(xì)胞間通訊得分。下游調(diào)節(jié)子的活性狀態(tài)和得分是通過GSEA來估計(jì)的,當(dāng)一個(gè)L-R互作可以激活多個(gè)調(diào)節(jié)子時(shí),活性得分被定義為所有激活調(diào)節(jié)子的加權(quán)總和。總的來說,CellCall不僅能夠量化某些L-R對的細(xì)胞間通訊,還能推斷出由TF活性反映的內(nèi)部調(diào)節(jié)信號。此外,CellCall還嵌入了通路活性分析方法,這有助于探索細(xì)胞間串?dāng)_所涉及的主要通路(圖1D)。
科研的小伙伴都知道,L-R互作和下游TF先驗(yàn)知識的準(zhǔn)確性對于推斷有意義的細(xì)胞間通訊至關(guān)重要。因此,作者從KEGG數(shù)據(jù)庫中提取了L-R-TF軸數(shù)據(jù),除了細(xì)胞間通訊分析和通路活性分析外,CellCall還提供了豐富的可視化工具來直觀地展示分析結(jié)果,包括熱圖、Circos圖、氣泡圖等(圖1D)。
推斷人類生精生態(tài)位和生殖細(xì)胞之間的細(xì)胞間通訊
睪丸生態(tài)位通過復(fù)雜的細(xì)胞間信號轉(zhuǎn)導(dǎo)在精子發(fā)生過程中發(fā)揮重要作用。因此,作者將CellCall應(yīng)用于人類睪丸細(xì)胞的scRNA-seq數(shù)據(jù)集(圖2A)。由于支持細(xì)胞(ST)是位于生精小管中唯一能夠支持生殖細(xì)胞發(fā)育并充當(dāng)生精生態(tài)位的體細(xì)胞,作者分析了支持細(xì)胞到其他14種生殖細(xì)胞的細(xì)胞間信號傳遞。如圖2所示,與其他生殖細(xì)胞類型相比,SSC(精原干細(xì)胞)是來自支持細(xì)胞信號的主要接收者。通路活性分析顯示,從支持細(xì)胞到SSC的細(xì)胞間信號傳遞主要富集在Notch信號通路、Hippo信號通路、MAPK信號通路、PI3K-Akt信號通路和人巨細(xì)胞病毒感染通路(圖2),這些通路對精子的形成至關(guān)重要。
從支持細(xì)胞到SSC共識別了47條細(xì)胞間通訊通路(圖2),其中大部分都與精子發(fā)育或SSC分化有關(guān)。對這些細(xì)胞間通訊下游的TF進(jìn)一步分析表明,這些TF大多與精子發(fā)育有關(guān)(圖2E)。對這些TF的富集分析表明,所有的TF都被明顯激活(圖3A),而且大多數(shù)TG的FC值都大于1(圖3B)。
為了證實(shí)CellCall推斷的細(xì)胞間通訊,作者進(jìn)行了免疫染色試驗(yàn),以確定ST和SSC之間INHBB-ACVR2A/B-SMAD2軸的表達(dá)。結(jié)果顯示,在FGFR3+SSC中,ACVR2B(紅色)與INHBB和SMAD2共存(圖3C-E)。此外,ACVR1B也被確認(rèn)在FGFR3+SSC中表達(dá)(圖3F)。
推斷生殖細(xì)胞的細(xì)胞間通訊
最近的研究表明,不同生殖細(xì)胞之間的細(xì)胞間通訊也在精子發(fā)生中起作用。因此,作者應(yīng)用CellCall來推斷SSC與其他分化生殖細(xì)胞之間的候選細(xì)胞間通訊。如圖4A、B所示,從P(粗線期)到SSC的細(xì)胞間通訊可能在SSC和其他不同的生殖細(xì)胞間的串?dāng)_中起關(guān)鍵作用。如?;鶊D所示,從P到SSC的細(xì)胞間通訊的下游TF,如HES1、SMAD1/9、TCF7和ID4,都被報(bào)道參與了精子的形成(見圖4C)。作者還通過免疫染色證實(shí)了從P到SSC的通訊軸(GDF5-BMPR1B-SMAD1)(圖4D)。這些結(jié)果顯示,在成人睪丸切片中,BMPR1B+(受體)和pSMAD1 + SSC均含有GDF5+(配體)精母細(xì)胞(圖4E)。GDF5-BMPR1B信號已被報(bào)道在軟骨形成和成骨過程中發(fā)揮重要作用。
推斷TIME中免疫細(xì)胞的細(xì)胞間通訊
越來越多的研究表明,腫瘤生態(tài)環(huán)境中免疫細(xì)胞之間的細(xì)胞間串?dāng)_參與了炎癥、免疫和腫瘤的發(fā)生,這對腫瘤的發(fā)展至關(guān)重要。在這項(xiàng)研究中,作者將CellCall應(yīng)用于10個(gè)TIME scRNA-seq數(shù)據(jù)集。首先,通過CellCall分析了6種免疫細(xì)胞類型,即B細(xì)胞(B)、常規(guī)CD4 T細(xì)胞(CD4Tconv)、CD8 T細(xì)胞(CD8 T)、衰竭CD8 T細(xì)胞(CD8Tex)、單核細(xì)胞/巨噬細(xì)胞(Mono/Macro)和自然殺傷(NK)細(xì)胞之間的細(xì)胞間通訊。如圖5A所示,與其他細(xì)胞類型相比,Mono/Macro從其他免疫細(xì)胞中收到的信號明顯更多,表明Mono/Macro在TIME中免疫細(xì)胞的細(xì)胞間串?dāng)_中起主導(dǎo)作用。然后,在研究正常/腫瘤組織之間細(xì)胞間通訊的差異中,作者在4個(gè)以上的數(shù)據(jù)集中得到了7個(gè)常見的腫瘤特異性細(xì)胞間通訊(圖5B),它們都涉及從其他細(xì)胞到Mono/Macro的細(xì)胞間通訊,包括CCL3/4/5-CCR1/5和TNF-TNFRSF1B信號(圖5C)。
此外,作者還研究了這些通訊下游的TF,大多數(shù)被激活的TF參與了癌癥的進(jìn)展(圖5D)。為了進(jìn)一步證明這些TF在癌癥中的功能和CellCall的性能,作者利用TCGA泛癌數(shù)據(jù)研究了前10個(gè)TF的表達(dá)與患者生存的關(guān)系。如圖5E,所有TF都顯著影響了不同癌癥患者的總生存率。這些結(jié)果表明,CellCall能夠有效地推斷TIME中重要的細(xì)胞間通信,并識別受細(xì)胞間串?dāng)_影響的潛在細(xì)胞內(nèi)過程。
CellCall與其他工具的比較
既然要推薦這個(gè)工具,當(dāng)然是擁有其他工具不具備的優(yōu)越性。作者從數(shù)據(jù)、方法和可視化三個(gè)方面系統(tǒng)地比較了CellCall和其他9個(gè)工具的特性,CellCall均優(yōu)于其他幾個(gè)工具(表1)。接下來,在人類睪丸細(xì)胞的數(shù)據(jù)集上比較了CellCall和其他4個(gè)提供通訊分?jǐn)?shù)閾值的工具(CellPhoneDB、CellChat、iTALK和SingleCellSignalR)的性能。如圖6A所示,每個(gè)工具根據(jù)的默認(rèn)cutoff值鑒定了從支持細(xì)胞到SSC的細(xì)胞間通訊。與這些細(xì)胞間通訊有關(guān)的文獻(xiàn)中,CellCall所識別的細(xì)胞間通訊超過87%被證實(shí)參與了精子的形成(圖6B),其文獻(xiàn)支持率都高于其他幾個(gè)工具。然后,作者用ROC曲線來比較這些方法,CellCal獲得了最高的AUC值(圖6C)。從這些方法的結(jié)果與最佳cut-point可以看出,與這些現(xiàn)有的方法相比,CellCall更能準(zhǔn)確地推斷出細(xì)胞間的通訊(圖6D)。
參考文獻(xiàn):CellCall: integrating paired ligand–receptor andtranscription factor activities for cell-cellcommunication
CellCall獲取地址:https://github.com/ShellyCoder/cellcall。