WGCNA使用非常廣泛,網(wǎng)上流傳的示例代碼也非常多,但還是推薦大家直接參考官方代碼,最全面且權(quán)威:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/index.html
今天不講代碼,只講講這些圖怎么看,能表達什么意義。
WGCNA文章[1]給出了工作流程圖,主要包括:構(gòu)建共表達網(wǎng)絡(luò)→模塊識別→模塊與性狀關(guān)聯(lián)→模塊相關(guān)性→關(guān)鍵模塊中識別核心基因
在構(gòu)建共表達網(wǎng)絡(luò)之前,還有一步比較關(guān)鍵的步驟——尋找最優(yōu)軟閾值(soft thresholding或power),使構(gòu)建的網(wǎng)絡(luò)更符合無標度拓撲結(jié)構(gòu)。這時,我們會看到如下圖:
確定最優(yōu)軟閾值主要參考左圖,即在不同軟閾值(x軸)情況下的無標度擬合指數(shù)(scale-free fit index,y軸)。其中紅線表示主觀選擇的無標度擬合指數(shù)取值,如圖為0.9,一般我們選擇0.8~0.95之間較為穩(wěn)妥。從左圖看,當無標度擬合指數(shù)在0.9時,符合構(gòu)建無標度網(wǎng)絡(luò)的最小軟閾值為6,因此可以選擇6作為最優(yōu)軟閾值用于后續(xù)分析。右圖為不同軟閾值情況下的網(wǎng)絡(luò)連通度。
基于最優(yōu)軟閾值構(gòu)建共表達網(wǎng)絡(luò),將基因劃分到不同模塊后,可以繪制基因聚類樹:
這個圖可以分為兩部分看:上半部分是基因的層次聚類樹狀圖,下半部分是基因模塊,也就是網(wǎng)絡(luò)模塊。上下對應,可以看到距離較近的基因(聚類到同一條分支)被劃分到了同一模塊。
接著,計算模塊與感興趣的臨床特征之間的相關(guān)性與顯著性,繪制相關(guān)性熱圖:
上圖中,最左側(cè)的顏色塊代表模塊,最右側(cè)的顏色條代表相關(guān)性范圍。中間部分的熱圖中,顏色越深相關(guān)性越高,紅色表示正相關(guān),綠色表示負相關(guān);每個單元格中的數(shù)字表示相關(guān)性和顯著性。如上圖,brown模塊與weight性狀表現(xiàn)為正相關(guān)且相關(guān)性最高。此時,我們可以選擇相關(guān)性最高的brown模塊作為關(guān)鍵模塊。一般,我們會按相關(guān)性的絕對值篩選最相關(guān)模塊,即負相關(guān)模塊也應該考慮在內(nèi)。需要注意的是,grey模塊中包含了所有未參與聚類的基因,因此是無效模塊,不應用于后續(xù)分析。
基于拓撲重疊矩陣,可以繪制基因之間的相關(guān)性熱圖。其中顏色越深,說明基因之間的相互作用越強。由于對角線表示模塊內(nèi)部基因之間的相互作用,所以自然是對角線上的顏色最深:
也可以看看模塊之間的聚類樹和相關(guān)性熱圖,探索模塊之間的互作關(guān)系:
可以將感興趣的性狀,如weight也加入到圖中。如上圖,可以發(fā)現(xiàn)red、brown、blue模塊之間有很強的相關(guān)性,甚至比他們與weight之間的相關(guān)性更強。
之后針對關(guān)鍵模塊brown和感興趣的性狀weight進一步挖掘,看看基因與模塊的相關(guān)性(Module Membership, MM)和基因與性狀的相關(guān)性(Gene Significance, GS)之間是否有某種關(guān)聯(lián)。
`
通過以上散點圖,可以發(fā)現(xiàn)MM和GS呈正相關(guān),說明這些與性狀高度相關(guān)的基因,在關(guān)鍵模塊中也扮演著舉足輕重的角色。
我們也可以基于關(guān)鍵模塊中基因之間的相似性,構(gòu)建關(guān)鍵模塊網(wǎng)絡(luò),以Cytoscape或VisANT軟件可視化展示網(wǎng)絡(luò)中基因之間的互作關(guān)系:
最后,也是最重要的——基于關(guān)鍵模塊篩選核心基因。這一步的可用方法比較多,沒有固定限制。比如,可以根據(jù)MM>0.8且GS>0.3篩選核心基因[2];可以根據(jù)關(guān)鍵模塊的網(wǎng)絡(luò)degree篩選top 30作為核心基因[3];也可以計算kME值,依據(jù)|kME|≥0.7篩選[4];或者將網(wǎng)絡(luò)導入Cytoscape后,利用插件cytoHubba篩選[5]。
參考文獻:
1. Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008;9:559. Published 2008 Dec 29. doi:10.1186/1471-2105-9-559
2. Song ZY, Chao F, Zhuo Z, Ma Z, Li W, Chen G. Identification of hub genes in prostate cancer using robust rank aggregation and weighted gene co-expression network analysis. Aging (Albany NY). 2019;11(13):4736-4756. doi:10.18632/aging.102087
3. Zhang X, Feng H, Li Z, et al. Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis. Onco Targets Ther. 2018;11:6001-6021. Published 2018 Sep 19. doi:10.2147/OTT.S171791
4. Panahi B, Hejazi MA. Weighted gene co-expression network analysis of the salt-responsive transcriptomes reveals novel hub genes in green halophytic microalgae Dunaliella salina. Sci Rep. 2021;11(1):1607. Published 2021 Jan 15. doi:10.1038/s41598-020-80945-3
5. Li CY, Cai JH, Tsai JJP, Wang CCN. Identification of Hub Genes Associated With Development of Head and Neck Squamous Cell Carcinoma by Integrated Bioinformatics Analysis. Front Oncol. 2020;10:681. Published 2020 May 22. doi:10.3389/fonc.2020.00681