病原感染類疾病中的生物標(biāo)志物
COVID-19疫情從蔓延開始,進(jìn)化的腳步一直沒有停下。有關(guān)它的傳染性、感染后的嚴(yán)重程度、臨床結(jié)局等都值得關(guān)注。
2022年9月份,柳葉刀子刊中一篇文章Development of a multiomics model for identification of predictive biomarkers for COVID-19 severity: a retrospective cohort study(IF:36.615),發(fā)現(xiàn)了102個生物標(biāo)志物,能夠很好地預(yù)測COVID-19的嚴(yán)重程度和臨床結(jié)果。
研究背景
COVID-19是一種多系統(tǒng)疾病,入院患者的臨床結(jié)果具有高度可變性。盡管一些細(xì)胞因子如白細(xì)胞介素-6(IF-6)被認(rèn)為與病情嚴(yán)重程度相關(guān),但沒有早期生物標(biāo)志物可以可靠地預(yù)測哪些患者更有可能出現(xiàn)不良結(jié)果。因此,發(fā)現(xiàn)嚴(yán)重并發(fā)癥的預(yù)測標(biāo)志物至關(guān)重要。
主要研究內(nèi)容與結(jié)果
1、作者利用機(jī)器學(xué)習(xí)和個體統(tǒng)計分析確定了幾種嚴(yán)重程度組之間存在顯著差異的蛋白質(zhì)。IL-6、C-C基序趨化因子2 (CCL2)、血管內(nèi)皮生長因子A (VEGFA)等的濃度與疾病嚴(yán)重程度呈正相關(guān)(圖1A,1B)。其他幾種細(xì)胞因子和趨化因子與嚴(yán)重程度也呈正相關(guān),包括C-C基序趨化因子7 (CCL7), C-X-C基序趨化因子9,10和11 (CXCL9, CXCL10, CXCL11)等(圖1A,1C)。凋亡標(biāo)志物,包括caspase-1 (CASP1)和TNF受體超家族成員10A (TNFRSF10A),在病情較嚴(yán)重的患者中水平較高。另外,在病情較嚴(yán)重的患者中,TNF配體超家族成員10 (TNFSF10)、TNF配體超家族成員11 (TNFSF11)和ICOS配體(ICOSLG)的水平降低(圖1A,1C)。
圖1
2、作者分析了脂類在疾病嚴(yán)重程度分類中的相對豐度。溶血磷脂酰膽堿、磷脂酰膽堿、醚磷脂酰乙醇胺和磷脂酰肌醇在住院患者中的含量低于門診患者(圖2A)。個別統(tǒng)計分析確定了住院參與者中幾種減弱的磷脂,包括溶血卵磷脂膽堿(18:0)、卵磷脂膽堿(14:0/20:3)等。與磷脂隨著疾病嚴(yán)重程度的增加而普遍下降相反,在住院參與者中,特定種類的神經(jīng)酰胺,包括神經(jīng)酰胺(16:0)和神經(jīng)酰胺(18:0)的濃度增加(圖2B)。個體統(tǒng)計分析發(fā)現(xiàn),與門診患者相比,住院患者的代謝物顯著升高,包括血紅素、N,N,N-三甲基丙基脯氨酸甜菜堿(TMAP)等。與宿主腸道微生物組相關(guān)的幾種代謝產(chǎn)物也與疾病嚴(yán)重程度顯著相關(guān)。住院患者與熊去氧膽酸鹽和2-羥基癸酸鹽(一種中鏈脂肪酸)濃度降低有關(guān),與組氨酸衍生的代謝物丙酸咪唑濃度增加有關(guān)(圖2C)。
圖2
3、為了分析預(yù)測細(xì)胞因子標(biāo)記物的mRNA表達(dá),作者根據(jù)單細(xì)胞RNA測序數(shù)據(jù),在嚴(yán)重組中觀察到從細(xì)胞因子分析中鑒定出的17種蛋白質(zhì)的類似上調(diào)。
圖3
4、作者采用21名患者的COVID-19前血漿樣本用于糖肽蛋白組學(xué)分析,共定量檢測到732種糖肽(圖4A)。在門診患者、重癥患者和危重患者這3個組之間,鑒定出114個糖肽具有組間差異(圖4B)。
圖4
5、作者使用24個配對樣本來進(jìn)行多組學(xué)分析,檢查感染后個體中各種分子是如何改變的。結(jié)果顯示大多數(shù)分子遵循上述研究設(shè)計中觀察到的模式,包括IL-6、TNF和LTA4H(這些分子在COVID-19危重癥患者隊列中的濃度高于COVID-19重癥患者隊列。圖5 A)。新冠肺炎發(fā)生后,危重癥患者CRTAC1水平顯著降低。在Post-COVID-19住院患者中觀察到溶血磷脂酰膽堿、磷脂酰膽堿、磷脂酰肌醇等的濃度降低,結(jié)果支持這些脂類與COVID-19嚴(yán)重和危重結(jié)局的相關(guān)性(圖5B)。代謝產(chǎn)物血紅素、熊去氧膽酸鹽、3-脲二酸丙酸和TMAP也顯示出類似的變化趨勢(圖5C)。
圖5
這項研究涉及637人,包括455名不同嚴(yán)重程度的COVID-19患者,是迄今為止使用綜合多組學(xué)方法對COVID-19血漿樣本進(jìn)行的最大研究。揭示了包括細(xì)胞因子、脂類和代謝物在內(nèi)的新分子作為COVID-19感染后嚴(yán)重和危重預(yù)后的預(yù)測生物標(biāo)志物。
上述文章利用多組學(xué)開發(fā)了一個可以預(yù)測COVID-19患者嚴(yán)重程度的模型,那么是否有研究來識別COVID-19診斷標(biāo)志物呢?答案是肯定的。在2022年8月份,MOLECULAR MEDICINE雜志上發(fā)表了一篇文章,利用生物信息學(xué)和機(jī)器學(xué)習(xí)算法來揭示SARS-COV-2發(fā)病機(jī)制的更多特征,并引入新的基于宿主反應(yīng)的診斷生物標(biāo)志物面板。
研究流程
從GEO數(shù)據(jù)庫中獲取COVID-19感染患者和其他類似疾病患者的全血(WB)和鼻咽(NP)樣本以及健康對照的RNA-Seq數(shù)據(jù)集。
對數(shù)據(jù)集進(jìn)行通路富集和GO功能富集分析。
在訓(xùn)練集上使用機(jī)器學(xué)習(xí)方法識別候選診斷生物標(biāo)志物,并在獨立隊列上進(jìn)行驗證,以引入最佳生物標(biāo)志物組合。
利用23個常見WB/NP DEGs相關(guān)的3 ~ 9個maker的所有組合,生成基于隨機(jī)森林的通用預(yù)測模型。
最后,比較了基于LASSO構(gòu)建的預(yù)測模型和基于隨機(jī)森林的通用預(yù)測模型這兩種預(yù)測模型的預(yù)測結(jié)果。
圖1 研究流程示意圖
研究結(jié)果
1、COVID-19患者與健康對照組全血樣本的轉(zhuǎn)錄組分析
COVID-19患者與健康對照組間的差異表達(dá)基因,紅色和綠色分別顯示上調(diào)和下調(diào)基因(圖A)
點狀圖顯示顯著上調(diào)和下調(diào)基因在BPs(GO)中的富集情況,圓點的大小和基因比例成正比(圖B)
條形圖展示hallmark基因集富集分析結(jié)果,條形大小與基因比例成正比(圖C)
圖2 COVID-19患者與健康對照組全血樣本的轉(zhuǎn)錄組分析
2、Cibersortx計算健康對照組與COVID-19患者全血中的免疫細(xì)胞類型比例
SARS-COV-2感染增加了T調(diào)節(jié)細(xì)胞(Tregs)的比例,而降低了CD8、CD4 na?ve和CD4記憶靜息細(xì)胞的比例。相應(yīng)地,與對照組相比,COVID-19中中性粒細(xì)胞、B細(xì)胞na?ve、漿細(xì)胞和巨噬細(xì)胞(M0和M1)的比例增加。
圖3 健康對照組與COVID-19患者全血中的免疫細(xì)胞類型比例
3、COVID-19患者鼻咽樣本與非病毒性和其他病毒性急性呼吸道疾病(ARIs)患者以及健康對照組的轉(zhuǎn)錄組分析
各組別差異表達(dá)基因,紅色和綠色分別顯示上調(diào)和下調(diào)基因(圖A)
點狀圖顯示各組別顯著上調(diào)和下調(diào)基因在BPs(GO)富集情況以及hallmark基因集富集分析結(jié)果(圖B、C)
圖4 COVID-19患者鼻咽樣本與非病毒性和其他病毒性急性呼吸道疾病(ARIs)患者以及健康對照組的轉(zhuǎn)錄組分析
WB和NP樣本中與COVID-19相關(guān)的共同和不同的基因特征
維恩圖顯示四組基因的分布(UB:血液中基因上調(diào),DB:血液中基因下調(diào),UN:鼻腔中基因上調(diào),DN:鼻腔中基因下調(diào))(圖A)
點狀圖顯示三個配對組的共同基因在BPs(GO)中的富集情況(圖B)
條形圖展示hallmark基因集富集分析結(jié)果(圖C)
圖5 WB和NP樣本中與COVID-19相關(guān)的共同和不同的基因特征
通過最佳生物標(biāo)志物組區(qū)分COVID-19患者與非COVID-19個體
作者建立了一個兩階段機(jī)器學(xué)習(xí)平臺,在第一階段,分類器分別使用五倍和十倍交叉驗證在WB和NP數(shù)據(jù)集的訓(xùn)練集(80%)上執(zhí)行。第一階段的輸入特征均為基于LASSO選擇的3 ~ 9個特征的組合??紤]到最高敏感性和特異性的最佳組合被挑選出來用于下一階段。在第二階段,基于獨立測試集(20%),再次驗證訓(xùn)練集中(80%)的最佳特征組合。兩階段的敏感性、特異性和準(zhǔn)確性用折線圖顯示(圖6)。同樣,繪制受試者工作特征(ROC)曲線,并計算曲線下面積(AUC)(圖7:A、C,第一階段;B、D,第二階段)。
表1 基于LASSO features的隨機(jī)森林分類器在第一階段和第二階段獲得的WB和NP樣本的標(biāo)準(zhǔn)
圖6 NP和WB兩期樣本的敏感性、特異性、準(zhǔn)確性
圖6 ROC曲線
這篇文章采用機(jī)器學(xué)習(xí)方法引入并驗證了基于宿主反應(yīng)的診斷生物標(biāo)志物,可作為從非COVID-19病例中診斷COVID-19感染的補充工具。
綜上所述,關(guān)于病原感染類疾?。ò[瘤)生物標(biāo)志物的識別鑒定具有重要意義。預(yù)測患者嚴(yán)重程度有助于識別并發(fā)癥和死亡風(fēng)險增加的患者,從而幫助臨床醫(yī)生盡早的為患者制定適當(dāng)?shù)母深A(yù)措施。此外,利用機(jī)器學(xué)習(xí)方法識別驗證診斷生物標(biāo)志物,可以作為診斷病原感染的工具。對于有生存信息和臨床特征的數(shù)據(jù)(自測和公共數(shù)據(jù)),利用LASSO、隨機(jī)森林、WGCNA等方法可以識別特征基因,構(gòu)建預(yù)后模型以預(yù)測患者預(yù)后。病原感染類疾病在這部分領(lǐng)域的分析值得探索研究,尤其是肺炎盛行的當(dāng)下。機(jī)不可失,失不再來。感興趣的小伙伴們抓緊掃碼咨詢吧~
病原感染個性化思路
掃碼咨詢