生物標(biāo)志物在重癥監(jiān)護(hù)中的作用
在重癥監(jiān)護(hù)中開(kāi)發(fā)和使用新型生物標(biāo)志物越來(lái)越重要。生物標(biāo)記物研究的統(tǒng)計(jì)學(xué)分析經(jīng)常出現(xiàn)不合理的結(jié)果,使其無(wú)法為臨床醫(yī)生提供科學(xué)有效和臨床相關(guān)的信息。今天介紹一篇2021年1月發(fā)表在Anesthesiology(IF:8.986)的文章。這篇文章系統(tǒng)的闡述了生物標(biāo)志物在重癥監(jiān)護(hù)中的作用,主要從生物標(biāo)志物的開(kāi)發(fā),評(píng)估標(biāo)志物所用的統(tǒng)計(jì)學(xué)方法,預(yù)測(cè)模型的選擇和評(píng)價(jià),生物標(biāo)志物的評(píng)估和臨床應(yīng)用等方面進(jìn)行了研究。
背景
生物標(biāo)記物越來(lái)越多地被用作診斷的個(gè)性化標(biāo)記物,用于評(píng)估疾病嚴(yán)重程度或風(fēng)險(xiǎn),并用于預(yù)測(cè)和指導(dǎo)臨床決策。探索心血管系統(tǒng)和腎臟以及炎癥的生物標(biāo)志物在重癥監(jiān)護(hù)和圍手術(shù)期醫(yī)學(xué)中激增。雖然現(xiàn)有的報(bào)告可提供生物標(biāo)記物研究中關(guān)鍵信息的指導(dǎo),但它們沒(méi)有明確提供適當(dāng)?shù)慕y(tǒng)計(jì)方法的指導(dǎo)。使用不恰當(dāng)?shù)慕y(tǒng)計(jì)方法來(lái)評(píng)估生物標(biāo)志物的臨床價(jià)值,干擾了臨床醫(yī)生對(duì)研究結(jié)果的解釋和可用性。這篇文章的目的不是對(duì)生物統(tǒng)計(jì)學(xué)和方法學(xué)問(wèn)題的詳盡回顧,而是作為一個(gè)起點(diǎn),讓非專(zhuān)家讀者和調(diào)查人員了解用于評(píng)估重癥監(jiān)護(hù)和圍手術(shù)期醫(yī)學(xué)中生物標(biāo)志物的傳統(tǒng)和新興研究方法。
研究?jī)?nèi)容
不同的生物標(biāo)志物開(kāi)發(fā)階段
生物標(biāo)志物在臨床實(shí)踐中可能有幾種作用。它可以提供診斷,具有預(yù)后作用,可用于評(píng)估治療反應(yīng)性,或指導(dǎo)藥物在治療中的使用。作者還提出了生物標(biāo)志物可用來(lái)識(shí)別危重患者的分子亞型,而不考慮患者的結(jié)局。表1列出了在重癥監(jiān)護(hù)和圍手術(shù)期醫(yī)學(xué)中具有不同作用的生物標(biāo)志物的例子。生物標(biāo)志物的開(kāi)發(fā)是一個(gè)多階段的過(guò)程,需要不同的統(tǒng)計(jì)方法來(lái)實(shí)現(xiàn)不同的目標(biāo)。生物標(biāo)志物開(kāi)發(fā)的三個(gè)階段,按時(shí)間順序依次為: (1)發(fā)現(xiàn); (2)預(yù)測(cè)(或診斷)準(zhǔn)確性評(píng)估; (3)在現(xiàn)有臨床預(yù)測(cè)(或診斷)工具基礎(chǔ)上增加價(jià)值的評(píng)估。
生物標(biāo)志物評(píng)估的統(tǒng)計(jì)學(xué)方法
在生物標(biāo)志物開(kāi)發(fā)的早期階段,生物標(biāo)志物與臨床結(jié)局之間通常通過(guò)回歸模型和比值比/風(fēng)險(xiǎn)比報(bào)告或相對(duì)危險(xiǎn)度估計(jì)來(lái)量化這種關(guān)聯(lián),最好包括對(duì)其價(jià)值的評(píng)估,而不是現(xiàn)有的生物標(biāo)志物或臨床特征。最好采用前瞻性設(shè)計(jì),因?yàn)檫@樣有助于明確納入標(biāo)準(zhǔn)、數(shù)據(jù)收集程序(盡量減少缺失數(shù)據(jù))和測(cè)量的標(biāo)準(zhǔn)化,并確保測(cè)量了所有相關(guān)的臨床信息。注冊(cè)研究方案并預(yù)先設(shè)定研究目標(biāo)、關(guān)注的生物標(biāo)志物和統(tǒng)計(jì)學(xué)方法將減少發(fā)表偏倚和選擇性報(bào)告。估計(jì)生物標(biāo)志物鑒別能力和生物標(biāo)志物增量值的常用方法是計(jì)算受試者工作特征曲線下面積(AUC) ,通過(guò)在x軸繪制假陽(yáng)性率(1 -特異度),在y軸繪制真陽(yáng)性率(靈敏度),形成了受試者工作特征曲線。AUC量化了生物標(biāo)志物的區(qū)分能力,范圍從0.5(即不比拋硬幣的結(jié)果好)到1(即完全區(qū)分)。辨別能力是生物標(biāo)志物區(qū)分發(fā)生和未發(fā)生事件的能力。所謂的“最佳”生物標(biāo)志物閾值通常是根據(jù)約登指數(shù)最大化(最大值[敏感性+特異性- 1])確定。約登指數(shù)常用于確定使敏感性和特異性之和最大化的生物標(biāo)志物的值。然而,如果在陰性似然比和陽(yáng)性似然比可用于選擇閾值的情況下,生物標(biāo)志物用于排除(高靈敏度)或確認(rèn)(高特異性)診斷,則這種方法存在問(wèn)題。研究人員可以報(bào)告“最佳”截止點(diǎn)的95% CI。此外,生物標(biāo)志物的二分類(lèi)在生物學(xué)上也是不合理的,因?yàn)椴淮嬖趯?dǎo)致風(fēng)險(xiǎn)突然變化的生物標(biāo)志物閾值(例如,通常沒(méi)有理由說(shuō)明為什么一個(gè)人的風(fēng)險(xiǎn)在切點(diǎn)的任何一邊會(huì)有顯著差異)。因此,在統(tǒng)計(jì)分析期間應(yīng)避免對(duì)連續(xù)測(cè)量值(如生物標(biāo)志物)進(jìn)行分類(lèi)(包括二分),因?yàn)檫@將導(dǎo)致信息丟失,并對(duì)預(yù)測(cè)準(zhǔn)確性產(chǎn)生負(fù)面影響。理想情況下,統(tǒng)計(jì)學(xué)分析應(yīng)保留原尺度上的連續(xù)測(cè)量值,允許考慮非線性關(guān)系(使用限制性立方樣條或分?jǐn)?shù)多項(xiàng)式)。
為了評(píng)估將一種新型生物標(biāo)志物添加到臨床模型或標(biāo)準(zhǔn)生物標(biāo)志物后的增量?jī)r(jià)值,經(jīng)常使用兩個(gè)預(yù)測(cè)模型之間AUC的差異(區(qū)分度的改善)。然后使用DeLong非參數(shù)檢驗(yàn)和Hanley和McNeil方法等方法,將正在研究的生物標(biāo)志物的AUC與在同一組個(gè)體中評(píng)估的已建立的生物標(biāo)志物或臨床模型進(jìn)行比較。比較AUC的主要局限性是需要相對(duì)較大的“獨(dú)立”關(guān)聯(lián)才能使新生物標(biāo)志物的AUC顯著增大。由于比較AUC不敏感,人們提出了重新分類(lèi)方法(例如凈重新分類(lèi)指數(shù)、綜合歧視指數(shù), net reclassification index, integrated discrimination index),并在表2中進(jìn)行了描述。然而,盡管這些方法很受歡迎,但后來(lái)的研究表明,這些方法比現(xiàn)有方法提供的信息少,并且在某些情況下可能不可靠。在測(cè)試一種新型生物標(biāo)志物的改進(jìn)預(yù)測(cè)性能時(shí),重新分類(lèi)方法已被證明會(huì)提高假陽(yáng)性率。使用決策分析方法基于凈效益的方法現(xiàn)在被廣泛推薦,因?yàn)樗鼈冊(cè)试S通過(guò)比較決策的獲益和風(fēng)險(xiǎn)(真陽(yáng)性)和相對(duì)危害(假陽(yáng)性),對(duì)新的生物標(biāo)志物和既定生物標(biāo)志物或生物標(biāo)志物組合進(jìn)行有意義的評(píng)估。作者對(duì)所有(或一系列)閾值進(jìn)行了比較,以評(píng)估新的生物標(biāo)志物是否增加了臨床效用。
使用生物標(biāo)志物的臨床風(fēng)險(xiǎn)預(yù)測(cè)模型
臨床預(yù)測(cè)模型通常使用回歸模型(例如Logistic回歸或Cox回歸)開(kāi)發(fā)。Logistic回歸主要用于短期二元結(jié)局(如死亡率、術(shù)后心肌梗死),而生存方法(如Cox回歸)用于至事件發(fā)生時(shí)間結(jié)局,并允許刪失。分析之前應(yīng)考慮缺失數(shù)據(jù)的處理方法(例如多重填補(bǔ),multiple imputation),有大量缺失數(shù)據(jù)的預(yù)測(cè)因素可能有問(wèn)題,這表明在日常實(shí)踐中進(jìn)行測(cè)量的頻率較低,可能限制了生物標(biāo)志物模型的有用性。選擇將哪些變量納入模型需要考慮: 變量應(yīng)該具有臨床相關(guān)性,并且在使用模型預(yù)測(cè)時(shí)隨時(shí)可用。對(duì)于任何連續(xù)變量(例如生物標(biāo)志物)的函數(shù)形式,應(yīng)使用分?jǐn)?shù)多項(xiàng)式或限制性立方樣條進(jìn)行適當(dāng)?shù)难芯?,以充分捕捉連續(xù)變量與結(jié)局關(guān)聯(lián)中的任何非線性。為了避免過(guò)擬合,多變量建模中需要考慮的候選預(yù)測(cè)因素?cái)?shù)量相對(duì)于結(jié)局事件數(shù)量受到限制,這一概念稱(chēng)為每變量事件數(shù)(events-per-variable),該概念最大限度地降低了過(guò)擬合(統(tǒng)計(jì)模型描述數(shù)據(jù)中的隨機(jī)變化而不是真實(shí)的基礎(chǔ)關(guān)系的一種情況)的風(fēng)險(xiǎn)。普遍情況下,只有當(dāng)每變量的事件數(shù)超過(guò)10時(shí)才進(jìn)行研究。可以考慮使用懲罰回歸方法(例如最小絕對(duì)收縮和選擇算子、嶺回歸、彈性網(wǎng)),因?yàn)樗兄谶x擇納入模型的變量,同時(shí)最小化過(guò)擬合(表2)。然而,懲罰方法不一定能解決與小樣本量相關(guān)的問(wèn)題。Box 3總結(jié)了開(kāi)發(fā)多變量預(yù)測(cè)模型時(shí)需要考慮的一般因素和生物標(biāo)志物特異性因素。
利用機(jī)器學(xué)習(xí)已經(jīng)開(kāi)發(fā)出改善生物標(biāo)志物臨床應(yīng)用的算法。機(jī)器學(xué)習(xí)的一個(gè)實(shí)用定義是使用從數(shù)據(jù)中自動(dòng)學(xué)習(xí)(即訓(xùn)練)的算法,這與臨床預(yù)測(cè)模型不同,臨床預(yù)測(cè)模型是基于預(yù)先設(shè)定的預(yù)測(cè)因子及其功能形式。這些算法分為有監(jiān)督和無(wú)監(jiān)督兩類(lèi)。有監(jiān)督的機(jī)器學(xué)習(xí)算法用于揭示一組臨床特征和生物標(biāo)志物與已知結(jié)局(預(yù)測(cè)和預(yù)后模型)。主要的有監(jiān)督學(xué)習(xí)算法(如人工神經(jīng)網(wǎng)絡(luò)、基于樹(shù)的方法、支持向量機(jī))見(jiàn)表2。應(yīng)將有監(jiān)督的常規(guī)統(tǒng)計(jì)模型(例如邏輯回歸)和有監(jiān)督的機(jī)器學(xué)習(xí)互補(bǔ)。Marafino等利用有監(jiān)督的機(jī)器學(xué)習(xí)算法,使用了100,000多例重癥監(jiān)護(hù)病房(ICU)患者入院后24小時(shí)內(nèi)的一組生命體征和生物學(xué)數(shù)據(jù),并納入了臨床軌跡指標(biāo),以開(kāi)發(fā)和驗(yàn)證ICU死亡率預(yù)測(cè)模型。利用每個(gè)預(yù)測(cè)變量的序列數(shù)據(jù)點(diǎn)建立的死亡風(fēng)險(xiǎn)預(yù)測(cè)模型顯示出與經(jīng)典死亡率評(píng)分(例如簡(jiǎn)化急性生理學(xué)評(píng)分ⅲ和急性生理學(xué)評(píng)估和慢性健康評(píng)估ⅳ評(píng)分)相當(dāng)?shù)膮^(qū)分度。
機(jī)器學(xué)習(xí)通常被認(rèn)為在高維環(huán)境(即具有大量解釋變量)中具有優(yōu)越的性能。然而,與基于回歸的方法進(jìn)行比較時(shí),支持這一說(shuō)法的證據(jù)有限。雖然機(jī)器學(xué)習(xí)算法被稱(chēng)表現(xiàn)良好,但它們需要非常大的數(shù)據(jù)集、大量的計(jì)算和足夠的專(zhuān)業(yè)知識(shí)。因此,它們不應(yīng)該被認(rèn)為是“通往完美預(yù)測(cè)的捷徑”。局限性包括過(guò)擬合,過(guò)擬合會(huì)捕捉訓(xùn)練數(shù)據(jù)集中的隨機(jī)誤差,使該算法無(wú)法推廣到未來(lái)的預(yù)測(cè)。控制過(guò)擬合的方法應(yīng)根據(jù)已建立的臨床預(yù)測(cè)模型文獻(xiàn)進(jìn)行調(diào)整,以提供預(yù)測(cè)準(zhǔn)確性的無(wú)偏倚評(píng)估。有監(jiān)督機(jī)器學(xué)習(xí)算法的另一個(gè)缺點(diǎn)是臨床醫(yī)師無(wú)法完全理解協(xié)變量和結(jié)局之間的基礎(chǔ)關(guān)聯(lián)(“黑箱”模型)。相反,在Logistic回歸模型中,每個(gè)協(xié)變量的回歸系數(shù)可以很容易地解釋為比值比(回歸系數(shù)的指數(shù)),它反映了與結(jié)局的關(guān)聯(lián)大小。應(yīng)避免在預(yù)測(cè)模型中對(duì)任何關(guān)聯(lián)進(jìn)行因果解釋?zhuān)驗(yàn)轭A(yù)測(cè)模型的目的是預(yù)測(cè)而不是歸因因果關(guān)系。與機(jī)器學(xué)習(xí)算法相比,臨床醫(yī)師在使用經(jīng)典回歸模型時(shí)對(duì)模型的解讀更直觀。
無(wú)論使用更傳統(tǒng)的基于回歸的方法還是現(xiàn)代機(jī)器學(xué)習(xí)來(lái)開(kāi)發(fā)預(yù)測(cè)模型,它們的預(yù)測(cè)準(zhǔn)確性都可以通過(guò)幾個(gè)指標(biāo)進(jìn)行評(píng)估。兩種被廣泛推薦的措施是校準(zhǔn)和區(qū)分(calibration and discrimination)。校準(zhǔn)評(píng)估了模型預(yù)測(cè)的風(fēng)險(xiǎn)與實(shí)際觀察到的風(fēng)險(xiǎn)的一致性。校準(zhǔn)度可以通過(guò)將觀察到的結(jié)局風(fēng)險(xiǎn)與預(yù)測(cè)風(fēng)險(xiǎn)(如死亡率、術(shù)后AKI)繪制在圖上進(jìn)行評(píng)估。區(qū)分度是衡量生物標(biāo)志物模型區(qū)分結(jié)局有興趣和沒(méi)有興趣的良好程度(主要通過(guò)AUC評(píng)估)。預(yù)測(cè)準(zhǔn)確性的另一個(gè)衡量指標(biāo)是Brier評(píng)分(患者結(jié)局和預(yù)測(cè)風(fēng)險(xiǎn)之間的平方差),這反映了預(yù)測(cè)模型的臨床效用。在實(shí)踐中,沒(méi)有一個(gè)度量是足夠的,需要使用多個(gè)度量來(lái)表征預(yù)測(cè)精度的不同組成部分。評(píng)估模型性能是一個(gè)至關(guān)重要的步驟。在預(yù)測(cè)模型的開(kāi)發(fā)過(guò)程中,應(yīng)進(jìn)行內(nèi)部驗(yàn)證,使用交叉驗(yàn)證或自舉,以模擬構(gòu)建過(guò)程中的不確定性,并使用原始研究樣本來(lái)評(píng)估模型的性能。進(jìn)行內(nèi)部驗(yàn)證的原因是獲得經(jīng)偏倚校正的模型性能估計(jì)值,對(duì)于基于回歸的模型,回歸系數(shù)隨后可因過(guò)擬合而縮小。對(duì)模型更強(qiáng)的測(cè)試是進(jìn)行外部驗(yàn)證,包括評(píng)估預(yù)測(cè)模型在不同參與者數(shù)據(jù)中的表現(xiàn)(區(qū)分度和校準(zhǔn)度),而不是用于模型開(kāi)發(fā)(通常從不同機(jī)構(gòu)收集)的數(shù)據(jù)。通常在外部驗(yàn)證后,模型的校準(zhǔn)會(huì)較差,應(yīng)考慮重新校準(zhǔn)模型的方法。
使用生物標(biāo)志物進(jìn)行表型分型和聚類(lèi)
無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法用于識(shí)別具有相似臨床或生物/分子特征的患者自然發(fā)生的集群或亞型,而不針對(duì)特定結(jié)局。幾種流行的無(wú)監(jiān)督學(xué)習(xí)算法(例如潛在類(lèi)別分析、聚類(lèi)分析)見(jiàn)表2。在危重癥護(hù)理中使用這種方法的一個(gè)例子是個(gè)性化醫(yī)學(xué)研究。具有相同臨床/生物學(xué)特征的患者更有可能對(duì)靶向治療(如通氣策略、液體管理策略、他汀類(lèi)藥物)產(chǎn)生應(yīng)答。例如,Calfee等認(rèn)利用潛在類(lèi)別分析(主要基于臨床數(shù)據(jù)和炎癥生物標(biāo)志物)在急性呼吸窘迫綜合征(ARDS)患者中發(fā)現(xiàn)了對(duì)呼氣末正壓(PEEP)策略有不同應(yīng)答的兩種不同亞表型。同一研究小組在辛伐他汀抑制羥甲基戊二?;鵆oA還原酶以減輕急性肺損傷肺功能障礙隊(duì)列中發(fā)現(xiàn)了ARDS的兩種不同亞型,具有不同的臨床和生物學(xué)特征(細(xì)胞因子)和不同的臨床結(jié)局。與安慰劑(placebo)相比,辛伐他汀改善了過(guò)度炎癥亞表型的生存。最后,Seymour等人回顧性地確定了膿毒癥的4種不同表型(主要基于炎癥、凝血和腎損傷標(biāo)志物),這些表型對(duì)早期目標(biāo)導(dǎo)向治療的反應(yīng)不同。
生物標(biāo)志物評(píng)估研究中的挑戰(zhàn)和常見(jiàn)陷阱
生物標(biāo)志物檢測(cè)的特性
評(píng)估生物標(biāo)志物測(cè)量的精確度應(yīng)報(bào)告生物學(xué)測(cè)定及其測(cè)量誤差。生物標(biāo)志物檢測(cè)應(yīng)該是敏感的(能檢測(cè)低濃度的生物標(biāo)志物),并具有特異性(它不受其他分子的影響)。在從不同機(jī)構(gòu)收集的隊(duì)列中評(píng)估生物標(biāo)志物模型的性能時(shí)(外部驗(yàn)證),應(yīng)考慮實(shí)驗(yàn)室間生物標(biāo)志物檢測(cè)的可重復(fù)性。另一個(gè)潛在的問(wèn)題是相同的生物標(biāo)志物可以由不同的細(xì)胞以不同的途徑機(jī)制產(chǎn)生。這一點(diǎn)在分析數(shù)據(jù)時(shí)難以控制,因?yàn)橐环N新型生物標(biāo)志物的生理機(jī)制通常不完全清楚。
時(shí)間和生物標(biāo)志物動(dòng)力學(xué)的作用
生物標(biāo)志物測(cè)定的時(shí)間是重要的考慮因素。例如,在術(shù)后期間診斷心肌梗死所需的最佳信息可在肌鈣蛋白I濃度的峰值(~24小時(shí))獲得。在大手術(shù)和危重癥監(jiān)護(hù)中,關(guān)注的生物標(biāo)志物(如肌鈣蛋白T、n末端b型鈉尿肽前體和c反應(yīng)蛋白)可能具有完全不同的動(dòng)力學(xué)。在這些情況下,主要問(wèn)題是生物標(biāo)志物測(cè)定的時(shí)間,不僅要考慮生物標(biāo)志物的動(dòng)力學(xué),而且還要考慮各種病理生理過(guò)程(例如,大手術(shù)后繼發(fā)膿毒癥)的發(fā)生時(shí)間。在分析過(guò)程中,還應(yīng)考慮個(gè)體內(nèi)重復(fù)測(cè)量的生物標(biāo)志物之間的相關(guān)性。在許多情況下,使用混合模型而不是重復(fù)測(cè)量方差分析具有明顯的優(yōu)勢(shì)。另一個(gè)問(wèn)題是腎功能或肝功能可能影響生物標(biāo)志物的消除,從而影響其診斷特性。對(duì)于老年患者(有慢性器官功能障礙)以及大手術(shù)和重癥監(jiān)護(hù)患者,這一點(diǎn)很重要,因?yàn)檫@些患者更有可能出現(xiàn)器官衰竭。在這方面,當(dāng)將協(xié)變量(如年齡、腎功能)納入實(shí)時(shí)收集臨床參數(shù)的回歸模型和機(jī)器學(xué)習(xí)算法時(shí),選擇“最佳”生物標(biāo)志物測(cè)定時(shí)間和協(xié)變量校正是一個(gè)真正的挑戰(zhàn)。
不完善的公認(rèn)標(biāo)準(zhǔn)方法
應(yīng)仔細(xì)考慮選擇用于定義患病和非患病患者(如術(shù)后AKI、術(shù)后心肌梗死)的參考試驗(yàn)。人們經(jīng)常根據(jù)公認(rèn)的標(biāo)準(zhǔn)對(duì)新型生物標(biāo)志物進(jìn)行評(píng)估,而公認(rèn)的標(biāo)準(zhǔn)被認(rèn)為可以根據(jù)患者是否患病而完全準(zhǔn)確地對(duì)患者進(jìn)行分類(lèi)。在實(shí)踐中,參考檢測(cè)很少是準(zhǔn)確的疾病預(yù)測(cè)指標(biāo),而且往往會(huì)對(duì)患者進(jìn)行錯(cuò)誤分類(lèi)。在公認(rèn)標(biāo)準(zhǔn)不完善的情況下(例如AKI62的血清肌酐延遲升高),患者分類(lèi)錯(cuò)誤會(huì)給新生物標(biāo)志物的敏感性和特異性估計(jì)值帶來(lái)偏倚。對(duì)一個(gè)“不完善”的參考標(biāo)準(zhǔn)提出的主要方法之一是復(fù)合參考標(biāo)準(zhǔn)。其基本原理是將不同的不完善測(cè)試的結(jié)果結(jié)合起來(lái),可以得到更準(zhǔn)確的參考測(cè)試。然而在某些情況下,結(jié)局不是二分類(lèi)的(患病或非患病患者),而是連續(xù)的(如肌酐水平變化)或有序的(如AKI網(wǎng)絡(luò)分期)。在這種情況下,可以應(yīng)用新型生物標(biāo)志物診斷準(zhǔn)確性的非參數(shù)估計(jì)值,其解釋類(lèi)似于AUC。
不同人群
研究人群可極大地影響檢測(cè)的診斷和預(yù)后性能。例如,在非心臟手術(shù)和心臟手術(shù)中,甚至在接受不同手術(shù)(冠狀動(dòng)脈旁路移植術(shù)vs.瓣膜手術(shù))的心臟手術(shù)患者中,用于診斷術(shù)后心肌梗死的心肌肌鈣蛋白I有不同的臨界點(diǎn)。在具有不同人口統(tǒng)計(jì)學(xué)特征和慢性疾病(如年齡、慢性腎臟病)的人群中,診斷檢查結(jié)果也可能不同。因此,科研人員應(yīng)該描述他們想要做出推斷的確切的研究人群。在回歸模型中納入生物標(biāo)志物時(shí),協(xié)變量校正(外部影響)是一個(gè)重點(diǎn)。
相關(guān)臨床預(yù)測(cè)因子或多種生物標(biāo)志物
為了評(píng)估與結(jié)局相關(guān)的臨床預(yù)測(cè)因素或多種生物標(biāo)志物,可以使用Logistic回歸或Cox回歸開(kāi)發(fā)風(fēng)險(xiǎn)預(yù)測(cè)模型。然后根據(jù)AUC的差異或Harrell C-statistic統(tǒng)計(jì)量的差異建立兩個(gè)模型并進(jìn)行比較,第一個(gè)模型采用常規(guī)預(yù)測(cè)因子,第二個(gè)模型分別采用常規(guī)預(yù)測(cè)因子和新型生物標(biāo)志物。也可以應(yīng)用多種生物標(biāo)志物方法。與生物標(biāo)志物性能的規(guī)劃和分析相關(guān)的概念性問(wèn)題見(jiàn)Box 4。這種方法學(xué)方法可以降低偏倚,從而獲得生物標(biāo)志物性能的匯總估計(jì)值。Box 5總結(jié)了最常見(jiàn)的可避免的陷阱。
結(jié)論
機(jī)器學(xué)習(xí)是一種很有前景的工具,可以改善危重患者的結(jié)局預(yù)測(cè)和分型,從而實(shí)現(xiàn)個(gè)性化治療。但目前需要更好地評(píng)估機(jī)器學(xué)習(xí)在預(yù)測(cè)病理或治療應(yīng)答方面的作用。在臨床決策中直接實(shí)施機(jī)器學(xué)習(xí)與實(shí)施不良的統(tǒng)計(jì)學(xué)方法對(duì)患者同樣有害。這篇文章提供的信息旨在幫助讀者更好地理解機(jī)器學(xué)習(xí)技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用,并避免其誤用(例如過(guò)擬合、缺乏獨(dú)立驗(yàn)證、未與較簡(jiǎn)單的建模方法進(jìn)行比較)。
參考文章
Soussi S, Collins GS, Jüni P, Mebazaa A, Gayat E, Le Manach Y. Evaluation of Biomarkers in Critical Care and Perioperative Medicine: A Clinician’s Overview of Traditional Statistical Methods and Machine Learning Algorithms. Anesthesiology. 2021 Jan 1;134(1):15-25. doi: 10.1097/ALN.0000000000003600