預(yù)判模型 | 臨床預(yù)判模型的創(chuàng)建與驗(yàn)證
預(yù)判模型 | 臨床預(yù)判模型開(kāi)發(fā)checklist詳解
你的預(yù)判模型文章報(bào)表是標(biāo)準(zhǔn)的嗎?
既然前面咱們已然對(duì)臨床預(yù)判模型的概念有了根本了解后,那么它詳細(xì)怎樣建立以及驗(yàn)證呢?本節(jié)咱們就研討下這方面的內(nèi)容。臨床問(wèn)題決議研發(fā)型號(hào):
首選咱們要明確詳細(xì)的臨床問(wèn)題決議研發(fā)型號(hào)的選取。臨床預(yù)判模型可以答復(fù)疾病的病因、診療、患者對(duì)醫(yī)治的反應(yīng)和預(yù)后等問(wèn)題。不同的問(wèn)題須要設(shè)計(jì)不同的研發(fā)型號(hào)。
比如,在病因?qū)W研發(fā)方面,隊(duì)列研發(fā)可以拿來(lái)依據(jù)潛在的原因來(lái)預(yù)判疾病能否爆發(fā)。對(duì)于診療確切性的臨床問(wèn)題,合適采取橫斷面研發(fā)設(shè)計(jì),由于預(yù)判因子和結(jié)果能夠同時(shí)爆發(fā)或在短時(shí)間內(nèi)爆發(fā)。
為了預(yù)判患者對(duì)醫(yī)治的反應(yīng),可以采取隊(duì)列研發(fā)或隨機(jī)對(duì)比實(shí)驗(yàn)(RCT)。針對(duì)預(yù)判類(lèi)臨床問(wèn)題,設(shè)計(jì)隊(duì)列研發(fā)是應(yīng)用的,由于預(yù)判因子和結(jié)局有縱向的時(shí)間邏輯關(guān)系。評(píng)價(jià)病因的隊(duì)列研發(fā)須要選取合理的研發(fā)目標(biāo)和操控混同原因。
在診療模型的研發(fā)中,須要1個(gè)“金規(guī)范”或考慮規(guī)范來(lái)獨(dú)立診療疾病,考慮規(guī)范的診療理應(yīng)在“盲法”狀況下進(jìn)行。也就是說(shuō),考慮規(guī)范診療不可依托于預(yù)判模型中預(yù)判因子的數(shù)據(jù),以以免顯現(xiàn)診療評(píng)價(jià)誤差。
評(píng)價(jià)患者對(duì)醫(yī)治的反應(yīng)是干預(yù)性研發(fā)的一類(lèi)型號(hào)。須要選取合理的研發(fā)目標(biāo)、操控非測(cè)驗(yàn)原因的攪擾。在預(yù)后模型中,預(yù)判因子與結(jié)局之間存在縱向關(guān)系,研發(fā)者往往希望獲得疾病在自然狀況下的結(jié)局,因而前瞻性隊(duì)列研發(fā)是最常見(jiàn)的預(yù)后模型,也是最好的研發(fā)設(shè)計(jì)型號(hào)。建立模型的數(shù)目:
首先須要回首文獻(xiàn)來(lái)確認(rèn)咱們要建立的預(yù)判模型的數(shù)目:
(一)對(duì)于詳細(xì)臨床問(wèn)題現(xiàn)在還沒(méi)有預(yù)判模型。為了建立1個(gè)新的模型,往往須要1個(gè)訓(xùn)練集來(lái)建立模型,并須要1個(gè)驗(yàn)證集來(lái)驗(yàn)證模型的預(yù)判本領(lǐng)。
(二)現(xiàn)在已有預(yù)判模型。為了建立新的模型,應(yīng)用驗(yàn)證集來(lái)建立新模型,并應(yīng)用相近的訓(xùn)練信息集來(lái)分別驗(yàn)證現(xiàn)有模型和新模型的預(yù)判本領(lǐng)。
(三)為了刷新現(xiàn)有模型,應(yīng)用相近的驗(yàn)證信息集來(lái)評(píng)價(jià)這2個(gè)模型的預(yù)判本領(lǐng)。
對(duì)于訓(xùn)練信息集和驗(yàn)證信息集的形成,可從前瞻性地或回首性地采集信息,此中前瞻性采集的信息擁有更高的品質(zhì)。針對(duì)建模人群,樣件量應(yīng)盡能夠大。
假設(shè)信息是回首性采集的,還理應(yīng)評(píng)價(jià)信息品質(zhì),辨認(rèn)離群值,并對(duì)缺失值進(jìn)行恰當(dāng)處置,如填充或刪除。
最終,依據(jù)實(shí)際狀況確認(rèn)用來(lái)建模的訓(xùn)練信息集和用來(lái)驗(yàn)證的驗(yàn)證信息集。因?yàn)楝F(xiàn)實(shí)原因,偶爾只可在同一信息集中建模和驗(yàn)證,這是容許的,但模型的外部應(yīng)用性會(huì)遭到絕對(duì)程度的影響。模型的創(chuàng)建與展現(xiàn):
在創(chuàng)建預(yù)判模型此前,有必須了解往常文獻(xiàn)報(bào)導(dǎo)中的預(yù)判因子,確認(rèn)選取預(yù)判因子的準(zhǔn)則和方式,并選取所需運(yùn)用的模型型號(hào),如logistic回歸模型或Cox回歸模型?,F(xiàn)在,預(yù)判模型常用有四種展現(xiàn)形態(tài):
(一)公式。直接應(yīng)用數(shù)學(xué)公式作為預(yù)判模型工具。
(二)列線(xiàn)圖Nomogram。通過(guò)恰當(dāng)?shù)臄?shù)學(xué)變換將回歸模型中的回歸系數(shù)轉(zhuǎn)換為分?jǐn)?shù),并將其繪制為諾模圖作為預(yù)判模型工具。
(三) 網(wǎng)絡(luò)計(jì)算器。其實(shí)質(zhì)也是通過(guò)恰當(dāng)?shù)臄?shù)學(xué)運(yùn)算將回歸模型中的回歸系數(shù)轉(zhuǎn)換成份數(shù),并將其制造成網(wǎng)站供在線(xiàn)應(yīng)用。
(四)評(píng)分體系。通過(guò)恰當(dāng)?shù)臄?shù)學(xué)運(yùn)算,將回歸模型的回歸系數(shù)轉(zhuǎn)變?yōu)?個(gè)可量化的評(píng)分體系。臨床預(yù)判模型的驗(yàn)證:
預(yù)判模型的成效會(huì)隨著運(yùn)用情景和人群的改變而改變。因而,對(duì)預(yù)判模型的完整研發(fā)理應(yīng)含蓋模型的驗(yàn)證。驗(yàn)證的內(nèi)容含蓋模型的內(nèi)部有效性和外部有效性。內(nèi)部有效性反映了模型的可反復(fù)性,可以用自身的研發(fā)信息通過(guò)交叉驗(yàn)證和Bootstrap方式來(lái)進(jìn)行驗(yàn)證。外部有效性反映了模型的廣泛性,須要應(yīng)用不是來(lái)自研發(fā)自身的信息集進(jìn)行驗(yàn)證,這類(lèi)信息集在時(shí)間或地理上是互相獨(dú)立的。
模型的內(nèi)部驗(yàn)證和外部驗(yàn)證是評(píng)價(jià)模型安穩(wěn)性和應(yīng)用性的必須方法。用來(lái)內(nèi)部驗(yàn)證和外部驗(yàn)證的信息集理應(yīng)是完全異質(zhì)的,不可只是在絕對(duì)程度上不同。通常狀況下,應(yīng)用原機(jī)構(gòu)的信息作為訓(xùn)練集來(lái)創(chuàng)建模型,并隨機(jī)抽取一部分內(nèi)部信息進(jìn)行內(nèi)部驗(yàn)證。選取來(lái)自其余機(jī)構(gòu)的信息作為外部驗(yàn)證信息集。固然,最佳是進(jìn)行外部信息集驗(yàn)證。以下簡(jiǎn)介幾種驗(yàn)證內(nèi)部有效性的方式。
(一)隨機(jī)拆分法。將現(xiàn)有信息隨機(jī)分成兩部分,一部分用來(lái)建立模型,另一部分用來(lái)驗(yàn)證模型。采取該方式將信息劃為兩部分進(jìn)行“內(nèi)部驗(yàn)證”。因?yàn)槲í?dú)一部分的信息用來(lái)建立模型,因而模型相對(duì)不安穩(wěn)。樣件量較小的研發(fā)往往不合適這類(lèi)方式。
(二)交叉驗(yàn)證方式。這類(lèi)方式是對(duì)隨機(jī)拆分法的的進(jìn)一步蔓延。常用的有半折交叉驗(yàn)證和十折交叉驗(yàn)證。半折交叉驗(yàn)證法是將起始信息分成兩部分,一部分用來(lái)創(chuàng)建模型,另一部分用來(lái)驗(yàn)證模型。接著替換兩部分的信息并互相驗(yàn)證。十折交叉驗(yàn)證法是將信息分成十部分,此中九部分用來(lái)建模,另一部分用來(lái)模型驗(yàn)證。用這類(lèi)方式創(chuàng)建和驗(yàn)證模型十次,就可以建立1個(gè)相對(duì)安穩(wěn)的模型。
(三)Bootstrap方式。傳統(tǒng)的Bootstrap內(nèi)部有效性驗(yàn)證方式是在起始信息集中有放回的隨機(jī)抽取絕對(duì)數(shù)目的樣件創(chuàng)建模型,接著應(yīng)用起始信息集對(duì)模型進(jìn)行驗(yàn)證。通過(guò)500-1000次的隨機(jī)抽樣、創(chuàng)建和驗(yàn)證,可以獲得500-1000個(gè)模型,并可以總結(jié)出模型的參數(shù)散布。因而,可以確認(rèn)模型的終極參數(shù)值。實(shí)踐證實(shí),該方式獲得的模型比前兩類(lèi)方式擁有更高的安穩(wěn)性??梢源y(cè),Bootstrap方式將越來(lái)越多地運(yùn)用于驗(yàn)證模型的內(nèi)部有效性解析。固然,在具有條件的狀況下,應(yīng)盡快對(duì)預(yù)判模型進(jìn)行外部驗(yàn)證,提升模型的外部應(yīng)用性?,F(xiàn)在臨床預(yù)判模型的研發(fā)從臨床醫(yī)師的角度大概可劃為三大類(lèi):
1.預(yù)判模型是依據(jù)傳統(tǒng)的臨床特點(diǎn)、病理特點(diǎn)、體檢結(jié)果、試驗(yàn)室檢驗(yàn)結(jié)果等建立起來(lái)的,這種模型中的預(yù)判變量愈加便于從臨床上獲得。
2.隨著影像組學(xué)研發(fā)方式的成熟,越來(lái)越多的學(xué)者意識(shí)到影像學(xué)的某類(lèi)體現(xiàn)或參數(shù)代表了特定的生物學(xué)特點(diǎn)。應(yīng)用彩色多普勒超聲、CT、MR以及PET的批量成像參數(shù)結(jié)合臨床特點(diǎn)來(lái)建立預(yù)判模型,通常可以進(jìn)一步提升預(yù)判模型的確切性。此類(lèi)建?;谟跋窠M學(xué)信息。此類(lèi)建模的初期工作量比第一類(lèi)方式大得多,而且須要臨床和影像部門(mén)之間的慎密協(xié)作。
3.隨著基因組學(xué)和蛋白質(zhì)組學(xué)等高通量生物技術(shù)的全面運(yùn)用,臨床研發(fā)職員正企圖從這類(lèi)海量的生物數(shù)據(jù)中尋找某種特點(diǎn)生物標(biāo)志物來(lái)建立預(yù)判模型。這類(lèi)預(yù)判模型是將根基醫(yī)學(xué)轉(zhuǎn)變?yōu)榕R床醫(yī)學(xué)的1個(gè)較好的切入點(diǎn),但因?yàn)轫氁獙?duì)臨床標(biāo)本進(jìn)行各類(lèi)組學(xué)測(cè)驗(yàn),這種研發(fā)通常須要強(qiáng)有力的資金支持。一經(jīng)樂(lè)意投入資金進(jìn)行組學(xué)解析的研發(fā),可以較好地轉(zhuǎn)變?yōu)榕R床研發(fā),通??梢援a(chǎn)出高分文章。另外,還必要要有生物樣件的支持。從臨床醫(yī)師的角度建立臨床預(yù)判模型的所需條件:
1.創(chuàng)建單一疾病的隨訪信息庫(kù),盡能夠完整地采集患者數(shù)據(jù),含蓋但不局限:人口統(tǒng)計(jì)學(xué)特點(diǎn)、既往病史、家族史、個(gè)體病史;與疾病有關(guān)的數(shù)據(jù),如醫(yī)治前主要的生理和試驗(yàn)室檢驗(yàn)結(jié)果、疾病的嚴(yán)重程度、臨床分期、病理分期、組織學(xué)分級(jí);醫(yī)治數(shù)據(jù):如手術(shù)方式、放化療計(jì)劃、劑量和強(qiáng)度;患者的預(yù)后:針對(duì)癌癥患者,須要連續(xù)的隨訪才能獲取其結(jié)果,這是一項(xiàng)極其艱難和高難的任務(wù)。
2.從往??堑念A(yù)判模型文章來(lái)看,大部分全是基于回首性的信息,也有一小部分是基于前瞻性的信息。與隨機(jī)對(duì)比研發(fā)相比,如此的研發(fā)更容易進(jìn)行,況且它們屬于咱們?nèi)缃癜l(fā)起的現(xiàn)實(shí)世界研發(fā)行業(yè)。在過(guò)去,咱們過(guò)度注重了隨機(jī)對(duì)比研發(fā)的主要性,而忽略了現(xiàn)實(shí)世界信息的較大價(jià)值。隨機(jī)對(duì)比研發(fā)的信息無(wú)疑是品質(zhì)最高的,但信息經(jīng)過(guò)了嚴(yán)密的篩選,因而證據(jù)的外推是有限的。真正信息來(lái)歷于咱們的平常臨床實(shí)踐,更廣泛地反映了臨床干預(yù)的有效性,證據(jù)擁有很好的外部應(yīng)用性。但是,現(xiàn)實(shí)世界研發(fā)的最大問(wèn)題是信息的品質(zhì)參差不齊,有太多難以辨認(rèn)的混同原因。因而,有必須用更高難的統(tǒng)計(jì)方式從高難的混同原因中找尋真象。
在這里,咱們須要解讀混同原因是客觀存在的,由于所有臨床結(jié)果的爆發(fā)都不是單一原因的結(jié)果。針對(duì)混同原因有2個(gè)級(jí)別的校正。一類(lèi)是試驗(yàn)設(shè)計(jì)階段的校正,即頂層校正,即通過(guò)隨機(jī)化和充足的樣件量來(lái)均衡組間的混同原因。這也是隨機(jī)對(duì)比研發(fā)盛行的原因:只需樣件量充足,隨機(jī)化準(zhǔn)確,就能一勞永逸地解決混同原因問(wèn)題。第二種狀況是通過(guò)統(tǒng)計(jì)方式進(jìn)行后續(xù)校正,明顯沒(méi)有隨機(jī)對(duì)比研發(fā)校正的那么徹底,但第二種狀況更靠近咱們臨床實(shí)踐的真正狀況。
3.樣件大小。因?yàn)楝F(xiàn)實(shí)研發(fā)中混同原因較多,須要絕對(duì)的樣件量才能到達(dá)充足的統(tǒng)計(jì)效能,才能分辨混同原因?qū)Y(jié)果的影響。多變量解析篩選變量的1個(gè)簡(jiǎn)潔可行的準(zhǔn)則是,假設(shè)多變量解析中含蓋1個(gè)變量,則有效樣件量應(yīng)為20個(gè),稱(chēng)為“1:20準(zhǔn)則”。比如,咱們?cè)谧鯟OX回歸解析時(shí),假設(shè)采集了8個(gè)與預(yù)后有關(guān)的變量,那么起碼理應(yīng)有160個(gè)患者爆發(fā)了咱們定論的終點(diǎn)事情,如滅亡。注重是起碼160個(gè)滅亡患者,而不是160個(gè)患者,未顯現(xiàn)終點(diǎn)事情的樣件咱們通常不可稱(chēng)其為有效樣件。
4.臨床研發(fā)洞察力。創(chuàng)建臨床預(yù)判模型是為了解決臨床問(wèn)題。要發(fā)掘有價(jià)值的臨床問(wèn)題,就須要進(jìn)行全面閱讀和臨床實(shí)踐。預(yù)判模型研發(fā)現(xiàn)在所面對(duì)的問(wèn)題:
1.臨床運(yùn)用率低。首要原因是預(yù)判模型的臨床運(yùn)用須要在模型的確切性和簡(jiǎn)捷性之間獲得平衡。假設(shè)有1個(gè)模型,它與TNM分期同樣易于應(yīng)用,但比TNM分期更確切,您會(huì)做出甚麼選???
2.大多數(shù)臨床預(yù)判模型全是基于回首性信息集來(lái)建立和驗(yàn)證的,很少在前瞻性信息中進(jìn)行驗(yàn)證。因而,模型預(yù)判的安穩(wěn)性相對(duì)較差。
3.大多數(shù)臨床預(yù)判模型的驗(yàn)證全是基于內(nèi)部信息。大多數(shù)文章唯獨(dú)1個(gè)信息集。縱然有2個(gè)信息集,1個(gè)要建立,另1個(gè)要驗(yàn)證,但這2個(gè)信息集通常來(lái)自同1個(gè)研發(fā)中心。假設(shè)該預(yù)判模型的有效功能夠進(jìn)一步擴(kuò)展到另1個(gè)研發(fā)中心的信息集,那么該模型的運(yùn)用價(jià)值將會(huì)大大提升??紤]文獻(xiàn)
Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R. Ann Transl Med. 2019;7(23):796. doi:10.21037/atm.2019.08.63