預(yù)判模型 | 臨床預(yù)判模型的創(chuàng)建與驗證
模型 |臨床預(yù)測模型制定檢查表的詳細(xì)說明
你的預(yù)測模型文章報告標(biāo)準(zhǔn)嗎?
現(xiàn)在我們對臨床預(yù)測模型的概念有了基本的了解,那么如何構(gòu)建和驗證呢?在本節(jié)中,我們將討論這一方面。
臨床問題決定研究類型:
首先要明確具體的臨床問題來確定研究類型的選擇。臨床預(yù)測模型可以回答疾病的病因、診斷、患者對治療的反應(yīng)、預(yù)后等問題。不同的問題需要設(shè)計不同的研究類型。
例如,在病因?qū)W研究中,隊列研究可用于根據(jù)潛在原因預(yù)測疾病的發(fā)生。關(guān)于診斷準(zhǔn)確性的臨床問題,適合采用橫斷面研究設(shè)計,因為預(yù)測因素和結(jié)果可能同時發(fā)生,也可能在短時間內(nèi)發(fā)生。
為了預(yù)測患者對治療的反應(yīng),可以使用隊列研究或隨機對照試驗(RCT)。對于預(yù)測性的臨床問題,隊列研究的設(shè)計是適用的,因為在預(yù)測因素和結(jié)果之間存在垂直的時間邏輯關(guān)系。評價病因的隊列研究需要選擇合理的研究對象,控制混雜因素。
在診斷模型的研究中,需要一個“金標(biāo)準(zhǔn)”或參考標(biāo)準(zhǔn)來獨立診斷疾病,參考標(biāo)準(zhǔn)的診斷要在“盲法”狀態(tài)下進行。也就是說,參考標(biāo)準(zhǔn)診斷不能依賴預(yù)測模型中預(yù)測因子的信息,以避免診斷和評價的偏差。
評估患者對治療的反應(yīng)是一種干預(yù)研究。要選擇合理的研究對象,控制非測試因素的干擾。在預(yù)后模型中,預(yù)測因子和轉(zhuǎn)歸之間存在垂直關(guān)系,研究者通常期望得到疾病在自然狀態(tài)下的轉(zhuǎn)歸。因此,前瞻性隊列研究是最常見的預(yù)后模型和最佳類型的研究設(shè)計。
模型版本的數(shù)量:
首先,我們需要查看文獻,以確定我們想要構(gòu)建的預(yù)測模型的數(shù)量:
(A)目前沒有針對具體臨床問題的模型預(yù)測。為了構(gòu)建一個新的模型,通常需要一個訓(xùn)練集來構(gòu)建模型,還需要一個驗證集來驗證模型的預(yù)測能力。
(2)目前有模型的預(yù)測。構(gòu)建新的模型,用一個驗證集構(gòu)建新的模型,用同一個訓(xùn)練數(shù)據(jù)集分別驗證現(xiàn)有模型和新模型的預(yù)測能力。
(C)為了更新現(xiàn)有的模型,使用相同的驗證數(shù)據(jù)集來評估這兩個模型的預(yù)測能力。
關(guān)于訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集的生成,可以前瞻性地或追溯性地收集數(shù)據(jù),并且前瞻性地收集的數(shù)據(jù)具有更高的質(zhì)量。對于建模人群,樣本量應(yīng)該盡可能大。
如果數(shù)據(jù)是回顧性收集的,還應(yīng)評估數(shù)據(jù)的質(zhì)量,識別異常值,并適當(dāng)處理缺失值,如填充或刪除。
最后,根據(jù)實際情況,確定用于建模的訓(xùn)練數(shù)據(jù)集和用于驗證的驗證數(shù)據(jù)集。出于實際原因,有時只能在同一個數(shù)據(jù)集中建模和驗證,這是允許的,但模型的外部適用性會受到一定影響。
模型的建立和展示:
在建立預(yù)測模型之前,需要了解以往文獻報道的預(yù)測因子,確定選擇預(yù)測因子的原則和方法,選擇要應(yīng)用的模型類型,如logistic回歸模型或Cox回歸模型。目前,預(yù)測模型通常有四種形式:
(1)公式。用直接的數(shù)學(xué)公式作為預(yù)測模型的工具。
(2)諾模圖的諾模圖。通過適當(dāng)?shù)臄?shù)學(xué)變換,將回歸模型中的回歸系數(shù)轉(zhuǎn)換成分?jǐn)?shù),繪制成諾謨圖,作為預(yù)測模型的工具。
(3)網(wǎng)絡(luò)計算器。其本質(zhì)是通過適當(dāng)?shù)臄?shù)學(xué)運算,將回歸模型中的回歸系數(shù)轉(zhuǎn)化為分?jǐn)?shù),并制作成網(wǎng)站供在線使用。
(4)評分系統(tǒng)。通過適當(dāng)?shù)臄?shù)學(xué)運算,將回歸模型的回歸系數(shù)轉(zhuǎn)化為可量化的評分體系。
臨床預(yù)測模型的驗證:
模型預(yù)測的效果會隨著應(yīng)用場景和人的變化而變化。因此,對模型預(yù)測的完整研究應(yīng)該包括對模型的驗證。驗證的內(nèi)容包括模型的內(nèi)部效度和外部效度。內(nèi)部效度反映的是模型的可重復(fù)性,可以用自己的研究數(shù)據(jù)通過交叉驗證和Bootstrap方法進行驗證。外部效度反映的是模型的普適性,需要使用非來自研究本身的數(shù)據(jù)集進行驗證,并且這些數(shù)據(jù)集在時間或地理上相互獨立。
模型的內(nèi)部驗證和外部驗證是評估模型穩(wěn)定性和適用性的必要步驟。用于內(nèi)部驗證和外部驗證的數(shù)據(jù)集應(yīng)該是完全異構(gòu)的,而不僅僅是在某種程度上不同。一般以原機構(gòu)的數(shù)據(jù)作為訓(xùn)練集建立模型,隨機選取部分內(nèi)部數(shù)據(jù)進行內(nèi)部驗證。選擇其他機構(gòu)的數(shù)據(jù)作為外部驗證數(shù)據(jù)集。當(dāng)然,最好是驗證外部數(shù)據(jù)集。以下是一些驗證內(nèi)部效度的方法。
(1)隨機分裂法?,F(xiàn)有數(shù)據(jù)隨機分為兩部分,一部分用于構(gòu)建模型,一部分用于驗證模型。這種方法將數(shù)據(jù)分為兩部分進行“內(nèi)部驗證”。由于只有一部分?jǐn)?shù)據(jù)用于構(gòu)造模型,模型相對不穩(wěn)定。樣本量小的研究通常不適合這種方法。
(2)交叉驗證法。這種方法是隨機分裂法的進一步推廣。常用的有半折交叉驗證和十折交叉驗證。半折交叉驗證法將原始數(shù)據(jù)分為兩部分,一部分用于建立模型,另一部分用于驗證模型。然后交換兩部分的數(shù)據(jù),互相驗證。十重交叉驗證法將數(shù)據(jù)分為十部分,其中九部分用于建模,另一部分用于模型驗證。這樣建立和驗證模型十次,就可以建立一個相對穩(wěn)定的模型。
(C)自助法。傳統(tǒng)的Bootstrap內(nèi)部有效性驗證方法是在原始數(shù)據(jù)集中隨機選取一定數(shù)量的樣本建立模型,然后用原始數(shù)據(jù)集對模型進行驗證。通過500-1000次的隨機抽樣、建立和驗證,可以得到500-1000個模型,總結(jié)出模型的參數(shù)分布。因此可以確定模型的最終參數(shù)值。實踐證明,這種方法得到的模型比前兩種方法更穩(wěn)定。可以推測,Bootstrap方法將越來越多地用于驗證模型的內(nèi)部效度分析。當(dāng)然,在條件允許的情況下,要盡量對外驗證預(yù)報模型,提高模型的對外適用性。
目前,臨床預(yù)測模型的研究從臨床醫(yī)生的角度大致可以分為三類:
1.預(yù)測模型是根據(jù)傳統(tǒng)的臨床特征、病理特征、體檢結(jié)果、實驗室檢查結(jié)果等構(gòu)建的。這種模型中的預(yù)測變量在臨床上更容易獲得。
2.隨著影像學(xué)研究方法的成熟,越來越多的學(xué)者認(rèn)識到影像學(xué)的某些表現(xiàn)或參數(shù)代表了特定的生物學(xué)特征。利用彩色多普勒超聲、CT、MR和PET的大量成像參數(shù)結(jié)合臨床特征構(gòu)建預(yù)測模型往往可以進一步提高預(yù)測模型的準(zhǔn)確性。這種建模是基于成像數(shù)據(jù)的。這種建模的前期工作要比第一種方法大得多,需要臨床和影像部門的密切配合。
3.隨著基因組學(xué)和蛋白質(zhì)組學(xué)等高通量生物技術(shù)的廣泛應(yīng)用,臨床研究人員正試圖從這些海量的生物信息中尋找一些特征生物標(biāo)志物來構(gòu)建預(yù)測性模型。這些對模型的預(yù)測是將基礎(chǔ)醫(yī)學(xué)轉(zhuǎn)化為臨床醫(yī)學(xué)的一個很好的起點。但由于需要對臨床標(biāo)本進行各種組學(xué)試驗,這類研究往往需要強大的資金支持。一旦你愿意投入組學(xué)分析的研究,就可以很好的轉(zhuǎn)化為臨床研究,一般都能出高分文章。此外,還必須有生物樣本支持。
從臨床醫(yī)生角度構(gòu)建臨床預(yù)測模型的必要條件;
1.建立單病種隨訪數(shù)據(jù)庫,盡可能完整地收集患者信息,包括但不限于:人口學(xué)特征、既往病史、家族史、個人病史;與疾病有關(guān)的信息,如治療前重要的生理和實驗室檢查結(jié)果、疾病的嚴(yán)重程度、臨床分期、病理分期和組織學(xué)分級;治療信息:如手術(shù)方法、放化療方案、劑量和強度;患者的預(yù)后:對于癌癥患者來說,需要持續(xù)的隨訪才能得到結(jié)果,這是一項極其困難和復(fù)雜的工作。