一種基于多元邏輯回歸檢測icu患者記錄中偽像的方法及系統的制作方法
【專利摘要】本發明公開了一種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法,其通過多元邏輯回歸表達式計算病人的ICU概率,并與設定的閥值比較,從而建立一個二元分類器,實現對ICU病人是否會死亡的判斷。基于本發明檢測ICU患者記錄中偽像的方法不需要預設預測變量服從正態分布的前提條件;并且預測變量既可以是連續的,又可以是離散的。同時,該本發明模型盡可能減少了預測變量數,在保證預測準確率的基礎上降低了模型的復雜度。本發明還公開了實現上述方法的系統,能夠有效解決現有風險預測模型的非特異性問題;相對現有模型,本發明提高了預測的準確率和特異性。
【專利說明】—種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法及系統
【技術領域】
[0001]本發明屬于醫療檢測【技術領域】,具體涉及一種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法及系統。
【背景技術】
[0002]保健技術(例如生物醫學傳感器、監視系統和醫療器械)在現在的重病監護室(ICU)中,在性能和完全普及(許多器械)方面快速發展。附加數據流的創建正在對保健工作人員施加顯著的“信息超載”挑戰,ICU有限的醫療資源和高昂的費用決定了并不是所有病人都可以得到特殊護理。對病人病情的準確評價和可靠的風險預測,是決定病人是否需要重癥監護、控制護理質量的重要依據。在一些極端情況下,如重癥監護注定無效,醫生需要作出決定中斷用設備維持病人生命。一個有效的病情評價系統,能夠在患者健康作為首要考量的前提下,最大程度節約醫療成本,并使更多真正有需要的患者受益。此外,這樣的量化系統在在臨床實驗中,有助于判斷實驗組和對照組的相似程度;在多中心研究中,橫向比較不同I⑶的醫療質量。
[0003]在計算機數據庫建立之前,由于受限于搜集大量病例數據的能力,研究者只能針對個別疾病的患者群體進行風險評價。而一般性的病情評分系統,是在上世紀80年代才逐漸開始出現的。這其中包括急性生理學和慢性健康狀況評分(APACHE)、簡化的急性生理學評分(SAPS)、死亡概率模型(MPM)、序貫臟器衰竭評分(SOFA)等。病例數據庫的更新和新的統計學方法的應用,使得平均每隔不到5年的時間,就有新的評分系統被提出。目前為止,在歐洲和北美的醫療系統內曾經或者正在被使用的評分系統大致有14種之多。它們都是在長時間的多中心研究的基礎上建立起來的。
[0004]值得注意的是,絕大多數現有模型建立的初衷都是對病人進行風險分層,而不是對某個特定病人的死亡風險進行預測。所以盡管它們在標準化死亡率、分辨能力和擬合度等指標上都有令人滿意的表現,本質上還是不能在個體病例上有效得協助醫生診療和進行醫療資源分配。事實上,這些模型的數據庫往往來源于很大范圍內的病人群體,被調查者在診斷上有很大的異質性。這樣模型預測的概率可以認為是對一個“平均”病人的預測。從理論上講,要使得模型能夠給出特異性的預測,除了要對病人群體進行準確細分,還要綜合考慮更多的風險因素,比如營養不良、求生意愿等。然而這些因素的加入勢必會顯著增加模型的復雜度,對系統的建立者和使用者都提出極大的挑戰。
【發明內容】
[0005]針對現有技術所存在的上述技術問題,本發明提供了一種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法及系統,實現了對特定個體病人的重癥分析,解決了傳統方法的非特異性問題。
[0006]一種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法,包括如下步驟:[0007]( I)對病人進行生理檢測得到測試樣本,并對所述的測試樣本進行降維處理得到關于病人生理指標特征的觀測向量X ;
[0008]所述的測試樣本為由η個生理指標數據組成的η維向量,η為大于I的自然數;每個生理指標數據采用多次測量后的平均值。
[0009](2)建立基于多元邏輯回歸的I⑶概率模型如下:
【權利要求】
1.一種基于多元邏輯回歸檢測ICU患者記錄中偽像的方法,包括如下步驟: (1)對病人進行生理檢測得到測試樣本,并對所述的測試樣本進行降維處理得到關于病人生理指標特征的觀測向量X ; 所述的測試樣本為由η個生理指標數據組成的η維向量,η為大于I的自然數;每個生理指標數據采用多次測量后的平均值; (2)建立基于多元邏輯回歸的ICU概率模型如下:
2.根據權利要求1所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的步驟(I)中對測試樣本進行降維處理的過程為:對測試樣本依次進行學生t檢驗、ROC檢驗、鄰域分析、排列檢定、單變量邏輯回歸分析以及主成分分析,得到關于病人生理指標特征的觀測向量X。
3.根據權利要求2所述的檢測I⑶患者記錄中偽像的方法,其特征在于:所述的學生t檢驗的具體過程如下: 首先,收集對應標識為O和I的兩組訓練樣本集Xtl和X1 ;` 然后,對于測試樣本中的任一生理指標數據,通過t檢驗判斷該生理指標數據在兩類標識O和I對應的訓練樣本集Xtl和X1中是否存在明顯差異,若檢驗計算得到的P值大于0.05,則刪除該生理指標數據;依此遍歷測試樣本中每個生理指標數據。
4.根據權利要求2所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的ROC檢驗的具體過程如下: 首先,對于學生t檢驗后測試樣本中保留下來的每一生理指標數據,確定對應的ROC閾值; 然后,根據所述的ROC閾值,在平面直角坐標系中為每一生理指標數據繪制對應的ROC曲線; 最后,對于其中任一生理指標數據,在平面直角坐標系中計算出其對應ROC曲線與斜率為I的直線所圍成的面積,若該面積小于給定的面積閾值,則刪除該生理指標數據;依此遍歷每個生理指標數據。
5.根據權利要求2所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的鄰域分析的具體過程如下: 首先,收集對應標識為O和I的兩組訓練樣本集Xtl和X1 ; 然后,對于ROC檢驗后測試樣本中保留下來的任一生理指標數據,根據訓練樣本集Xtl和X1中對應生理指標g的均值和標準差,通過以下算式計算該生理指標g的相關度:
P (g) = [ U O (g) _ y I (g) ] / [ σ ο (g) + σ I (g)] 其中:P(g)為生理指標g的相關度,μ Jg)和Oci(S)分別表示生理指標g在訓練樣本集Xtl中的均值和標準差,μ工(g)和σ i (g)分別表示生理指標g在訓練樣本集X1中的均值和標準差;若-r ≤ p(g) ≤ r,則刪除該生理指標數據,r為閾值半徑;依此遍歷每個生理指標數據。
6.根據權利要求2所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的排列檢定的具體過程如下: 首先,取m個歷史樣本組成的nXm維矩陣,所述的歷史樣本為由η個生理指標數據組成的η維向量;對這m個歷史樣本,分別用標簽I和O來標記重癥病例和非重癥病例,得到一個標簽序列,m為大于I的自然數; 對原來的標簽序列隨機重新排列,得到一組新的鄰域; 重復上述操作多次,得到鄰域內生理指標的數量隨鄰域半徑r的變化曲線,同時得到對應隨機排列標簽的1%顯著性水平曲線; 最后,取變化曲線與1%顯著性水平曲線的交點為閾值半徑,從而確定測試樣本中的特征數目。
7.根據權利要求2所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的單變量邏輯回歸分析的具體過程如下: 首先,利用軟件進行H-L檢驗,把測試樣本中的生理指標數據根據預測概率分成10組;根據觀測頻數和預測頻數構造卡方統計量; 然后,根據自由度為8的卡方分布計算各生理指標的P值,并對邏輯回歸模型進行檢驗; 最后,刪除P值大于0.05的生理指標數據。
8.根據權利要求2所述的檢測ICU患者記錄中偽像的方法,其特征在于:所述的主成分分析的具體過程如下: 首先,通過對協方差矩陣或相關矩陣做本征分解,得出測試樣本中各生理指標數據的主成分和權值; 然后,確定CN的大小,CN由下式計算得到:
【文檔編號】G06F19/00GK103488889SQ201310428462
【公開日】2014年1月1日 申請日期:2013年9月18日 優先權日:2013年9月18日
【發明者】劉華鋒 申請人:劉華鋒, 上海杏翔計算機科技有限公司