一種基于特征加權和改進貝葉斯算法的摔倒檢測方法
【專利摘要】本發明涉及一種基于特征加權和改進貝葉斯算法的摔倒檢測方法。本方法的操作步驟是:1)摔倒建模,2)特征選擇和特征加權,3)基于改進貝葉斯算法的摔倒檢測。本發明基于樸素貝葉斯框架的機器學習方法對摔倒檢測進行改進,使系統智能化并能夠適應不同特征個體的摔倒檢測要求;考慮摔倒檢測過程不同特征的重要程度,結合特征選擇的方法和特征加權,最后根據特征權重改進樸素貝葉斯算法,提高檢測性能。
【專利說明】
一種基于特征加權和改進貝葉斯算法的摔倒檢測方法
技術領域
[0001] 本發明涉及健康監護技術領域,具體涉及一種基于特征加權和改進貝葉斯算法的 摔倒檢測方法。
【背景技術】
[0002] 如今,隨著世界人口老齡化進程加劇,老年人獨居的現象也越來越普遍。由于老年 人生理機能的退化,摔倒成為老年人的突出問題。大部分摔倒會對老人造成身體傷害,并且 由于摔倒后得不到及時的救助而產生心理壓力,導致嚴重的后果。因此及時且準確地檢測 老年人的摔倒行為,是摔倒檢測系統的主要目標。摔倒檢測算法是摔倒檢測系統中的核心 部分,在現階段研究中,大多數摔倒檢測系統采用基于閾值的方法來檢測摔倒,不能很好地 匹配不同特征的人體,對于與摔倒過程相似的身體狀態在檢測的時候誤判率較高。為了提 高摔倒檢測的準確率,有些系統提取大量特征檢測摔倒,使冗余特征增加特征維數,導致系 統運算復雜。同時大部分系統認為所有特征的重要程度一致,而不考慮特征優先性。
【發明內容】
[0003] 針對現有技術存在的缺陷,本發明的目的在于提供一種基于特征加權和改進貝葉 斯算法的摔倒檢測方法。本發明中的方法區別于現有方法的顯著區別在于:其一,本發明基 于樸素貝葉斯框架的機器學習方法對摔倒檢測進行改進,使系統智能化并能夠適應不同特 征個體的摔倒檢測要求;其二,本發明設計考慮摔倒檢測過程不同特征的重要程度,結合特 征選擇和特征加權的方法,最后根據特征權重改進樸素貝葉斯算法,提高檢測性能。
[0004] 為達到上述目的,本發明采用以下技術方案:
[0005] -種基于特征加權和改進貝葉斯算法的摔倒檢測方法,其特征在于:結合特征選 擇和特征加權的方法,具體操作步驟如下:1)摔倒建模,2)特征選擇與特征加權,3)基于改 進貝葉斯算法的摔倒檢測。
[0006] 所述步驟1)摔倒建模:
[0007] (1)摔倒檢測系統的環境建模
[0008] 建立三維直角坐標系,以人腳部位置的關鍵點位置作為坐標系的基點,規定人體 運動的水平方向為X軸正方向,與X軸垂直的水平方向的為Y軸方向,Z軸方向向上,X、Y、Z軸 相互正交,且符合右手螺旋法則;空間中任意向量均可分解成X、Y、Z方向的分量,建立人體 三維坐標;
[0009] (2)特征提取與數據預處理
[0010] 為了準確地區分摔倒和其他日常行為過程,需要采集到人體各個部位的加速度特 征并分析其變化規律;收集人體胸部、腰部以及左右腳踝的運動加速度特征,并采用基于規 范化的范圍標度化方法,將數據離散化到某個指定的范圍上,而不是范圍[0,1]上,離散化 依據一下公式計算:
[0011] yi= (int)(0.5+region*((Xi-min x)/(max x_min x)))
[0012]其中max X和min X分別是特征原始值的最大值和最小值,region是換算后變量的 范圍;
[0013] (3)樸素貝葉斯算法
[0014] 假設Xi,Yi,Zi,X2,Y2,Z2,X 3,Y3,Z3,X4,Y4,Z4是數據集的12個特征,分別表示人體運 動過程中胸部、腰部、以及左右腳踝的X、Y、Z加速度特征,在摔倒檢測系統中有2個分類C = {-1,1},Ci = -l表示摔倒,C2= 1表示沒有摔倒;給定一個訓練數據集A,其屬性值為A= {xi, yi,zi,X2,y2,Z2,X3,y3,Z3,X4,y4,Z4},這里xi,yi,zi是屬性Xi,Yi,Zi的具體取值,其中i = l,2, 3,4,屬于某一個類Q的后驗概率是?((^|4),」=1,2,(:以)表示分類所得的類標簽,則:
[0015] <(^) = ai'gmax/:>(C'; | A)
[0016] 所述步驟2)特征選擇和特征加權:
[0017] 摔倒檢測其實就是一個對人體狀態的二類分類模型,即將實例分成正類或負類, 對一個二分問題來說,會出現四種情況;如果一個正類實例被預測成正類,即為真正類,如 果一個負類實例被預測成正類,稱之為假正類;相應地,如果一個負類實例被預測成負類, 稱之為真負類,一個正類實例被預測成負類,稱之為假負類;
[0018] 受試者工作特征曲線,縮寫為R0C曲線:對于二類分類模型,根據不同預測閾值可 產生一系列分類方式,且綜合不同截斷點的真陽性率和假陽性率,以無數個截斷點的真陽 性率為縱坐標,假陽性率為橫坐標作圖而成,反映不同截斷點下靈敏度和特異度的關系。
[0019] 靈敏度:
[0020] 特異度:
[0021]其中了?、?1??、了~分別為真正類、真負類、假正類和假負類的個數,了?1?、??1?分別表 示真陽性率和假陽性率,sensitivity、specificity分別表示靈敏度和特異度。
[0022] 分類器通過設定不同閾值0產生不同的分類器,然后可以計算得到對應的靈敏度 和特異度;當0從0變為〇,靈敏度和特異度分別從〇%升至1〇〇% ;因此,通過改變預測閾值 能夠得到R0C曲線;在離散形式中,R0C曲線上只有一些靈敏度和特異度的離散點,我們用直 線段將這些點連接起來形成一個凸殼曲線;
[0023] R0C曲線是對分類性能的二維圖形描述,為了能夠直接比較多個分類器在任何比 例分布和任何錯誤代價比的情況下,將R0C曲線描述的分類器性能轉換為一個數值來表示 分類器的性能;一個通用的方法是計算R0C曲線下的面積,縮寫為AUC,在比較分類器時,只 用比較它們對應曲線所占的面積,AUC值較大預示具有比較好的平均性能,標記為AUC(A| |y ^Ci ,y = Ci);
[0024] 根據分類器性能評價標準,利用每個特征單獨應用貝葉斯算法進行摔倒分類,并 畫出對用的R0C曲線,計算AUC值,AUC值越大則該特征對于摔倒檢測越重要,分類器根據AUC 值大小排序進行特征選擇,并對每個特征增加權重權wk:
[0025] wk = AUC(ak| |y^Ci,y = Ci)
[0026] 其中ak= {叉1,71,21,叉2,72,22,叉3,73,2344,74,24}為人體胸部、腰部以及左右腳踝 的X、Y、Z軸方向加速度值。
[0027] 所述步驟3)基于改進貝葉斯算法的摔倒檢測:
[0028]給定特征維數K,且1<K<12,利用利用特征選擇可以選出最優特征子集AK,根據 貝葉斯公式計算在最優特征子集實例屬于類別G的后驗概率PKi |ak):
[0030]其中ak= {叉1,71,21,叉2,72,22,叉3,73,2344,74,24}為人體胸部、腰部以及左右腳踝 的X、Y、Z軸方向加速度值,CpI-1,1}分別表示類別,包括摔倒和人體正常生活行為兩種;P (C〇和P(AK)分別是先驗概率;
[0031 ]對上述等式進行對數處理,將類別匕的判別評估函數定義為C :
[0033] 整理后可得:
[0034] F( {Ak) = (\-n) log P(Q) + ^ log P(Q \ a,) k=l
[0035]其中 l〇g=l〇g2,ak= {11,71,2142,72,2243,73,2344,74,24}為人體胸部、腰部以及 左右腳踝的X、Y、Z軸方向加速度值,(^={-1,1}分別表示類別,包括摔倒和人體正常生活行 為兩種;P(C0為類別的先驗概率,PKdak)為特征a k屬于類別匕的后驗概率;
[0036] 考慮到每個特征的重要程度不一樣,在判別評估函數巧;〇4"中增加特征權重wk, 此時判別評估函數G P")可定義為:
[0037] (^A) = (l-/〇lognC) + 2;^ log/>(C -k=l
[0038] 其中ak= {叉1,71,21,叉2,72,22,叉3,73,23,叉4,74,24}為人體胸部、腰部以及左右腳踝 的X、Y、Z軸方向加速度值,CpI-1,1}分別表示類別,包括摔倒和人體正常生活行為兩種;P (⑴為類別的先驗概率,PK^ak)為特征ak屬于類別匕的后驗概率,wk為特征ak的權重;
[0039] 最后判斷所屬類別并輸出c(AK):
[0040] c(^r) = argmaxf;.(/^) C).e.G
[0041] 本發明與現有技術相比較,具有如下顯而易見的突出實質性特點和顯著技術進 步:
[0042] 第一:本發明提出的基于貝葉斯機器學習算法的人體摔倒檢測研究方法,是能夠 適應不同個體的摔倒檢測算法。該算法具有一下優勢:1)算法邏輯簡單,易于實現;2)分類 算法的時間、空間復雜度小;3)算法性能穩定,對于不同的數據特點其分類性能差別不大, 即模型健壯性比較好。
[0043]第二:本發明提出的基于特征選擇和特征加權的摔倒檢測方法,采用R0C曲線下的 面積AUC值作為分類器性能的評價標準,并以此提出特征選擇和特征加權,考慮特征重要程 度的同時提取最優特征子集,減少特征維數。
【附圖說明】
[0044]圖1:本發明提出對分類器性能評價的R0C曲線圖。
[0045] 圖2:本發明提出的基于改進貝葉斯框架的摔倒檢測方法流程圖。
【具體實施方式】
[0046] 以下結合附圖對本發明做進一步說明。
[0047] 實施例一:本優選實施例基于改進貝葉斯算法的摔倒檢測方法,如圖2所示,具體 包含以下優化步驟:1)摔倒建模,2)特征選擇與特征加權,3)基于改進貝葉斯算法的摔倒檢 測 。
[0048] 實施例二:本實施例與實施例一基本相同,特別之處如下:
[0049] 所述步驟1)摔倒建模:
[0050] (1)摔倒檢測系統的環境建模
[0051] 建立三維直角坐標系,以人腳部位置的關鍵點位置作為坐標系的基點,規定人體 運動的水平方向為X軸正方向,與X軸垂直的水平方向的為Y軸方向,Z軸方向向上,X、Y、Z軸 相互正交,且符合右手螺旋法則;空間中任意向量均可分解成X、Y、Z方向的分量,建立人體 三維坐標;
[0052] (2)特征提取與數據預處理
[0053]為了準確地區分摔倒和其他日常行為過程,需要采集到人體各個部位的加速度特 征并分析其變化規律;收集人體胸部、腰部以及左右腳踝的運動加速度特征,并采用基于規 范化的范圍標度化方法,將數據離散化到某個指定的范圍上,而不是范圍[0,1]上,離散化 依據一下公式計算:
[0054] yi=(int)(0?5+region*((Xi-min x)/(max x_min x)))
[0055] 其中max x和min x分別是特征原始值的最大值和最小值,region是換算后變量的 范圍;
[0056] (3)樸素貝葉斯算法
[0057] 假設Xi,Yi,Zi,X2,Y2,Z2,X 3,Y3,Z3,X4,Y4,Z4是數據集的12個特征,分別表示人體運 動過程中胸部、腰部、以及左右腳踝的X、Y、Z加速度特征,在摔倒檢測系統中有2個分類C = {-1,1},Ci = -l表示摔倒,C2= 1表示沒有摔倒;給定一個訓練數據集A,其屬性值為A= {xi, yi,zi,X2,y2,Z2,X3,y3,Z3,X4,y4,Z4},這里xi,yi,zi是屬性Xi,Yi,Zi的具體取值,其中i = l,2, 3,4,屬于某一個類Q的后驗概率是?((^|4),」=1,2,(:以)表示分類所得的類標簽,則:
[0058] c(雄=arg max |』)
[0059] 所述步驟2)特征選擇和特征加權:
[0060] 摔倒檢測其實就是一個對人體狀態的二類分類模型,即將實例分成正類或負類, 對一個二分問題來說,會出現四種情況;如果一個正類實例被預測成正類,即為真正類,如 果一個負類實例被預測成正類,稱之為假正類;相應地,如果一個負類實例被預測成負類, 稱之為真負類,一個正類實例被預測成負類,稱之為假負類;
[0061] 受試者工作特征曲線,縮寫為R0C曲線:對于二類分類模型,根據不同預測閾值可 產生一系列分類方式,且綜合不同截斷點的真陽性率和假陽性率,以無數個截斷點的真陽 性率為縱坐標,假陽性率為橫坐標作圖而成,反映不同截斷點下靈敏度和特異度的關系。
[0062] 靈敏度:
[0063] 特異度:
[0064]其中了?、?1??、了~分別為真正類、真負類、假正類和假負類的個數,了?1?、??1?分別表 示真陽性率和假陽性率,sensitivity、specificity分別表示靈敏度和特異度。
[0065] 分類器通過設定不同閾值0產生不同的分類器,然后可以計算得到對應的靈敏度 和特異度;當0從0變為〇,靈敏度和特異度分別從〇%升至1〇〇% ;因此,通過改變預測閾值 能夠得到R0C曲線;在離散形式中,R0C曲線上只有一些靈敏度和特異度的離散點,我們用直 線段將這些點連接起來形成一個凸殼曲線;
[0066] R0C曲線是對分類性能的二維圖形描述,為了能夠直接比較多個分類器在任何比 例分布和任何錯誤代價比的情況下,將R0C曲線描述的分類器性能轉換為一個數值來表示 分類器的性能;一個通用的方法是計算R0C曲線下的面積,縮寫為AUC,在比較分類器時,只 用比較它們對應曲線所占的面積,AUC值較大預示具有比較好的平均性能,標記為AUC(A| |y ^Ci ,y = Ci);
[0067] 根據分類器性能評價標準,利用每個特征單獨應用貝葉斯算法進行摔倒分類,并 畫出對用的R0C曲線,計算AUC值,AUC值越大則該特征對于摔倒檢測越重要,分類器根據AUC 值大小排序進行特征選擇,并對每個特征增加權重權wk:
[0068] wk = AUC(ak| |y^Ci,y = Ci)
[0069] 其中ak= {叉1,71,21,叉2,72,22,叉3,73,2344,74,24}為人體胸部、腰部以及左右腳踝 的X、Y、Z軸方向加速度值。
[0070] 所述步驟3)基于改進貝葉斯算法的摔倒檢測:
[0071] 給定特征維數K,且1<K<12,利用利用特征選擇可以選出最優特征子集AK,根據 貝葉斯公式計算在最優特征子集實例屬于類別G的后驗概率PKi |AK):
[0073] 其中ak= {叉1,71,21,叉2,72,22,叉3,73,2344,74,24}為人體胸部、腰部以及左右腳踝 的X、Y、Z軸方向加速度值,CpI-1,1}分別表示類別,包括摔倒和人體正常生活行為兩種;P (C〇和P(AK)分別是先驗概率;
[0074] 對上述等式進行對數處理,將類別(^的判別評估函數定義為:
[0076] 整理后可得:
[0079] 考慮到每個特征的重要程度不一樣,在判別評估函數)中增加特征權重wk, 此時判別評估函數4 (/,)可定義為:
[0080] f; (^ ") = (1 - n) log P(C]) + f^wt log P(C] \ a,) k^=l
[0081] 其中ak= {^^,^,^,丫:^:^^:^以^…丨為人體胸部~腰部以及左右腳踝 的X、Y、Z軸方向加速度值,CpI-1,1}分別表示類別,包括摔倒和人體正常生活行為兩種;P (⑴為類別的先驗概率,PK^ak)為特征ak屬于類別匕的后驗概率,wk為特征ak的權重;
[0082]最后判斷所屬類別并輸出c(AK): 「00831 rd') = argmaxF( (Z) C-eC 1
【主權項】
1. 一種基于特征加權和改進貝葉斯算法的摔倒檢測方法,其特征在于:結合特征選擇 和特征加權的方法,具體操作步驟如下:1)摔倒建模,2)特征選擇與特征加權,3)基于改進 貝葉斯算法的摔倒檢測。2. 根據權利要求書1所述的基于特征加權和改進貝葉斯算法的摔倒檢測方法,其特征 在于所述步驟1)摔倒建模是: (1) 摔倒檢測系統的環境建模 建立三維直角坐標系,以人腳部位置的關鍵點位置作為坐標系的基點,規定人體運動 的水平方向為X軸正方向,與X軸垂直的水平方向的為Y軸方向,Z軸方向向上,X、Y、Z軸相互 正交,且符合右手螺旋法則;空間中任意向量均能夠分解成Χ、Υ、Ζ方向的分量,建立人體三 維坐標; (2) 特征提取與數據預處理 為了準確地區分摔倒和其他日常行為過程,需要采集到人體各個部位的加速度特征并 分析其變化規律;收集人體胸部、腰部以及左右腳踝的運動加速度特征,并采用基于規范化 的范圍標度化方法,將數據離散化到某個指定的范圍上,而不是范圍[〇,1]上,離散化依據 一下公式計算: yi=(int)(0.5+region*((xi-minx)/(maxx-minx))) 其中maxx和minx分別是特征原始值的最大值和最小值,region是換算后變量的范圍; (3) 樸素貝葉斯算法 假設Xi,Yi,Z1,X2,Y2,Z2,X 3,Y3,Z3,X4,Y4,Z4是數據集的12個特征,分別表示人體運動過 程中胸部、腰部、以及左右腳踝的X、Y、Z加速度特征,在摔倒檢測系統中有2個分類C= {-1, I},Cl = _1表示摔倒,C2 = 1表示沒有摔倒;給定一個訓練數據集Α,其屬性值為A= {xi,yi,ZI, X2,y2,Z2,X3,y3,Z3,X4,y4,Z4},這里Xi,yi,Zi是屬性Xi,Yi,Zi的具體取值,其中i = l,2,3,4,屬 于某一個類Cj的后驗概率是P(Q I A),j = 1,2,c (A)表示分類所得的類標簽,則:3. 根據權利要求書1所述的基于特征加權和改進貝葉斯算法的摔倒檢測方法,其特征 在于所述步驟2)特征選擇和特征加權是: 摔倒檢測其實就是一個對人體狀態的二類分類模型,即將實例分成正類或負類,對一 個二分問題來說,會出現四種情況;如果一個正類實例被預測成正類,即為真正類,如果一 個負類實例被預測成正類,稱之為假正類;相應地,如果一個負類實例被預測成負類,稱之 為真負類,一個正類實例被預測成負類,稱之為假負類; 受試者工作特征曲線,縮寫為ROC曲線:對于二類分類模型,根據不同預測閾值產生一 系列分類方式,且綜合不同截斷點的真陽性率和假陽性率,以無數個截斷點的真陽性率為 縱坐標,假陽性率為橫坐標作圖而成,反映不同截斷點下靈敏度和特異度的關系:其中了?、?1??、了~分別為真正類、真負類、假正類和假負類的個數,了?1?、??1?分別表示真 陽性率和假陽性率,sensitivity、specificity分別表示靈敏度和特異度; 分類器通過設定不同閾值β產生不同的分類器,然后計算得到對應的靈敏度和特異度; 當β從0變為〇,靈敏度和特異度分別從〇%升至100%;因此,通過改變預測閾值能夠得到 ROC曲線;在離散形式中,ROC曲線上只有一些靈敏度和特異度的離散點,我們用直線段將這 些點連接起來形成一個凸殼曲線; ROC曲線是對分類性能的二維圖形描述,為了能夠直接比較多個分類器在任何比例分 布和任何錯誤代價比的情況下,將ROC曲線描述的分類器性能轉換為一個數值來表示分類 器的性能;一個通用的方法是計算ROC曲線下的面積,縮寫為AUC,在比較分類器時,只用比 較它們對應曲線所占的面積,AUC值較大預示具有比較好的平均性能,標記為AUC(A| |y辛 Ci ,y = Ci); 根據分類器性能評價標準,利用每個特征單獨應用貝葉斯算法進行摔倒分類,并畫出 對用的ROC曲線,計算AUC值,AUC值越大則該特征對于摔倒檢測越重要,分類器根據AUC值大 小排序進行特征選擇,并對每個特征增加權重權Wk: wk=AUC(ak| |y^Ci,y = Ci) 其中ak= {11,71,2142,72,22 43,73,23 44,74,24}為人體胸部、腰部以及左右腳踝的父、¥、 Z軸方向加速度值。4.根據權利要求書1所述的基于特征加權和改進貝葉斯算法的摔倒檢測方法,其特征 在于所述步驟3)基于改進貝葉斯算法的摔倒檢測是: 給定特征維數K,且1<K<12,利用特征選擇選出最優特征子集Ακ,根據貝葉斯公式計算 在最優特征子集實例屬于類別匕的后驗概率PK1 |AK):其中ak= {11,71,2142,72,22 43,73,23 44,74,24}為人體胸部、腰部以及左右腳踝的父、¥、 Z軸方向加速度值,C1=I-Ull分別表示類別,包括摔倒和人體正常生活行為兩種;P(C1)和P (Ak)分別是先驗概率; 對上述等式進行對數處理,將類別匕的判別評估函數定義為斤其中 l〇g=l〇g2,ak= {11,71,2142,72,2243,73,2344,74,24}為人體胸部、腰部以及左右 腳踝的x、Y、z軸方向加速度值,C1=I-UU分別表示類別,包括摔倒和人體正常生活行為兩 種;P(C 1)為類別的先驗概率,PK1 Iak)為特征ak屬于類別匕的后驗概率; 考慮到每個特征的重要程度不一樣,在判別評估函數&(.#)中增加特征權重Wk,此時 判別評估函定義為:其中ak= {11,71,2142,72,22 43,73,23 44,74,24}為人體胸部、腰部以及左右腳踝的父、¥、 Z軸方向加速度值,C1=I-UU分別表示類別,包括摔倒和人體正常生活行為兩種;P(C1)S 類別的先驗概率,P(C1Iak)為特征ak屬于類別匕的后驗概率,Wk為特征a k的權重; 最后判斷所屬類別并輸出c(AK):
【文檔編號】G06K9/62GK105930906SQ201610234563
【公開日】2016年9月7日
【申請日】2016年4月15日
【發明人】李敏, 李 杰, 王忠亞
【申請人】上海大學