一種基于三軸加速度傳感器人體動作識別方法
【專利摘要】一種基于三軸加速度傳感器人體動作識別方法,本發明包括以下步驟:1)獲取人體所佩戴移動設備輸出的三軸加速度信號;2)對原始信號濾除噪聲提取動作分類特征;3)采用多個分類器進行分類,并將輸出結果的平均值作為最終輸出結果。本發明的有益效果為,提升了人體動作識別的準確率,使人體動作分類正確率更高。
【專利說明】
-種基于H軸加速度傳感器人體動作識別方法
技術領域
[0001] 本發明屬于人體動作識別方法技術領域,尤其是屬于基于=軸加速度傳感器技術 和多列雙向長短期記憶人工神經網絡技術的人體動作識別方法技術領域。
【背景技術】
[0002] 隨著手機、平板等電子設備的普及,其中內含的帶有加速度傳感器的移動設備也 在人們生活中普及。帶有加速度傳感器的移動設備可W很方便地捕獲人體的動作,通過捕 獲人體的動作,從而提升了用戶體驗感,并為附帶有該系統的設備提供了很好的發展機會。 因此,基于移動設備的人體動作識別系統受到了研究人員越來越多的關注,特別是多媒體 大數據領域的關注。
[0003] 提取特征和分類在模式識別領域是很重要的兩個步驟。提取特征分對于時域特征 的提取和對于頻域特征的提取兩種。
[0004] 對于時域特征的提取,提取特征(人體加速度特征)一般只考慮了一維的情況,對 時間軸上的原始信號直接進行特征提取,研究者用均值作為特征,通常會用一個窗函數來 過濾隨機峰值和噪聲,運種方法的計算復雜度和對硬件的要求比較低;有用最大最小值,方 差和標準差的方法來做人體動作識別的問題,運種方法對于步行和跑步等差別較大的動作 的識別有不錯效果,但對于原地踏步、快速走、上下樓梯等動作的識別不是很理想。對于頻 域特征的提取,大多數的研究者依賴快速傅里葉變換,離散傅里葉變換,離散余弦變換分解 時域信號到頻域上,頻域上要得到比較好的區分信號,需要進行較長的采樣時間,運樣會很 大程度上影響實時性。
[0005] 目前,上述兩種提取特征的方法,人體動作識別的效果并不理想。
[0006] 特征提取后,就是對所提的特征進行分類,現有的分類器如,k近鄰分類器化-順), 支持向量機(SVM ),多層感知機(MLP ),k均值化-mean S ),都是不錯的分類器,但運些傳統的 分類器,并不是最優的選擇。
【發明內容】
[0007] 本發明正是為了克服上述現有技術的缺陷,提供了一種采用了雙向長短期記憶人 工神經網絡(BLSTM)的分類器,其對特征有很好的分類,能達到理想的效果。
[000引本發明采用如下技術方案實現。
[0009] -種基于=軸加速度傳感器人體動作識別方法,本發明包括W下步驟:1)獲取人 體所佩戴移動設備輸出的=軸加速度信號;2)對原始信號濾除噪聲提取動作分類特征;3) 采用多個分類器進行分類,并將輸出結果的平均值作為最終輸出結果。
[0010] 本發明步驟1),W=軸加速度信號的合加速度峰值為中屯、,截取一小段信號作為 待識別的人體動作樣本。
[0011] 本發明=軸加速度信號的峰值通過W下方式獲得:
[0012] -個采樣窗口獲取的人體動作=軸加速度信號,可W表示為一個包含M= 1000個 樣本點的矩陣B = [Bi,化,…,Bm],每一個樣本點Bi是一個3維向量:
[OOU] Bi=(bxi,byi,bzi)T (I)
[0014] bxi,byi,bzi分別表示第i個樣本的x,y,z .3個抽h的倍號,巧此每個樣本點合加速 度構成矩陣B'=[||Bi| |,|陽I I,…,I IBmML運J
[0015] 因此,合加速度信號的峰值可W有W下的方式計算:
[0016] D = UB',wl)-L(B',w2) (2)
[0017] L表示均值濾波器,Wl和w2(wl>w2)是均值濾波器的窗口大小,取差值D的局部極 大值就是加速度信號的峰值。
[0018] 本發明樣本截取方式,其信號的長度定義為250個采樣點;
[0019] 本發明步驟2),提取的特征是:原始加速度信號特征,加速度信號的范數特征,兩 方向加速度信號特征作為人體動作識別的特征。
[0020] 本發明步驟3)采用雙向長短期記憶人工神經網絡(BLSTM)分類器進行分類。
[0021] 本發明步驟3)采用S個雙向長短期記憶人工神經網絡(BLSTM)分類器構成多列雙 方向的長短期記憶人工神經網絡(MBLSTM),其輸出結果為前端的S個化STM輸出的平均值。
[0022] 本發明步驟2),對原始信號濾除噪聲提取動作分類特征過程如下:
[0023] 在人體動作識別發明中,=軸加速度傳感器的一個采樣窗口的輸出表示為一個包 含N=250個樣本點的矩陣A= [Al,A2,…,An],每一個樣本點Ai是一個3維向量:
[0024] Ai= (axi ,Syi ,azi) (3)
[00劇 axi,ayi,azi分別表示第i個樣本的x,y,z3個軸上的信號;A作為原始加速度信號特 征。
[0026] 毎個掙本點合加速度構成矩陣A'=[MAi||,| |A2| I,…,I IAnI I],運里
,A/就是加速度信號的范數特征。
[0027] 加速度信號的均值可W有W下的方式計算:
W 近 (4)
[0029: (5) 障; (巧
[0031; 分別表示x,y,zS軸上人體動作信號的均值。
[0032]接下來,考慮到加速度信號能被分解到水平和豎直2個方法上,由于在一段時間 內,水平方向上的加速度信號的均值很小,所W豎直方向上的單位向量ev表示為:
[00削
仍
[0034]所W第i個樣本垂直方向上的信號Vi可W用下式估計:
[0035] Vi = Ai ? ev (8)
[0036] 第i個樣本水平方向上的信號的范數出為:
[0037] 出=I IA廣Vi I I (9)
[003引 V=[Vi,V2,...,Vn巧陽=化,出,…,曲]就是兩方向特征;即得到原始加速度信號特 征,加速度信號的范數特征,兩方向加速度信號特征。
[0039] -種雙向長短期記憶人工神經網絡(BLSTM)分類器,該分類器設置為5層,且上一 個層的輸出作為下一個層輸入;該分類器包括一個輸入層、一個前向傳播層、一個雙向長短 期記憶人工神經網絡(BLSTM)層、一個匯總層、一個SOf tmax層依序連接組成。
[0040] 本發明分離器的工作過程如下:1)輸入層:輸入的序列被分割成大小為3的塊,然 后每個塊被掃描成一個向量作為第1個隱藏層的輸入;2)第2個隱藏層是前向傳播層,第1個 隱藏層的輸出作為第2隱藏層的輸入;3)雙向長短期記憶人工神經網絡(BLSTM)層是第3個 隱藏層包含了若干個雙向長短期記憶人工神經網絡(BLSTM)單元,第2個隱藏層的輸出作為 第3隱藏層的輸入;4)第4個隱藏層是匯總層,每隔一段時間會匯總第3層所有的輸出;5) SOf tmax層:匯總層的輸出作為最后一層:SOftmax層的輸入,最后一層有C路輸出,代表人體 動作的類別數。
[0041] 本發明的有益效果為,本發明從多個方向提取、結合了不同的加速度信號特征,使 得提取的特征有更強的判別能力,提升了人體動作識別的準確率;確立采用多個雙向長短 期記憶人工神經網絡(BLSTM)分類器對不同特征進行分類,并對分類結果求平均,使人體動 作分類正確率更高。本發明通過優化了的特征提取方法和分類器的結構,最終達到人體動 作的高效識別,具有突出的進步和顯著效果。
[0042 ]下面結合附圖和【具體實施方式】對本發明作進一步解釋。
【附圖說明】
[0043] 圖1為本發明的原理結構示意圖。
【具體實施方式】
[0044] -種基于=軸加速度傳感器人體動作識別方法,本發明包括W下步驟:1)獲取人 體所佩戴移動設備輸出的=軸加速度信號;2)對原始信號濾除噪聲提取動作分類特征;3) 采用多個分類器進行分類,并將輸出結果的平均值作為最終輸出結果。
[0045] 本發明步驟1),W=軸加速度信號的合加速度峰值為中屯、,截取一小段信號作為 待識別的人體動作樣本。
[0046] 本發明=軸加速度信號的峰值通過W下方式獲得:
[0047] -個采樣窗口獲取的人體動作=軸加速度信號,可W表示為一個包含M= 1000個 樣本點的矩陣B =[Bi,化,…,Bm],每一個樣本點Bi是一個3維向量:
[004引 Bi=(bxi,byi,bzi)T (1)
[0049] bxi,byi,bzi分別表示第i個樣本的x,y,z,3個細H的倍寫.巧化每個樣本點合加速 度構成矩陣B'=MlBiI I,|帕||,…,MBmM],運里
[0050] 因此,合加速度信號的峰值可W有W下的方式計算:
[0051] D = UB',wl)-L(B',w2) (2)
[0052] L表示均值濾波器,Wl和w2(wl>w2)是均值濾波器的窗口大小,取差值D的局部極 大值就是加速度信號的峰值。
[0053] 本發明樣本截取方式,其信號的長度定義為250個采樣點;
[0054] 本發明步驟2),提取的特征是:原始加速度信號特征,加速度信號的范數特征,兩 方向加速度信號特征作為人體動作識別的特征。
[0055] 本發明步驟3)采用雙向長短期記憶人工神經網絡(BLSTM)分類器進行分類。
[0056] 本發明步驟3)采用S個雙向長短期記憶人工神經網絡(BLSTM)分類器構成多列雙 方向的長短期記憶人工神經網絡(MBLSTM),其輸出結果為前端的S個化STM輸出的平均值。
[0057] 本發明步驟2),對原始信號濾除噪聲提取動作分類特征過程如下:
[005引在人體動作識別發明中,=軸加速度傳感器的一個采樣窗口的輸出表示為一個包 含N=250個樣本點的矩陣A= [Al,A2,…,An],每一個樣本點Ai是一個3維向量:
[0059] Ai= (axi,ayi,azi)T (3)
[00側 axi,ayi,azi分別表示第i個樣本的x,y,z3個軸上的信號;A作為原始加速度信號特 征。
[0061] 毎個掙本點合加速度構成矩陣A'=[MAi||,| |A2| I,…,I IAnI I],運里
,A/就是加速度信號的范數特征。
[0062] 加速度信號的均值可W有W下的方式計算:
閨 (4) 國 (5) 幽: (巧
[0066] ,今,4:分別表示x,y,zS軸上人體動作信號的均值。
[0067] 接下來,考慮到加速度信號能被分解到水平和豎直2個方法上,由于在一段時間 內,水平方向H的力n巧底倍號的均值很小,所W豎直方向上的單位向量ev表示為:
[0068]
(7)
[0069] 所W第i個樣本垂直方向上的信號Vi可W用下式估計:
[0070] Vi = Ai ? ev (8)
[0071] 第i個樣本水平方向上的信號的范數出為:
[0072] 出=I I A廣Vi I I (9)
[007引 V= [Vi,V2,…,Vn巧日H=化,出,…,曲]就是兩方向特征;即得到原始加速度信號特 征,加速度信號的范數特征,兩方向加速度信號特征。
[0074] -種雙向長短期記憶人工神經網絡(BLSTM)分類器,該分類器設置為5層,且上一 個層的輸出作為下一個層輸入;該分類器包括一個輸入層、一個前向傳播層、一個雙向長短 期記憶人工神經網絡(BLSTM)層、一個匯總層、一個SOf tmax層依序連接組成。
[0075] 本發明分離器的工作過程如下:1)輸入層:輸入的序列被分割成大小為3的塊,然 后每個塊被掃描成一個向量作為第1個隱藏層的輸入;2)第2個隱藏層是前向傳播層,第1個 隱藏層的輸出作為第2隱藏層的輸入;3)雙向長短期記憶人工神經網絡(BLSTM)層是第3個 隱藏層包含了若干個雙向長短期記憶人工神經網絡(BLSTM)單元,第2個隱藏層的輸出作為 第3隱藏層的輸入;4)第4個隱藏層是匯總層,每隔一段時間會匯總第3層所有的輸出;5) SOf tmax層:匯總層的輸出作為最后一層:SOftmax層的輸入,最后一層有C路輸出,代表人體 動作的類別數。
[0076] 實施例:實驗選100個人,用智能手機收集了人體動作的=軸加速度信號,包括跳, 慢跑,正常走,原地踏步,快速走,上樓梯,下樓梯巧巾人體動作。用包含250點的窗,將峰值點 置于窗的中屯、截取信號,得到的每個人體動作信號的數量如表1:
[0077] 表1樣本統計
[007引
[0079] 實驗中,分別對比了兩方向加速度信號特征VH,加速度信號的特征A和加速度信號 均值的范數特征;實驗中,隨機選擇所有人中的50,60,70,80個作為訓練集,表中記為Ptr, 隨機選擇所有人中的20個作為測試集,選擇訓練集中的5分之1作為驗證集。每個實驗重復 10次,都用雙向長短期記憶人工神經網絡(BLSTM)來進行分類,對W上S種特征的錯誤率, 如表2,表3,表4所示:
[0080] 為了說明本方法的有效性,選擇了k近鄰分類器化-NN),支持向量機(SVM),集成流 型排序保留化MR),雙向的長短期記憶人工神經網絡(化STM)來進行對比,運里都用兩方向 特征來作為輸入的特征。隨機選擇所有人中的40和80個作為訓練集,剩下的作為測試集,選 擇訓練集中的5分之1作為驗證集。每個試驗重復5次,算出平均錯誤率。對比結果如表5所 /J、- O
[0081] 表2加速度信號特征A對應的實驗結果
[0082]
[0083]表3加速度信號范數特征對應的實驗結果 「00841
[0089] 通過表2,表3,表4的實驗結果,從合計錯誤率來看,在用相同分類器的條件下,兩 方向加速度信號特征V H得到的錯誤率要比加速度信號的均值特征Al和加速度信號均值的 范數特征錯誤率要低,運說明了兩方向加速度信號特征V H比其他2種特征更有區分能 力。
[0090] 通過表5的實驗結果,在輸入相同特征的情況下,多列雙向長短期記憶人工神經網 絡(M化STM)分類器的平均錯誤率要遠低于其他4中分類器的錯誤率,說明MBLSTM分類器分 類能力優于其他4種分類器。
【主權項】
1. 一種基于三軸加速度傳感器人體動作識別方法,其特征在于,包括以下步驟:1)獲取 人體所佩戴移動設備輸出的三軸加速度信號;2)對原始信號濾除噪聲提取動作分類特征; 3)采用多個分類器進行分類,并將輸出結果的平均值作為最終輸出結果。2. 根據權利要求1所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在于, 步驟1)的實現方法,以三軸加速度信號的合加速度峰值為中心,截取一小段信號作為待識 別的人體動作樣本。3. 根據權利要求1或2所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在 于,步驟2),提取的特征是:原始加速度信號特征,加速度信號的范數特征,兩方向加速度信 號特征作為人體動作識別的特征。4. 根據權利要求1或3所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在 于,所述的步驟2),對原始信號濾除噪聲提取動作分類特征過程如下: 在人體動作識別發明中,三軸加速度傳感器的一個采樣窗口的輸出表示為一個包含N 個樣本點的矩陣Α=[Αι,Α2,···,An],每一個樣本點Ai是一個3維向量: Ai-(Elxi,Elyi,Elzi ) ( 3 ) axl,ayl,azl分別表示第i個樣本的x,y,z3個軸上的信號;A作為原始加速度信號特征; 每個樣本點合加速度構成矩陣A' = [ I I Ai I I,I I A2 I I,…,I I An I I ],這里/就是加速度信號的范數特征; 加速度信號的均值可以有以下的方式計算:i,?分別表示x,y,z三軸上人體動作信號的均值; 接下來,考慮到加速度信號能被分解到水平和豎直2個方法上,由于在一段時間內,水 平方向上的加速度信號的均值很小,所以豎直方向上的單位向量ev表示為:(7) 所以第i個樣本垂直方向上的信號1可以用下式估計: Vi=Ai · ev (8) 第i個樣本水平方向上的信號的范數出為: Hi=| |Ai-Vi| (9) V= [Vi,V2,…,VN]和H= [m,H2,…,Hn]就是兩方向特征;即得到原始加速度信號特征, 加速度信號的范數特征,兩方向加速度信號特征。5. 根據權利要求1所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在于, 步驟3)采用雙向長短期記憶人工神經網絡(BLSTM)分類器進行分類。6. 根據權利要求1或5所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在 于,步驟3)采用三個雙向長短期記憶人工神經網絡(BLSTM)分類器構成多列雙方向的長短 期記憶人工神經網絡(MBLSTM),其輸出結果為前端的三個BLSTM輸出的平均值。7. 根據權利要求2所述的一種基于三軸加速度傳感器人體動作識別方法,其特征在于, 所述的三軸加速度信號的合加速度峰值通過以下方式獲得: 一個采樣窗口獲取的人體動作三軸加速度信號,可以表示為一個包含Μ個樣本點的矩 陣8=[81,82,"_,8(?],每一個樣本點&是一個3維向量 : Bi= (bxi,byi,bzi)T (1) bxi,byi,bzi分別表不第i個樣本的x,y,z,3個軸上的信號,因此每個樣本點合加速度構 成矩陣以=[| |Bi| |,| |β2| |,···,| |Bm| |],這里因此,合加速度信號的峰值可以有以下的方式計算: D = L(B,,wl)-L(B,,w2) (2) L表示均值濾波器,wl和w2(wl>w2)是均值濾波器的窗口大小,取差值D的局部極大值 就是加速度信號的峰值。8. -種雙向長短期記憶人工神經網絡分類器,其特征在于,該分類器設置為5層,且上 一個層的輸出作為下一個層輸入;該分類器包括一個輸入層、一個前向傳播層、一個雙向長 短期記憶人工神經網絡層、一個匯總層、一個softmax層依序連接組成。9. 根據權利要求8所述的一種雙向長短期記憶人工神經網絡分類器,其特征在于,該分 離器的工作過程如下:1)輸入層:輸入的序列被分割成大小為3的塊,然后每個塊被掃描成 一個向量作為第1個隱藏層的輸入;2)第2個隱藏層是前向傳播層,第1個隱藏層的輸出作為 第2隱藏層的輸入;3)雙向長短期記憶人工神經網絡層是第3個隱藏層包含了若干個雙向長 短期記憶人工神經網絡單元,第2個隱藏層的輸出作為第3隱藏層的輸入;4)第4個隱藏層是 匯總層,每隔一段時間會匯總第3層所有的輸出;5) S〇ftmax層:匯總層的輸出作為最后一 層:softmax層的輸入,最后一層有C路輸出,代表人體動作的類別數。
【文檔編號】G06K9/62GK105956558SQ201610290443
【公開日】2016年9月21日
【申請日】2016年4月26日
【發明人】陶大鵬
【申請人】陶大鵬