一種基于心音多維特征提取的身份識別算法及其系統的制作方法
【技術領域】
[0001] 本發明涉及屬于身份識別領域,特別涉及一種基于心跳聲音進行身份識別的算法 及其系統。
【背景技術】
[0002] 近年來,人們越來越強調個人信息安全的重要性,但是黑客攻擊和系統漏洞使傳 統的身份認證系統(如靜態密碼,手機口令等)面臨著巨大的挑戰。現有的生物認證技術 (如:指紋認證,語音認證)因為其易竊取,易復制的特性,無法滿足人們對信息安全的需 求。心臟是人體內部中獨一無二的器官,其竊取和復制的難度高。而心臟所產生的信號與每 個人的心臟生理結構有密切的關系,不同的人擁有不同的心音,這為心音認證提供了可能。
[0003] 心音除了與每個人生理結構有關,還與運動、疾病有著很大的關系。因而選取有效 的特征,剝離開與個人生理結構無關的信息,是心音認證的關鍵所在。因此,需要開發一種 快速,有效的特征提取和識別方案,可以精確的區分不同人的心音。這一需求推動了心音的 生理特征和分類識別方法的研宄。
[0004] 國內外研宄學者主要通過數字信號處理技術提取與心臟的生理結構有關的特征 參數,利用模式識別方法訓練分類器,以實現自動識別不同心音的目的。例如,2007年 Beritelli等人,使用了 stft作為特征,并使用歐式距離作為模式識別方法。2010年, Jasper使用能量峰值,同樣也使用了歐式距離作為識別方法。2001年科羅拉多大學健康科 學中心兒童醫院的CG. DeGroff等首先在69例有心臟雜音的兒童中驗證了人工神經網絡在 生理性和病理性雜音分類識別中的有效性。這些研宄成果開闊了心音認證的研宄思路,但 是這些方法都使用了單一的特征作為識別特征,不利于認證識別率的提高。而某些特征的 維度還很高,不利于計算機的快速計算。
【發明內容】
[0005] 為了克服現有技術中存在的使用單一的特征作為識別特征,不利于認證識別率的 提高,而某些特征的維度還很高,不利于計算機的快速計算的問題,本發明提供一種多特征 綜合、分類識別效率更高、運算速度更快的基于心音多維特征提取的身份識別算法。
[0006] 為實現上述目的,本發明采用的技術方案為:
[0007] -種基于心音多維特征提取的身份識別算法,包括以下步驟:
[0008] (1)利用傳感器采集心音信號,將采集到的心音信號通過先通過濾波器處理,再通 過離散小波變換處理,得到較為純凈的信號;
[0009] 采集到的心音通常含有背景噪聲,而心音信號頻率較低,主要集中在50-100HZ,因 而使用一個低通濾波器可以濾除一部分高頻噪聲。步驟(1)中選擇截止頻率為150HZ的 FIR濾波器初步過濾噪聲;濾波后的心音仍然還有一些噪聲,步驟(1)中采用離散小波變換 處理。
[0010] 離散小波變換對小波變換中的尺度參數按冪級數進行離散化處理,對時間進行均 勻離散取值(采樣頻率滿足奈奎斯特采樣定理),將信號變換為在頻域上不同能量大小的 組合,其中變換系數決定了信號在該頻率上的大小。通過離散小波變換,可以將信號和噪聲 在頻率上區分開;通過設置能量門限,將噪聲的變換系數減少,消除噪聲分量。然后通過離 散小波變換逆變換(IDWT)重構信號,從而達到去噪的目的。通過經驗選取多貝西小波作為 母波函數,其階數為5,將信號分解為6階。
[0011] (2)通過計算機提取心音信號的梅爾頻率倒譜系數(MFCC)和希爾伯特邊際譜 (HHT);
[0012] Mel頻率倒譜系數是語音信號處理中常用的特征量。它是將聲音信號的頻譜通 過一個中心頻率基于人類感知尺度的帶通濾波器,然后從這些通過濾波的信號中提取譜特 征。Mel頻率與實際頻率的對應關系如下:
[0014] 希爾伯特黃邊際譜是本發明提取的另一個譜特征。它主要由兩個步驟組成:首先, 對原始數據進行經驗模態分解,把數據分解成滿足Hilbert變換要求的n階本征模態函數 (MF)和殘余函數之和。之后,對每一階MF進行Hilbert變換,得到瞬時頻率,求得時頻 圖。
[0015] MF分量的獲得過程如下:通過對極大值和極小值的三次樣條函數得到上包絡和 下包絡。上包絡和下包絡兩條曲線的算術平均值曲線為Hi 1,從原信號里減去Hi1得到h 1:
[0016] hi= X (t) -m !
[0017] 需要重復上述步驟以得到準確的本征模態函數。當hlk不滿足本征模態函數的條 件時,重復上述步驟以得到包絡均值mn,接著hn= h ^m11用以確定本征模態函數條件是否 滿足。此過程可以重復最多k次以得到本征模態函數hlk。令(31=1!11;,(3 1為原始信號的第 1個本征模態函數。
[0018] 從原始f目號里減去C1,差值為!T1:
[0019] T1= X (t) -C !
[0020] 將A作為新的原始信號,接著計算出第2個本征模態函數c 2.重復上述步驟直到 得到n個本征模態函數:
[0022] 當Cn或者rn低于預設門限或1^為單調函數,以至于不能推導出新的本征模態函 數時,停止重復。最終,原始信號可以被表示為一系列本征模態函數的和,并且余量為:
[0023] X(I) =Ef=ic, +
[0024] 其中C1C2......(^代表信號在不同時間量度下的特征。
[0025] 將原始信號分解為一系列本征模態函數之后,就可以對其每一個本征模態函數分 量進行希爾伯特變換了,其公式如下:
[0029] (3)利用步驟(1)和(2),提取并組成模版特征;
[0030] 在模式識別中,模板特征有著標準化的定義;特征向量集的每一列代表一個特征, 每一行代表一個人,一個人至少有兩行。
[0031] (4)將模版特征歸一化并使用PCA算法進行特征選擇,構造更完善維度低的模版 特征空間;
[0032] 由于提取到的特征之間的單位量綱不同,因而需要對其進行歸一化處理。常用的 特征歸一化方法如下式:
[0034] 其中U是均值,〇是標準差。
[0035] PCA算法是一種經典的特征降維方法,其基本思想是尋找一個投影方向將高維數 據投影到低維空間中,而且盡可能地保持原始數據中的信息。假設有N個d維樣本X 1. ... xN, 且21=1.*? = 〇,其協方差矩陣為
[0037] 求解其特征值,選出前m個特征值所對應的特征向量O1*" ?m,這m個正交的特征 向量就構成了本發明所需要的投影方向。
[0038] (5)使用KNN算法對訓練特征訓練;
[0039] KNN算法屬于有監督學習,其基本思想是:在訓練樣本中尋找K個與測試樣本最相 近的鄰居,在特征空間中的相似度度量可以通過歐式距離或者馬氏距離來計算。
[0040] (6)使用構造好的分類器測試待測試的測試特征。
[0041] 本發明的另一個目的是利用上述算法,提供一種基于心音的身份認證系統,采用 以下技術方案:
[0042] 一種基于心音的身份認證系統,包括心音信號預處理模塊、心音特征提取模塊以 及匹配認證模塊,心音特征提取模塊連接心音數據庫,心音特征提取模塊和心音數據庫均 連接匹配認證模塊。
[0043] 所述心音信號預處理模塊通過一些數字信號處理的方法對原始心音信號進行預 處理,達到降噪以及為特征處理做鋪墊的目的;分為兩個階段:第一階段主要是降噪和預 加重處理,第二階段主要是幀化加窗處理。
[0044] 所述匹配認證模塊包括心音信號特征的匹配正確率計算模塊和用戶身份綜合認 證模塊;其中,心音信號特征的匹配正確率計算模塊通過模式識別計算各特征的正確匹配 率。
[0045] 將訓練好的分類器傳入系統,當有一個人出入了他的心音信號,系統自動構建測 試特征,并用分類器去測試該特征集,計算出錯誤率。系統通過錯誤率的大小自動判斷是接 受還是拒絕。
[0046] 經過實驗證明,梅爾頻率倒譜系數(MFCC)和希爾伯特邊際譜(HHT)均是很好的代 表心音的特征,具有很高的同類間相似性和不同類的區別性。通過PCA算法降維處理能加 快計算機的處理速度,提高系統識別率。
[0047] 本發明的有益效果是:
[0048] 本發明利用傳感器采集心音信號,再對其進行預處理,以便獲得較好的特征值,最 后利用分類器獲得匹配結果,該算法所構成匹配率高;利用小波變換對其進行預處理,濾掉 高頻分量,重構成為具有心音特征的信號;提取適合心音認證系統的兩個特征值梅爾頻率 倒譜系數(MFCC),希爾伯特邊際譜(HHT),相較于其他特征,它們適合心音,成功提高匹配 率;使用PCA降維技術,降低計算機運算量,提升分類器的識別準確率。
[0049] 本發明提出利用心音信號作為身份認證的依據,由于該生物特征是人的內在屬 性,具有極高的穩定性和個體差異性,因此在安全領域開辟了新的思路;
[0050] 本發明采用心音信號的多種特征值相綜合,排除了單個特征的敏感性低識別性差 以及個體差異導致的影響,提高了身份認證的準確率;
[0051] 將模式識別引入身份匹配算法當中,利用計算機自身學習能力和快速的運算能 力,采用大量數據進行訓練匹配,進一步提高了識別速度和精確度;
【附圖說明】
[0052] 圖1是本發明的算法的結構框圖;
[0053] 圖2是本發明預處理部分的框圖;
[0054] 圖3是本發明梅爾頻率倒譜系數(MFCC)特征提取的原理框圖;
[0055] 圖4是本發明希爾伯特邊際譜(HHT)特征提取的原理圖;
[0056] 圖5是本發明模式識別部分框圖。
【具體實施方式】
[0057] 下面結合附圖對本發明作更進一步的說明。
[0058] 如圖1所示為一種基于心音的身份認證系統,包括心音信號預處理模塊102、心音 特征提取模塊103以及匹配認證模塊105,心音特征提取模塊103連接心音數據庫1