一種基于語音生物特征的網絡安全驗證方法
【技術領域】
[0001]本發明涉及一種語音識別安全驗證技術,尤其涉及一種基于語音生物特征的網絡安全驗證方法,屬于網絡安全驗證領域。
【背景技術】
[0002]當前網絡安全驗證領域的驗證碼均采用文本方式,用來區分驗證用戶是人在操作還是計算機進行操作的公共全自動程序。驗證碼系統設計的初衷是為了防止惡意破解密碼、刷票、論壇灌水,有效防止黑客對某一個特定注冊用戶采用自動程序暴力破解方式不斷地進行登陸嘗試。隨著計算機技術的不斷發展,傳統的驗證碼技術,如文本方式驗證碼,已經無法再發揮設計之初所要達到的目的,暴露出越來越多的缺陷:
[0003](I)用戶獲取信息的困難性:隨著技術的不斷進步,計算機程序已經可以很方便的自動識別簡單的文字識別碼。為了進一步組織計算機程序的暴力破解,越來越多的識別碼系統增加了干擾信息。雖然這在一定程度上緩解了安全性上的問題,但是卻給用戶造成了很大的困擾,用戶不得不頻繁的重新獲取新的驗證碼,并需要消耗很長的時間來正確識別驗證碼。
[0004](2)用戶輸入信息的困難性:為了進一步提高系統的安全性,系統在識別碼本身的隨機性上也做了加強,不但出現了字母數字的組合,字母也進行了大小寫的區分;更有一些系統還加入了漢字的組合,來提高系統防止計算機程序的暴力破解的能力。用戶為了能夠正確輸入所需的識別碼,需要復雜的輸入操作,有時甚至超過了用戶密碼的設置復雜度。這種問題在移動設備上給用戶帶來的困擾就顯得越發明顯。
[0005]由于當前網絡安全驗證技術中存在上述諸多問題,因此,亟需開發一種方便用戶識別和輸入的可避免計算機程序的自動暴力破解的基于用戶語音生物特征的網絡安全驗證方法。
【發明內容】
[0006]本發明的一個目的是針對增加了干擾信息的驗證碼,在增加了安全性的同時給用戶造成了很大的困擾,用戶不得不頻繁的重新獲取新的驗證碼,并需要消耗較長的時間來正確識別驗證碼;另一個目的是解決當前識別采用字母數字的組合,字母也了大小寫的區分,甚至還加入了漢字的組合,用戶為了輸入正確的識別碼,需要進行復雜的輸入操作。為了實現上述的發明目的,本發明提供了一種方使用戶識別和輸入的可避免計算機程序的自動暴力破解的基于用戶語音生物特征的網絡安全驗證方法。
[0007]本發明的技術方案是提供一種基于語音生物特征的網絡安全驗證方法,其設計要點在于:
[0008]包括客戶端和用于驗證的驗證服務端,所述客戶端和驗證服務端通過通信網絡進行通信連接;
[0009]所述客戶端包括語音采集模塊、處理模塊和通信模塊,
[0010]語音采集模塊內置有語音采集單元和特征提取單元,處理模塊根據驗證服務端發送的操作信號操縱語音采集單元采集設定時間長度的語音信號,操縱特征提取單元將所述語音信號進行預處理得到語音數字信號,并對所述語音數字信號進行計算處理提取用于表征語音生物特征信息的語音生物特征數據;
[0011]通信模塊用于實現客戶端和驗證服務端之間的數據轉輸,用于接收驗證服務端向客戶端發送的操作信號,用于將所述語音生物特征數據和賬戶信息發送到驗證服務端;
[0012]所述驗證服務端包括數據庫、處理模塊和通信模塊,
[0013]數據庫預先存儲有用戶的語音生物特征數據,處理模塊檢索數據庫中與所接收的賬戶信息相對應的語音生物特征數據,并把所檢索的語音生物特征數據與所接收的來自客戶端的語音生物特征數據進行計算驗證處理;若所檢索的語音生物特征數據與所接收的語音生物特征數據相匹配,則通過驗證,控制客戶端上開啟相應的功能模塊;若所檢索的語音生物特征數據與所接收的語音生物特征數據不相匹配,則未通過驗證,向客戶端發送驗證失敗?目息;
[0014]通信模塊用于實現驗證服務端和客戶端間的數據轉輸,用于向客戶端發送操作信號,用于接收客戶端向驗證服務端發送的語音生物特征數據和賬戶信息。
[0015]本發明在應用中,還有如下進一步優化的技術方案。
[0016]進一步地,所述客戶端還包括登錄模塊,用于用戶進行登錄操作;
[0017]在處理模塊根據驗證服務端發送的操作信號操縱語音采集單元采集設定時間長度的語音信號之前,還包括以下步驟:客戶端的處理模塊操縱所述登錄模塊輸入的賬戶信息,并將所述賬戶信息發送到驗證服務端,驗證服務端檢索數據庫中是否存在與所接收的賬戶信息相對應的賬戶信息,若存在,則向客戶端發送用于采集語音信號的操作信號,若不存在,則向客戶端發送賬戶信息不存在提示信息。
[0018]進一步地,所述客戶端還包括注冊模塊,用于新用戶進行注冊;驗證服務端還包括語音模型訓練模塊,用于根據來自客戶端的用戶的語音生物特征數據序列通過模型訓練生成該用戶的模型參數和參數閾值;在所述登錄之前還包括用戶通過客戶端進行的注冊步驟。
[0019]進一步地,所述注冊步驟包括:用戶在客戶端的注冊模塊中輸入用于注冊的賬戶信息,客戶端的處理模塊將所述賬戶信息發送到驗證服務端,驗證服務端的處理模塊檢索數據庫中是否已存在所接收的賬戶信息,若賬戶信息不存在,驗證服務端向客戶端發送用于采集語音信號的操作信號;客戶端的處理器根據所接收的操作信號操縱語音采集單元采集設定時間長度的語音信號,并操縱特征提取單元將所述語音信號進行預處理得到語音數字信號,對所述語音數字信號進行計算處理提取用于表征語音生物特征的語音生物特征數據;將所述語音生物特征數據和賬戶信息發送到驗證服務端,驗證服務端的處理模塊根據所接收的語音生物特征數據和賬戶信息在數據庫中建立該用戶的賬戶信息字段,并操縱語音模型訓練模塊利用所述語音生物特征數據序列通過模型訓練生成該用戶的模型參數和參數閾值,并更新數據庫中該用戶的相應字段信息;若所輸入賬戶信息不存在,驗證服務端向客戶端發送注冊失敗信息。
[0020]進一步地,所述客戶端和驗證服務端均有預先約定的對稱加密密鑰,在將所述語音生物特征數據、賬戶信息或語音生物特征數據和賬戶信息傳輸到驗證服務端之前,客戶端的處理模塊采用所述對稱加密密鑰對所述語音生物特征數據、賬戶信息或語音生物特征數據和賬戶信息進行加密處理封裝成賬戶信息包;在驗證服務端接收所述賬戶信息包后,驗證服務端的處理模塊采用所述對稱加密密鑰通過逆運算得到所述語音生物特征數據、賬戶信息或語音生物特征數據和賬戶信息。驗證服務端在向客戶端發送操作信號前,驗證服務端的處理模塊采用所述對稱加密密鑰對所述操作信號進行加密處理封裝成操作信息包,客戶端接收到所述操作信息包,客戶端的處理模塊采用所述對稱加密密鑰通過逆運算得到所述操作信息。
[0021]進一步地,所述傳輸到驗證服務端的賬戶信息為用戶的賬戶名或賬戶名和生日。
[0022]進一步地,所述語音生物特征數據為梅爾頻率倒譜系數。
[0023]進一步地,所述數據庫內置有用于存儲有用戶注冊信息的UserInfo表、用于存儲用戶語音訓練后的GMM模型參數的GMMInfo表和用于存儲用戶語音的梅爾頻率倒譜系數的MFCCInfo表,所述UserInfo表中包含有記錄用戶姓名的User Name和記錄用戶生日的User Birthday字段,MFCCInfo表中包含有記錄用戶姓名的User Name、用來記錄用戶梅爾頻率倒譜系數序號的MFCCData Index、記錄梅爾頻率倒譜系數的MFCC Data字段,GMMInfo表中包括有記錄用戶姓名的UserName、記錄GMM模型權重的GMM Weight、記錄GMM模型均值的GMM Means、記錄GMM模型方差的GMM Variance和記錄GMM閾值的GMM Threshold字段;所述UserInfo表、GMMInfo表和MFCCInfo表通過所述User Name字段關聯。
[0024]上述的客戶端中的語音采集模塊、登錄模塊、注冊模塊、通信模塊分別和處理模塊連接,驗證服務端中的數據庫、語音模型訓練模塊、通信模塊分別和處理模塊連接。
[0025]本發明在應用中,用戶進行登錄或安全驗證時,不需要再輸入不便于識別的加了干擾信息的文本方式的驗證碼,或進行復雜的輸入操作輸入字母區分大小寫的增加有漢字的文本方式的驗證碼,只需要錄入一定時間長度的語音信號,即可完成安全驗證工作,方便又快捷。
[0026]有益效果
[0027]方便快捷,安全性能高,通過用戶的語音信號的生物特征信息,如梅爾頻率倒譜系數,作為安全驗證信息,其具有唯一性,不易被仿制,安全性能高于文本式驗證;同時用戶只需要說出一定時間長度的語音信息,不需要輸入復雜的驗證碼,使安全驗證非常方便。
[0028]識別率高,驗證效率高,語音信號的生物特征信息采用梅爾