一種基于語音識別的認證方法和設備的制作方法

文檔序號：7756734閱讀：141來源：國知局

專利名稱：一種基于語音識別的認證方法和設備的制作方法
技術領域：
本發明涉及身份認證技術領域，尤其涉及一種基于語音識別的認證方法和設備。
背景技術：
目前，已經存在多種對用戶進行身份認證的方式，例如基于語音識別對用戶的身份進行認證。這種認證方式的主要內容是預先保存用戶錄制的閱讀認證口令的原始音頻文件；當用戶請求認證時，要求該用戶重復該認證口令；接收用戶重復該認證口令的音頻文件，并將其與預先錄制的原始音頻文件進行匹配驗證，如果二者匹配成功，則對該用戶的認證通過。這種認證方式可以應用于多種領域，例如，應用于IP話機中。由于IP話機的用戶可以在話機上存儲一些私密的信息，為了避免這些私密信息被其他用戶獲取，可以采用上述方式對用戶進行身份認證，當對用戶的身份認證通過之后，IP話機才允許該用戶讀取自己預先存儲的信息，但是，上述身份認證方法的安全性不高，因為認證系統無法判斷進行身份認證時接收到的聲音是來源于說話者本人、還是事先錄制的聲音樣本；如果有攻擊者事先錄制了某用戶閱讀認證口令的聲音樣本，則可以假冒該用戶，進而竊取到該用戶的私密信息。

發明內容
本發明提供了一種基于語音識別的認證方法，能夠提高認證的安全性。本發明還提供了一種基于語音識別的認證設備，能夠提高認證的安全性。本發明的技術方案是這樣實現的一種基于語音識別的認證方法，包括認證設備保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；認證設備接收用戶的認證請求，隨機播放所述多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證設備在預先設定的時間內接收所述用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。一種基于語音識別的認證設備，包括存儲單元、接收單元、播放單元和認證單元；其中，所述存儲單元，用于保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；接收單元，用于接收用戶的認證請求，并指示播放單元進行播放；播放單元，用于按照接收單元的指示，隨機播放所述存儲單元中保存的多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證單元，用于在所述播放單元播放完畢之后，在預先設定的時間內接收用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。可見，本發明提出的基于語音識別的認證方法，預先錄制用戶閱讀多個密碼的多個原始音頻文件；當用戶請求認證時，要求該用戶重復幾個隨機的密碼，將用戶重復這些隨機密碼的音頻文件與預先錄制的該用戶閱讀這些密碼的原始音頻文件進行匹配驗證，如果二者匹配，則對該用戶的認證通過。由于用戶每次認證時會重復認證系統所要求的隨機密碼，這就使得攻擊者無法通過事先錄制聲音樣本的方式進行攻擊，從而提高了認證的安全性。

圖1為本發明基于語音識別的認證方法流程圖；圖2為本發明實施例中隨機播放標準音頻文件的方法流程圖；圖3為本發明實施例中進行匹配驗證的方法流程圖；圖4為本發明基于語音識別的認證設備結構示意圖。
具體實施例方式本發明提出一種基于語音識別的認證方法，如圖1為本發明基于語音識別的認證方法流程圖，該方法包括步驟101 認證設備保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；步驟102 認證設備接收用戶的認證請求，隨機播放所述多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；步驟103 認證設備在預先設定的時間內接收所述用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。上述方法可以進一步包括如果認證設備在預先設定的時間內接收不到所述用戶重復所述密碼的語音，則對所述用戶的認證失敗。此處預先設定的時間的長度可以按照實際情況具體設定，例如，按照一般語速和需要重復的密碼的個數，計算用戶重復所述密碼所需的時間，再加上適當長度的反應時間，可以計算出預先設定的時間長度。步驟102中，認證設備隨機播放多個標準音頻文件中的一個以上標準音頻文件可以包括A、設定要求播放標準音頻文件的個數；B、判斷已經調用的標準音頻文件的個數是否小于所述要求播放標準音頻文件的個數，如果是，則執行步驟C ；否則執行步驟D ；C、隨機調用所述多個標準音頻文件中尚未被調用的一個標準音頻文件，等待預先設定的時間間隔，將所述標準音頻文件與舒適噪音進行混音，將經過混音后的音頻文件保存入存儲地址，繼續執行步驟B ；并播放所述存儲地址中的音頻文件。步驟103中，認證設備判斷認證音頻文件與對應密碼的原始音頻文件是否匹配的方式可以為將認證音頻文件分別與對應密碼的原始音頻文件進行自相關運算，計算認證音頻文件與對應密碼的原始音頻文件的自相關性值，判斷所述自相關性值是否大于預先設定的閾值，如果大于，則判定認證音頻文件與對應密碼的原始音頻文件匹配成功。以下舉具體的實施例詳細介紹。在本實施例中，上述認證設備可以為IP話機，在節省IP話機成本以及軟硬件設計和結構設計的前提下，通過基于IP話機內部的數字信號處理器(DSP)來完成IP話機對當前使用者的語音識別。IP話機預先保存對應多個密碼的標準音頻文件和用戶預先錄制的對應這些密碼的多個原始音頻文件。例如，所述的密碼可以為0到9這10個數字，IP話機預先保存對應 0到9的10個標準音頻文件和用戶錄制的10個原始音頻文件。當IP話機接收到用戶的認證請求后，隨機播放多個預先保存的標準音頻文件，要求用戶重復這些標準音頻文件對應的密碼。如圖2為本發明實施例中隨機播放標準音頻文件的方法流程圖，包括步驟201 =IP話機接收用戶的認證請求，IP話機的上層業務模塊向DSP發送播放隨機密碼的命令，該命令中包含要求播放的標準音頻文件的個數N ；該命令被保存在DSP驅動中；步驟202 =DSP通過DSP驅動讀取上述播放隨機密碼的命令，獲取要求播放的標準音頻文件的個數N。步驟203 =DSP判斷已經調用的標準音頻文件的個數是否小于N，如果小于，則執行步驟204，如果不小于，則執行步驟205。步驟204 :DSP隨機調用上述預先保存的10個標準音頻文件中尚未被調用的一個，等待預先設定的時間間隔，如300ms，將該音頻文件與舒適噪聲進行混音，并將經過混音后的音頻文件保存入片外地址，返回步驟203。在本步驟中，DSP等待預先設定的時間間隔以及與舒適噪聲進行混音處理，都是為了使處理之后的音頻文件收聽時更舒適。其中，等待預先設定的時間間隔是利用了人體聲學感受值，當語速小于90字/秒時，語速很慢、會使聽者無耐心；當語速在120字/秒和140字/秒之間時，語速適中；當語速大于160字/秒時，語速過快，需要聽者集中注意力且容易產生聽覺疲勞)。為了使處理之后的音頻文件語速適中，在調用標準音頻文件之后可以等待預先設定的時間間隔，如 300ms ο步驟205 =DSP讀取已經保存入片外地址的音頻文件，播放該音頻文件。用戶可以通過聽筒收聽該音頻文件，并按照要求重復該音頻文件對應的密碼。例如，當N = 8時，DSP隨機調用8個標準音頻文件，這8個標準音頻文件所對應的密碼為“7、4、1、2、3、6、9、8”，用戶通過聽筒收聽之后，按照要求重復這8個密碼。IP話機在預先設定的時間內接收用戶重復上述密碼的語音并生成認證音頻文件，將認證音頻文件與上述密碼對應的原始音頻文件進行匹配驗證，如果匹配成功，則對該用
6戶的認證成功。圖3為本發明實施例中進行匹配驗證的方法流程圖，包括步驟301 用戶按照IP話機的要求重復上述密碼，IP話機接收用戶重復上述密碼的語音并生成音頻文件；步驟302 :IP話機中的DSP-模擬接口芯片(AIC)模塊對該音頻文件進行模數轉換 (A/D轉換)，生成認證音頻文件；步驟303 將認證音頻文件分別與上述密碼對應的原始音頻文件進行自相關運算，計算認證音頻文件與原始音頻文件的自相關性值；步驟304 判斷所述自相關性值是否大于預先設定的閾值(如90% )，如果大于，則判定認證音頻文件與上述密碼的原始音頻文件匹配成功，則IP話機對該用戶的認證成功，繼續進行IP話機正常程序的操作；否則，判定認證音頻文件與上述密碼的原始音頻文件匹配不成功，則IP話機對該用戶的認證失敗。本發明還提出一種基于語音識別的認證設備，如圖4為本發明基于語音識別的認證設備結構示意圖，該設備包括存儲單元410、接收單元420、播放單元430和認證單元 440 ；其中，所述存儲單元410，用于保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；接收單元420，用于接收用戶的認證請求，并指示播放單元430進行播放；播放單元430，用于按照接收單元420的指示，隨機播放所述存儲單元410中保存的多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證單元440，用于在所述播放單元430播放完畢之后，在預先設定的時間內接收用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。上述認證單元440還用于，如果在預先設定的時間內接收不到所述用戶重復所述密碼的語音，則對所述用戶的認證失敗。上述播放單元430可以包括上層業務模塊431和DSP 432 ；其中，所述上層業務模塊431，用于設定要求播放標準音頻文件的個數，并向DSP432發送所述要求播放標準音頻文件的個數；DSP 432，用于獲取所述要求播放標準音頻文件的個數，當已經調用的標準音頻文件的個數小于所述要求播放標準音頻文件的個數時，隨機調用所述多個標準音頻文件中尚未被調用的一個標準音頻文件，等待預先設定的時間間隔，將所述標準音頻文件與舒適噪音進行混音，將經過混音后的音頻文件保存入存儲地址；直至已經調用的標準音頻文件的個數等于所述要求播放標準音頻文件的個數時，讀取并播放所述存儲地址中的音頻文件。所述認證單元440包括自相關模塊441和判斷模塊442 ；其中，所述自相關模塊441，用于將認證音頻文件分別與對應密碼的原始音頻文件進行自相關運算，計算認證音頻文件與對應密碼的原始音頻文件的自相關性值；所述判斷模塊442，用于判斷所述自相關性值是否大于預先設定的閾值，如果大于，則判定認證音頻文件與對應密碼的原始音頻文件匹配成功。綜上可見，本發明提出的基于語音識別的認證方法，預先錄制用戶閱讀多個密碼的原始音頻文件；當用戶請求認證時，要求該用戶重復幾個隨機的密碼，將用戶重復這些隨機密碼的音頻文件與預先錄制的該用戶閱讀這些密碼的原始音頻文件進行匹配驗證，如果匹配成功，則對該用戶的認證通過；否則對該用戶的認證失敗。由于用戶每次請求認證時都應認證系統的要求重復幾個隨機的密碼，就使得攻擊者無法通過事先錄制聲音樣本的方式進行攻擊，從而保證了對用戶認證的安全性。以上所述僅為本發明的較佳實施例而已，并不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的范圍之內。
權利要求
1.一種基于語音識別的認證方法，其特征在于，所述方法包括認證設備保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；認證設備接收用戶的認證請求，隨機播放所述多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證設備在預先設定的時間內接收所述用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。
2 .根據權利要求1所述的方法，其特征在于，所述方法進一步包括如果認證設備在預先設定的時間內接收不到所述用戶重復所述密碼的語音，則對所述用戶的認證失敗。
3.根據權利要求1或2所述的方法，其特征在于，所述認證設備隨機播放多個標準音頻文件中的一個以上標準音頻文件包括A、設定要求播放標準音頻文件的個數；B、判斷已經調用的標準音頻文件的個數是否小于所述要求播放標準音頻文件的個數，如果是，則執行步驟C ；否則執行步驟D ；C、隨機調用所述多個標準音頻文件中尚未被調用的一個標準音頻文件，等待預先設定的時間間隔，將所述標準音頻文件與舒適噪音進行混音，將經過混音后的音頻文件保存入存儲地址，繼續執行步驟B;D、讀取并播放所述存儲地址中的音頻文件。
4.根據權利要求1或2所述的方法，其特征在于，所述判斷認證音頻文件與對應密碼的原始音頻文件是否匹配為將認證音頻文件分別與對應密碼的原始音頻文件進行自相關運算，計算認證音頻文件與對應密碼的原始音頻文件的自相關性值，判斷所述自相關性值是否大于預先設定的閾值，如果大于，則判定認證音頻文件與對應密碼的原始音頻文件匹配成功。
5.一種基于語音識別的認證設備，其特征在于，所述設備包括存儲單元、接收單元、播放單元和認證單元；其中，所述存儲單元，用于保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；接收單元，用于接收用戶的認證請求，并指示播放單元進行播放；播放單元，用于按照接收單元的指示，隨機播放所述存儲單元中保存的多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證單元，用于在所述播放單元播放完畢之后，在預先設定的時間內接收用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。
6.根據權利要求5所述的設備，其特征在于，所述認證單元還用于，如果在預先設定的時間內接收不到所述用戶重復所述密碼的語音，則對所述用戶的認證失敗。
7.根據權利要求5或6所述的設備，其特征在于，所述播放單元包括上層業務模塊和數字信號處理器DSP ；其中，所述上層業務模塊，用于設定要求播放標準音頻文件的個數，并向DSP發送所述要求播放標準音頻文件的個數；DSP，用于獲取所述要求播放標準音頻文件的個數，當已經調用的標準音頻文件的個數小于所述要求播放標準音頻文件的個數時，隨機調用所述多個標準音頻文件中尚未被調用的一個標準音頻文件，等待預先設定的時間間隔，將所述標準音頻文件與舒適噪音進行混音，將經過混音后的音頻文件保存入存儲地址；直至已經調用的標準音頻文件的個數等于所述要求播放標準音頻文件的個數時，讀取并播放所述存儲地址中的音頻文件。
8.根據權利要求5或6所述的設備，其特征在于，所述認證單元包括自相關模塊和判斷模塊；其中，所述自相關模塊，用于將認證音頻文件分別與對應密碼的原始音頻文件進行自相關運算，計算認證音頻文件與對應密碼的原始音頻文件的自相關性值；所述判斷模塊，用于判斷所述自相關性值是否大于預先設定的閾值，如果大于，則判定認證音頻文件與對應密碼的原始音頻文件匹配成功。
全文摘要
本發明提出一種基于語音識別的認證方法和設備，其中方法包括認證設備保存對應多個密碼的多個標準音頻文件和用戶預先錄制的對應所述多個密碼的多個原始音頻文件；認證設備接收用戶的認證請求，隨機播放所述多個標準音頻文件中的一個以上標準音頻文件，要求用戶重復所述播放的標準音頻文件所對應的密碼；認證設備在預先設定的時間內接收所述用戶重復所述密碼的語音并生成認證音頻文件，判斷所述認證音頻文件與對應所述密碼的原始音頻文件是否匹配，如果匹配，則對所述用戶的認證成功。本發明能夠提高認證的安全性。
文檔編號H04M7/00GK102377736SQ201010252450
公開日2012年3月14日申請日期2010年8月12日優先權日2010年8月12日
發明者余昌剛, 馮聲威, 方新勇, 羅光, 馬年磊申請人:杭州華三通信技術有限公司

完整全部詳細技術資料下載