在獲取到聲紋特征信息后,可以將聲紋特征信息作為基礎數據用于后續流程處理,例如,用于基于聲紋特征信息的認證等場景。
[0152]本實施例中,通過從文本內容中提取詞匯,相對于直接采用固定文本的方式,可以提高靈活性,擴展能夠保存的詞匯及對應的聲音樣本的數量,從而提高安全性及可靠性。
[0153]需要說明的是,在本發明的描述中,術語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發明的描述中,除非另有說明,“多個”的含義是指至少兩個。
[0154]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部分,并且本發明的優選實施方式的范圍包括另外的實現,其中可以不按所示出或討論的順序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明的實施例所屬技術領域的技術人員所理解。
[0155]應當理解,本發明的各部分可以用硬件、軟件、固件或它們的組合來實現。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟件或固件來實現。例如,如果用硬件來實現,和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現:具有用于對數據信號實現邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現場可編程門陣列(FPGA)等。
[0156]本技術領域的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,該程序在執行時,包括方法實施例的步驟之一或其組合。
[0157]此外,在本發明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現,也可以采用軟件功能模塊的形式實現。所述集成的模塊如果以軟件功能模塊的形式實現并作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。
[0158]上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
[0159]在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
[0160]盡管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發明的限制,本領域的普通技術人員在本發明的范圍內可以對上述實施例進行變化、修改、替換和變型。
【主權項】
1.一種信息驗證方法,其特征在于,包括: 獲取用戶的語音輸入信息; 當所述語音輸入信息屬于預設的信息類型時,從預先保存的詞匯中選擇預設個數的詞匯,并對選擇的詞匯進行組合; 根據組合后的詞匯獲取展示信息,并向用戶展示所述展示信息; 獲取用戶朗讀所述展示信息的語音信息,并與預先保存的用戶的聲音樣本進行比對,得到驗證結果。2.根據權利要求1所述的方法,其特征在于,所述根據組合后的詞匯獲取展示信息,并向用戶展示所述展示信息,包括: 采用語音合成技術,生成組合后的詞匯對應的合成語音,并向用戶播放所述合成語音;或者, 將組合后的詞匯作為展示信息,以文本形式展示給用戶。3.根據權利要求1所述的方法,其特征在于,所述從預先保存的詞匯中選擇預設個數的詞匯,包括: 從預先保存的詞匯中,隨機選擇預設個數的詞匯。4.根據權利要求1-3任一項所述的方法,其特征在于,還包括: 獲取文本內容并展示給用戶; 采集用戶朗讀所述文本內容的語音信息; 在所述文本內容中提取詞匯,并確定所述語音信息中與所述詞匯對應的語音片段,將所述語音片段作為用戶的聲音樣本與對應的詞匯進行關聯保存。5.根據權利要求4所述的方法,其特征在于,所述獲取文本內容包括: 從已有的多個文本內容中,隨機選擇一個文本內容。6.根據權利要求4或5所述的方法,其特征在于,所述文本內容是著名的短文。7.根據權利要求4或5所述的方法,其特征在于,所述提取的詞匯是出現次數大于預設值的詞匯,或者,易被語音識別的詞匯。8.根據權利要求4或5所述的方法,其特征在于,所述提取的詞匯對應的語音片斷是一個或多個。9.根據權利要求4或5所述的方法,其特征在于,還包括: 根據所述語音信息獲取所述用戶的聲紋特征信息。10.根據權利要求9所述的方法,其特征在于,還包括: 在驗證時,還根據所述聲紋特征信息進行驗證,以及,在根據所述聲音樣本以及所述聲紋特征信息均驗證成功時,最終確定為驗證成功。11.根據權利要求1-3任一項所述的方法,其特征在于,所述預設的信息類型包括:購物類或支付類。12.—種聲音樣本的生成方法,其特征在于,包括: 獲取文本內容并展示給用戶; 采集用戶朗讀所述文本內容的語音信息; 在所述文本內容中提取詞匯,并確定所述語音信息中與所述詞匯對應的語音片段,將所述語音片段作為用戶的聲音樣本與對應的詞匯進行關聯保存。13.根據權利要求12所述的方法,其特征在于,所述獲取文本內容,包括: 從已有的多個文本內容中,隨機選擇一個文本內容。14.根據權利要求12或13所述的方法,其特征在于,所述文本內容是著名的短文。15.根據權利要求12或13所述的方法,其特征在于,所述提取的詞匯是出現次數大于預設值的詞匯,或者,易被語音識別的詞匯。16.根據權利要求12或13所述的方法,其特征在于,所述提取的詞匯對應的語音片斷是一個或多個。17.根據權利要求12或13所述的方法,其特征在于,還包括: 根據所述語音信息獲取所述用戶的聲紋特征信息。18.一種信息驗證裝置,其特征在于,包括: 獲取模塊,用于獲取用戶的語音輸入信息; 選擇模塊,用于當所述語音輸入信息屬于預設的信息類型時,從預先保存的詞匯中選擇預設個數的詞匯,并對選擇的詞匯進行組合; 第一展示模塊,用于根據組合后的詞匯獲取展示信息,并向用戶展示所述展示信息; 驗證模塊,用于獲取用戶朗讀所述展示信息的語音信息,并與預先保存的用戶的聲音樣本進行比對,得到驗證結果。19.根據權利要求18所述的裝置,其特征在于,所述第一展示模塊具體用于: 采用語音合成技術,生成組合后的詞匯對應的合成語音,并向用戶播放所述合成語音;或者, 將組合后的詞匯作為展示信息,以文本形式展示給用戶。20.根據權利要求18所述的裝置,其特征在于,所述選擇模塊用于從預先保存的詞匯中選擇預設個數的詞匯,包括: 從預先保存的詞匯中,隨機選擇預設個數的詞匯。21.根據權利要求18-20任一項所述的裝置,其特征在于,還包括: 第二展示模塊,用于獲取文本內容并展示給用戶; 采集模塊,用于采集用戶朗讀所述文本內容的語音信息;保存模塊,用于在所述文本內容中提取詞匯,并確定所述語音信息中與所述詞匯對應的語音片段,將所述語音片段作為用戶的聲音樣本與對應的詞匯進行關聯保存。22.—種聲音樣本的生成裝置,其特征在于,包括: 展示模塊,用于獲取文本內容并展示給用戶; 采集模塊,用于采集用戶朗讀所述文本內容的語音信息; 保存模塊,用于在所述文本內容中提取詞匯,并確定所述語音信息中與所述詞匯對應的語音片段,將所述語音片段作為用戶的聲音樣本與對應的詞匯進行關聯保存。23.根據權利要求22所述的裝置,其特征在于,所述展示模塊用于獲取文本內容,包括: 從已有的多個文本內容中,隨機選擇一個文本內容。24.根據權利要求22或23所述的裝置,其特征在于,還包括: 獲取模塊,用于根據所述語音信息獲取所述用戶的聲紋特征信息。
【專利摘要】本發明提出一種信息驗證方法和裝置及聲音樣本的生成方法和裝置,該信息驗證方法包括:獲取用戶的語音輸入信息;當所述語音輸入信息屬于預設的信息類型時,從預先保存的詞匯中選擇預設個數的詞匯,并對選擇的詞匯進行組合;根據組合后的詞匯獲取展示信息,并向用戶展示所述展示信息;獲取用戶朗讀所述展示信息的語音信息,并與預先保存的用戶的聲音樣本進行比對,得到驗證結果。該方法提高仿冒難度,從而提高信息安全性,并且,還可以提高識別率,從而提高驗證可靠性。
【IPC分類】H04L29/06, G10L15/26
【公開號】CN105225664
【申請號】CN201510617103
【發明人】李海武
【申請人】百度在線網絡技術(北京)有限公司
【公開日】2016年1月6日
【申請日】2015年9月24日