專利名稱:一種語音識別的方法及移動終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通訊技術(shù)領(lǐng)域,尤其涉及一種語音識別的方法及移動終端。
背景技術(shù):
隨著移動通訊技術(shù)不斷的開發(fā)和完善,手機、平板電腦等移動終端已經(jīng)成為了人 們?nèi)粘I钪胁豢苫蛉钡囊粋€部分,人們不僅可以利用移動終端進行通訊,還可以進行文 件傳輸、攝像等。
以手機為例,隨著手機越來越智能化,手機可以通過接收用戶的語音信息執(zhí)行相 應(yīng)的操作,例如長按手機通話鍵時,手機提示用戶輸入語音信息,用戶可說出聯(lián)系人的姓 名,手機通過網(wǎng)絡(luò)服務(wù)器端的公共語音數(shù)據(jù)庫識別用戶語音信息,并顯示與該用戶語音信 息相匹配的聯(lián)系人。由于網(wǎng)絡(luò)服務(wù)器端的公共語音數(shù)據(jù)庫中存儲標(biāo)準(zhǔn)語音,其并不針對單 個用戶實現(xiàn)語音定制,采用公共語音數(shù)據(jù)庫對用戶語音信息進行識別時,可能因為用戶的 發(fā)音問題,導(dǎo)致識別不成功,或識別出錯誤的聯(lián)系人語音,降低了語音識別率。發(fā)明內(nèi)容
本發(fā)明實施例提供一種語音識別的方法及移動終端,采用用戶數(shù)據(jù)庫進行語音識 別,可以更精準(zhǔn)的查找用戶需要的語音數(shù)據(jù),提高了移動終端的語音識別率。
本發(fā)明實施例提供了一種語音識別的方法,其包括
在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;
從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中 調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中或遠程 服務(wù)器中。
相應(yīng)地,本發(fā)明實施例還提供了一種語音識別的移動終端,包括
語音輸入模塊,用于在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音 信息;
第一查找模塊,用于從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
第一執(zhí)行模塊,用于如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù) 據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述公共語音數(shù)據(jù) 庫設(shè)于網(wǎng)絡(luò)服務(wù)器。
本發(fā)明實施例中,可以預(yù)先設(shè)定用戶數(shù)據(jù)庫,當(dāng)接收到用戶輸入的語音信息時,優(yōu) 先在用戶數(shù)據(jù)庫查找與該語音信息相匹配的語音數(shù)據(jù),并在應(yīng)用程序中根據(jù)用戶的語音指 令調(diào)用所述語音數(shù)據(jù),采用用戶數(shù)據(jù)庫進行語音識別,可以更精準(zhǔn)的查找用戶需要的語音 數(shù)據(jù),提高了移動終端的語音識別率,提升了用戶的體驗,使移動終端更加具備人性化的特
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例描述 中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施 例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲 得其他的附圖。
圖1是本發(fā)明一種語音識別的方法的第一實施例流程示意圖2是本發(fā)明一種語音識別的方法的第二實施例流程示意圖3是本發(fā)明實施例的一種語音識別的移動終端主要組成模塊的結(jié)構(gòu)示意圖4是本發(fā)明實施例的一種語音識別的移動終端的結(jié)構(gòu)示意圖5是本發(fā)明實施例的設(shè)置模塊的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā) 明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本發(fā)明保護的范圍。
在本發(fā)明實施例中,移動終端根據(jù)用戶輸入的語音指令,優(yōu)先從用戶數(shù)據(jù)庫中查 找與所述語音指令中的語音信息相匹配的語音數(shù)據(jù),如果沒有查找到,再從公共語音數(shù)據(jù) 庫中查找。所述移動終端根據(jù)查找到的語音數(shù)據(jù),在應(yīng)用程序中調(diào)用所述語音數(shù)據(jù)。
其中用戶輸入的語音信息可以為普通話、粵語、閩南語和英語等不同的方言或語 言,所述用戶數(shù)據(jù)庫可以為用戶預(yù)先設(shè)定的并存于移動終端中或遠程服務(wù)器中,如果所述 用戶數(shù)據(jù)庫存放在遠程服務(wù)器中,則所述遠程服務(wù)器優(yōu)選為云端服務(wù)器,所述移動終端通 過無線網(wǎng)絡(luò)W1-Fi與所述云端服務(wù)器中的用戶數(shù)據(jù)庫建立連接;所述公共語音數(shù)據(jù)庫可以 為供應(yīng)商默認設(shè)置的并存于網(wǎng)絡(luò)服務(wù)器中。
實施例一
請參見圖1,為本發(fā)明實施例提供一種語音識別的方法的第一實施例流程示意圖。 如圖1所示,本發(fā)明實施例的所述方法包括以下步驟
S101,在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;
具體的,所述應(yīng)用程序可以為移動終端中的便箋應(yīng)用、短信息應(yīng)用和聯(lián)系人應(yīng)用 等,所述移動終端可以為手機、平板電腦等。本步驟中,應(yīng)用程序可通過調(diào)用移動終端的麥 克風(fēng)等設(shè)備,接收用戶輸入的語音指令,所述語音指令包含語音信息。
以手機的聯(lián)系人應(yīng)用為例,聯(lián)系人應(yīng)用可提供語音撥號按鍵,用戶可以點擊該語 音撥號按鍵,聯(lián)系人應(yīng)用提示用戶輸出欲撥號的聯(lián)系人姓名,聯(lián)系人應(yīng)用通過調(diào)用手機的 麥克風(fēng),接收用戶輸入的欲撥號的聯(lián)系人姓名,生成語音指令,該語音指令用于指令應(yīng)用程 序發(fā)起對該聯(lián)系人的撥號;其中,語音指令包含用戶輸入的聯(lián)系人姓名的語音信息。
S102,從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
具體的,所述用戶數(shù)據(jù)庫可以為用戶預(yù)先設(shè)定的數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫可包含 用戶輸入的語音數(shù)據(jù),該語音數(shù)據(jù)包含語音信息及該語音信息對應(yīng)的文本信息。本步驟中, 根據(jù)接收到用戶輸入的語音指令所包含的語音信息,在用戶數(shù)據(jù)庫中查找與所述語音信息匹配的語音數(shù)據(jù)。
依照步驟SlOl所示例子,在手機的聯(lián)系人應(yīng)用中,當(dāng)接收到用戶輸入的撥號語音 指令時,根據(jù)所述撥號語音指令中所包含的欲撥號的聯(lián)系人姓名的語音信息,在用戶數(shù)據(jù) 庫中查找相匹配的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本信息。
S103,如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用 程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中 或遠程服務(wù)器中;
具體的,如果在用戶數(shù)據(jù)庫中查找到與用戶輸入的語音指令所包含的語音信息相 匹配的語音數(shù)據(jù),則將所述語音數(shù)據(jù)返回到應(yīng)用程序中,執(zhí)行用戶輸入的語音指令。
依照上述步驟所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果在用戶數(shù)據(jù)庫中查找到 與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本,且用戶輸入的為撥號語音指 令,則在聯(lián)系人中匹配該聯(lián)系人姓名對應(yīng)的電話號碼,調(diào)用該電話號碼進行撥號;如果在用 戶數(shù)據(jù)庫中未查找到與聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的語音數(shù)據(jù),優(yōu)選的,通 過無線網(wǎng)絡(luò)W1-Fi將所述聯(lián)系人姓名的語音信息發(fā)送到公共語音數(shù)據(jù)庫進行查找。
本發(fā)明實施例中,可以預(yù)先設(shè)定用戶數(shù)據(jù)庫,當(dāng)接收到用戶輸入的語音信息時,優(yōu) 先在用戶數(shù)據(jù)庫查找與該語音信息相匹配的語音數(shù)據(jù),并在應(yīng)用程序中根據(jù)用戶的語音指 令調(diào)用所述語音數(shù)據(jù),無需頻繁的在網(wǎng)絡(luò)服務(wù)器端的公共語音數(shù)據(jù)庫中進行查找,減少了 查找過程所需的時間,并且可以更精準(zhǔn)的查找用戶需要的語音數(shù)據(jù),提高了移動終端的語 音識別率,提升了用戶的體驗,使移動終端更加具備人性化的特點。
實施例二
請參加圖2,為本發(fā)明實施例提供一種語音識別的方法的第二實施例流程示意圖。 如圖2所示,本發(fā)明實施例的所述方法包括以下步驟
S201,設(shè)置所述用戶數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫包含用戶輸入的語音數(shù)據(jù);
具體的,可以通過調(diào)用移動終端的麥克風(fēng)等設(shè)備接收用戶輸入的語音信息,提取 所述語音信息中有效的語音數(shù)據(jù),并將所述語音數(shù)據(jù)保存至所述用戶數(shù)據(jù)庫中,所述用戶 數(shù)據(jù)庫包含用戶輸入的語音數(shù)據(jù),該語音數(shù)據(jù)包含語音信息及該語音信息對應(yīng)的文本信 肩、O
以手機的聯(lián)系人應(yīng)用為例,在保存所述聯(lián)系人時,可以添加錄音選項,用戶可以通 過手機的麥克風(fēng)進行錄音,當(dāng)手機錄制了聯(lián)系人姓名的語音信息時,優(yōu)選的,濾除該語音信 息的背景和環(huán)境噪音,提取有效的語音數(shù)據(jù),即清晰的聯(lián)系人姓名的語音以及所述語音所 對應(yīng)的文本,將所述語音數(shù)據(jù)保存到所述用戶數(shù)據(jù)庫中。
S202,在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;
S203,從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
具體的,如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則執(zhí)行 步驟S204 ;如果在所述用戶數(shù)據(jù)庫中未查找到與所述語音信息相匹配的語音數(shù)據(jù),則執(zhí)行 步驟S205。
S204,如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用 程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中 或遠程服務(wù)器中;
S205,如果在所述用戶數(shù)據(jù)庫中未查找到與所述語音信息相匹配的語音數(shù)據(jù),則 從公共語音數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
具體的,所述公共語音數(shù)據(jù)庫可以為供應(yīng)商默認設(shè)置的語音庫,所述數(shù)據(jù)庫可以 包含國際標(biāo)準(zhǔn)的普通話、英語和國內(nèi)標(biāo)準(zhǔn)的方言等語音信息以及這些語音信息對應(yīng)的文本信息。
如果在所述公共語音數(shù)據(jù)庫中未查找到與所述語音指令所包含的語音信息相匹 配的語音數(shù)據(jù),則執(zhí)行步驟S206 ;如果在所述公共語音數(shù)據(jù)庫中查找到與所述語音信息相 匹配的語音數(shù)據(jù),則執(zhí)行步驟S207。
依照上述步驟所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果在所述用戶數(shù)據(jù)庫中未 查找到與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本信息,則優(yōu)選的將所述 聯(lián)系人姓名的語音信息通過無線網(wǎng)絡(luò)W1-Fi傳輸至公共語音數(shù)據(jù)庫中進行查找。
S206,如果在所述公共語音數(shù)據(jù)庫中未查找到與所述語音指令信息相匹配的語音 數(shù)據(jù),則發(fā)出提示信息;
具體的,所述提示信息可以為在移動終端上顯示未查找到的提示信息。
依照上述步驟所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果在所述公共語音數(shù)據(jù)庫 中也沒有找到與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本信息,則在手機 端返回未檢索到有關(guān)聯(lián)系人的提示信息。
S207,如果在所述公共語音數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù), 則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令;
具體的,如果在所述公共語音數(shù)據(jù)庫中查找到與用戶輸入的語音指令所包含的語 音信息相匹配的語音數(shù)據(jù),則將所述語音數(shù)據(jù)返回到應(yīng)用程序中,執(zhí)行用戶輸入的語音指 令。
依照上述步驟所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果在公共語音數(shù)據(jù)庫中查 找到與預(yù)撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本信息,則返回該文本到手 機中,如果用戶輸入的為撥號語音指令,則在聯(lián)系人中匹配該聯(lián)系人姓名對應(yīng)的電話號碼, 調(diào)用該電話號碼進行撥號。
其中,步驟S202、S203和S204可以分別參見實施例一的步驟S101、S102和S103,在此不進行贅述。
下面以一個具體例子來說明本發(fā)明的實施步驟。
本實施例中,所述應(yīng)用程序為便箋,所述語音指令為寫便箋和輸入語音“你好”這 兩個操作,執(zhí)行步驟如下
用戶可以預(yù)先的在便箋的常用語句中添加“你好”的語句,并且對該語句進行錄 音,移動終端通過濾除所述錄音的背景和環(huán)境的噪音,提取清晰的“你好”的語音,并將該包 含“你好”的語音和其對應(yīng)的文本在內(nèi)的語音數(shù)據(jù)保存在用戶數(shù)據(jù)庫中。
所述用戶點擊“寫便箋”的按鍵,向移動終端發(fā)出“你好”的語音,所述移動終端接 收到所述“你好”的語音,優(yōu)先在所述用戶數(shù)據(jù)庫中查找到預(yù)存的“你好”的語音對應(yīng)的“你 好”的文本,將所述“你好”的文本返回到便箋應(yīng)用程序中,并執(zhí)行寫便箋的命令,將所述“你 好”的文本寫入便箋中;如果在所述用戶數(shù)據(jù)庫中未查找到預(yù)存的“你好”的語音對應(yīng)的“你 好”的文本,則再將所述“你好”的語音發(fā)送至公共語音數(shù)據(jù)庫中進行查找。
如果在所述公共語音數(shù)據(jù)庫中查找到了 “你好”的語音對應(yīng)的“你好”的文本,將 所述“你好”的文本返回到便箋應(yīng)用程序中,并執(zhí)行寫便箋的命令,將所述“你好”的文本寫 入便箋中;如果在所述公共語音數(shù)據(jù)庫沒有查找到“你好”的語音對應(yīng)的“你好”的文本,則 在手機端返回未檢索到有關(guān)語句的提示信息。
本發(fā)明實施例中,可以預(yù)先設(shè)定用戶數(shù)據(jù)庫,當(dāng)接收到用戶輸入的語音信息時,優(yōu) 先在用戶數(shù)據(jù)庫查找與該語音信息相匹配的語音數(shù)據(jù),如果在用戶數(shù)據(jù)庫中沒有查找到, 再發(fā)送到公共語音數(shù)據(jù)庫中進行匹配,并在應(yīng)用程序中根據(jù)用戶的語音指令調(diào)用所述語音 數(shù)據(jù),如果匹配不到,也會發(fā)出檢索失敗的提示信息。通過設(shè)置用戶數(shù)據(jù)庫,無需頻繁的在 網(wǎng)絡(luò)服務(wù)器端的公共語音數(shù)據(jù)庫中進行查找,減少了查找過程所需的時間,并且如果用戶 的口音偏重或者與標(biāo)準(zhǔn)的普通話有差異,也可以更精準(zhǔn)的查找用戶需要的語音數(shù)據(jù),提高 了移動終端的語音識別率,提升了用戶的體驗,使移動終端更加具備人性化的特點。
實施例三
請參見圖3,為本發(fā)明實施例提供一種語音識別的移動終端主要組成模塊的結(jié)構(gòu) 示意圖。如圖3所示,本發(fā)明實施例的所述移動終端I至少包括
語音輸入模塊11,用于在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;
具體實現(xiàn)中,所述應(yīng)用程序可以為移動終端中的便箋應(yīng)用、短信息應(yīng)用和聯(lián)系人 應(yīng)用等,所述移動終端I可以為手機、平板電腦等。應(yīng)用程序可通過調(diào)用語音輸入模塊11 的麥克風(fēng)等設(shè)備,接收用戶輸入的語音指令,所述語音指令包含語音信息。
以手機的聯(lián)系人應(yīng)用為例,聯(lián)系人應(yīng)用可提供語音撥號按鍵,用戶可以點擊該語 音撥號按鍵,聯(lián)系人應(yīng)用提示用戶輸出欲撥號的聯(lián)系人姓名,聯(lián)系人應(yīng)用通過調(diào)用語音輸 入模塊11的麥克風(fēng),接收用戶輸入的欲撥號的聯(lián)系人姓名,生成語音指令,該語音指令用 于指令應(yīng)用程序發(fā)起對該聯(lián)系人的撥號;其中,語音指令包含用戶輸入的聯(lián)系人姓名的語 音信息。
第一查找模塊12,用于從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);
具體實現(xiàn)中,所述用戶數(shù)據(jù)庫可以為用戶預(yù)先設(shè)定的數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫可 包含用戶輸入的語音數(shù)據(jù),該語音數(shù)據(jù)包含語音信息及該語音信息對應(yīng)的文本信息。所述 第一查找模塊12根據(jù)所述語音輸入模塊11接收到用戶輸入的語音指令所包含的語音信 息,在用戶數(shù)據(jù)庫中查找與所述語音信息匹配的語音數(shù)據(jù)。
依照上述模塊所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,當(dāng)所述語音輸入模塊11接收 到用戶輸入的撥號語音指令時,所述第一查找模塊12根據(jù)所述撥號語音指令中所包含的 欲撥號的聯(lián)系人姓名的語音信息,在用戶數(shù)據(jù)庫中查找相匹配的聯(lián)系人姓名的語音信息對 應(yīng)的聯(lián)系人姓名的文本信息。
第一執(zhí)行模塊13,用于如果所述第一查找模塊12在用戶數(shù)據(jù)庫中查找到與所述 語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音 指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中或遠程服務(wù)器中;
具體實現(xiàn)中,如果所述第一查找模塊12在用戶數(shù)據(jù)庫中查找到與用戶輸入的語 音指令所包含的語音信息相匹配的語音數(shù)據(jù),則將所述語音數(shù)據(jù)返回到應(yīng)用程序中,所述 第一執(zhí)行模塊13執(zhí)行用戶輸入的語音指令。
依照上述模塊所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果所述第一查找模塊12在 用戶數(shù)據(jù)庫中查找到與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本,且用戶 輸入的為撥號語音指令,則所述第一執(zhí)行模塊13在聯(lián)系人中匹配該聯(lián)系人姓名對應(yīng)的電 話號碼,調(diào)用該電話號碼進行撥號;如果所述第一查找模塊12在用戶數(shù)據(jù)庫中未查找到與 聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的語音數(shù)據(jù),優(yōu)選的,通過無線網(wǎng)絡(luò)W1-Fi將所 述聯(lián)系人姓名的語音信息發(fā)送到公共語音數(shù)據(jù)庫進行查找。
在本發(fā)明實施例中,所述一種語音識別的移動終端I還包括設(shè)置模塊來設(shè)置用戶 數(shù)據(jù)庫,還包括第二查找模塊、第二執(zhí)行模塊和提示模塊來完成所述移動終端I在公共語 音數(shù)據(jù)庫中的執(zhí)行過程。
下面將結(jié)合圖4,對所述設(shè)置模塊、第二查找模塊、第二執(zhí)行模塊和提示模塊進行 詳細介紹。
請參照圖4,為本發(fā)明實施例提供一種語音識別的移動終端的結(jié)構(gòu)示意圖。如圖4 所不,本發(fā)明實施例的所述移動終端I不僅包括語音輸入模塊11、第一查找模塊12和第一 執(zhí)行模塊13,還可以包括
設(shè)置模塊14,用于設(shè)置用戶數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫包含用戶輸入的語音數(shù)據(jù);
具體實現(xiàn)中,所述設(shè)置模塊14接收用戶輸入的語音信息,提取有效的清晰的語音 數(shù)據(jù),并將所述語音數(shù)據(jù)存放至用戶數(shù)據(jù)庫中。
具體的,請一并參照圖5,圖5為本發(fā)明實施例提供設(shè)置模塊的結(jié)構(gòu)示意圖。如圖 5所示,所述設(shè)置模塊14包括
接收單元141,用于接收用戶輸入的語音信息;
具體實現(xiàn)中,所述接收單元141接收所述用戶通過麥克風(fēng)等設(shè)備發(fā)出的語音信 息。以手機的聯(lián)系人應(yīng)用為例,在保存所述聯(lián)系人時,可以添加錄音選項,所述接收單元141 接收用戶錄音時的語音信息。
提取單元142,用于提取所述語音信息中有效的語音數(shù)據(jù);
具體實現(xiàn)中,當(dāng)接收單元141接收到所述語音信息時,所述提取單元142優(yōu)選的濾 除所述語音信息的背景和環(huán)境噪音,提取有效的清晰的語音數(shù)據(jù)。所述語音數(shù)據(jù)可以包含 用戶輸入的語音信息以及所述語音信息對應(yīng)的文本信息。
存儲單元143,用于將所述語音數(shù)據(jù)保存至所述用戶數(shù)據(jù)庫中;
具體實現(xiàn)中,所述存儲單元143將所述提取單元142提取的語音數(shù)據(jù)保存至用戶 數(shù)據(jù)庫中。
第二查找模塊15,用于如果所述第一查找模塊12在所述用戶數(shù)據(jù)庫中未查找到 與所述語音信息相匹配的語音數(shù)據(jù),則從公共語音數(shù)據(jù)庫中查找與所述語音信息相匹配的 語音數(shù)據(jù);
具體實現(xiàn)中,所述公共語音數(shù)據(jù)庫可以為供應(yīng)商默認設(shè)置的語音庫,所述數(shù)據(jù)庫 可以包含國際標(biāo)準(zhǔn)的普通話、英語和國內(nèi)標(biāo)準(zhǔn)的方言等語音信息以及這些語音信息對應(yīng)的 文本信息。
依照上述模塊所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果所述第一查找模塊12在 所述用戶數(shù)據(jù)庫中未查找到與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本 信息,則所述第二查找模塊15優(yōu)選的將所述聯(lián)系人姓名的語音信息通過無線網(wǎng)絡(luò)W1-Fi傳輸至公共語音數(shù)據(jù)庫中進行查找。
第二執(zhí)行模塊16,用于如果所述第二查找模塊15在所述公共語音數(shù)據(jù)庫中查找 到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行 所述語音指令,所述公共語音數(shù)據(jù)庫設(shè)于網(wǎng)絡(luò)服務(wù)器;
具體實現(xiàn)中,如果在所述公共語音數(shù)據(jù)庫中查找到與用戶輸入的語音指令所包含 的語音信息相匹配的語音數(shù)據(jù),則將所述語音數(shù)據(jù)返回到應(yīng)用程序中,執(zhí)行用戶輸入的語 首指令。
依照上述模塊所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果所述第二查找模塊15在 公共語音數(shù)據(jù)庫中查找到與預(yù)撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名的文本信 息,則返回該文本到手機中,如果用戶輸入的為撥號語音指令,則所述第二執(zhí)行模塊16在 聯(lián)系人中匹配該聯(lián)系人姓名對應(yīng)的電話號碼,調(diào)用該電話號碼進行撥號。
提示模塊17,用于如果所述第二查找模塊15在所述公共語音數(shù)據(jù)庫中未查找到 與所述語音指令信息相匹配的語音數(shù)據(jù),則發(fā)出提示信息;
具體實現(xiàn)中,所述提示信息可以為在移動終端I上顯示未查找到的提示信息。
依照上述模塊所示例子,在手機的聯(lián)系人應(yīng)用當(dāng)中,如果所述第二查找模塊15在 所述公共語音數(shù)據(jù)庫中也沒有找到與欲撥號的聯(lián)系人姓名的語音信息對應(yīng)的聯(lián)系人姓名 的文本信息,則提示模塊17在手機端返回未檢索到有關(guān)聯(lián)系人的提示信息。
下面以一個具體例子來說明本發(fā)明的移動終端中各模塊單元的動作原理。
本實施例中,所述應(yīng)用程序為便箋,所述語音指令為寫便箋和輸入語音“你好”這 兩個操作,執(zhí)行步驟如下
用戶可以預(yù)先的在便箋的常用語句中添加“你好”的語句,并且通過所述設(shè)置模塊 14的接收單元141對該語句進行錄音,所述設(shè)置模塊14的提取單元142通過濾除所述錄音 的背景和環(huán)境的噪音,提取清晰的“你好”的語音,所述設(shè)置單元14的存儲單元143將該包 含“你好”的語音和其對應(yīng)的文本在內(nèi)的語音數(shù)據(jù)保存在用戶數(shù)據(jù)庫中。
所述用戶點擊“寫便箋”的按鍵,向移動終端發(fā)出“你好”的語音,所述語音輸入模 塊11接收到所述“你好”的語音,所述第一查找模塊12優(yōu)先在所述用戶數(shù)據(jù)庫中查找到預(yù) 存的“你好”的語音對應(yīng)的“你好”的文本,將所述“你好”的文本返回到便箋應(yīng)用程序中,所 述第一執(zhí)行模塊13執(zhí)行寫便箋的命令,將所述“你好”的文本寫入便箋中;如果所述第一查 找模塊12在所述用戶數(shù)據(jù)庫中未查找到預(yù)存的“你好”的語音對應(yīng)的“你好”的文本,則所 述第二查找模塊15再將所述“你好”的語音發(fā)送至公共語音數(shù)據(jù)庫中進行查找。
如果所述第二查找模塊15在所述公共語音數(shù)據(jù)庫中查找到了“你好”的語音對應(yīng) 的“你好”的文本,將所述“你好”的文本返回到便箋應(yīng)用程序中,所述第二執(zhí)行模塊16執(zhí) 行寫便箋的命令,將所述“你好”的文本寫入便箋中;如果所述第二查找模塊15在所述公共 語音數(shù)據(jù)庫沒有查找到“你好”的語音對應(yīng)的“你好”的文本,則所述提示模塊17在手機端 顯示未檢索到有關(guān)語句的提示信息。
本發(fā)明實施例中,可以預(yù)先設(shè)定用戶數(shù)據(jù)庫,當(dāng)接收到用戶輸入的語音信息時,優(yōu) 先在用戶數(shù)據(jù)庫查找與該語音信息相匹配的語音數(shù)據(jù),如果在用戶數(shù)據(jù)庫中沒有查找到, 再發(fā)送到公共語音數(shù)據(jù)庫中進行匹配,并在應(yīng)用程序中根據(jù)用戶的語音指令調(diào)用所述語音 數(shù)據(jù),如果匹配不到,也會發(fā)出檢索失敗的提示信息。通過設(shè)置用戶數(shù)據(jù)庫,無需頻繁的在網(wǎng)絡(luò)服務(wù)器端的公共語音數(shù)據(jù)庫中進行查找,減少了查找過程所需的時間,并且如果用戶 的口音偏重或者與標(biāo)準(zhǔn)的普通話有差異,也可以更精準(zhǔn)的查找用戶需要的語音數(shù)據(jù),提高 了移動終端的語音識別率,提升了用戶的體驗,使移動終端更加具備人性化的特點。
本發(fā)明實施例中所述模塊或單元,可以通過通用集成電路,例如CPU (Central Processing Unit,中央處理器),或通過ASIC(Application SpecificIntegrated Circuit, 專用集成電路)來實現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以 通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì) 中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁 碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random Access Memory, RAM)等。
以上所揭露的僅為本發(fā)明較佳實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范 圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種語音識別的方法,其特征在于,包括在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中或遠程服務(wù)器中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在應(yīng)用程序中接收輸入的語音指令之前, 包括設(shè)置所述用戶數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫包含用戶輸入的語音數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述設(shè)置所述用戶數(shù)據(jù)庫包括接收用戶輸入的語音信息;提取所述語音信息中有效的語音數(shù)據(jù);將所述語音數(shù)據(jù)保存至所述用戶數(shù)據(jù)庫中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù),還包括如果在所述用戶數(shù)據(jù)庫中未查找到與所述語音信息相匹配的語音數(shù)據(jù),則從公共語音數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);如果在公共語音數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述公共語音數(shù)據(jù)庫設(shè)于網(wǎng)絡(luò)服務(wù)器。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從公共語音數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù),還包括如果在所述公共語音數(shù)據(jù)庫中未查找到與所述語音指令信息相匹配的語音數(shù)據(jù),則發(fā)出提示信息。
6.一種語音識別的移動終端,其特征在于,包括語音輸入模塊,用于在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信第一查找模塊,用于從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);第一執(zhí)行模塊,用于如果所述第一查找模塊在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令,所述用戶數(shù)據(jù)庫設(shè)于移動終端中或遠程服務(wù)器中。
7.根據(jù)權(quán)利要求6所述的移動終端,其特征在于,還包括設(shè)置模塊,用于設(shè)置用戶數(shù)據(jù)庫,所述用戶數(shù)據(jù)庫包含用戶輸入的語音數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的移動終端,其特征在于,所述設(shè)置模塊包括接收單元,用于接收用戶輸入的語音信息;提取單元,用于提取所述語音信息中有效的語音數(shù)據(jù);存儲單元,用于將所述語音數(shù)據(jù)保存至所述用戶數(shù)據(jù)庫中。
9.根據(jù)權(quán)利要求6所述的移動終端,其特征在于,還包括第二查找模塊,用于如果所述第一查找模塊在所述用戶數(shù)據(jù)庫中未查找到與所述語音信息相匹配的語音數(shù)據(jù),則從公共語音數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);第二執(zhí)行模塊,用于如果所述第二查找模塊在公共語音數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令, 所述公共語音數(shù)據(jù)庫設(shè)于網(wǎng)絡(luò)服務(wù)器。
10.根據(jù)權(quán)利要求9所述的移動終端,其特征在于,還包括提示模塊,用于如果所述第二查找模塊在所述公共語音數(shù)據(jù)庫中未查找到與所述語音指令信息相匹配的語音數(shù)據(jù),則發(fā)出提示信息。
全文摘要
本發(fā)明實施例公開了一種語音識別的方法及移動終端,其中方法包括如下步驟在應(yīng)用程序中接收輸入的語音指令,所述語音指令包含語音信息;從用戶數(shù)據(jù)庫中查找與所述語音信息相匹配的語音數(shù)據(jù);如果在用戶數(shù)據(jù)庫中查找到與所述語音信息相匹配的語音數(shù)據(jù),則在應(yīng)用程序中調(diào)用查找到的所述語音數(shù)據(jù)以執(zhí)行所述語音指令。提高了移動終端的語音識別率,提升了用戶的體驗,使移動終端更加具備人性化的特點。
文檔編號G10L15/22GK103000175SQ20121050867
公開日2013年3月27日 申請日期2012年12月3日 優(yōu)先權(quán)日2012年12月3日
發(fā)明者秦敏榕 申請人:深圳市金立通信設(shè)備有限公司