一種身份識(shí)別的方法及裝置制造方法
【專利摘要】本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法及裝置,涉及電視【技術(shù)領(lǐng)域】,用于提高用戶身份識(shí)別的準(zhǔn)確率。所述方法,包括:接收用戶的語(yǔ)音信號(hào);提取所述語(yǔ)音信號(hào)的第一參數(shù);分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶。
【專利說(shuō)明】一種身份識(shí)別的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電視【技術(shù)領(lǐng)域】,尤其涉及一種身份識(shí)別的方法及裝置。
【背景技術(shù)】
[0002]在現(xiàn)在高度信息化的生活中,電視設(shè)備早已超越了最初單純收看影畫的基本屬性,取而代之的是電視設(shè)備的智能化,其中,智能語(yǔ)音電視設(shè)備為智能電視設(shè)備的一種。為了滿足用戶的使用需求,現(xiàn)有的智能語(yǔ)音電視設(shè)備設(shè)置有兩種工作模式,即通用模式與個(gè)性化模式。在通用模式下,電視設(shè)備根據(jù)用戶輸入的語(yǔ)音指令直接執(zhí)行相應(yīng)的播放操作;在個(gè)性化模式下,電視設(shè)備根據(jù)用戶的訪問記錄向用戶推薦節(jié)目,方便用戶選擇自身喜愛的節(jié)目。
[0003]在現(xiàn)有技術(shù)中,在智能語(yǔ)音電視設(shè)備啟動(dòng)時(shí),處于通用模式,當(dāng)用戶需要在個(gè)性化模式下進(jìn)行觀影時(shí),通常采用聲紋識(shí)別的方法將通用模式切換為個(gè)性化模式,即電視設(shè)備接收用戶輸入的語(yǔ)音信號(hào),并將接收到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,從而在預(yù)處理后的語(yǔ)音信號(hào)中提取聲紋信息,并將提取的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)進(jìn)行匹配,當(dāng)提取的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)匹配時(shí),則確定用戶的身份,并向用戶呈現(xiàn)與該用戶相對(duì)應(yīng)的個(gè)性化界面,即將通用模式切換為個(gè)性化模式。
[0004]在上述實(shí)現(xiàn)模式切換的方法中,采用聲紋識(shí)別的方法將通用模式切換為個(gè)性化模式時(shí),當(dāng)用戶A與用戶B的聲紋特征非常接近時(shí),若電視設(shè)備對(duì)用戶A的身份進(jìn)行識(shí)別,電視設(shè)備在接收到的用戶A的語(yǔ)音信號(hào)中提取用戶A的聲紋信息,并將用戶A的聲紋信息與存儲(chǔ)器中存儲(chǔ)的語(yǔ)音信息數(shù)據(jù)進(jìn)行匹配,此時(shí),可能存在用戶A的聲紋信息與存儲(chǔ)器中存儲(chǔ)的用戶B的語(yǔ)音信息數(shù)據(jù)相匹配,則確定的用戶為用戶B,即用戶身份識(shí)別錯(cuò)誤,從而導(dǎo)致電視設(shè)備根據(jù)用戶B的訪問記錄向用戶A推薦用戶B喜愛的節(jié)目。因此,采用聲紋識(shí)別的方法來(lái)確定用戶的身份時(shí),導(dǎo)致用戶身份識(shí)別的準(zhǔn)確率不高。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的實(shí)施例提供了一種身份識(shí)別的方法及裝置,用于提高用戶身份識(shí)別的準(zhǔn)確率。
[0006]為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
[0007]第一方面,本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,包括:接收用戶的語(yǔ)音信號(hào);提取所述語(yǔ)音信號(hào)的第一參數(shù);分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶。
[0008]在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述語(yǔ)音信號(hào)通過麥克風(fēng)陣列獲取。[0009]結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第二種可能的實(shí)現(xiàn)方式中,當(dāng)所述最大第一概率小于所述第一閾值,通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)
音信號(hào)。
[0010]結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶進(jìn)行注冊(cè)。
[0011]結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0012]結(jié)合第一方面,在第一方面的第五種可能的實(shí)現(xiàn)方式中,對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
[0013]結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第一方面的第六種可能的實(shí)現(xiàn)方式中,所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0014]結(jié)合第一方面的第一至第六任一種可能的實(shí)現(xiàn)方式,在第一方面的第七種可能的實(shí)現(xiàn)方式中,所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第一參數(shù)包括美爾頻率倒譜系數(shù)MFCC。
[0015]第二方面,本發(fā)明實(shí)施例提供了一種電視設(shè)備,包括:接收單元,用于接收用戶的語(yǔ)音信號(hào);處理單元,用于提取所述語(yǔ)音信號(hào)的第一參數(shù);所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率;所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率;所述處理單元,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;所述處理單元,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶,并切換至所述用戶對(duì)應(yīng)的個(gè)性化模式。
[0016]在第二方面的第一種可能的實(shí)現(xiàn)方式中,所述接收單元,具體用于通過所述麥克風(fēng)陣列獲取所述語(yǔ)音信號(hào)。
[0017]結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二方面的第二種可能的實(shí)現(xiàn)方式中,所述接收單元,還用于在所述最大第一概率小于所述第一閾值時(shí),通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)音信號(hào)。
[0018]結(jié)合第二方面,在第二方面的第三種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶進(jìn)行注冊(cè)。
[0019]結(jié)合第二方面的第三種可能的實(shí)現(xiàn)方式,在第二方面的第四種可能的實(shí)現(xiàn)方式中,所述接收單元,還用于通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào);所述處理單元,還用于對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;所述處理單元,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0020]結(jié)合第二方面,在第二方面的第五種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。[0021]結(jié)合第二方面,在第二方面的第六種可能的實(shí)現(xiàn)方式中,所述處理單元,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶不是所述最大第二概率對(duì)應(yīng)的用戶,并切換至通用模式。
[0022]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法及裝置,電視設(shè)備接收到用戶的語(yǔ)音信號(hào)之后,在接收的用戶的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶為最大第二概率對(duì)應(yīng)的用戶,從而根據(jù)用戶的語(yǔ)音內(nèi)容及聲紋特征確定用戶的用戶身份。這樣,當(dāng)用戶A與用戶B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶A與用戶B的聲紋信息確定用戶的身份,會(huì)導(dǎo)致對(duì)用戶的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶A與用戶B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶的用戶身份,從而提高了身份識(shí)別的準(zhǔn)確率。
【專利附圖】
【附圖說(shuō)明】
[0023]為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0024]圖1為本發(fā)明實(shí)施例提供的一種身份識(shí)別的方法的流程示意圖;
[0025]圖2為本發(fā)明實(shí)施例提供的另一種身份識(shí)別的方法的流程示意圖;
[0026]圖3為本發(fā)明實(shí)施例提供的一種電視設(shè)備的功能示意圖。
【具體實(shí)施方式】
[0027]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,應(yīng)用于帶有麥克風(fēng)陣列的電視設(shè)備中,如圖1所示,包括:
[0029]101、接收用戶的語(yǔ)音信號(hào)。
[0030]102、提取所述語(yǔ)音信號(hào)的第一參數(shù)。
[0031]其中,所述第一參數(shù)為所述用戶的語(yǔ)音信號(hào)的特征參數(shù)。
[0032]進(jìn)一步的,所述第一參數(shù)包括MFCC(MelFrequency Cepstrum Coefficient,美爾頻率倒譜系數(shù))。
[0033]具體的,電視設(shè)備在獲取到用戶的語(yǔ)音信號(hào)之后,將獲取的語(yǔ)音信號(hào)進(jìn)行FFT (Fast Fourier Transform,快速傅里葉變換),即將時(shí)域的語(yǔ)音信號(hào)轉(zhuǎn)換為頻域的語(yǔ)音信號(hào),再將頻域的語(yǔ)音信號(hào)經(jīng)過由至少一個(gè)帶通濾波器組成的頻率濾波器,得到頻域的語(yǔ)音信號(hào)的對(duì)數(shù)能量譜,進(jìn)而將頻域的語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT(DisCrete CosineTransform,離散余弦變換),從而得到用戶的語(yǔ)音信號(hào)的MFCC參數(shù)。
[0034]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法獲取用戶的語(yǔ)音信號(hào)的MFCC參數(shù),本發(fā)明對(duì)此不作限制。
[0035]需要說(shuō)明的是,第一參數(shù)還可以是其他參數(shù),例如LPCC(Linear PredictiveCoefficient,線性預(yù)測(cè)倒譜系數(shù)),本發(fā)明對(duì)此不做限制。
[0036]103、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0037]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0038]具體的,電視設(shè)備在提取出用戶的語(yǔ)音信號(hào)的第一參數(shù)后,即得到用戶的語(yǔ)音信號(hào)的特征向量,并將用戶的語(yǔ)音信號(hào)的特征向量分別與預(yù)先存儲(chǔ)的至少一個(gè)第一模型參數(shù)進(jìn)行第一模型匹配,例如,分別計(jì)算用戶的語(yǔ)音信號(hào)的特征向量與預(yù)先存儲(chǔ)的每一個(gè)第一模型參數(shù)的第一概率,并在計(jì)算出的所有第一概率中確定出最大第一概率,并將最大第一概率確定為語(yǔ)音內(nèi)容識(shí)別的結(jié)果。
[0039]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法確定用戶的語(yǔ)音信號(hào)的特征向量與預(yù)先存儲(chǔ)的每一個(gè)第一模型參數(shù)的第一概率,本發(fā)明對(duì)此不作限制。
[0040]104、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0041]其中,所述第二模型參數(shù)為與用戶特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0042]具體的,電視設(shè)備在得到用戶的語(yǔ)音信號(hào)的特征向量之后,將用戶的語(yǔ)音信號(hào)的特征向量分別與預(yù)先存儲(chǔ)的每一個(gè)已注冊(cè)用戶的第二模型參數(shù)進(jìn)行第二模型匹配,例如,分別計(jì)算用戶的語(yǔ)音信號(hào)的特征向量與每一個(gè)已注冊(cè)用戶的第二模型參數(shù)的第二概率,并在計(jì)算出的所有已注冊(cè)用戶對(duì)應(yīng)的第二概率中確定出最大第二概率,并將最大第二概率確定為對(duì)用戶的聲紋識(shí)別的結(jié)果,由于每一個(gè)已注冊(cè)用戶與第二模型參數(shù)是一一對(duì)應(yīng)的,因此,可以根據(jù)最大第二概率對(duì)應(yīng)的第二模型參數(shù)來(lái)確定此第二模型參數(shù)對(duì)應(yīng)的用戶。
[0043]需要說(shuō)明的是,電視設(shè)備還可以根據(jù)其他方法確定用戶的語(yǔ)音信號(hào)的特征向量與每一個(gè)已注冊(cè)用戶對(duì)應(yīng)的第二模型參數(shù)的第二概率,本發(fā)明對(duì)此不作限制。
[0044]105、將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0045]具體的,電視設(shè)備在確定最大第一概率之后,將最大第一概率與預(yù)先設(shè)定的與語(yǔ)音內(nèi)容有關(guān)的第一閾值進(jìn)行比較,在確定最大第一概率不小于預(yù)先設(shè)定的與語(yǔ)音內(nèi)容有關(guān)的第一閾值時(shí),則確定對(duì)用戶的語(yǔ)音內(nèi)容識(shí)別的結(jié)果正確,此時(shí),將用戶的語(yǔ)音內(nèi)容識(shí)別的結(jié)果與聲紋識(shí)別的結(jié)果進(jìn)行結(jié)合,并確定用戶的語(yǔ)音內(nèi)容識(shí)別的結(jié)果與聲紋識(shí)別的結(jié)果所占的比例,進(jìn)而將最大第一概率與最大第二概率進(jìn)行加權(quán)運(yùn)算,從而得到運(yùn)算結(jié)果。
[0046]需要說(shuō)明的是,電視設(shè)備還可以將最大第二概率與最大第一概率進(jìn)行其他運(yùn)算,本發(fā)明對(duì)此不做限制。
[0047]106、將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶。[0048]具體的,電視設(shè)備將加權(quán)運(yùn)算后的運(yùn)算結(jié)果與預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值進(jìn)行比較,當(dāng)確定運(yùn)算結(jié)果不小于與預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值時(shí),則確定輸入語(yǔ)音信號(hào)的用戶為根據(jù)最大第二概率確定的用戶,即為電視設(shè)備識(shí)別用戶的身份成功。
[0049]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,電視設(shè)備接收到用戶的語(yǔ)音信號(hào)之后,在接收的用戶的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶為最大第二概率對(duì)應(yīng)的用戶,從而根據(jù)用戶的語(yǔ)音內(nèi)容及聲紋特征確定用戶的用戶身份。這樣,當(dāng)用戶A與用戶B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶A與用戶B的聲紋信息確定用戶的身份,會(huì)導(dǎo)致對(duì)用戶的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶A與用戶B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶的用戶身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0050]本發(fā)明實(shí)施例提供了另一種身份識(shí)別的方法,應(yīng)用于帶有麥克風(fēng)陣列的電視設(shè)備中,如圖2所示,包括:
[0051]201、獲取注冊(cè)指令。
[0052]具體的,電視設(shè)備在檢測(cè)到有注冊(cè)指令時(shí),則確定在接收到用戶輸入的語(yǔ)音信號(hào)時(shí),需要對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行注冊(cè)。
[0053]202、通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0054]其中,所述注冊(cè)語(yǔ)音信號(hào)包括所述用戶輸入至所述麥克風(fēng)陣列的至少一次語(yǔ)音信號(hào)。所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0055]具體的,電視設(shè)備通過麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,即首先對(duì)獲取的注冊(cè)語(yǔ)音信號(hào)通過一個(gè)一階有限激勵(lì)響應(yīng)高通濾波器,使得注冊(cè)語(yǔ)音信號(hào)的頻譜變得平坦的預(yù)加重處理,然后對(duì)預(yù)加重處理后的語(yǔ)音信號(hào)進(jìn)行分幀處理,得到至少一幀語(yǔ)音信號(hào),并將得到的每一幀語(yǔ)音信號(hào)分別進(jìn)行加窗處理,從而減小吉布斯效應(yīng)的影響,進(jìn)一步對(duì)加窗處理后的語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)來(lái)確定用戶輸入的注冊(cè)語(yǔ)音信號(hào)的開始與結(jié)束位置,并去除語(yǔ)音信號(hào)開始與結(jié)束時(shí)的空白噪聲,從而完成對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理。
[0056]需要說(shuō)明的是,電視設(shè)備對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理還可以包括其他處理,例如,在預(yù)加重處理之前對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)濾波,采樣和量化處理,本發(fā)明對(duì)此不做限制。
[0057]203、提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0058]其中,所述第二參數(shù)為所述用戶的注冊(cè)語(yǔ)音信號(hào)的特征參數(shù)。
[0059]進(jìn)一步的,所述第一模型包括HMM(Hidden Markov Model,隱馬爾可夫模型);所述第二模型包括GMM (Gaussian Mixture Model,高斯混合模型);所述第二參數(shù)包括MFCC參數(shù)。
[0060]具體的,電視設(shè)備在將獲取到的用戶的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理之后,將經(jīng)過加窗處理后的每一幀語(yǔ)音信號(hào)分別進(jìn)行FFT變換,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù),再將每一幀語(yǔ)音信號(hào)的頻譜參數(shù)經(jīng)過由至少一個(gè)帶通濾波器組成的頻率濾波器,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù)的對(duì)數(shù)能量譜,進(jìn)而將每一幀語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT (DiscreteCosine Transform,離散余弦變換),從而得到用戶的注冊(cè)語(yǔ)音信號(hào)的MFCC參數(shù),即得到用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量,并將用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行HMM模型訓(xùn)練,以得到與用戶的注冊(cè)語(yǔ)音內(nèi)容相關(guān)的模型參數(shù),即將用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量作為HMM模型訓(xùn)練的輸入,與HMM模型預(yù)先設(shè)定的初始模型參數(shù)根據(jù)預(yù)設(shè)的規(guī)則不斷調(diào)整模型參數(shù),并構(gòu)成新的模型,以使得輸出概率最大,并將最大輸出概率對(duì)應(yīng)的模型參數(shù)確定為第一模型參數(shù)。
[0061]再將用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行GMM模型訓(xùn)練,以得到與用戶的聲紋相關(guān)的模型參數(shù),即將用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量作為GMM模型訓(xùn)練的輸入,與GMM模型預(yù)先設(shè)定的初始模型參數(shù)根據(jù)預(yù)設(shè)的規(guī)則訓(xùn)練,并在訓(xùn)練后的數(shù)據(jù)中確定最大似然度對(duì)應(yīng)的模型參數(shù),并將此模型參數(shù)確定為第二模型參數(shù)。
[0062]需要說(shuō)明的是,電視設(shè)備對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行HMM模型訓(xùn)練及GMM模型訓(xùn)練的具體過程,與現(xiàn)有技術(shù)中對(duì)語(yǔ)音信號(hào)的特征向量的HMM模型訓(xùn)練及GMM模型訓(xùn)練的過程相同,本發(fā)明在此不再贅述。
[0063]需要說(shuō)明的是,用戶的注冊(cè)語(yǔ)音信號(hào)中的每一個(gè)語(yǔ)音信號(hào)的內(nèi)容相同,對(duì)于相同內(nèi)容的語(yǔ)音信號(hào)訓(xùn)練后得到的第一模型參數(shù)及第二模型參數(shù)均只有一個(gè)。對(duì)于不同內(nèi)容的語(yǔ)音信號(hào)訓(xùn)練后得到的第一模型參數(shù)及第二模型參數(shù)的個(gè)數(shù)與語(yǔ)音內(nèi)容的個(gè)數(shù)相對(duì)應(yīng)。
[0064]需要說(shuō)明的是,第二參數(shù)還可以是其他參數(shù),例如LPCC系數(shù),本發(fā)明對(duì)此不做限制。
[0065]需要說(shuō)明的是,電視設(shè)備還可以對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)的特征向量進(jìn)行其他模型訓(xùn)練,以得到與用戶的語(yǔ)音內(nèi)容相關(guān)的模型參數(shù)及與用戶的聲紋相關(guān)的模型參數(shù),本發(fā)明對(duì)此不作限制。
[0066]204、將所述第一模型參數(shù)與所述第二模型參數(shù)進(jìn)行存儲(chǔ)。
[0067]具體的,電視設(shè)備在確定第一模型參數(shù)與第二模型參數(shù)之后,需要將第一模型參數(shù)與第二模型參數(shù)進(jìn)行存儲(chǔ),以便電視設(shè)備在接收到用戶的語(yǔ)音信號(hào)時(shí),根據(jù)存儲(chǔ)的第一模型參數(shù)確定用戶的語(yǔ)音內(nèi)容,根據(jù)存儲(chǔ)的第二模型參數(shù)確定用戶的用戶身份。
[0068]205、接收用戶的語(yǔ)音信號(hào)。
[0069]具體的,電視設(shè)備通過麥克風(fēng)陣列獲取用戶的語(yǔ)音信號(hào)。
[0070]206、對(duì)所述語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0071]具體的,電視設(shè)備對(duì)用戶的語(yǔ)音信號(hào)的預(yù)處理過程,與電視設(shè)備對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)的預(yù)處理過程類似,可參考步驟202,本發(fā)明在此不再贅述。
[0072]207、在所述進(jìn)行預(yù)處理之后的用戶的語(yǔ)音信號(hào)中提取第一參數(shù)。
[0073]其中,所述第一參數(shù)包括MFCC參數(shù)。
[0074]具體的,電視設(shè)備在將獲取到的用戶的語(yǔ)音信號(hào)進(jìn)行預(yù)處理之后,將經(jīng)過加窗處理后的每一幀語(yǔ)音信號(hào)分別進(jìn)行FFT變換,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù),再將每一幀語(yǔ)音信號(hào)的頻譜參數(shù)經(jīng)過由至少一個(gè)帶通濾波器組成的頻率濾波器,得到每一幀語(yǔ)音信號(hào)的頻譜參數(shù)的對(duì)數(shù)能量譜,進(jìn)而將每一幀語(yǔ)音信號(hào)的對(duì)數(shù)能量譜進(jìn)行DCT變換,從而得到用戶的語(yǔ)音信號(hào)的MFCC參數(shù)。
[0075]需要說(shuō)明的是,第二參數(shù)與第一參數(shù)相同,當(dāng)?shù)谝粎?shù)為MFCC參數(shù)時(shí),第二參數(shù)也為MFCC參數(shù);當(dāng)?shù)谝粎?shù)為L(zhǎng)PCC參數(shù)時(shí),第二參數(shù)也為L(zhǎng)PCC參數(shù)。
[0076]需要說(shuō)明的是,電視設(shè)備在執(zhí)行完步驟207之后,可以先執(zhí)行步驟208,再執(zhí)行步驟209 ;也可以先執(zhí)行步驟209,再執(zhí)行步驟208 ;或者步驟208與步驟209同時(shí)執(zhí)行,本發(fā)明對(duì)此不做限制。
[0077]208、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0078]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0079]具體的,可參考步驟103,本發(fā)明在此不再贅述。
[0080]209、分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0081]其中,所述第二模型參數(shù)為與用戶特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0082]具體的,可參考步驟104,本發(fā)明在此不再贅述。
[0083]需要說(shuō)明的是,電視設(shè)備將最大第一概率與第一閾值進(jìn)行比較的結(jié)果不同,執(zhí)行的步驟也不同,在確定最大第一概率不小于第一閾值時(shí),則執(zhí)行步驟210-211,步驟214-215 ;在確定最大第一概率小于第一閾值時(shí),則執(zhí)行步驟212-215。
[0084]需要說(shuō)明的是,電視設(shè)備在確定最大第一概率不小于第一閾值后,執(zhí)行步驟210與步驟211沒有先后順序,本發(fā)明對(duì)此不做限制。
[0085]210、將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0086]具體的,可參考步驟105,本發(fā)明在此不再贅述。
[0087]211、若所述最大第一概率不小于所述第一閾值,則激活所述麥克風(fēng)陣列。
[0088]具體的,電視設(shè)備在確定出最大第一概率不小于第一閾值時(shí),則激活麥克風(fēng)陣列,以使得用戶通過麥克風(fēng)陣列輸入語(yǔ)音指令,從而使得電視設(shè)備根據(jù)用戶輸入的語(yǔ)音指令執(zhí)行相應(yīng)的操作。
[0089]需要說(shuō)明的是,電視設(shè)備在確定最大第一概率小于第一閾值時(shí),有兩種實(shí)現(xiàn)方法,在直接通過所述麥克風(fēng)陣列重新獲取用戶的語(yǔ)音信號(hào)時(shí),則執(zhí)行步驟212;在提示用戶進(jìn)行注冊(cè)時(shí),則執(zhí)行步驟213。
[0090]212、當(dāng)所述最大第一概率小于所述第一閾值,通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)音信號(hào)。
[0091]具體的,電視設(shè)備在確定出最大第一概率小于第一閾值時(shí),則確定對(duì)用戶輸入的語(yǔ)音內(nèi)容識(shí)別的結(jié)果不正確,此時(shí),電視設(shè)備可以重新獲取用戶的語(yǔ)音信號(hào)。
[0092]213、當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶進(jìn)行注冊(cè)。
[0093]具體的,電視設(shè)備在確定最大第一概率小于第一閾值時(shí),可以通過語(yǔ)音設(shè)備輸出有關(guān)注冊(cè)的語(yǔ)音,以使得用戶接收到此語(yǔ)音后,輸入用戶的注冊(cè)語(yǔ)音信號(hào)。[0094]214、將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶。
[0095]具體的,可參考步驟105,本發(fā)明在此不再贅述。
[0096]本發(fā)明實(shí)施例提供了一種身份識(shí)別的方法,電視設(shè)備在獲取到注冊(cè)指令后,通過麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并對(duì)預(yù)處理后的注冊(cè)語(yǔ)音信號(hào)提取第二參數(shù),并對(duì)第二參數(shù)分別進(jìn)行第一模型訓(xùn)練及第二模型訓(xùn)練,得到第一模型參數(shù)及第二模型參數(shù),并將第一模型參數(shù)及第二模型參數(shù)進(jìn)行存儲(chǔ),從而,電視設(shè)備在接收到用戶的語(yǔ)音信號(hào)之后,在接收的用戶的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶的聲紋特征進(jìn)行識(shí)另II,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶為最大第二概率對(duì)應(yīng)的用戶,從而根據(jù)用戶的語(yǔ)音內(nèi)容及聲紋特征確定用戶的用戶身份。這樣,當(dāng)用戶A與用戶B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶A與用戶B的聲紋信息確定用戶的身份,會(huì)導(dǎo)致對(duì)用戶的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶A與用戶B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶的用戶身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0097]如圖3所示,其為本發(fā)明實(shí)施例提供了一種電視設(shè)備的功能示意圖。參考圖3所示,該設(shè)備包括:接收單元301及處理單元304。
[0098]所述接收單元301,用于接收用戶的語(yǔ)音信號(hào)。
[0099]所述處理單元302,用于提取所述語(yǔ)音信號(hào)的第一參數(shù)。
[0100]其中,所述第一參數(shù)為所述用戶的語(yǔ)音信號(hào)的特征參數(shù)。
[0101]進(jìn)一步的,所述第一參數(shù)包括MFCC參數(shù)。
[0102]所述處理單元302,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率。
[0103]其中,所述第一模型參數(shù)為與語(yǔ)音內(nèi)容相關(guān)的,且為最大輸出概率對(duì)應(yīng)的參數(shù)。
[0104]所述處理單元302,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率。
[0105]其中,所述第二模型參數(shù)為與用戶特征有關(guān)的,且為最大似然度對(duì)應(yīng)的參數(shù)。
[0106]所述處理單元302,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算。
[0107]所述處理單元302,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶,并切換至所述用戶對(duì)應(yīng)的個(gè)性化模式。
[0108]其中,所述個(gè)性化模式為所述電視設(shè)備根據(jù)用戶的訪問記錄為用戶提供服務(wù)的模式。
[0109]具體的,所述處理單元302在確定用戶為最大第二條件概率對(duì)應(yīng)的用戶后,將切換至此用戶對(duì)應(yīng)的個(gè)性化模式,進(jìn)而根據(jù)已存儲(chǔ)的用戶的訪問記錄來(lái)向用戶提供服務(wù),例如根據(jù)已存儲(chǔ)的用戶的訪問記錄來(lái)向用戶推薦電視節(jié)目,以使得用戶根據(jù)推薦的電視節(jié)目快速選擇自身喜愛的電視節(jié)目,而不需要對(duì)所有電視頻道進(jìn)行切換來(lái)選擇自身喜愛的節(jié)目,提聞了用戶體驗(yàn)。
[0110]進(jìn)一步的,所述接收單元301,還用于獲取注冊(cè)指令。
[0111]所述接收單元301,還用于通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào)。
[0112]其中,所述用戶的注冊(cè)語(yǔ)音信號(hào)包括所述用戶輸入至所述麥克風(fēng)陣列的至少一次
語(yǔ)音信號(hào)。
[0113]所述處理單元302,還用于對(duì)所述用戶的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0114]其中,所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
[0115]所述處理單元302,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
[0116]其中,所述第二參數(shù)為所述用戶的注冊(cè)語(yǔ)音信號(hào)的特征參數(shù)。所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第二參數(shù)包括MFCC參數(shù)。
[0117]所述處理單元302,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取第一參數(shù)。
[0118]所述處理單元302,還用于在確定所述最大第一概率不小于所述第一閾值時(shí),激活所述麥克風(fēng)陣列。
[0119]所述處理單元302,還用于在所述最大第一概率小于所述第一閾值時(shí),通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)音信號(hào)。
[0120]所述處理單元302,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶進(jìn)行注冊(cè)。
[0121]所述處理單元302,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶不是所述最大第二概率對(duì)應(yīng)的用戶,并切換至通用模式。
[0122]其中,所述通用模式為所述電視設(shè)備根據(jù)所述用戶輸入的語(yǔ)音指令直接執(zhí)行相應(yīng)的播放操作的模式。
[0123]具體的,所述處理單元302在確定運(yùn)算結(jié)果小于預(yù)先設(shè)定的與聲紋識(shí)別相關(guān)的第二閾值時(shí),則確定輸入語(yǔ)音信號(hào)的用戶不是根據(jù)最大第二概率確定的用戶,即為識(shí)別用戶身份失敗,則將電視模式切換為通用模式,進(jìn)而根據(jù)用戶輸入的語(yǔ)音指令直接進(jìn)行相應(yīng)的操作。
[0124]本發(fā)明實(shí)施例提供了一種電視設(shè)備,電視設(shè)備在獲取到注冊(cè)指令后,通過麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)用戶的注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并對(duì)預(yù)處理后的注冊(cè)語(yǔ)音信號(hào)提取第二參數(shù),并對(duì)第二參數(shù)分別進(jìn)行第一模型訓(xùn)練及第二模型訓(xùn)練,得到第一模型參數(shù)及第二模型參數(shù),并將第一模型參數(shù)及第二模型參數(shù)進(jìn)行存儲(chǔ),從而,電視設(shè)備在接收到用戶的語(yǔ)音信號(hào)之后,在接收的用戶的語(yǔ)音信號(hào)中提取第一參數(shù),首先分別將第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出第一模型匹配的最大第一概率,即對(duì)用戶的語(yǔ)音內(nèi)容進(jìn)行識(shí)別;然后分別將第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出第二模型匹配的最大第二概率,即對(duì)用戶的聲紋特征進(jìn)行識(shí)別,此時(shí),將最大第一概率與第一閾值進(jìn)行比較,若最大第一概率不小于第一閾值,則將最大第二概率與最大第一概率進(jìn)行運(yùn)算,并將運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若運(yùn)算結(jié)果不小于第二閾值,則確定用戶為最大第二概率對(duì)應(yīng)的用戶,從而根據(jù)用戶的語(yǔ)音內(nèi)容及聲紋特征確定用戶的用戶身份。這樣,當(dāng)用戶A與用戶B的聲紋特征非常接近時(shí),在現(xiàn)有技術(shù)中,只根據(jù)用戶A與用戶B的聲紋信息確定用戶的身份,會(huì)導(dǎo)致對(duì)用戶的身份識(shí)別的準(zhǔn)確率不高。而本發(fā)明中,用戶A與用戶B可以輸入不同內(nèi)容的語(yǔ)音信號(hào),則電視設(shè)備根據(jù)獲取的不同內(nèi)容的語(yǔ)音信號(hào)及聲紋特征相結(jié)合的方法來(lái)確定用戶的用戶身份,從而提高了身份識(shí)別的準(zhǔn)確率。
[0125]在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0126]所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0127]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理包括,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0128]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-Only Memory,簡(jiǎn)稱ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,簡(jiǎn)稱RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0129]最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種身份識(shí)別的方法,其特征在于: 接收用戶的語(yǔ)音信號(hào); 提取所述語(yǔ)音信號(hào)的第一參數(shù); 分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率; 分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率; 將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算; 將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶。
2.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于:所述語(yǔ)音信號(hào)通過麥克風(fēng)陣列獲取。
3.根據(jù)權(quán)利要求2所述的身份識(shí)別的方法,其特征在于: 當(dāng)所述最大第一概率小于所述第一閾值,通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)音信號(hào)。
4.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于: 當(dāng)所述最大第一概率小于所述第一閾值,則提示所述用戶進(jìn)行注冊(cè)。
5.根據(jù)權(quán)利要求4所述的身份識(shí)別的方法,其特征在于: 通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào),并對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
6.根據(jù)權(quán)利要求1所述的身份識(shí)別的方法,其特征在于: 對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
7.根據(jù)權(quán)利要求5所述的身份識(shí)別的方法,其特征在于:所述預(yù)處理包括預(yù)加重、分幀、加窗及端點(diǎn)檢測(cè)處理。
8.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,其特征在于,所述第一模型包括隱馬爾可夫模型HMM ;所述第二模型包括高斯混合模型GMM ;所述第一參數(shù)包括美爾頻率倒譜系數(shù)MFCC。
9.一種電視設(shè)備,其特征在于,包括: 接收單元,用于接收用戶的語(yǔ)音信號(hào); 處理單元,用于提取所述語(yǔ)音信號(hào)的第一參數(shù); 所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第一模型參數(shù)進(jìn)行第一模型匹配,并確定出所述第一模型匹配的最大第一概率; 所述處理單元,還用于分別將所述第一參數(shù)與預(yù)存儲(chǔ)的第二模型參數(shù)進(jìn)行第二模型匹配,并確定出所述第二模型匹配的最大第二概率; 所述處理單元,還用于將所述最大第一概率與第一閾值進(jìn)行比較,若所述最大第一概率不小于所述第一閾值,則將所述最大第二概率與所述最大第一概率進(jìn)行運(yùn)算;所述處理單元,還用于將所述運(yùn)算結(jié)果與第二閾值進(jìn)行比較,若所述運(yùn)算結(jié)果不小于所述第二閾值,則確定所述用戶為所述最大第二概率對(duì)應(yīng)的用戶,并切換至所述用戶對(duì)應(yīng)的個(gè)性化模式。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述接收單元,具體用于通過所述麥克風(fēng)陣列獲取所述語(yǔ)音信號(hào)。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其特征在于, 所述接收單元,還用于在所述最大第一概率小于所述第一閾值時(shí),通過所述麥克風(fēng)陣列重新獲取所述用戶的語(yǔ)音信號(hào)。
12.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于在所述最大第一概率小于所述第一閾值時(shí),提示所述用戶進(jìn)行注冊(cè)。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其特征在于, 所述接收單元,還用于通過所述麥克風(fēng)陣列獲取用戶的注冊(cè)語(yǔ)音信號(hào); 所述處理單元,還用于對(duì)所述注冊(cè)語(yǔ)音信號(hào)進(jìn)行預(yù)處理; 所述處理單元,還用于提取與所述注冊(cè)語(yǔ)音信號(hào)對(duì)應(yīng)的第二參數(shù),對(duì)所述第二參數(shù)進(jìn)行第一模型訓(xùn)練,得到第一模型參數(shù);并對(duì)所述第二參數(shù)進(jìn)行第二模型訓(xùn)練,得到第二模型參數(shù)。
14.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于對(duì)所述語(yǔ)音信號(hào)進(jìn)行所述預(yù)處理,在進(jìn)行預(yù)處理之后的語(yǔ)音信號(hào)中提取所述第一參數(shù)。
15.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于, 所述處理單元,還用于在所述運(yùn)算結(jié)果小于所述第二閾值時(shí),確定所述用戶不是所述最大第二概率對(duì)應(yīng)的用戶,并切換至通用模式。
【文檔編號(hào)】H04R3/00GK103943111SQ201410173009
【公開日】2014年7月23日 申請(qǐng)日期:2014年4月25日 優(yōu)先權(quán)日:2014年4月25日
【發(fā)明者】匡濤, 賈魁, 王勇進(jìn), 任曉楠 申請(qǐng)人:海信集團(tuán)有限公司