一種用于獲取用戶(hù)的用戶(hù)特征信息的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種用于獲取用戶(hù)的用戶(hù)特征信息的方法和裝置。
【背景技術(shù)】
[0002]目前,隨著機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究的發(fā)展,語(yǔ)音識(shí)別技術(shù)的應(yīng)用也越來(lái)越廣。然而,現(xiàn)有技術(shù)中,語(yǔ)音識(shí)別技術(shù)通常用于準(zhǔn)確地識(shí)別語(yǔ)音內(nèi)容,如通過(guò)語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)語(yǔ)音觸發(fā)的交費(fèi)或搜索功能等。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種用于獲取用戶(hù)的用戶(hù)特征信息的方法和裝置。
[0004]根據(jù)本發(fā)明的一個(gè)方面,提供一種用于獲取用戶(hù)的用戶(hù)特征信息的方法,其中,該方法包括以下步驟:
[0005]對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,根據(jù)所述用戶(hù)的語(yǔ)音信息,從該用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中獲得與所述語(yǔ)音信息相匹配的預(yù)定特征;
[0006]根據(jù)與所述語(yǔ)音信息相匹配的預(yù)定特征,確定所述用戶(hù)的用戶(hù)特征信息。
[0007]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種用于獲取用戶(hù)的用戶(hù)特征信息的裝置,其中,該裝置包括以下裝置:
[0008]匹配裝置,用于對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,根據(jù)所述用戶(hù)的語(yǔ)音信息,從該用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中獲得與所述語(yǔ)音信息相匹配的預(yù)定特征;
[0009]確定裝置,用于根據(jù)與所述語(yǔ)音信息相匹配的預(yù)定特征,確定所述用戶(hù)的用戶(hù)特征信息。
[0010]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):能夠根據(jù)用戶(hù)的語(yǔ)音信息,獲得該語(yǔ)音信息針對(duì)多個(gè)用戶(hù)特征對(duì)象的、相匹配的預(yù)定特征,從而可獲得較全面的用戶(hù)特征信息,能夠便于進(jìn)行用戶(hù)的身份識(shí)別,如在國(guó)家安全領(lǐng)域中,可用于根據(jù)來(lái)自嫌疑人的錄音來(lái)獲得嫌疑人的用戶(hù)特征信息,從而縮小嫌疑人范圍;能夠根據(jù)與語(yǔ)音信息相對(duì)應(yīng)的語(yǔ)音特征信息和/或文本信息,來(lái)從每個(gè)用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中確定與語(yǔ)音信息相匹配的預(yù)定特征,且可基于大數(shù)據(jù)的語(yǔ)音樣本集合和詞語(yǔ)樣本集合來(lái)提高準(zhǔn)確性;對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,能夠結(jié)合當(dāng)前已獲得的、與其他用戶(hù)特征對(duì)象相匹配的預(yù)定特征,來(lái)從該用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中確定與語(yǔ)音信息性匹配的預(yù)定特征;能夠通過(guò)采集大量語(yǔ)音樣本或詞語(yǔ)樣本來(lái)建立與每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合或詞語(yǔ)樣本集合,以用于與語(yǔ)音信息進(jìn)行匹配,來(lái)獲得更準(zhǔn)確全面的用戶(hù)特征信息。
【附圖說(shuō)明】
[0011]通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0012]圖1為本發(fā)明一個(gè)實(shí)施例的用于獲取用戶(hù)的用戶(hù)特征信息的方法的流程示意圖;
[0013]圖2為本發(fā)明一個(gè)實(shí)施例的用于獲取用戶(hù)的用戶(hù)特征信息的裝置的結(jié)構(gòu)示意圖;
[0014]圖3為本發(fā)明一個(gè)示例的用戶(hù)特征對(duì)象與預(yù)定特征之間的對(duì)應(yīng)關(guān)系的示意圖。
[0015]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0016]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0017]圖1為本發(fā)明一個(gè)實(shí)施例的用于獲取用戶(hù)的用戶(hù)特征信息的方法的流程示意圖。
[0018]其中,本實(shí)施例的方法主要通過(guò)計(jì)算機(jī)設(shè)備來(lái)實(shí)現(xiàn);所述計(jì)算機(jī)設(shè)備包括用戶(hù)設(shè)備和網(wǎng)絡(luò)設(shè)備。所述網(wǎng)絡(luò)設(shè)備包括但不限于單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計(jì)算(Cloud Computing)的由大量計(jì)算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī);所述網(wǎng)絡(luò)設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)等。所述用戶(hù)設(shè)備包括但不限于PC機(jī)、平板電腦、智能手機(jī)、PDA, IPTV等。
[0019]需要說(shuō)明的是,所述用戶(hù)設(shè)備、網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的計(jì)算機(jī)設(shè)備如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以?xún)?nèi),并以引用方式包含于此。
[0020]根據(jù)本實(shí)施例的方法包括步驟SI和步驟S2。
[0021]在步驟SI中,對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,計(jì)算機(jī)設(shè)備根據(jù)用戶(hù)的語(yǔ)音信息,從該用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中獲得與該語(yǔ)音信息相匹配的預(yù)定特征。
[0022]其中,所述用戶(hù)特征對(duì)象包括任何在描述用戶(hù)特征時(shí)能夠作為目標(biāo)的對(duì)象;優(yōu)選地,所述用戶(hù)特征對(duì)象包括但不限于:用戶(hù)的性別、年齡、地域、性格、職業(yè)等。
[0023]其中,一個(gè)用戶(hù)特征對(duì)象包括多個(gè)預(yù)定特征,該多個(gè)預(yù)定特征用于表示對(duì)該用戶(hù)特征對(duì)象進(jìn)行預(yù)定劃分所得到的特征。例如,圖3為本發(fā)明一個(gè)示例的用戶(hù)特征對(duì)象與預(yù)定特征之間的對(duì)應(yīng)關(guān)系的示意圖;其中,用戶(hù)特征對(duì)象“性別”的預(yù)定特征包括:男性、女性,用戶(hù)特征對(duì)象“年齡”的預(yù)定特征包括:0歲-15歲、15歲-30歲、30歲-50歲、50歲以上,用戶(hù)特征對(duì)象“地域”的預(yù)定特征包括:華北地區(qū)、東北地區(qū)、華東地區(qū)、華中地區(qū)、華南地區(qū)、西南地區(qū)、西北地區(qū),用戶(hù)特征對(duì)象“性格”的預(yù)定特征包括:外向型、內(nèi)向型、均衡型,用戶(hù)特征對(duì)象“職業(yè)”的預(yù)定特征包括:技能型、事務(wù)型、研究型、藝術(shù)型、經(jīng)管型、社交型。
[0024]其中,計(jì)算機(jī)設(shè)備可采用多種方式獲取用戶(hù)的語(yǔ)音信息。例如,計(jì)算機(jī)設(shè)備直接獲取存儲(chǔ)在該計(jì)算機(jī)設(shè)備中的、用戶(hù)的語(yǔ)音信息。又例如,計(jì)算機(jī)設(shè)備為網(wǎng)絡(luò)設(shè)備,該網(wǎng)絡(luò)設(shè)備接收用戶(hù)通過(guò)用戶(hù)設(shè)備上傳至該網(wǎng)絡(luò)設(shè)備的語(yǔ)音信息。
[0025]具體地,對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,計(jì)算機(jī)設(shè)備根據(jù)用戶(hù)的語(yǔ)音信息,從該用戶(hù)特征對(duì)象的多個(gè)預(yù)定特征中獲得與該語(yǔ)音信息相匹配的預(yù)定特征的實(shí)現(xiàn)方式包括但不限于:
[0026]I)所述步驟SI進(jìn)一步包括步驟Sll-1和步驟SI 1-2。
[0027]在步驟Sll-1中,計(jì)算機(jī)設(shè)備根據(jù)所述語(yǔ)音信息,獲得與所述語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音特征信息。
[0028]其中,所述語(yǔ)音特征信息包括任何與語(yǔ)音的特征相關(guān)的信息;優(yōu)選地,所述語(yǔ)音特征信息包括但不限于:
[0029]a)與語(yǔ)音對(duì)應(yīng)的聲波頻率相關(guān)的信息,如語(yǔ)音的音調(diào)、音高等。
[0030]b)與聲音對(duì)應(yīng)的聲波振幅相關(guān)的信息,如語(yǔ)音的響度、音強(qiáng)等。
[0031]c)與語(yǔ)音對(duì)應(yīng)的聲波周期相關(guān)的信息,如語(yǔ)音的音長(zhǎng)等。
[0032]d)與語(yǔ)音對(duì)應(yīng)的波形特性相關(guān)的信息,如語(yǔ)音的音色等。
[0033]需要說(shuō)明的是,上述語(yǔ)音特征信息僅為舉例,而非對(duì)本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)能理解,任何與語(yǔ)音的特征相關(guān)的信息,均應(yīng)包含在本發(fā)明所述的語(yǔ)音特征信息的范圍內(nèi)。
[0034]具體地,計(jì)算機(jī)設(shè)備可采用多種方式根據(jù)所述語(yǔ)音信息,獲得與所述語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音特征信息。
[0035]例如,計(jì)算機(jī)設(shè)備直接對(duì)用戶(hù)的語(yǔ)音信息進(jìn)行語(yǔ)音分析處理(如快速傅里葉變換等),來(lái)提取語(yǔ)音信息中的語(yǔ)音特征信息。
[0036]又例如,計(jì)算機(jī)設(shè)備將語(yǔ)音信息作為語(yǔ)音模型(該語(yǔ)音模型為通過(guò)樣本訓(xùn)練獲得的用于提取語(yǔ)音特征信息的模型)的輸入,來(lái)獲得該語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音特征信息。
[0037]需要說(shuō)明的是,上述舉例僅為更好地說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述語(yǔ)音信息,獲得與所述語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音特征信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0038]在步驟S11-2中,對(duì)于所述至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,計(jì)算機(jī)設(shè)備根據(jù)所述語(yǔ)音特征信息,以及與該用戶(hù)特征對(duì)象的每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合,獲得與所述語(yǔ)音特征信息相匹配的預(yù)定特征。
[0039]其中,所述語(yǔ)音樣本集合用于集合多個(gè)語(yǔ)音樣本,所述語(yǔ)音樣本集合可表現(xiàn)多種形式,如文件形式、數(shù)據(jù)庫(kù)形式、向量集形式等。
[0040]其中,對(duì)于用戶(hù)特征對(duì)象的每個(gè)預(yù)定特征,與該預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合中包括與該預(yù)定特征相對(duì)應(yīng)的至少一個(gè)語(yǔ)音樣本。例如,用戶(hù)特征對(duì)象“性別”包括以下預(yù)定特征:男性、女性;預(yù)定特征“男性”對(duì)應(yīng)的語(yǔ)音樣本集合中包括來(lái)自男性用戶(hù)的多個(gè)語(yǔ)音樣本,預(yù)定特征“女性”對(duì)應(yīng)的語(yǔ)音樣本集合中包括來(lái)自女性用戶(hù)的多個(gè)語(yǔ)音樣本。又例如,用戶(hù)特征對(duì)象“性格”的預(yù)定特征包括:外向型、內(nèi)向型、均衡型,預(yù)定特征“外向型”對(duì)應(yīng)的語(yǔ)音樣本集合中包括來(lái)自具有外向性格的用戶(hù)的多個(gè)語(yǔ)音樣本(該多個(gè)語(yǔ)音樣本具有聲調(diào)較高、語(yǔ)速較快的特點(diǎn)),預(yù)定特征“內(nèi)向型”對(duì)應(yīng)的語(yǔ)音樣本集合中包括來(lái)自具有內(nèi)向性格的用戶(hù)的多個(gè)語(yǔ)音樣本(該多個(gè)語(yǔ)音樣本具有聲調(diào)較低、語(yǔ)速較慢的特點(diǎn)),預(yù)定特征“均衡型”對(duì)應(yīng)的語(yǔ)音樣本集合中包括來(lái)自具有均衡性格的用戶(hù)的多個(gè)語(yǔ)音樣本(該多個(gè)語(yǔ)音樣本具有聲調(diào)較穩(wěn)定、語(yǔ)速較平緩的特點(diǎn))。
[0041]需要說(shuō)明的是,將與用戶(hù)特征對(duì)象的每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合進(jìn)行合并,即為與該用戶(hù)特征對(duì)象相對(duì)應(yīng)的總語(yǔ)音樣本集合,該總語(yǔ)音樣本集合中的每個(gè)語(yǔ)音樣本均為該用戶(hù)特征對(duì)象所對(duì)應(yīng)的語(yǔ)音樣本。
[0042]具體地,對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,計(jì)算機(jī)設(shè)備根據(jù)所述語(yǔ)音特征信息,以及與該用戶(hù)特征對(duì)象的每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合,獲得與所述語(yǔ)音特征信息相匹配的預(yù)定特征的實(shí)現(xiàn)方式包括但不限于:
[0043]a)對(duì)于至少一個(gè)用戶(hù)特征對(duì)象中的每個(gè)用戶(hù)特征對(duì)象,計(jì)算機(jī)設(shè)備對(duì)與該用戶(hù)特征對(duì)象的每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本集合進(jìn)行樣本訓(xùn)練,得到與所述每個(gè)預(yù)定特征相對(duì)應(yīng)的語(yǔ)音樣本模型;在步驟S11-2中,計(jì)算機(jī)設(shè)備將每個(gè)預(yù)定特征所對(duì)應(yīng)的語(yǔ)音樣本模型與語(yǔ)音特征信息進(jìn)行匹配,并將匹配度最高的語(yǔ)音樣本模型所對(duì)應(yīng)的預(yù)定特征作為與語(yǔ)音特征信息相匹配的預(yù)定特征。
[0044]例如,用戶(hù)特征對(duì)象“性格”的預(yù)定特征包括:外向型、內(nèi)向型、均衡型;其中,與預(yù)定特征“外向型”相對(duì)應(yīng)的語(yǔ)音樣本集合為Setljf Setl進(jìn)行樣本訓(xùn)練得到的語(yǔ)音樣本模型為model I,與預(yù)定特征“內(nèi)向型”相對(duì)應(yīng)的語(yǔ)音樣本集合為Set2,對(duì)Set2進(jìn)行樣本訓(xùn)練得到的語(yǔ)音樣本模型為model2,與預(yù)定特征“均衡型”相