語音數據處理方法及終端的制作方法
【技術領域】
[0001]本發明涉及通信領域的語音處理技術,尤其涉及一種語音數據處理方法及終端。
【背景技術】
[0002]目前終端在進行語音通信時,參與通信的兩個終端往往是基于對端的終端標識如終端的電話號碼來完成對另一方終端的識別,這種識別僅僅限于兩個終端參與語音通信的場景,對于多個終端參與的語音通信場景中,如何對語音數據中的語音的來源終端也即來源終端的用戶進行識別,進而基于識別出的用戶來對多終端語音場景中的業務功能進行擴展,相關技術尚無有效解決方案。
【發明內容】
[0003]本發明實施例提供一種語音數據處理方法及終端,能夠對語音數據中的語音的來源終端也即來源終端的用戶進行識別,進而對多終端語音場景中的業務功能進行擴展,提升用戶體驗。
[0004]本發明實施例的技術方案是這樣實現的:
[0005]本發明實施例提供一種語音數據處理方法,所述方法包括:
[0006]第一終端從獲取的語音數據中提取出聲紋特征,將所述聲紋特征與至少一個預設聲紋特征進行匹配,得到與所述提取出的聲紋特征匹配的預設聲紋特征;
[0007]基于與所述提取出的聲紋特征匹配的預設聲紋特征、以及所述預設聲紋特征與用戶的信息的一一對應關系,確定與所述提取出的聲紋特征對應的目標用戶的信息;
[0008]基于所述提取出的聲紋特征、和/或與所述提取出的聲紋特征對應的目標用戶的信息響應操作指令。
[0009]優選地,所述方法還包括:
[0010]所述第一終端從獲取的語音數據中提取出聲紋特征之前,獲取來自第二終端的語音數據,所述來自第二終端的語音數據中承載有所述第二終端的用戶的語音;
[0011]從來自所述第二終端的語音數據中提取出所述第二終端的用戶的聲紋特征;
[0012]建立所述第二終端的用戶的聲紋特征與所述第二終端的用戶的信息之間的對應關系O
[0013]優選地,所述基于與提取出的聲紋特征、和/或與所述提取出的聲紋特征對應的目標用戶的信息響應操作指令,包括:
[0014]所述語音數據中承載有至少兩個所述用戶的語音;
[0015]當確定與所述提取出的聲紋特征對應的用戶的信息時,基于圖形界面呈現與所述提取出的聲紋特征對應的用戶的信息,直至所接收的所述語音數據中不再承載有與所述用戶的對應的語音。
[0016]優選地,所述基于與提取出的聲紋特征、和/或與所述提取出的聲紋特征對應的用戶的信息響應操作指令,包括:
[0017]采集信息,利用所述提取出的聲紋特征對所采集到的信息進行加密;
[0018]基于與所述提取出的聲紋特征對應的目標用戶的信息,向所述目標用戶對應的第三終端發送加密后的信息;其中,
[0019]所述加密后的信息用于使所述第三終端基于所述目標用戶的聲紋特征進行聲紋匹配,以對所述加密后的信息進行解密。
[0020]優選地,所述基于與提取出的聲紋特征、和/或與所述提取出的聲紋特征對應的用戶的信息響應操作指令,包括:
[0021]基于所述提取出的聲紋特征,在所述語音數據中濾除與所述聲紋特征對應的語音數據;
[0022]所述基于與所述提取出的聲紋特征對應的用戶的信息響應操作指令,包括:
[0023]基于所述提取出的聲紋特征、以及與所述提取出的聲紋特征對應的目標用戶的信息,確定所述語音數據中承載有不同所述目標用戶的語音的數據段,對所確定的數據段進行語音編輯操作。
[0024]本發明實施例提供一種終端,所述終端包括:
[0025]語音獲取模塊,用于獲取語音數據;
[0026]聲紋提取模塊,用于從所述獲取的語音數據中提取出聲紋特征,
[0027]聲紋匹配模塊,用于將所述聲紋特征與至少一個預設聲紋特征進行匹配,得到與所述提取出的聲紋特征匹配的預設聲紋特征;
[0028]聲紋關聯模塊,用于存儲所述預設聲紋特征與用戶的信息的一一對應關系;
[0029]聲紋識別模塊,用于基于與所述提取出的聲紋特征匹配的預設聲紋特征、以及所述聲紋關聯模塊存儲的所述預設聲紋特征與用戶的信息的一一對應關系,確定與所述提取出的聲紋特征對應的目標用戶的信息;
[0030]響應模塊,用于基于所述提取出的聲紋特征、和/或與所述提取出的聲紋特征對應的目標用戶的信息響應操作指令。
[0031]優選地,所述語音獲取模塊,還用于從獲取的語音數據中提取出聲紋特征之前,獲取來自第二終端的語音數據,所述來自第二終端的語音數據中承載有所述第二終端的用戶的語音;
[0032]所述聲紋提取模塊,還用于從來自所述第二終端的語音數據中提取出所述第二終端的用戶的聲紋特征;
[0033]所述聲紋關聯模塊,還用于建立所述第二終端的用戶的聲紋特征與所述第二終端的用戶的信息之間的對應關系。
[0034]優選地,所述響應模塊,還用于當所述聲紋識別模塊確定與所述提取出的聲紋特征對應的用戶的信息時,基于圖形界面呈現與所述提取出的聲紋特征對應的用戶的信息,直至所接收的所述語音數據中不再承載有與所述用戶的對應的語音;
[0035]其中,所述語音數據中承載有至少兩個所述用戶的語音。
[0036]優選地,所述響應模塊包括:
[0037]采集單元,用于采集信息,利用所述提取出的聲紋特征對所采集到的信息進行加密;
[0038]加密單元,用于基于與所述提取出的聲紋特征對應的目標用戶的信息,向所述目標用戶對應的第三終端發送加密后的信息;其中,
[0039]所述加密后的信息用于使所述第三終端基于所述目標用戶的聲紋特征進行聲紋匹配,以對所述加密后的信息進行解密。
[0040]優選地,所述響應模塊包括:觸發單元、濾除單元、編輯單元;
[0041]所述觸發單元,用于基于所述操作指令觸發所述濾除單元和/或所述編輯單元;其中,
[0042]所述濾除單元,用于基于所述提取出的聲紋特征,在所述語音數據中濾除與所述聲紋特征對應的語音數據;
[0043]用于基于所述提取出的聲紋特征、以及與所述提取出的聲紋特征對應的目標用戶的信息,確定所述語音數據中承載有不同所述目標用戶的語音的數據段,對所確定的數據段進行語音編輯操作。
[0044]本發明實施例中,第一終端處于多終端的語音通信場景中時,可以基于從多終端語音通信場景中獲取的語音數據中提取出聲紋特征,與第一終端中預設聲紋特征匹配,進而得到提取出的聲紋特征對應的目標用戶的信息,這就克服了多終端語音通信場景中無法識別語音的來源用戶(也即目標用戶)的問題;同時,第一終端可以基于提取出的目標用戶的聲紋特征、和/或來源目標用戶的信息,對多終端的語音通信場景進行功能擴展,例如提示當前語音的來源用戶、與來源用戶基于聲紋特征進行加密通信,或基于聲紋特征對語音數據進行編輯,滿足了用戶在多終端的語音通信場景中的需求,提升了用戶體驗。
【附圖說明】
[0045]圖1是本發明實施例中語音數據處理的實現流程示意圖一;
[0046]圖2a至圖2c是本發明實施例中終端的結構示意圖;
[0047]圖3是本發明實施例中語音數據處理的實現流程示意圖二。
【具體實施方式】
[0048]為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
[0049]本發明實施例記載一種語音數據處理方法,可以應用于第一終端(如智能手機),如圖1所示,包括以下步驟:
[0050]步驟S101,第一終端從獲取的語音數據中提取出聲紋特征,將所述聲紋特征與至少一個預設聲紋特征進行匹配,得到與所述提取出的聲紋特征匹配的預設聲紋特征。
[0051]步驟S102,基于與所述提取出的聲紋特征匹配的預設聲紋特征、以及所述預設聲紋特征與用戶的信息的一一對應關系,確定與所述提取出的聲紋特征對應的目標用戶的信息。
[0052]作為一個示例,預設聲紋特征與用戶的信息的一一對應關系可以在第一終端用戶的歷史通話過程中,基于所接收語音數據提取聲紋特征得到,例如,第一終端在與第二終端進行點對點的語音通信時,