一種提高語音音質的方法、系統及移動終端的制作方法
【技術領域】
[0001]本發明涉及通信領域,具體涉及一種提高語音音質的方法、系統及移動終端。
【背景技術】
[0002]現在,移動終端的應用已經非常廣泛,普及程度非常高。視頻通話作為移動終端的一項新功能,得到了越來越多的使用。視頻通話中的語音音質的提升也是所有移動終端都致力于努力研究的課題。
[0003]從人耳的聽覺特性來講,低頻是基礎音,如果低頻聲音聲壓值不夠,則會顯得音色單純,缺乏力度,這部分對聽覺的影響很大。對于中頻聲音,是人耳聽覺最靈敏的區域,適當提升有利于增強放音的臨場感,有利于提高清晰度和層次感。對于高頻聲音的提升可以使音色顯得生動活潑。一般情況下,發聲音質的好壞可以用頻率響應曲線來做判定,好的頻響曲線聽起來主觀感覺良好。
[0004]通常視頻通話時,人們會使用耳機模式或者免提模式進行語音交流。對于免提模式,每個用戶在使用時移動終端到人頭的空間位置(比如距離和角度)都是不完全相同的;而目前對于視頻通話中的語音音質的調試和校準都是將移動終端放在固定位置進行的,在現有技術中,視頻通話中免提模式語音信號處理使用的低通濾波器輸出的語音信號的靈敏度和頻率響應是根據標準位置(比如正對移動終端攝像頭20cm的位置)測試而設定,但是因為用戶使用習慣的不同,手握移動終端到人臉的角度和距離有很大差別,所以在非標準位置(其他角度和距離)的情況下移動終端的頻率響應和靈敏度相對用戶感受是改變的。這樣實際使用感受就是移動終端到人臉的空間位置近于標準值時高音缺乏,聲音清晰度和層次感不強;移動終端到人臉的空間位置遠于標準值時則低音缺乏,聲音聽起來單調不夠飽滿,無論是低音還是中高音頻率缺乏都會影響用戶聽音效果。
[0005]由此可見,現有技術中視頻通話免提模式中的語音音質的調試和校準都是將移動終端放在固定位置進行的,但隨著移動終端到人臉的角度和距離的改變,移動終端對人臉的語音信號的頻率響應和靈敏度都會改變,這樣的差別就影響了語音音質的效果。因此需要一種語音信號處理的方法來彌補人為因素帶來的差別,使得視頻通話中的語音音質能達到更好的聽音效果,從而提升了用戶體驗效果,增加了產品的市場競爭力。
【發明內容】
[0006]本發明需要解決的技術問題是提供一種提高語音音質的方法、系統及移動終端,能夠保持免提頻率響應和靈敏度基本保持在一個較佳狀態基本不變,彌補了因為移動終端到人臉的距離或角度的改變而使頻率響應曲線低頻或中高頻缺失的情況,從而提升視頻通話中的語音音質,提升用戶聽音效果。
[0007]為了解決上述技術問題,本發明提供了一種提高語音音質的方法,包括:
[0008]移動終端獲取用戶的人臉到移動終端的空間位置;
[0009]確定所述人臉到所述移動終端的空間位置對應的音頻參數;
[0010]將所述移動終端的語音處理模塊的音頻參數調至所述人臉到所述移動終端的空間位置對應的音頻參數;
[0011]將從網絡側接收到的語音信號經過調整音頻參數后的語音處理模塊輸出。
[0012]進一步地,所述人臉到所述移動終端的空間位置包括:所述人臉到所述移動終端的距離和角度,所述角度為正對移動終端偏左或偏右的角度,所述角度小于或等于90度。
[0013]進一步地,在所述獲取用戶人臉到移動終端的空間位置之前,所述方法還包括:
[0014]預先設置所述人臉到所述移動終端的空間位置與采集到的人臉數據的對應關系。
[0015]進一步地,所述預先設置所述人臉到所述移動終端的空間位置與人臉數據的對應關系,包括:
[0016]設置所述人臉到所述移動終端的距離的最大值和最小值,設置角度偏左的最大值為正對移動終端左偏90度和角度偏右的最大值為正對移動終端右偏90度;
[0017]根據預設的距離間隔和角度間隔,從距離最小值以及左偏90度開始向右依次采集人臉到移動終端的不同距離和不同角度的人臉數據;
[0018]保存所述不同距離和不同角度對應的人臉數據。
[0019]進一步地,所述獲取用戶人臉到移動終端的空間位置,包括:
[0020]采集當前用戶的人臉數據,比較所述當前用戶的人臉數據與保存的人臉數據,當所述當前用戶的人臉數據與所述保存的人臉數據的差值小于預設閾值時,則將所述保存的人臉數據對應的空間位置作為當前用戶人臉到移動終端的空間位置。
[0021]進一步地,在所述確定所述人臉到所述移動終端的空間位置對應的音頻參數之前,還包括:預先配置人臉到移動終端的空間位置與音頻參數的對應關系;
[0022]所述確定所述人臉到所述移動終端的空間位置對應的音頻參數,包括:
[0023]根據預先配置的所述人臉到移動終端的空間位置與音頻參數的對應關系確定所述人臉到所述移動終端的空間位置對應的音頻參數。
[0024]進一步地,所述預先配置人臉到移動終端的空間位置與音頻參數的對應關系,包括:
[0025]設置所述人臉到所述移動終端的距離的最大值和最小值,設置角度偏左的最大值為正對移動終端左偏90度和角度偏右的最大值為正對移動終端右偏90度;
[0026]根據預設的距離間隔和角度間隔,從距離最小值以及左偏90度開始向右依次測量同一語音信號在所述人臉到所述移動終端的不同距離和不同角度通過所述語音處理模塊處理輸出的語音信號的靈敏度和頻率響應;
[0027]計算使不同距離和不同角度輸出的的語音信號的靈敏度和頻率響應在標準范圍內的音頻參數;
[0028]保存不同距離和不同角度對應的音頻參數。
[0029]為了解決上述技術問題,本發明還提供了一種提高語音音質的系統,包括:
[0030]空間位置識別模塊,用于獲取用戶的人臉到移動終端的空間位置;
[0031]音頻參數確定模塊,用于確定所述人臉到所述移動終端的空間位置對應的音頻參數;
[0032]語音處理模塊,用于將其音頻參數調至所述人臉到所述移動終端的空間位置對應的音頻參數,然后將從網絡側接收到的語音信號輸出。
[0033]進一步地,所述人臉到所述移動終端的空間位置包括:所述人臉到所述移動終端的距離和角度,所述角度為正對移動終端偏左或偏右的角度,所述角度小于或等于90度。
[0034]進一步地,還包括:
[0035]配置模塊,用于在所述獲取用戶人臉到移動終端的空間位置之前,預先設置所述人臉到所述移動終端的空間位置與采集到的人臉數據的對應關系。
[0036]進一步地,所述配置模塊,用于預先設置所述人臉到所述移動終端的空間位置與人臉數據的對應關系,包括:
[0037]設置所述人臉到所述移動終端的距離的最大值和最小值,設置角度偏左的最大值為正對移動終端左偏90度和角度偏右的最大值為正對移動終端右偏90度;
[0038]根據預設的距離間隔和角度間隔,從距離最小值以及左偏90度開始向右依次采集人臉到移動終端的不同距離和不同角度的人臉數據;
[0039]保存所述不同距離和不同角度對應的人臉數據。
[0040]進一步地,所述空間位置識別模塊,用于獲取用戶人臉到移動終端的空間