音頻處理方法和裝置制造方法
【專利摘要】本發明公開了一種音頻處理方法和裝置,所述音頻處理方法包括步驟:通過麥克采集音頻信息,濾除音頻信息中的環境噪音;將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息;對混合后的音頻信息進行編碼處理,從而將真實的背景音替換為用戶自定義設置的背景音。因此在通話過程中,對方聽到的背景音為用戶設置的背景音,而非真實環境下的背景音,使得用戶可以設置背景音來偽裝自己身處的環境,以達到保護隱私或調侃對方的目的,或者對于陌生人的騷擾電話,可以通過設置白噪或類似的背景噪音作為背景音來警告對方。既消除了當前環境的環境噪音,提高了錄音或通話質量,又提高了操控性和趣味性,滿足了用戶的個性化需求。
【專利說明】音頻處理方法和裝置
【技術領域】
[0001]本發明涉及通信【技術領域】,尤其是涉及一種音頻處理方法和裝置。
【背景技術】
[0002]現有技術中,移動終端在通話過程中通常會使用降噪技術來濾除環境噪音,以此來提高通話質量。隨著通信技術的迅速發展,移動終端的娛樂屬性越來越強,用戶不僅追求更高的語音質量,還對移動終端的操控性和趣味性提出了更高要求。現有的移動終端顯然無法滿足用戶在通話過程中對操控性和趣味性的個性化需求,用戶體驗不佳。
【發明內容】
[0003]本發明的主要目的在于提供一種音頻處理方法和裝置,旨在提高錄音或通話過程中的操控性和趣味性,提升用戶體驗。
[0004]為達以上目的,本發明提出一種音頻處理方法,包括步驟:
[0005]通過麥克采集音頻信息,濾除所述音頻信息中的環境噪音;
[0006]將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息;
[0007]對混合后的音頻信息進行編碼處理。
[0008]優選地,所述將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息包括:
[0009]讀取預設的背景音的音頻文件,將所述背景音的格式解碼為脈沖編碼調制格式;
[0010]對所述脈沖編碼調制格式的背景音的采樣率進行轉換,以使所述背景音的采樣率與采集到的音頻信息的采樣率相同;
[0011]將所述背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息。
[0012]優選地,所述濾除音頻信息中的環境噪音包括:
[0013]比較兩個麥克采集的音頻信息的音量差值;
[0014]將采集的音頻信息中音量差值小于預設值的音頻信息作為環境噪音予以濾除。
[0015]優選地,所述對混合后的音頻信息進行編碼處理的步驟之后還包括:存儲或向外發送編碼處理后的音頻信息。
[0016]優選地,所述方法還包括:在一次通話或錄音過程中,循環使用所述背景音進行混合或使用所述背景音預設次數進行混合。
[0017]本發明同時提出一種音頻處理裝置,包括設置單元、麥克、濾除單元和處理單元,其中:
[0018]設置單元,用于設置背景音;
[0019]麥克,用于米集音頻信息;
[0020]濾除單元,用于濾除所述音頻信息中的環境噪音;
[0021]處理單元,用于將預設的背景音與濾除了環境噪音的音頻信息混合為一路音頻信息,并對混合后的音頻信息進行編碼處理。
[0022]優選地,所述處理單元用于:
[0023]讀取預設的背景音的音頻文件,將所述背景音的格式解碼為脈沖編碼調制格式;
[0024]對所述脈沖編碼調制格式的背景音的采樣率進行轉換,以使所述背景音的采樣率與采集到的音頻信息的采樣率相同;
[0025]將所述背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息。
[0026]優選地,所述麥克至少為兩個,所述濾除單元用于:比較兩個麥克采集的音頻信息的音量差值,將采集的音頻信息中音量差值小于預設值的音頻信息作為環境噪音予以濾除。
[0027]優選地,所述處理單元進一步用于:存儲或向外發送編碼處理后的音頻信息。
[0028]優選地,所述處理單元進一步用于:在一次通話或錄音過程中,循環使用所述背景音進行混合或使用所述背景音預設次數進行混合。
[0029]本發明所提供的一種音頻處理方法,在錄音或通話過程中,通過預先設置背景音,濾除當前采集的音頻信息的環境噪音,并將背景音與音頻信息實時混合在一起,從而將真實的背景音替換為用戶自定義設置的背景音。因此在通話過程中,對方聽到的背景音為用戶設置的背景音,而非真實環境下的背景音,使得用戶可以設置背景音來偽裝自己身處的環境,以達到保護隱私或調侃對方的目的,或者對于陌生人的騷擾電話,可以通過設置白噪或類似的背景噪音作為背景音來警告對方。既消除了當前環境的環境噪音,提高了錄音或通話質量,又提高了操控性和趣味性,滿足了用戶的個性化需求,提升了用戶體驗。
【專利附圖】
【附圖說明】
[0030]圖1是本發明的音頻處理方法第一實施例的流程圖;
[0031]圖2是本發明中背景音與音頻信息混合的示意圖;
[0032]圖3是本發明的音頻處理方法第二實施例的流程圖;
[0033]圖4是本發明的音頻處理裝置一實施例的模塊示意圖。
[0034]本發明目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。
【具體實施方式】
[0035]應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
[0036]本發明的音頻處理方法可以應用于語音通話、音頻錄制等應用場景,所述語音通話可以是二人通話或多人通話(如電話會議),也可以是基于應用程序的視頻通話,所述音頻錄制包括錄音或錄像。下面以語音通話為例進行詳細說明。
[0037]參見圖1,提出本發明的音頻處理方法第一實施例,所述音頻處理方法包括以下步驟:
[0038]步驟SlOl:設置背景音
[0039]本實施例在通話之前預先設置背景音。具體實現上,可以在終端的撥號界面顯示“通話設置”選項,在“通話設置”選項中增加背景音添加功能選項,可以預設音樂會、咖啡館、電影院、比賽現場等背景音選項供用戶選擇,還可以由用戶自定義選擇本地的音頻文件作為背景音選項。還可以進一步設置生效次數,如僅對一次通話生效,或者對所有的通話生效;或者設置應用對象,如應用于特定聯系人、應用于通訊錄中的所有聯系人或陌生人(即不在通訊錄中的電話)等。
[0040]進一步地,可以設置一個音頻文件作為背景音,也可以設置兩個或多個音頻文件作為背景音,并可設置多個音頻文件的混合順序。還可設置在一次通話過程中,循環使用預設的背景音進行混合(即循環讀取(或播放)預設的背景音),或使用預設的背景音預設次數進行混合(即讀取(或播放)預設的背景音預設次數)。
[0041]步驟S102:建立語音通話后,通過麥克采集音頻信息
[0042]步驟S103:濾除采集的音頻信息中的環境噪音
[0043]終端可利用現有技術中的降噪技術來濾除音頻信息中的環境噪音。
[0044]優選地,終端利用至少兩個麥克來采集音頻信息,比較任意兩個麥克采集的音頻信息的音量差值,由于用戶離麥克最近,因此兩個麥克采集到的用戶的音頻信息的音量差值較大,從而將音量差值較小如小于預設值的音頻信息作為噪聲予以濾除,所述預設值優選為6分貝。
[0045]步驟S104:將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息
[0046]具體的,如圖2所示,終端通過播放器讀取(或播放)預設的背景音的音頻文件,所述音頻文件可以是WMV、MP3、WAV、MP4、AV1、FLV等音頻格式。在讀取音頻文件過程中,解析音軌,通過編解碼器將背景音的格式解碼為脈沖編碼調制(PCM,Pulse CodeModulat1n)格式;再對PCM格式的背景音的采樣率進行轉換,以使背景音的采樣率與采集到的音頻信息的采樣率(通常為8K)相同;最后將背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息。
[0047]步驟S105:對混合后的音頻信息進行編碼處理
[0048]終端通過編解碼器對混合后的音頻信息進行編碼處理。
[0049]步驟S106:向外發送編碼處理后的音頻信息
[0050]終端通過射頻模塊向外發送編碼處理后的音頻信息。從而,使得通話對方聽到的背景音為用戶設置的背景音,而非真實環境下的背景音,使得用戶可以設置背景音來偽裝自己身處的環境,以達到保護隱私或調侃對方的目的,或者對于陌生人的騷擾電話,可以通過設置白噪或類似的背景噪音作為背景音來警告對方。提高了操控性和趣味性,滿足了用戶的個性化需求,提升了用戶體驗。
[0051]參見圖3,提出本發明的音頻處理方法第二實施例,所述音頻處理方法包括以下步驟:
[0052]步驟S201:通話過程中,設置背景音
[0053]本實施例允許用戶在通話過程中隨時設置背景音或變更設置好的背景音。具體實現上,可以在終端的撥號界面顯示“更多”選項,在“更多”選項中增加背景音添加功能選項。本實施例中的背景音具體設置方法與第一實施例中的步驟SlOl相同,在此不再贅述。
[0054]步驟S202:通過麥克采集音頻信息
[0055]步驟S203:濾除采集的音頻信息中的環境噪音
[0056]步驟S204:將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息
[0057]步驟S205:對混合后的音頻信息進行編碼處理
[0058]步驟S206:向外發送編碼處理后的音頻信息
[0059]本實施例允許用戶在通話過程中隨時設置背景音或變更設置好的背景音,使得用戶可以根據實際情況進行實時變更和處理,進一步提高了操控性能,提升了用戶體驗。
[0060]在某些實施例中,所述音頻處理方法也可以應用于音頻錄制過程,背景音可以在音頻錄制前設置或者在音頻錄制過程中進行設置,其具體處理方法與語音通話過程中的處理方法大致相同,區別在于對編碼處理后的音頻信息的最后處理。若為錄音、錄像應用進行音頻錄制,則在錄制完成后將編碼處理后的音頻信息存儲于本地;若為微信等應用進行音頻錄制,則在錄制完成后通過微信將編碼處理后的音頻信息發送給相應的聯系人。在一次錄音過程中,可以循環使用背景音進行混合或使用背景音預設次數進行混合。
[0061]參見圖4,提出本發明的音頻處理裝置一實施例,所述音頻處理裝置包括設置單元、麥克、濾除單元和處理單元。
[0062]設置單元:用于設置背景音。
[0063]設置單元可以在通話或錄音之前設置背景音,也可以在通話或錄音過程中隨時設置或變更背景音。具體的,可以設置選項中或者錄音或通話界面增加背景音添加功能選項,可以預設音樂會、咖啡館、電影院、比賽現場等背景音選項供用戶選擇,還可以由用戶自定義選擇本地的音頻文件作為背景音選項。還可以進一步設置生效次數,如僅對一次通話生效,或者對所有的通話生效;或者設置應用對象,如應用于特定聯系人、應用于通訊錄中的所有聯系人或陌生人(即不在通訊錄中的電話)等。
[0064]進一步地,可以設置一個音頻文件作為背景音,也可以設置兩個或多個音頻文件作為背景音,并可設置多個音頻文件的混合順序。還可設置在一次通話或錄音過程中,循環使用預設的背景音進行混合(即循環讀取(或播放)預設的背景音),或使用預設的背景音預設次數進行混合(即讀取(或播放)預設的背景音預設次數)。
[0065]麥克:用于采集音頻信息,并發送給處理單元或濾除單元。
[0066]濾除單元:用于濾除采集的音頻信息中的環境噪音。
[0067]濾除單元可利用現有技術中的降噪技術來濾除音頻信息中的環境噪音。
[0068]優選地,音頻處理裝置利用至少兩個麥克來采集音頻信息,濾除單元比較任意兩個麥克采集的音頻信息的音量差值,由于目標聲源通常離麥克最近,因此兩個麥克采集到的目標聲源的音頻信息的音量差值較大,從而將音量差值較小如小于預設值的音頻信息作為噪聲予以濾除,所述預設值優選為6分貝。
[0069]處理單元:用于根據設置單元的設置參數,進行相應處理。若設置單元沒有設置背景音,則直接接收麥克采集到的音頻信息;若設置單元設置了背景音,則控制麥克將采集到的音頻信息發送給濾除單元進行環境噪音濾除處理,將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息,并對混合后的音頻信息進行編碼處理。
[0070]具體的,如圖2所示,處理單元通過播放器讀取(或播放)預設的背景音的音頻文件,所述音頻文件可以是WMV、MP3、WAV、MP4、AV1、FLV等音頻格式。在讀取音頻文件過程中,解析音軌,通過編解碼器將背景音的格式解碼為脈沖編碼調制(PCM,Pulse CodeModulat1n)格式;再對PCM格式的背景音的采樣率進行轉換,以使背景音的采樣率與采集到的音頻信息的采樣率(通常為8K)相同;最后將背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息,并通過編解碼器對混合后的音頻信息進行編碼處理。
[0071]若音頻處理裝置當前正通過錄音、錄像應用進行音頻錄制,處理單元則在錄制完成后將編碼處理后的音頻信息存儲于本地;若正通過微信等應用進行音頻錄制,處理單元則在錄制完成后通過微信將編碼處理后的音頻信息發送給相應的聯系人。
[0072]若音頻處理裝置當前正在進行語音通話,處理模單元則通過射頻模塊向外發送編碼處理后的音頻信息。從而,使得對方聽到的背景音為用戶設置的背景音,而非真實環境下的背景音,使得用戶可以設置背景音來偽裝自己身處的環境,以達到保護隱私或調侃對方的目的,或者對于陌生人的騷擾電話,可以通過設置白噪或類似的背景噪音作為背景音來警告對方。提高了操控性和趣味性,滿足了用戶的個性化需求,提升了用戶體驗。
[0073]上述方法實施例中的技術特征在本裝置均對應適用,這里不再重述。
[0074]需要說明的是:上述實施例提供的音頻處理裝置在進行音頻處理時,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模塊完成。另外,上述實施例提供的音頻處理裝置與音頻處理方法實施例屬于同一構思,其具體實現過程詳見方法實施例,這里不再贅述。
[0075]本領域普通技術人員可以理解,實現上述實施例方法中的全部或部分步驟可以通過程序來控制相關的硬件完成,所述的程序可以存儲于一計算機可讀取存儲介質中,所述的存儲介質可以是R0M/RAM、磁盤、光盤等。
[0076]應當理解的是,以上僅為本發明的優選實施例,不能因此限制本發明的專利范圍,凡是利用本發明說明書及附圖內容所作的等效結構或等效流程變換,或直接或間接運用在其他相關的【技術領域】,均同理包括在本發明的專利保護范圍內。
【權利要求】
1.一種音頻處理方法,其特征在于,包括步驟: 通過麥克采集音頻信息; 濾除所述音頻信息中的環境噪音; 將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息; 對混合后的音頻信息進行編碼處理。
2.根據權利要求1所述的音頻處理方法,其特征在于,所述將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息包括: 讀取預設的背景音的音頻文件,將所述背景音的格式解碼為脈沖編碼調制格式; 對所述脈沖編碼調制格式的背景音的采樣率進行轉換,以使所述背景音的采樣率與采集到的音頻信息的采樣率相同; 將所述背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息。
3.根據權利要求1或2所述的音頻處理方法,其特征在于,所述濾除音頻信息中的環境噪音包括: 比較兩個麥克采集的音頻信息的音量差值; 將采集的音頻信息中音量差值小于預設值的音頻信息作為環境噪音予以濾除。
4.根據權利要求1或2所述的音頻處理方法,其特征在于,所述對混合后的音頻信息進行編碼處理的步驟之后還包括:存儲或向外發送編碼處理后的音頻信息。
5.根據權利要求1或2所述的音頻處理方法,其特征在于,所述方法還包括:在一次通話或錄音過程中,循環使用所述背景音進行混合或使用所述背景音預設次數進行混合。
6.一種音頻處理裝置,其特征在于,包括設置單元、麥克、濾除單元和處理單元,其中: 設置單元,用于設置背景音; 麥克,用于采集音頻信息; 濾除單元,用于濾除所述音頻信息中的環境噪音; 處理單元,用于將預設的背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息,并對混合后的音頻信息進行編碼處理。
7.根據權利要求6所述的音頻處理裝置,其特征在于,所述處理單元用于: 讀取預設的背景音的音頻文件,將所述背景音的格式解碼為脈沖編碼調制格式; 對所述脈沖編碼調制格式的背景音的采樣率進行轉換,以使所述背景音的采樣率與采集到的音頻信息的采樣率相同; 將所述背景音與濾除了環境噪音的音頻信息實時混合為一路音頻信息。
8.根據權利要求6或7所述的音頻處理裝置,其特征在于,所述麥克至少為兩個,所述濾除單元用于:比較兩個麥克采集的音頻信息的音量差值,將采集的音頻信息中音量差值小于預設值的音頻信息作為環境噪音予以濾除。
9.根據權利要求6或7所述的音頻處理裝置,其特征在于,所述處理單元進一步用于:存儲或向外發送編碼處理后的音頻信息。
10.根據權利要求6或7所述的音頻處理裝置,其特征在于,所述處理單元進一步用于:在一次通話或錄音過程中,循環使用所述背景音進行混合或使用所述背景音預設次數進行混合。
【文檔編號】G10L21/0208GK104167213SQ201410426117
【公開日】2014年11月26日 申請日期:2014年8月26日 優先權日:2014年8月26日
【發明者】孫麗 申請人:深圳市中興移動通信有限公司