收音方法及收音系統的制作方法
【專利摘要】一種收音方法,用于一電子裝置中,所述電子裝置包括兩麥克風及一攝像頭,其特征在于,所述方法包括:將所述攝像頭前面的空間劃分為若干區塊;計算出每一區塊到所述兩麥克風之間的收音延遲;確定一用戶的臉部位于所述若干區塊中的一特定區塊;根據所述特定區塊對應的收音延遲,計算出指向所述特定區塊的波束;所述兩麥克風收集在所述波束范圍中的語音并抑制在所述波束范圍以外的噪音。本發明還公開了一種收音系統。
【專利說明】收音方法及收音系統
【技術領域】
[0001] 本發明涉及語音處理領域,特別是涉及一種收音方法及收音系統。
【背景技術】
[0002] 隨著科技的發展,筆記型電腦(Notebook PC)、平板電腦(Tablet PC)、智能手機 (Smartphone)等電子設備,對語音錄入的要求越來越高,清晰、低噪的語音既可以給用戶帶 來良好的使用體驗,也可以提高語音識別應用的準確度。因此,如何降低環境的噪音和其他 干擾源對語音錄入的干擾一直是語音處理領域的研究重點和難點,現有的降噪手段常常需 要較為繁復的運算才能取得足夠的收音品質,然而,反復的運算對硬件設備的要求更高,所 需運算時間也會更多,不適宜即時運算的需要。
【發明內容】
[0003] 鑒于以上內容,有必要提供一種收音方法及收音系統,可以在保證收音品質的前 提下提商收首效率,減少運算時間。
[0004] 一種收音方法,用于一電子裝置中,所述電子裝置包括兩麥克風及一攝像頭,所述 方法包括: 空間劃分步驟,將所述攝像頭前面的空間劃分為若干區塊; 延遲計算步驟,計算出每一區塊到所述兩麥克風之間的收音延遲; 區塊確定步驟,確定一用戶的臉部位于所述若干區塊中的一特定區塊; 波束計算步驟,根據所述特定區塊對應的收音延遲,計算出指向所述特定區塊的波束; 及 語音收集步驟,所述兩麥克風收集在所述波束范圍中的語音并抑制在所述波束范圍以 外的噪音。
[0005] 優選地,所述延遲計算步驟包括: 根據公式Δ= | D1-D2 I /C計算出每一區塊到所述兩麥克風之間的收音延遲,其中,Δ表示 每一區塊到所述兩麥克風之間的收音延遲,D1和D2分別表示每一區塊的中心點到所述兩 麥克風的距離,C表不音速常量。
[0006] 優選地,所述收音方法還包括: 語音監視步驟,監視所述兩麥克風收集到的語音信號的差異是否超過一閥值;及 波束修正步驟,若所述兩麥克風收集到的語音信號的差異超過所述閥值,則利用粒子 群優化算法重新計算指向所述特定區塊的波束。
[0007] 優選地,所述收音方法還包括: 用戶偵測步驟,偵測在所述空間中是否出現多個候選用戶;及 用戶篩選步驟,若所述空間中出現多個候選用戶,則從所述多個候選用戶中篩選出所 述用戶。
[0008] 優選地,所述用戶篩選步驟包括: 偵測所述多個候選用戶的嘴部變化,選取其中嘴部變化最大的候選用戶作為所述用 戶。
[0009] -種收音系統,用于一電子裝置中,所述電子裝置包括兩麥克風及一攝像頭,所述 系統包括: 空間劃分模塊,用于將所述攝像頭前面的空間劃分為若干區塊; 延遲計算模塊,用于計算出每一區塊到所述兩麥克風之間的收音延遲; 區塊確定模塊,用于確定一用戶的臉部位于所述若干區塊中的一特定區塊; 波束計算模塊,用于根據所述特定區塊對應的收音延遲,計算出指向所述特定區塊的 波束;及 語音收集模塊,用于控制所述兩麥克風收集在所述波束范圍中的語音并抑制在所述波 束范圍以外的噪音。
[0010] 優選地,所述延遲計算模塊用于根據公式Δ= | D1-D2 | /C計算出每一區塊到所述兩 麥克風之間的收音延遲,其中,Δ表示每一區塊到所述兩麥克風之間的收音延遲,D1和D2分 別表示每一區塊的中心點到所述兩麥克風的距離,C表示音速常量。
[0011] 優選地,所述收音系統還包括: 語音監視模塊,用于監視所述兩麥克風收集到的語音信號的差異是否超過一閥值;及 波束修正模塊,用于當所述兩麥克風收集到的語音信號的差異超過所述閥值時,利用 粒子群優化算法重新計算指向所述特定區塊的波束。
[0012] 優選地,所述收音系統還包括: 用戶偵測模塊,用于偵測在所述空間中是否出現多個候選用戶;及 用戶篩選模塊,用于當所述空間中出現多個候選用戶時,從所述多個候選用戶中篩選 出所述用戶。
[0013] 優選地,所述用戶篩選模塊用于偵測所述多個候選用戶的嘴部變化,選取其中嘴 部變化最大的候選用戶作為所述用戶。
[0014] 與現有技術相比,用于上述電子裝置中的收音方法及收音系統,藉由偵測用戶人 臉所在的特定空間區塊確定收音延遲,再套用該收音延遲計算出指向所述特定空間區塊的 波束,對該波束范圍內的語音進行采集并對該波束范圍以外的噪音進行抑制,這樣,既保證 了所述電子裝置的收音品質,也避免了聲源定位所需的龐大運算量,使得運算更為即時和 精準。
【專利附圖】
【附圖說明】
[0015] 圖1為本發明一種實施方式中的電子裝置的立體圖。
[0016] 圖2為本發明一種實施方式中的電子裝置的功能框圖。
[0017] 圖3為本發明一種實施方式中的收音系統的功能框圖。
[0018] 圖4為本發明一種實施方式中的電子裝置的攝像頭前面空間被劃分為若干區塊 后的不意圖。
[0019] 圖5為本發明一種實施方式中的計算一區塊與兩麥克風的示意圖。
[0020] 圖6和圖7為本發明一種實施方式中的收音方法的流程圖。
[0021] 主要元件符號說明
【權利要求】
1. 一種收音方法,用于一電子裝置中,所述電子裝置包括兩麥克風及一攝像頭,其特征 在于,所述方法包括: 空間劃分步驟,將所述攝像頭前面的空間劃分為若干區塊; 延遲計算步驟,計算出每一區塊到所述兩麥克風之間的收音延遲; 區塊確定步驟,確定一用戶的臉部位于所述若干區塊中的一特定區塊; 波束計算步驟,根據所述特定區塊對應的收音延遲,計算出指向所述特定區塊的波束; 及 語音收集步驟,所述兩麥克風收集在所述波束范圍中的語音并抑制在所述波束范圍以 外的噪音。
2. 如權利要求1所述的收音方法,其特征在于:所述延遲計算步驟包括: 根據公式Δ= | D1-D2 | /C計算出每一區塊到所述兩麥克風之間的收音延遲,其中,Δ表示 每一區塊到所述兩麥克風之間的收音延遲,D1和D2分別表示每一區塊的中心點到所述兩 麥克風的距離,C表不音速常量。
3. 如權利要求2所述的收音方法,其特征在于:所述收音方法還包括: 語音監視步驟,監視所述兩麥克風收集到的語音信號的差異是否超過一閥值;及 波束修正步驟,若所述兩麥克風收集到的語音信號的差異超過所述閥值,則利用粒子 群優化算法重新計算指向所述特定區塊的波束。
4. 如權利要求2所述的收音方法,其特征在于:所述收音方法還包括: 用戶偵測步驟,偵測在所述空間中是否出現多個候選用戶;及 用戶篩選步驟,若所述空間中出現多個候選用戶,則從所述多個候選用戶中篩選出所 述用戶。
5. 如權利要求4所述的收音方法,其特征在于:所述用戶篩選步驟包括: 偵測所述多個候選用戶的嘴部變化,選取其中嘴部變化最大的候選用戶作為所述用 戶。
6. -種收音系統,用于一電子裝置中,所述電子裝置包括兩麥克風及一攝像頭,其特征 在于,所述系統包括: 空間劃分模塊,用于將所述攝像頭前面的空間劃分為若干區塊; 延遲計算模塊,用于計算出每一區塊到所述兩麥克風之間的收音延遲; 區塊確定模塊,用于確定一用戶的臉部位于所述若干區塊中的一特定區塊; 波束計算模塊,用于根據所述特定區塊對應的收音延遲,計算出指向所述特定區塊的 波束;及 語音收集模塊,用于控制所述兩麥克風收集在所述波束范圍中的語音并抑制在所述波 束范圍以外的噪音。
7. 如權利要求6所述的收音系統,其特征在于:所述延遲計算模塊用于根據公式 Δ= | D1-D2 | /C計算出每一區塊到所述兩麥克風之間的收音延遲,其中,Δ表示每一區塊到所 述兩麥克風之間的收音延遲,D1和D2分別表示每一區塊的中心點到所述兩麥克風的距離, C表示音速常量。
8. 如權利要求7所述的收音系統,其特征在于:所述收音系統還包括: 語音監視模塊,用于監視所述兩麥克風收集到的語音信號的差異是否超過一閥值;及 波束修正模塊,用于當所述兩麥克風收集到的語音信號的差異超過所述閥值時,利用 粒子群優化算法重新計算指向所述特定區塊的波束。
9. 如權利要求7所述的收音系統,其特征在于:所述收音系統還包括: 用戶偵測模塊,用于偵測在所述空間中是否出現多個候選用戶;及 用戶篩選模塊,用于當所述空間中出現多個候選用戶時,從所述多個候選用戶中篩選 出所述用戶。
10. 如權利要求9所述的收音系統,其特征在于:所述用戶篩選模塊用于偵測所述多個 候選用戶的嘴部變化,選取其中嘴部變化最大的候選用戶作為所述用戶。
【文檔編號】G10L21/02GK104157291SQ201310176743
【公開日】2014年11月19日 申請日期:2013年5月14日 優先權日:2013年5月14日
【發明者】梁哲銓 申請人:鴻富錦精密工業(深圳)有限公司, 鴻海精密工業股份有限公司