專利名稱:結合定位技術的麥克風陣列收音方法及其系統的制作方法
技術領域:
本發明涉及一種結合定位技術的麥克風陣列收音方法及其系統,特別是涉及一種可在噪音環境下增強麥克風陣列錄音品質的結合定位技術的麥克風陣列收音方法及其系統。
背景技術:
傳統的麥克風陣列主要包含多個以陣列方式相連接的麥克風,并處理由這些麥克風接收的音源信號,以得知音源信號的方向性,因此應用麥克風陣列可以提升信號信噪比(signal-to-noise ratio,簡稱SNR),以增強來自一特定方向的信號并抑制其他不需要的噪音。
如圖1所示,是現有技術一種稱為”延遲后求和”(delay-and-sum)的麥克風陣列裝置1,其包括n個等距(距離d)設置的麥克風11,n個與各麥克風對應連接的時間延遲單元12,以及一與各時間延遲單元12連接的加法器13。其方法為當這些麥克風11收到音源信號時,先由這些時間延遲單元12以多個不同的延遲時間Δt1、Δt2、Δt3等預估值,依序對該音源信號進行信號延遲,例如將進入第一麥克風m1的信號x1(t)延遲(n-1)×Δt1,對進入第二麥克風m2的信號x2(t)延遲(n-2)×Δt1…,依此類推,最后將經過這些時間延遲單元12延遲的信號送入加法器13進行求和,即可分別針對不同的時間差Δt1、Δt2、Δt3分別得到如下信號求和后的表示式y1(t)=Σk=1nxk(t+(k-1)×Δt1)]]>
y2(t)=Σk=1nxk(t+(k-1)×Δt2)]]>y3(t)=Σk=1nxk(t+(k-1)×Δt3)]]>然后,從這些求和后的信號y1(t)~y3(t)中找出具有一最大振幅的信號,即判定其為最大音源,而得知該最大音源的聲波到達最接近的麥克風與到達鄰近該最接近麥克風的麥克風之間的一延遲時間Δt,并根據式子d×sinθ=v×Δt,其中v為音速,即可求得該最大音源的方向及角度θ。求得延遲時間Δt之后,即令這些時間延遲單元12根據該延遲時間Δt去延遲由所述各麥克風收到的該最大音源信號,即可達到增強(放大)該最大音源并抑制來自其他方向音源的目的。
因此,由上述說明可知,現有技術的麥克風陣列裝置1可以根據上述預估延遲時間的方法去找到最大音源方向,并針對該最大音源進行收音及信號放大。然而,也因為現有技術的麥克風陣列裝置1利用上述估測延遲時間的方法,只能測知最大音源并針對最大音源進行放大,以致于在其收音環境中,當一噪音的聲音強度大過于其所欲收音的目標音源時,該最大音源(即噪音)即會被加強,反而使得該目標音源受到抑制,而產生不佳的錄音效果。
發明內容
本發明的目的在于提供一種結合定位技術的麥克風陣列收音方法及其系統,其可針對特定音源(不一定是最大音源)進行收音及放大,以提升麥克風陣列在噪音環境下的錄音品質。
于是,本發明結合定位技術的麥克風陣列收音方法,可針對一目標音源進行音源收音及放大,其中該麥克風陣列包括多個呈陣列方式排列的麥克風,兩兩麥克風相距一第一距離。該方法包括(a)使用一目標音源偵測單元偵測該目標音源的方位及與該目標音源相距的一第二距離,(b)根據該目標音源偵測單元與這些麥克風之間的已知距離,求得距離該目標音源最近及最遠的一第一麥克風及一第二麥克風,以獲得該第一麥克風與該目標音源相距的一第三距離,以及該第二麥克風與該第一麥克風的間隔數s,(c)根據該第一距離及第三距離,求得該目標音源發出的一聲波到達該第一麥克風及到達另一與該第一麥克風相鄰的麥克風的一延遲時間Δt,及(d)在所述各麥克風收到一聲波信號后,將所述各聲波信號延遲(s-i)×Δt后進行求和,其中i為所述各麥克風與該第一麥克風的間隔數;借此,增強來自該目標音源的聲音信號。
此外,本發明用以實現上述方法的結合定位技術的麥克風陣列收音系統,可針對一目標音源進行音源收音及放大。該系統包括n個麥克風,一目標音源偵測單元及一信號處理單元。這些麥克風是以陣列方式排列,且兩兩麥克風之間間隔一第一距離。該目標音源偵測單元用以測得該目標音源的方位及與該目標音源相距的一第二距離,并根據與這些麥克風之間的已知距離,求得距離該目標音源最近及最遠的一第一麥克風及一第二麥克風,以獲得該第一麥克風與該目標音源相距的一第三距離,以及該第二麥克風與該第一麥克風的間隔數s。該信號處理單元與這些麥克風電連接,并根據該第一距離及第三距離,求得該目標音源發出的聲波信號到達該第一麥克風及到達另一與該第一麥克風相鄰的麥克風的一延遲時間Δt,以在所述各麥克風收到該聲波信號后,依序將所述各聲波信號延遲(s-i)×Δt后進行求和,其中i為所述各麥克風與該第一麥克風的間隔數,借此將該目標音源予以放大。
下面通過最佳實施例及附圖對本發明結合定位技術的麥克風陣列收音方法及其系統進行詳細說明,附圖中
圖1是現有技術的一種麥克風陣列裝置的電路方塊及其工作原理示意圖。
圖2是本發明結合定位技術的麥克風陣列收音方法及其系統的一圖3是本實施例的流程圖。
圖4是本實施例的時間延遲元件的功能說明圖。
具體實施例方式
有關本發明的前述及其他技術內容、特點與功效,在以下配合參考附圖的一實施例的詳細說明中,將可清楚地明白。
參見圖2所示,并配合圖3的流程所示,是本發明結合定位技術的麥克風陣列收音方法及其系統的一實施例,本實施例的結合定位技術的麥克風陣列收音系統2,可針對一目標音源3進行音源收音及放大。系統2包括n個(本實施例以4個為例)麥克風m1~m4,一目標音源偵測單元21及一信號處理單元22。
這些麥克風m1~m4是以陣列(本實施例以一唯陣列為例)方式排列,且兩兩麥克風之間等距間隔一第一距離d1。
且如圖3的步驟a所示,目標音源偵測單元21,用以測得目標音源3的方位及距離,在本實施例中,目標音源偵測單元21是使用一現有技術的人臉偵測技術來實現,其主要包括一數碼攝像機211及一第一處理器212。假設麥克風陣列是欲針對”人”所發出的聲音進行收音,則如圖2所示,當在一錄音環境中同時存在一人(即目標音源3)及一動物4時,數碼攝像機211是用以取得包含目標音源(人)3及動物4在內的一圖像畫面,然后將該圖像畫面送至第一處理器212進行處理。又如圖3的步驟b所示,第一處理器212可根據人臉偵測原理(因屬現有技術且并非本案討論重點,在此不予詳述)判斷出畫面中何者為人的圖像,并根據該人(即目標音源3)在畫面中的位置及成像大小,求得數碼攝像機211與目標音源3相距的一第二距離d2。此外,如圖3的步驟c所示,第一處理器212根據數碼攝像機211與這些麥克風m1~m4間的已知距離,可以得知距離目標音源3最近及最遠的一第一麥克風(即第二個麥克風m2)及第二麥克風(即第四個麥克風m4),并求得第一麥克風m2與目標音源3相距的一第三距離d3,以及第一麥克風m2與第二麥克風m4之間的間隔數s(s=2)(亦即間隔幾個第一距離d1)。
當然,上述的目標音源偵測單元21亦可使用其他,例如活氧(Oxygen)計劃中開發的”Cricket”室內定位系統,無線網路室內定位系統,或全球衛星定位系統(GPS)等來實現,而同樣能夠獲得上述的結果。
信號處理單元22包括一第二處理器221,n(n=4)個分別與所述各麥克風對應連接的時間延遲元件D1~D4以及一加法器222。第二處理器221與上述第一處理器212連接,且如圖2及圖3的步驟d所示,其可根據第一距離d1及第三距離d3,以及目標音源3至第一麥克風m2與目標音源3至第一麥克風m2的相鄰麥克風m3之間的夾角θ,以及公式d4=d1×sinθ=v×Δt,求得目標音源3發出的聲波到達第一麥克風m2及其相鄰麥克風m1或m3的一延遲時間Δt。
這些時間延遲元件D1~D4分別與第一處理器212及第二處理器221連接,以由第一處理器212得知第一麥克風m2的位置及間隔數s,并由第二處理器221得知延遲時間Δt,因此,如圖3的步驟e所示,當所述各麥克風m1~m4分別收到來自各個方向的聲波信號時,其會根據本身與第一麥克風m2的間隔數i(即間隔幾個第一距離d1),將收到的聲波信號x(t)延遲(s-i)×Δt后,分別送至后端的加法器222進行求和,可得到一求和后的聲波信號y(t)=xm1(t+Δt)+xm2(t+2Δt)+xm3(t+Δt)+xm4(t),其中,如圖2及圖4所示,xm1(t+Δt)是由第一時間延遲元件D1將聲波xm1(t)延遲Δt所產生,xm2(t+2Δt)是由第二時間延遲元件D2將聲波xm2(t)延遲2Δt所產生,xm3(t+Δt)是由第三時間延遲元件D3將聲波xm3(t)延遲Δt所產生,而xm4(t)則是由第四時間延遲元件D4不經時間延遲直接輸出。借此,當這些信號被求和后,將使得聲波信號y(t)中的目標音源3的振幅被大大地提升,并相對抑制其他音源,而增強(放大)了目標音源3的聲音信號。
由上述說明可知,本發明與現有技術的麥克風陣列裝置1最大不同之處在于,現有技術的麥克風陣列裝置1是以延遲時間推算出最大音源的方向,亦即嘗試用不同的延遲時間去延遲聲音信號,以獲得一最大音源的方向及一適用的延遲時間,再令麥克風陣列以該延遲時間對該最大音源進行適當延遲后求和,以增強該最大音源,因此無法針對一特定音源進行信號增強。
而本發明則是先測得預設目標音源方位,再由目標音源推算出延遲時間,亦即先以目標音源偵測單元21測知所欲收音的目標音源3的方位,以及目標音源3與麥克風陣列中最接近的麥克風的距離,然后,由信號處理單元22中的第二處理器221根據目標音源3與最接近的麥克風的距離,以及最接近的麥克風與其相鄰麥克風的距離,得出目標音源3的聲波到達最接近的麥克風以及到達與最接近的麥克風相鄰的麥克風的延遲時間,再使所述各麥克風的時間延遲元件根據該延遲時間對收到的聲音信號進行延遲后求和,即可針對聲音信號中的目標音源予以加強。
因此,本發明借由定位技術的輔助,使麥克風陣列能夠針對一預設的特定目標音源(不一定是最大音源)收音并增強其信號,相較于現有技術在噪音聲音強度大過其目標音源的收音環境中,該噪音即被加強而反使目標音源受抑制的缺點,本發明具有可針對特定目標精確收音的明顯功效,而可借此提升麥克風陣列的錄音品質。
權利要求
1.一種結合定位技術的麥克風陣列收音方法,可針對一目標音源進行音源收音及放大,其中該麥克風陣列包括多個呈陣列方式排列的麥克風,兩兩麥克風相距一第一距離;其特征在于該方法包括(a)使用一目標音源偵測單元偵測該目標音源的方位及與該目標音源相距的一第二距離;(b)根據該目標音源偵測單元與這些麥克風之間的已知距離,求得距離該目標音源最近及最遠的一第一麥克風及一第二麥克風,以獲得該第一麥克風與該目標音源相距的一第三距離,以及該第二麥克風與該第一麥克風的間隔數s;(c)根據該第一距離及第三距離,求得該目標音源發出的一聲波到達該第一麥克風及到達另一與該第一麥克風相鄰的麥克風的一延遲時間Δt;及(d)在所述各麥克風收到一聲波信號后,將所述各聲波信號延遲(s-i)×Δt后進行求和,其中i為所述各麥克風與該第一麥克風的間隔數;借此,增強來自該目標音源的聲音信號。
2.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于在步驟(b)中,該間隔數是指兩麥克風之間的第一距離的數目。
3.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于在步驟(a)中,該目標音源偵測單元是一人臉偵測裝置,其包含一數碼攝像機及一第一處理器,該數碼攝像機用以取得包含該目標音源在內的一畫面,并借由該第一處理器判斷在該畫面中該目標音源的大小及方位,而求得該第一距離。
4.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于步驟(c)更包括下列次步驟(c1)根據該第一距離及第三距離,以及該目標音源至該第一麥克風與該目標音源至該第一麥克風的相鄰麥克風之間的夾角,求得該延遲時間Δt;(c2)根據間隔數s,延遲時間Δt以及所述各麥克風與第一麥克風的間隔數i,將所述各麥克風收到的聲波信號延遲(s-i)×Δt;及(c3)將這些延遲后的聲波信號進行求和。
5.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于步驟(a)中的該目標音源偵測單元是一室內定位系統。
6.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于步驟(a)中的該目標音源偵測單元是一無線網路室內定位系統。
7.如權利要求1所述結合定位技術的麥克風陣列收音方法,其特征在于步驟(a)中的該目標音源偵測單元是一全球衛星定位系統。
8.一種結合定位技術的麥克風陣列收音系統,可針對一目標音源進行音源收音及放大,該系統包括多個以陣列方式排列的麥克風、一目標音源偵測單元及一信號處理單元,其特征在于這些麥克風之間兩兩間隔一第一距離;該目標音源偵測單元用以測得該目標音源的方位及與該目標音源相距的一第二距離,并根據與這些麥克風之間的已知距離,求得距離該目標音源最近及最遠的一第一麥克風及一第二麥克風,以獲得該第一麥克風與該目標音源相距的一第三距離,以及該第二麥克風與該第一麥克風的間隔數s;及該信號處理單元與這些麥克風電連接,并根據該第一距離及第三距離,求得該目標音源發出的一聲波信號到達該第一麥克風及到達另一與該第一麥克風相鄰的麥克風的一延遲時間Δt,以在所述各麥克風收到該聲波信號后,將各自收到的該聲波信號延遲(s-i)×Δt后進行求和,其中i為所述各麥克風與該第一麥克風的間隔數,而將該目標音源予以放大。
9.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該間隔數是指所述各麥克風與該第一麥克風之間的第一距離的數目。
10.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該目標音源偵測單元是一人臉偵測裝置,其包含一數碼攝像機及一第一處理器,該數碼攝像機用以取得包含該目標音源在內的一畫面,并借由該第一處理器判斷在該畫面中的該目標音源的大小及方位,而求得該第一距離。
11.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該信號處理單元包括一第二處理器,多個與所述各麥克風對應連接的時間延遲元件及一加法器,該第二處理器與該音源偵測單元連接,并根據該第一距離及第三距離,以及該目標音源至該第一麥克風與該目標音源至該第一麥克風的相鄰麥克風之間的夾角,求得該延遲時間Δt;這些時間延遲元件分別與該音源偵測單元及該第二處理器連接,并根據間隔數s,延遲時間Δt以及所述各麥克風與第一麥克風的間隔數i,將所述各麥克風收到的聲波信號延遲(s-i)×Δt之后,分別送至該加法器進行求和,而增強聲波信號中的目標音源信號。
12.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該目標音源偵測單元是一室內定位系統。
13.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該目標音源偵測單元是一無線網路室內定位系統。
14.如權利要求8所述結合定位技術的麥克風陣列收音系統,其特征在于該目標音源偵測單元是一全球衛星定位系統。
全文摘要
一種結合定位技術的麥克風陣列收音方法及其系統,可放大一目標音源;該系統包括多個以一第一距離相間隔排列的麥克風,一目標音源偵測單元,可測得該目標音源的方位及與其相距的一第二距離,并求得距離該目標音源最近及最遠的一第一及第二麥克風,以獲得該第一麥克風與該目標音源相距的一第三距離,以及該第二麥克風與該第一麥克風的間隔數s,及一信號處理單元,其可根據該第一距離及第三距離,求得該目標音源到達該第一麥克風及與該第一麥克風相鄰麥克風的延遲時間Δt,以將所述各麥克風收到的聲波信號延遲(s-i)×Δt后進行求和,其中i為所述各麥克風與該第一麥克風的間隔數,借此,將該目標音源予以放大。
文檔編號H04R9/00GK1645971SQ200410002739
公開日2005年7月27日 申請日期2004年1月19日 優先權日2004年1月19日
發明者許天明 申請人:宏碁股份有限公司