專利名稱:利用心理聲學模型和過采樣濾波器組的聲音清晰度增強的制作方法
技術領域:
本發明涉及音頻再現應用,其中期望的音頻信號以無污染的形式獲得并且干擾(例如環境噪聲)作為聲音信號出現。
背景技術:
在聲音嘈雜的環境中,收聽者難以聽到所想要的聲音信號或“興趣信號”。例如,在汽車里的手機用戶通過他們的耳機可能難以聽清所接收的語音信號,因為汽車的噪音屏蔽了興趣信號(即手機所接收的語音信號)。為了解決這一問題,過去曾經進行了許多嘗試。其中一些簡要地描述如下(a)被動噪聲衰減耳機用于耳機應用的特定應用場合,由將環境聲音噪聲與收聽者的耳朵以物理方式隔離的大而笨重的耳罩提供無源噪聲衰減。
(b)放大放大輸入的感興趣的電信號以克服背景噪聲的強度。如果控制不適當,可能導致有害的高聲輸出強度。并且,除非很好地控制了放大工作,否則不能提供所希望的好處。
(c)過濾信號被靜態地過濾,使其更清晰。
(d)簡單自動增益控制(AGC)興趣信號通過自動增益控制系統,其中根據耳罩內或耳罩外的噪聲強度測量調節增益。這種AGC增益通常通過簡單測量整體噪聲強度來控制。
(e)主動噪聲清除(ANC)產生抗噪聲(用開環或閉環伺服系統產生的)并有聲地施加給噪聲信號。對于耳機的應用,參見Bose,Amar等人的“Headphoning”(美國專利4,455,675,1984年6月19日)和Moy,Chu的“Active Noise Reduction in Headphone System”,(Headwize技術論文庫,1999)。
(f)有時候,這些方法相結合耳機應用的一個通常方案是將被動噪聲衰減耳機和ANC系統相結合(見Bose,Amar等人的“Headphoning”,(美國專利4455675,1984年6月19日))。
雖然在多種應用中,這些方法是很有效的,并且能減少噪聲,但這些方法并不總是是合適的。例如,ANC需要精確的噪聲基準(reference),該噪聲基準有時可能得不到,并且其只在低頻下工作。被動噪聲衰減只有在具有足夠的隔音空間時才能有效地工作。過濾使信號頻率成分失真。AGC系統沒有考慮人的聽力系統并產生次優化結果。同時,即使能夠應用這些方案的,也存在著由于這些方案的能量消耗過大而受到限制的場合,所以需要小型化,低能量的技術。
因此,需要解決上面提到的這些問題,并且還需要有一種革新方法以提高和/或取代現有的技術。
發明內容
本發明的目的是提供一種提高信號質量和信號清晰度的新穎方法和系統。
根據本發明的一方面,提供了一種克服干擾信號的提高信號清晰度的系統,其包括一個分析濾波器組,用于將時域中的信息信號轉換成轉換域中的多通道信息信號;一個信號處理器,用于處理分析濾波器組的輸出,該信號處理器包括一個利用心理聲學模型計算動態范圍的心理聲學處理器,以提供克服干擾信號的可聽的信息信號;和一個合成濾波器組,用于混合信號處理器的輸出,以產生輸出信號。
本發明的信號清晰度增強(SIE)的設計使得減小了現有技術裝置的不利因素和缺點。它可以用于噪聲信號相對于興趣信號很強的環境中。這種環境導致能得到的動態范圍非常有限。雖然可以利用以往系統的簡單動態范圍壓縮方法將興趣信號映射到這個很小的動態范圍中,但是所得到信號的保真度和質量可能受到影響。在這種情況下,施加使興趣信號克服不良噪聲而可被聽見所需要的最小增益(因而更清晰),造成了信號質量的提高。因此本發明涉及確定和應用這個最小增益。
根據本發明,SIE處理包括一個心理聲學模型,它在工作進行中,計算要使興趣信號克服不良噪聲而可被聽見所必須施加的最小放大值。這樣得到較好的保真度和信號質量。
根據本發明,信號清晰度增強(SIE)算法通過測量(1)外部干擾(不良信號、噪聲)強度或(2)頭戴式耳機耳罩中的或耳道中的干擾(不良信號、噪聲)強度,自適應地調節興趣信號(電的)的增益和平衡,以使興趣信號的清晰度和可聽性提高。這些強度測量是單獨利用頻段級別或綜合利用本領域的已知技術來進行,這些技術描述在Schneider,Told A.的“自適應動態控制器”(MASc論文集,加拿大安大略省,滑鐵盧大學,1991);Schneider和Brennan的“用于數字助聽器的壓縮策略”(Proc.ICASSP 1997,德國,慕尼黑);和Schmidt,John的“音頻信號的動態范圍壓縮裝置”(美國專利5832444號)中已經說明。
總的來說,通過利用本發明,使用者接收的信號的SNR(信噪比)得到了提高,并且其不斷地適應使用者的環境,提供的興趣信號強度是令人舒適的。這樣就提高了信號清晰度,提高了感知信號質量,并減少使用者的疲勞。
為了提供最好的保真度,超微型的尺寸和最低的功率消耗,優選地,SIE算法利用過采樣濾波器組實現,以將興趣信號和不良信號分成若干個交疊的、相鄰的或不交疊的波段。在Schneider和Brennan的美國專利6,236,731“用于過濾信息信號并將信息信號分成不同波段的濾波器組結構和方法,特別是用于助聽器的音頻信號上述結構和方法”中說明了一種合適的過采樣濾波器組。有利地實現該設計的結構組合了一個加權疊加(WOLA)濾波器組、一個可編程軟件DSP芯、一個輸入-輸出處理器和非易失存儲器。在Schneider和Brennan的美國專利6,240,192“包括應用特定的集成電路和可編程數字信號處理器的數字助聽器中的過濾裝置和方法”已說明了這種結構。
在任何需要提高含有大量噪聲的所接收音頻信號的清晰度,同時要保持高保真度和良好的信號質量的場合,都可以使用本發明。本發明的典型應用包括用于呼叫中心的耳機、在噪聲環境(例如飛機、音樂會、工廠等)中使用的移動電話和其他微型/便攜式音頻裝置。
參考下面的說明書、權利要求和附圖可以進一步理解本發明的其他特征、方面和優點。
下面將參考附圖描述本發明的實施例,其中圖1示出了用于接收算法的典型情況;圖2是將興趣信號的動態范圍映射成可獲得的動態范圍的示意圖;圖3示出根據本發明的信號清晰度增強的基本操作。
圖4示出根據本發明的SIE處理的高電平框圖,包括期望信號活性檢測器(DSAD)(或聲音活性檢測器(VAD));圖5示出利用自適應噪聲評估的SIE的框圖;圖6示出利用不同譜線的噪聲評估的SIE的框圖;圖7示出直線壓縮的輸入/增益函數;圖8示出一個具有相結合的SIE和ANC的本發明的實施例;圖9是一個說明結合左右噪聲層(noise floor)的曲線圖;圖10示出具有傳輸算法能力的二進制組合系統;圖11示出具有共享傳輸(Tx)傳聲器的開環SIE的框圖;圖12示出具有共享傳輸(Tx)傳聲器和方向處理的開環SIE的框圖。
具體實施例方式
下面將具體參考收聽者使用的耳機描述優選實施例,本發明主要用于耳機,但并不是只能用于耳機。
應用于音頻收聽的信號處理算法通常稱之為“接收算法”(Rx),因為收聽者想要聽到接收的音頻信號。本發明的信號清晰度增強(SIE)處理的一種典型應用是用于噪聲環境的耳機。圖1示意地示出了該元件和興趣信號。收聽者101收聽通常來自電信號107的期望聲音和環境(周圍)噪聲110的合成,環境噪聲是使興趣信號的清晰度降低的不良信號。由耳機115提供的被動衰減減少了可聽到的環境噪聲強度。
如果在耳道中興趣信號的強度遠低于噪聲信號的強度,那末興趣信號被淹沒而聽不到。收聽者還具有覺得舒適的最大信號強度(響度不舒適強度-LDL)。LDL可以是簡單的基于頻率的對不舒適強度的測量(如本技術領域中眾所周知的用于聽覺的聽力評估和調校),或是對說明臨界帶寬之內的信號強度、頻率成分、信號持續時間或其他相關心理聲學參數的心理聲學響度的復雜測量。噪聲信號和LDL均為頻率的函數,兩者強度的差別在于有效動態范圍,有效動態范圍也是頻率的函數。由于不良信號(即噪聲)的強度,收聽者感受到減小的動態范圍。以與頻率相關的方式再映射興趣信號,增加興趣信號的強度使之高于周圍的噪聲,興趣信號就可以被聽到。然而,放大作用必須使信號強度不能超出使收聽者感到舒適的最大信號強度(LDL)。解決的方法是在出現環境噪聲的情況下,將原始興趣信號的動態范圍映射成可用的信號動態范圍。這種信號處理被稱為動態范圍壓縮。在圖2中示出了單一頻段的這種映射,在圖2中,期望(原始)動態范圍210及其噪聲層215,與具有被環境噪聲增大了的噪聲層225的不純動態范圍220相比較。因此,動態范圍壓縮的目的是有意地使興趣信號的動態范圍失真,但同時使感覺到的失真最小。
下面參考圖3來說明作為頻率函數的一種動態范圍壓縮操作的形式。圖3以頻率300比任意強度305的比例的曲線形式,示出了期望興趣信號310和不良(環境)噪聲315的頻譜。注意,在一定頻率320之上,興趣信號310的強度下降,趨近并低于不良噪聲315。在系統中,興趣信號310有選擇地,即取決于頻率和輸入強度,作為輸入強度地函數被放大為330,以便高于噪聲層而能夠被聽到。多個交疊或不交疊的頻段有利地實現了這一操作,這些頻段可以被單獨處理或組成為通道一起處理。為完整起見,圖3還示出了前述的響度不舒適強度(LDL)340。
在下面對優選實施例的描述中,在一個或多個分析濾波器組和合成濾波器組之間的路徑應當認為具有N維(dimension)(平行路徑),這是因為通過分析濾波器組得到N個子頻段,每個都需要單獨的路徑。由于要單獨考慮和操作每個子頻段,這種考慮也適用于設置在該濾波器組之間的任何功能框。雖然通常N>=16,本發明特別適用于N>1的情況。在某些實施例中,這些N個子頻段組成為K個通道中,其中每個通道包括一個或多個相鄰的子頻段,然后處理每個通道,使得在這個通道內的所有子頻段得到相同的增益。
參考圖4,圖4示出本發明的一個實施例的框圖,第一聲音輸入裝置(信號傳聲器)401接收興趣信號(通常是語音),并且將它傳遞到第一WOLA分析濾波器組405。第二聲音輸入裝置(噪聲傳聲器)402接收可能參有興趣信號的環境噪聲并將它傳遞到第二WOLA分析濾波器組406。第二聲音輸入裝置402通常位于耳道內(所謂的閉環裝置(implementation))或耳道外面(所謂開環裝置)。每個濾波器組將輸入信號分成N個子頻段。
這些裝置之間的任何差別在下面的描述中被指出。在閉環裝置中,由于信號路徑(例如,將聲音傳輸到模制在耳機中的揚聲器中的聲管)聲音的原因,已經包括了平衡。相反,在開環裝置中,由于頭戴式耳機耳罩的衰減和頻率響應以及聲音信號路徑的原因,包含從傳聲器到耳道內的傳遞函數模型。也可以包括輸出級的模型,使得在任何自適應平衡之前,可能出現在耳道中的興趣信號的強度能夠被逼近。
在開環裝置中,可以使用單獨或共享的環境噪聲傳聲器。在利用共享傳聲器的情況下,可以使用同一個揚聲器傳輸信號(例如,應用耳機中傳輸語音)。這就減少了成本并簡化了機械結構。在這種情況下,需要有一個信號或噪聲活性(activity)檢測器,以確保噪聲頻譜估計不包含任何傳輸信號。
在運行中,包含在心理聲學處理方框430中的心理聲學模型以頻率子頻段的方式或以組合的頻率子頻段(通道)方式接收興趣信號強度,該頻率子頻段覆蓋由第一(興趣信號)WOLA分析濾波器組405產生的期望信號頻譜。然后,使用這些相同頻段或組合頻段(通道)中的環境噪聲強度,但被應用于由第二(環境噪聲)WOLA分析濾波器組產生的環境噪聲頻譜的心理聲學處理方框430計算動態范圍參數。這些計算出的參數被送到多段壓縮器420,多段壓縮器又將他們施加到由第一(興趣信號)WOLA分析濾波器組405得到的子頻段。然后多段壓縮器420利用由心理聲學處理方框430提供的動態范圍參數去平衡作為頻率函數的信號,從而改進可聽見性或清晰度。利用與已知的動態范圍壓縮技術相結合的心理聲學模型,確保了輸出音頻克服環境噪聲而被清晰地聽見,同時使感覺到的失真最小,并保持期望信號的質量。期望信號活性檢測器(DSAD)方框410接收來自WOLA分析濾波器405、406的輸出,并利用頻譜評估方框435將更新控制到噪聲頻譜的評估。以下說明的該頻譜評估方框435為心理聲學處理方框430提供進一步信息。多段壓縮器420的輸出被提供給合成濾波器組450。合成濾波器組450將多段壓縮器420的輸出轉換,以輸出一個時域音頻信號。
噪聲評估對在心理聲學處理方框430中進行的SIE信號處理的一個重要輸入是由第二輸入裝置402提供的環境噪聲頻譜。本發明的SIE處理頻譜評估方框435包括一種自適應評估技術或頻譜區別技術。結合期望信號功率檢測器(DSAD)410,這些技術對要確定的環境噪聲頻譜提供精確的不參雜的評估。在另一個優選實施例中,環境噪聲是用共享的輸入傳聲器獲得的(見下文)。
在開環的情況下,噪聲評估是由共享或單獨傳聲器完成的。共享或單獨傳聲器上的DSAD或VAD以從共享或單獨傳聲器經頻譜分析得到的噪聲頻譜評估來控制更新。如果在共享或單獨傳聲器上檢測到語音(或某些其他興趣信號),那末噪聲的頻譜評估不進行更新(注意,在開環情況下不使用頻譜區分和自適應評估)。
在閉環情況下,位于耳罩內的傳聲器接收的是信號加噪聲的混合形式。在這種情況下,我們需要將信號去除(這是已知的,因為我們有電形式的信號)。這是利用頻譜區分和自適應評估技術來實現的。
期望信號活性檢測器(DSAD)DSAD 410利用本領域共知的技術,在不存在興趣信號時(即,在期望信號暫停或中斷時)對信號頻譜采樣。這樣確保算法不把期望信號(或在具有共享傳聲器的耳機應用情況下,所傳輸的語音)當作環境噪聲的一部分。
在使用閉環裝置的實施例中,當DSAD 410指示沒有期望興趣信號出現,噪聲頻譜圖像被更新,從而使得結果頻譜被興趣信號參雜得最少。在利用開環裝置的另一個實施例中,DSAD 410可以有選擇地監控環境噪聲信號,以確保傳輸語音或其他興趣信號不會參雜作為對心理聲學模型的輸入所提供的噪聲頻譜。
在閉環裝置中,如果噪聲頻譜在某些預定的時間內沒有被更新,那末,輸出音頻可以在短時間內有選擇地凈噪,使得在沒有期望信號出現時,噪聲頻譜能夠被更新。結合定時更新(需要時)使用DSAD,確保噪聲頻譜總是最新的,并且絕不參雜有期望信號頻譜。
自適應噪聲評估在本發明的一個優選實施例中,利用采用了本領域已知技術的自適應噪聲評估來評估環境噪聲,但是,在過采樣的WOLA子頻段濾波器組的情況下,也可以使用一種技術,這種技術在由本申請人同一天申請的一起尚待批準的序列號為2,354,808的加拿大專利申請中已作了說明,其名稱為“在過采樣濾波器組中的子頻段自適應處理”,其美國申請號為xxxxxxx,在此結合該專利公開的內容作為參考。
圖5示出了具有自適應評估的SIE的框圖。雖然描述了時域技術,但本領域的技術人員應當明白,變換(例如,頻率)域技術也是可能的并且是有利的。電子形式的期望信號501被傳遞到第一分析濾波器組503,該濾波器組產生多個如前面的實施例中的子頻段。然后每個子頻段被乘法器505用從心理聲學模型507得到的函數G相乘。施加增益的結果轉而傳遞到合成濾波器組509,該濾波器組轉換來自子頻段修改的信號并將該輸出傳遞到驅動接收器513的功率放大器511。物理位置接近于接收器513的傳聲器520將其輸出送出到一個自適應相關器525,其中該輸出是參有包括環境噪聲的各種噪聲成分的期望信號。作為噪聲信號的評估,對自適應相關器525的輸出被第二合成濾波器組530分解成子頻段。來自第二合成濾波器組530的子頻段也被傳遞到心理聲學模型框507。如上所述,自適應評估也可以在轉換域中進行。
自適應噪聲評估不需要中斷興趣信號來評估噪聲。噪聲是利用從傳聲器520得到的參雜信號和期望電輸入信號501(興趣信號)之間的相關性連續地評估的。自適應相關器525的輸出主要包含期望信號501和期望信號加噪聲520之間不相關的信號成分。
利用頻譜區分的噪聲評估頻譜區分是取興趣信號的變換域形式與環境噪聲的變換域形式的過濾或未過濾形式之間的差。這個減法可以在頻段或頻段組進行。這種評估方法在閉環裝置(見下文)中特別有利,由于環境噪聲和SIE處理的興趣信號的聲學累加,在閉環裝置中環境噪聲信號也包含有興趣信號。
采用對興趣信號的過濾能夠得到更精確的評估。當濾波器具有與輸出級(SIE平衡、放大器、揚聲器和聲音)以及傳聲器的頻率響應相等或近似相等的頻率響應時,那么變換域中的減法對未參雜的(用興趣信號)環境噪聲提供了極佳的近似。這種過濾可以有選擇地包括對于零輸出(null-out)變換器和其他差值的校準,并且可以用離線或在線技術來實現。
和自適應評估一樣,頻譜區分不需要中斷期望信號來評估噪聲——噪聲是利用兩個信號之間的頻譜差別連續地評估。圖6示出了這樣一種系統,其中引入了新的函數F’605,該函數逼近分析濾波器組601和接收器614之間的信號路徑的整體傳遞函數F 610。信號路徑包括一個乘法器611、一個合成濾波器612、一個功率放大器613和接收器614本身。采樣傳聲器620將代表期望信號加任何引進噪聲的信號送入第二濾波器組625,第二濾波器組的輸出與作用在期望信號適當子頻段的函數F’605的結果相結合,以產生噪聲評估630,噪聲評估630被輸送到心理聲學模型635。然后來自心理聲學模型635的增益輸出與每個子頻段在乘法器611中相乘。
圖6a示出N個子頻段被組合進K個通道中的另一個實施例,并且引進另一個與耳機性能特性評估相關的函數。對于重復圖6中函數的那些組件,不再加以說明。分析濾波器601、625的N個輸出子頻段被傳遞到頻段成組框603、627,頻段成組框將若干個頻段組合為單一的通道,這樣僅僅進一步處理k個通道(其中K<N)。頻段成組框603、627的輸出分別傳遞到強度測量方框605、628,在此每個通道的強度被測量,其結果又傳遞到適當的強度寄存器606、629。心理聲學模型635利用儲存在寄存器606、629的通道的興趣信號和“信號+噪聲”強度,來計算施加到每個頻段的增益。此外,這些增益以反饋的形式被用來調節函數H(z)615,該函數利用模型640逼近耳機的傳遞函數。函數H(z)的輸出用減法器630調節作為提交給心理聲學模型635的噪聲強度。
心理聲學處理可以使用心理聲學模型635的四個不同的方式以及其組合來計算施加給變換信號域的增益。對該增益的計算要確保期望信號處理后的形式總能克服環境噪聲而被聽見,并且總是能使收聽者感到舒適。在所有情況下,LDL確定了動態范圍的上限。
1)動態范圍的下限由一個頻段或頻段組合的環境噪聲的能量來確定。
2)動態范圍的下限由一個頻段或頻段組合的環境噪聲的強度乘以0與1之間的可調節系數(X)建立。該系數控制低強度興趣信號被裝置放大的量。較低的X可使興趣信號獲得較大動態范圍,并改進信號質量。X太低則意味著在低強度時,興趣信號被環境噪聲所掩沒。
3)動態范圍的下限由復雜的心理聲學模型確定,該模型考慮興趣信號和環境噪聲的強度、頻譜成分和頻譜性質,以計算在噪聲內的最小的可清晰聽到的強度,這在本領域內已為人所知。
4)動態范圍的下限由一個通道內的噪聲能量減去興趣信號的SNR所確定。
在一個優選實施例中,利用臨界頻段、頻率成分、信號持續時間或其他相關的心理聲學參數,以信號強度為基礎,并利用感知信號響度的在線評估來計算LDL。
多頻段壓縮器在一個優選實施例中,心理聲學模型的一個元件是多頻段動態范圍壓縮器。對于較小的有效動態范圍的動態范圍壓縮是利用若干種已知的強度映射算法中的一種完成的。使用這些方法時可以結合查詢表或其他已知的手段的輔助,以提供壓縮輸入對增益函數的形狀,在其他情況下增益可以根據數學公式直接計算。可能的強度映射算法的例子是
1)直線壓縮法——其中輸入/增益函數是如圖7所示的直線。這里,強度映射算法包括以分貝形式表示的用于壓縮區的數學公式增益=E噪聲×(1-E信號/LDL)2)曲線壓縮法——輸入/增益函數不是直線,而是彎曲的,以便較好地符合人的聽力系統中對響度增長的感覺。這種方法的結果是改進了感知保真度,但是它必須依賴于復雜的公式,或者要從查詢表中提取信息。
3)心理聲學模型包含在壓縮器中或與壓縮器一體,以使期望信號能夠被聽見。對增益的時間變化以這樣的方式控制,使感覺的失真最小,并且使興趣信號盡可能被聽見。
對于所有的強度映射算法,心理聲學模型通過確定要在噪聲內聽到什么聲音,來計算在給定(子頻段或)通道中使失真最小的強度。這樣的信息帶來對期望信號質量的客觀評估,能夠計算出近似優化的壓縮參數。采用其他強度映射模式也是可行的。
通常的情況是,輸入的興趣信號不是完全沒有噪聲的。在這種情況下,并非對整個動態范圍進行壓縮,對存在噪聲的信號的低強度擴展(增加動態范圍)是有利的。這樣可以感覺到興趣信號中的噪聲減小,并且使其聽不到。如果已經知道興趣信號的噪聲層,前面參考圖2描述的動態范圍再映射可以進一步減少該噪聲層的可聽見度,因為它被環境噪聲所掩沒。
為了在所有環境中提供高感知保真度,可以執行頻譜傾斜限制(tiltconstraints)。這類限制防止本發明對聲音過度處理到這樣的程度,即輸出音頻的均衡使得在以頻譜成形的噪聲環境中,輸出音頻令人不舒服或質量下降。在一個優選實施例中,該限制是通過在壓縮器的不同通道之間執行最大的增益差而實現的。當本發明中所用的處理試圖超出最大增益差的閾值時,在各通道中兼顧考慮以要求更極端的調節或適應,并且施加或多或少的增益以滿足該限制。也可采用使用更復雜手段的其他限制,例如語音質量的目標測量。
每個個人的是獨一無二的,并且因此每個個人的能夠確定并設置他或她自己的LDL、期望收聽強度和響度的加大量。通過個性化處理,心理聲學操作的關鍵特性是針對單個使用者進行調節(與助聽器的調節方式不同)。在一個優選實施例中,這些參數作為心理聲學模型的一部分,被非易失存儲器存儲。
使用者的SIE強度調節SIE的使用者也許想要調節信號處理算法的靈敏度。因為低強度的聲音是聽不見的(不是因為高強度的聲音是可聽見的),調節這種控制的使用者通常是調節強度,這種控制可以看作是高級音量控制。在一個優選實施例中,前面(心理聲學處理中)所述的參數“X”可以讓使用者能調節控制SIE算法的靈敏度。也可以采用其他更先進的實施例,其中強度調節為心理聲學處理框提供一個參數輸入。并且這類更先進的實施例依賴于所采用的心理聲學處理的特定類型。
與主動噪聲消除的結合目前許多耳機都有主動噪聲消除(ANC)。ANC技術的應用是通過產生主動消除環境噪聲的抗噪聲(anti-noise),改善噪聲環境中的信號清晰度。然而,由于已知的反饋系統的限制,ANC通常只對低頻有效。通過將SIE發明與ANC結合,聲音的質量和可感知度被增強,這是兩種方法中任何一種都不能單獨獲得的。圖8示出了這種結合。興趣信號801進入分析濾波器組805,由此子頻段通過乘法器807,然后傳輸到合成濾波器809,在此被轉換并傳遞到加法器812,加法器的輸出通過反相器814、輸出級(放大器)816、使輸出與噪聲信號817混合的第二加法器818,然后傳輸到接收器820。興趣信號還輸入給心理聲學模型框840,心理聲學模型框控制通過乘法器807的子頻段。心理聲學模型框840的另一個輸入來自包含聲音延時825的一個反饋回路,聲學延時825將用來驅動接收器820的信號輸送到傳聲器830,傳聲器830的輸出首先被放大到832,然后通過低通濾波器834被傳遞到第一加法器812,并傳輸到心理聲學模型框840。在某些實施例中,相關ANC系統已經具有用來采樣噪聲的傳聲器,這個傳聲器同時可以用于信號清晰度增強以對耳道中的環境噪聲進行采樣。這兩種技術的結合使其每一種更精巧,因此減小了失真,同時可以提高質量和感知性。
在另一個實施例中,SIE和ANC處理的結合是使用過采樣的WOLA濾波器組作為對ANC系統的預均衡器實現的。可以利用這二者結合的模擬或數字信號處理來實現ANC系統。在本領域,這種ANC處理是眾所周知的,因此不再說明。WOLA測量耳道中的(閉環ANC)預均衡的剩余噪聲或外部環境噪聲(開環ANC),并使用所得的頻譜信息作為給預均衡器提供動態范圍參數的心理聲學模型的輸入。
雙聲道操作當使用立體聲系統時(例如雙耳聲道耳機或頭戴式麥克風),可以包括用于SIE的聯合通道處理擴展。考慮兩種情況1)每只耳朵外(開環)或耳罩內(閉環)有一個傳聲器。在這種情況下,如圖9所示,其中具有噪聲強度軸950,頻率軸960,右聲道910和左聲道900的噪聲層通過某種方式(例如取每個通道的或每個通道中的每個子頻段的左右側的最大強度或平均強度)結合,以提供結合的噪聲層920。
2)在耳罩中的一個或在裝置的其它地方只有一個傳聲器。在這種情況下,只具有一個噪聲測量。
僅有一個噪聲測量對于SIE算法是很重要的,因為立體聲壓縮器方式(可能具有獨立的噪聲測量)可以導致不需要的獨立通道調節,并因此降低感知的音頻質量。當使用者僅有一個環境噪聲測量時,SIE處理方式的左右兩側使用同樣的信息來。在立體聲興趣信號情況下,兩個SIE處理裝置使用同樣的環境噪聲強度,以控制隨后的每個音頻流的處理。
在圖10所示的一個實施例中,雙聲道耳機1020、1052與單聲道信號1000一起使用。其典型的應用是使用單聲道語音的移動電話耳機。結合器(combiner)1072、心理聲學模型框1075和供給乘法器1007的組合實現了一個單一SIE處理裝置被。經過放大器1001的放大、數字到模擬的轉換1003,輸入(期望的)信號1999被第一分析濾波器1005分成子頻段,每個子頻段在乘法器1007與來自心理聲學模型框1075的合適輸出相乘,然后被合成濾波器1013轉換為單頻段。這個“單頻段”電信號經其各自的低通濾波器1030、1060,反相器1035、1062,加法器1015、1050和放大器1017和、1051被送到輸出變換器1020、1052,根據靠近其各自接收器1020、1052的噪聲檢測傳聲器1022、1055的輸入,這些信號進一步被單獨修正。心理聲學模型框1075也利用來自噪聲檢測揚聲器1022、1055的信號,噪聲檢測揚聲器1022、1055的輸出經過其各自的模-數轉換器1027、1065傳遞到第二和第三分析濾波器1040、1070,其輸出子頻段在結合器1072被結合形成聯合頻譜圖像,以便由心理聲學模型方塊1075處理,來產生用于乘法器1007中的各個子頻段的合適增益控制信號。這種方式的優勢在于,只用一個D/A轉換器1013將處理過的信號傳遞給兩個輸出轉換器1020、1052。
包括1025、1030、1035、和1015(或1056、1060、1062和1050)的反饋路徑實現了前述的ANC系統與SIE的結合。
共享噪聲傳聲器本發明的另一個SIE實施例被用在圖11所示的開環結構中(通常用在無線電通信頭戴式耳機中),其中用來接收傳輸的(Tx)語音的傳聲器1120也用來采樣環境噪聲——所謂的共享傳聲器技術。興趣信號1101被第一分析濾波器組1103輸入到N個子頻段,并且子頻段被頻段成組框1150組成K個通道。每個這些“興趣信號”通道的強度由強度測量框1153來測量,并且該強度被存儲在合適的寄存器1155中。每個子頻段還被乘法器1107修正,并且這些子頻段被合成濾波器組1110重新組合成單頻段并傳輸到音頻輸出1115。類似地,來自傳聲器1120的環境噪聲的采樣被第二合成濾波器1123分成N個子頻段,并且其結果的子頻段被另一個頻段組合框1160組合成K個通道。每個這些噪聲通道的強度由強度測量框1163測量并存儲在合適的寄存器1165中。心理聲學模型框1140利用存儲在興趣信號寄存器和噪聲寄存器中的強度值確定由乘法器1107施加到輸入的興趣信號1101的每個頻段的增益。聲音活性檢測器1125監控噪聲分析濾波器組1123的輸出并檢測傳輸信號(聲音)的間隙。只有出現這種間隙時,測量到的強度才被認為是正確的。因此,信號從聲音活性檢測器1125傳遞到強度寄存器1165指示出何時沒有聲音活性。這種方式降低了成本和硬件的復雜性。
在另一個實施例中,用來恢復傳輸信號的算法也可以與圖1的開環傳聲器共享SIE系統相結合。例如,在圖12中,本領域所共知的或尚待批準的處理算法已經被用來減少傳輸信號的噪聲,但是用于該信號的相同傳聲器也可以采用圖11所示的技術被用于評估環境噪聲。在圖12中,興趣信號1210的路徑類似于前述實施例中的路徑,即興趣信號1210被第一方向濾波器組1213分成子頻段,每個子頻段被乘法器1215修改,并且這些子頻段被合成濾波器組1217變換成單一頻段,并且被放大器1219放大用于接收器1220。然而,相反的是,噪聲信號是從兩個揚聲器(所謂的前后揚聲器)1201、1207得到的,揚聲器1201、1207的輸出被相應的第二和第三分析濾波器組1203、1209分成子頻段。兩組子頻段被方向處理框1230利用,因在此不相關,所以不作說明。同一組子頻段信號被傳輸給期望信號活性檢測器(DSAD)框1240,框1240的輸出傳輸給控制乘法器1215的心理聲學模型框1260。同時,對應距離被傳輸信號最遠的傳聲器的第三分析濾波器1209的輸出經過傳遞函數框1250,被傳遞給心理聲學模型框1260。期望能夠確定從Tx傳聲器到輸出變換器的傳遞函數1250,以對耳道中的噪聲強度提供精確的評估,從而逼近閉環條件。
在另一個實施例中(圖12未示出),方向處理框提供一個輸出噪聲評估以獲得包含較少傳輸語音的噪聲評估,該輸出噪聲評估是使音束偏離被傳輸的信號源而產生的。在又一個實施例中,可以從一個傳聲器中減去方向輸出,以便獲得改進的噪聲評估。
注意,諸如DSAD,自適應噪聲評估或頻譜區分噪聲評估的前端處理技術可以被用在任何開環結構中。其他的前端處理(如方向處理)能使某些語音和噪聲的分離,從而改進性能。
以下說明本發明的其他特征和方面,以及相關的優點1)提高了信號清晰度。同時,保持了信號的保真度和質量,并且在噪聲環境中提高了感知質量。
2)對心理聲學模型和高保真度的,限制動態范圍適應方式的使用意味著使用的動態范圍的最大(其中動態范圍是在噪聲之上的能聽見的最小信號強度與最大允許信號強度之間的強度差)。這樣就得到極佳的信號質量和保真度。
3)該設計可以利用適合直接安裝于頭戴式耳機中或其他便攜式音頻應用中的超低能量、次微型技術來實現(見Schneider和Brennan的美國專利6,240,192號,其名稱為“包括應用特定的集成電路和可編程數字信號處理器的數字助聽器中的過濾裝置和方法”)。利用過采樣濾波器組的實現(見Schneider和Brennan的美國專利6,236,731號中,其名稱為“用于過濾信息信號并將信息信號分成不同波段的濾波器組結構和方法,特別是用于助聽器的音頻信號上述結構和方法”)為便攜式低能量音頻應用提供了理想的高保真和超低能量解決方案。
4)當與閉環、主動噪聲消除(ANC)系統結合時,可以利用一個優勢,即兩者都需要有在接近輸出變換器的地方測量不良噪聲的裝置。所以同一個傳聲器(位于輸出變換器的附近)既可以被用來測量產生“抗噪”的信號,也能提供剩余強度的測量,從該測量可以計算用于信號清晰度增強(SIE)處理的輸入強度評估。這種結合方法比單獨使用兩種方法之一效果要好,這是因為ANC只限于對低頻有利(由于設計的考慮),信號清晰度增強在高頻下有利。利用同一個傳聲器減少了成本,并使系統簡化。在很多收聽情況下,低頻噪聲占主要地位。這里,在低頻下用ANC以減少噪聲增加了可用的動態范圍,其結果是相對于單獨使用一種方法(ANC或SIE),保真度被提高。
5)在興趣信號包含噪聲的情況下,興趣信號可以用心理聲學模型和/或低強度擴展來處理,使得噪聲強度有效地低于聲音信號強度(或在應用ANC時,是剩余信號強度)。當處理得當時,收聽者感知到很小的噪聲。
6)可以將單個傳聲器噪聲減少技術結合在興趣信號通道中,如在加拿大的PCT申請Bernnan,Robert的PCT/CA98/00331“用于減少噪聲,特別時助聽器中的噪聲的方法和裝置”中所述。因為被處理的興趣信號包含很少噪聲,這就為收聽者提供了更容易聽到的信號(相對于環境噪聲),并減少長時間的收聽疲勞。
7)當使用期望信號活性檢測器(DSAD)時,就能夠實現區分興趣信號和環境噪聲(干擾)。這樣確保了噪聲信號評估不會參雜興趣信號,使聲音交流具有較高清晰度而更加清楚。
8)在本發明的另一個實施例中,使用了自適應濾波器使參雜信號(信號+噪聲)與未參雜電信號發生關系,以便能夠得到噪聲評估。這對于參雜了興趣信號的噪聲信號提供了更可靠的評估。采用這種技術提高了信號的保真度。
9)在本發明的另一個實施例中,使用了頻譜區分技術評估環境噪聲的頻譜內容。這對于參雜了興趣信號的噪聲信號提供了更可靠的評估。這種處理也提高了信號的保真度。
10)利用壓縮器元件的多頻段處理(頻率范圍被單獨地處理,而不一致地壓縮整個頻譜),可以對剩余動態范圍進行更精確地映射,并且提高了整體感知音頻質量,這在Schneider和Brennan的“用于數字助聽器的壓縮策略”(Proc.ICASSP 1997,德國,慕尼黑)中已作了說明。相互獨立地處理頻段使得產生高保真度壓縮具有更大的自由度。此外,通過限制頻率范圍的相關對壓縮水平使得出現預定的最大頻率成形量,在較寬范圍的噪聲環境中保持了信號質量。這確保了頻率局域噪聲源可以被更好地處理。
11)使用多頻段和/或自適應噪聲強度測量,能夠使設備平滑地處理噪聲環境的任何變化。它還能防止不良失真,否則的話,在環境噪聲劇烈變化時就會發生這種失真。見Schneider,Told A.的“自適應動態控制器”(MASc論文集,加拿大,安大略省,滑鐵盧,滑鐵盧大學,1991)和Schneider和Brennan的“用于數字助聽器的壓縮策略”(Proc.ICASSP1997,德國,慕尼黑)。
12)本發明隱含有一個安全系統。信號處理不會使期望聲音放大超過使用者的響度不舒適強度(LDL)。這是設計的一個安全特征,有助于在高噪聲環境中保護使用者的聽力。這與本發明提供的其他調節一起,可以對特定使用者實現個性化的處理。
雖然已經參考具體實施例,對本發明作了描述,但這種描述只是對本發明的說明,而不應理解為對本發明的限制。對本領域的技術人員來說,還可以對本發明進行各種更改,同時不脫離所附權利要求限定的本發明的實質和范圍。
權利要求
1.一種克服干擾信號的提高信號清晰度的系統,其包括一個分析濾波器組,用于將時域的信息信號變換成變換域的多通道信息信號;一個信號處理器,用于處理所述分析濾波器組的輸出,所述信號處理器包括一個心理聲學處理器,它利用一個心理聲學模型來計算動態范圍,以使所述信息信號克服干擾信號而能被聽見,以及一個合成濾波器組,用于將所述信號處理器的輸出組合,以產生一個輸出信號。
2.如權利要求1的系統,其還包括一個分析濾波器組,用于將時域中的所述干擾信號變換成變換域中的多通道干擾信號的。
3.如權利要求2的系統,其特征在于,所述信號處理器還包括一個壓縮器,用于根據動態范圍來均衡通道信息信號。
4.如權利要求3的系統,其特征在于,所述信號處理器還包括一個用來為一個信號特定強度擴展動態范圍的電路,以使得噪聲不被聽見。
5.如權利要求3的系統,其特征在于,所述心理聲學處理器處理信號以進行低強度擴展,使得接收輸出信號的使用者感受到很少噪聲。
6.如權利要求3的系統,其特征在于,所述心理聲學處理器根據響度不舒適強度(LDL)計算動態范圍,以便使輸出信號的響度強度令人舒適。
7.如權利要求6的系統,其特征在于,所述LDL存儲在非易失存儲器中,用于每個接收所述輸出信號的使用者。
8.如權利要求3的系統,其特征在于,所述心理聲學處理器計算動態范圍,以保護接收所述輸出信號的使用者。
9.如權利要求1的系統,其特征在于,在所述信號處理器中的所述信號處理的靈敏度是可調的。
10.如權利要求9的系統,其特征在于,控制所述信號處理的所述靈敏度的參數存儲在非易失存儲器中,用于每個接收所述輸出信號的使用者。
11.如權利要求1的系統,其特征在于,所述信號處理器還包括一個用于調節所述輸出信號量的電路。
12.如權利要求3的系統,其特征在于,所述信號處理器還包括一個用于評估干擾信號的頻譜的噪聲評估電路。
13.如權利要求12的系統,其特征在于,所述噪聲評估電路對所述干擾信號進行自適應噪聲評估。
14.如權利要求12的系統,其特征在于,所述噪聲評估電路利用頻譜區分技術進行噪聲評估。
15.如權利要求3的系統,其特征在于,所述信號處理器還包括一個用于評估噪聲頻譜的噪聲評估電路,和一個用于控制所述噪聲評估的期望數字信號活性檢測器(DSAD)。
16.如權利要求15的系統,其還包括一個用于提高所述輸出信號清晰度的前端處理器。
17.如權利要求16的系統,其特征在于,所述前端處理器包括一個用來執行方向處理算法以提供噪聲評估的電路。
18.如權利要求16的系統,其特征在于,所述前端處理器包括一個用于減少噪聲的電路。
19.如權利要求1的系統,其還包括一個主動噪聲消除(ANC)電路,通過將信號處理的結果反饋給所述信號處理器,以主動地消除噪聲。
20.如權利要求1的系統,其特征在于,所述干擾信號包括噪聲和所述信息信號。
21.如權利要求20的系統,其還包括一個自適應相關器,用于根據所述信息信號和所述干擾信號來輸出噪聲評估,所述干擾信號的分析濾波器組變換所述自適應相關器的輸出。
22.如權利要求20的系統,其特征在于,所述信號處理器還包括一個噪聲評估和一個用于控制所述噪聲評估的期望數字信號活性檢測器(DSAD)。
23.如權利要求2的系統,其特征在于,所述干擾信號包括噪聲和所述信息信號,并且所述信號處理器包括一個噪聲評估電路,用于將所述通道信息信號從所述通道干擾信號中減去,以評估噪聲。
24.如權利要求1的系統,其特征在于,所述分析濾波器組和所述合成濾波器組是過采樣濾波器組。
25.如權利要求2的系統,其特征在于,所述用于干擾信號的分析濾波器組是過采樣濾波器組。
全文摘要
本發明公開了一種聲音清晰度增強(SIE)系統。該SIE系統利用心理聲學模型,并且優選地,利用一個過取樣濾波器組,在其中低于環境噪聲的興趣信號被有選擇地放大作為輸入強度和頻率的函數,以使該信號克服噪聲而可以被聽見,但是絕不會超過作為頻率函數的一個預定最大輸出強度。該SIE系統可以與主動噪聲消除相結合。
文檔編號G10L21/0364GK1568502SQ02817745
公開日2005年1月19日 申請日期2002年8月7日 優先權日2001年8月7日
發明者T·施奈德, D·庫德, R·L·布倫南, P·歐利杰尼克 申請人:數字信號處理工廠有限公司