專利名稱::混響除去裝置、混響除去方法、混響除去程序和記錄介質的制作方法
技術領域:
:本發明涉及聲響(acoustic)信號處理的
技術領域:
,特別涉及從包含混響(reverberation)的聲響信號中除去混響的技術。
背景技術:
:如果在有混響的環境中接收聲響信號,則觀測到在本來信號中疊加了混響的信號。在該情況下,由于疊加的混響分量而使聲響信號的明確性大幅降低,難以提取聲響信號本來的性質。例如,在通過自動語音識別(以下稱作語音識別)系統識別了包含混響的語音信號的情況下,由于該混響的影響而使語音識別系統的識別率顯著地降低。混響除去處理是在這樣的情況下能夠將疊加了的混響除去而使聲響信號恢復到本來的音質的技術。由此,例如能夠恢復語音信號的明確性并且改善語音識別率等。作為除去長的混響的混響除去處理的以往例子,有非專利文獻1所/^開的方法。在該以往例子中,假定后部混響(latereverberation)呈指數函數地衰減,使用指數函數估計后部混響的能量并且進行混響除去。即,將觀測信號變換為頻域信號,假定在各頻率中,頻域信號為直接聲音和后部混響之和,使用混響能量呈指數函數地減少的模型(multi-banddecaymodel)估計該模型參數,并對估計的后部混響能量和觀測信號能量應用譜減法(Spectralsubtraction),除去后部混響。另外,對于模型參數的估計,使用僅觀測到后部混響的聲音(sound)的末尾部分。非專利文獻1:I.TashevandD.Allred,"ReverberationReductionforImprovedSpeechRecognition"2005JointWorkshoponhands-FreeSpeechCommunicationandMicrophoneArrays。
發明內容發明要解決的課題但是,在上述以往例子中,存在根據環境不同而有時不能自動進行精度高的混響除去的問題。即,在上述以往例子的情況下,如果使用的指數函數能夠高精度地將觀測聲音中的后部混響進行建模,則能夠高精度地除去后部混響。但是,一般難以通過指數函數準確地近似根據房間、說話人和麥克風之間距離而變化多樣的混響。此外,在聲響信號的末尾部分和除此以外的部分混響特性不同的情況下,不能使用該架構。這樣,在上述以往例子中,由于通過指數函數將后部混響模型化,因此在該模型與觀測聲音中的后部混響不完全一致的情況下,或者混響特性在聲響信號的末尾部分和除此以外的部分不同的情況下,不能自動地進行高精度的混響除去。本發明鑒于這樣的方面而完成,其目的在于提供一種在任何環境中都能夠進行高精度的混響除去處理的混響除去技術。用于解決i果題的手賴在本發明中,為了解決上述課題,執行離散聲響信號存儲步驟,首先在存儲器中存儲離散聲響信號值,所述離散聲響信號值通過將由M(M>1)個傳感器分別觀測的M個信道(channel)m(m=1,…,M)的聲響信號分別在多個時刻進行采樣而得到;模型應用步驟,使用多個上述離散聲響信號值來計算信道w(w=l,…,M)的多階(multi-step)線性預測^^莫型(通過將長時間區間中的M個信道的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在該長時間區間的規定時間后的離散時間n的信道w的離散聲響信號值的線性預測模型);以及后部混響預測步驟,將線性預測值作為在離散時間n的信道w的后部混響預測值而輸出,所述線性預測值通過將上述信道w的多階線性預測模型的各線性預測系數和多個上述離散聲響信號值代入上述信道w的多階線性預測模型的上述線性預測項而得到。另外,"模型"表示表現了物理狀態的關系式。此外,"信道,,表示每個傳感器的處理序列,由相同傳感器觀測到的聲響信號的處理序列屬于相同信道。此外,在M》2的情況下,傳感器中的至少一部分被配置在與其它傳感器不同的位置。即,在M》2的情況下,全部傳感器不會完全配置在相同的位置上。此外,將M》2的情況下的"多階線性預測模型"稱作"多信道多階線性預測模型"。即,本發明中的"多階線性預測模型"是"多信道多階線性預測模型"的上位概念。這樣,在本發明中,由多階線性預測片莫型的線性預測項計算聲響信號的后部混響預測值(詳細在后面說明),通過使用該后部混響預測值來除去聲響信號的混響。這里,在本發明中,由于通過多階線性預測模型將聲響信號進行模型化,因此與僅通過指數函數將后部混響模型化的情況相比,能夠進行更準確的近似。即,聲響信號的后部混響分量由過去的各時刻的聲響信號引起,在某一時間區間中具有自相關性。因此,可以說以多個時刻的時間序列數據的線性結合表現各時刻的時間序列數據的多階線性預測模型適于混響信號的模型化。此外,本發明的多階線性預測模型是通過將長時間區間中的M(M>1)個信道的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在該長時間區間的規定時間后的離散時間n的信道w的離散聲響信號值的線性預測模型。通過使用這樣的"表現該長時間區間的規定時間后的離散聲響信號值的線性預測模型",從而與使用"表現緊接著該長時間區間之后的離散聲響信號值的線性預測模型,,的情況相比,能夠高精度地估計后部混響信號(詳細在后面敘述)。其結果,能夠進行適當的后部混響除去。此外,在本發明中,對于多階線性預測模型的模型參數的估計,不是僅使用聲響信號的末尾部分,而是使用離散聲響信號的整體,因此即使在混響特性在聲響信號的末尾部分和除此以外的部分不同的情況下,也能夠進行適當的后部混響除去。此外,在本發明中,優選M》2。通過使用多信道多階線性預測模型,從而即使在室內傳遞函數中的最大相位分量多的環境下,也能夠高精度地進行后部混響除去(詳細在后面敘述)。此外,本發明中,優選上述模型應用步驟具有模擬白色化步驟,從各離散時間的上述離散聲響信號值中,抑制與緊接著該離散時間之前的短時間區間內的各離散聲響信號值具有自相關性的自相關分量(short-termcorrelation),并生成模擬白色化(pre-whitening)后的離散聲響信號值;以及第一線性預測系數計算步驟,使用上述模擬白色化后的離散聲響信號值,計算上述多階線性預測模型的各線性預測系數。這里,上述短時間區間比上述長時間區間短。多階線性預測模型是將后部混響分量估計為線性預測項的模型。從而,該線性預測系數的計算所使用的離散聲響信號值的自相關分量在理想情況下僅為后部混響分量所引起的分量。但是,聲響信號的直接聲音分量與后部混響分量相比,具有非常短的時間區間內的自相關性。模擬白色化是用于抑制該短的時間區間內的自相關性的處理。使用模擬白色化后的離散聲響信號計算多階線性預測模型的各線性預測系數,使得后部混響除去處理的精度提高。此外,在本發明中,優選上述模擬白色化步驟具有第二線性預測系數計算步驟,使用上述離散聲響信號值來計算信道m的短時間線性預測模型的各線性預測系數,所述信道m的短時間線性預測模型,是通過將上述短時間區間中的信道m的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在緊接著上述短時間區間之后的離散時間n的該信道m的離散聲響信號值的線性預測模型;以及逆濾波處理步驟,在通過將由上述第二線性預測系數計算步驟計算出的上述各線性預測系數代入信道m的上述短時間線性預測模型而得到的逆濾波器中,代入該信道m的上述離散聲響信號值,并將由此得到的該短時間線性預測模型的上述預測誤差項的值作為該信道m的上述模擬白色化后的離散聲響信號值輸出。由此,能夠抑制被觀測到的聲響信號的直接聲音分量的自相關性。此外,在該情況下,優選M》2,上述第二線性預測系數計算步驟具有自相關系數計算步驟,對每個信道計算上述離散聲響信號值的自相關系數;自相關系數平均化步驟,計算將對每個信道求出的上述自相關系數在信道之間平均化后的平均自相關系數;以及方程式運算步驟,使用上述平均自相關系數,計算上述短時間線性預測模型的各線性預測系數。這樣,通過將在每個信道中求出的自相關系數在信道之間平均化后的平均自相關系數用于計算短時間線性預測模型的各線性預測系數,從而短時間線性預測模型的各線性預測系數的計算精度提高,模擬白色化后的離散聲響信號的生成精度提高。這對后部混響除去處理的精度提高有貢獻。代替使用上述平均自相關系數,也可以計算離散聲響信號值的自相關系數,并使用上述自相關系數計算上述短時間線性預測模型的各線性預測系數,上述離散聲響信號值將由上述M個傳感器中最接近聲響信號的聲源的一個傳感器所觀測到的聲響信號,在多個時刻進行采樣而得到。由此,能夠高精度地計算短時間線性預測模型的各線性預測系數,并且模擬白色化后的離散聲響信號的生成精度提高。這對后部混響除去處理的精度提高有貢獻。此外,本發明中,優選具有頻域變換步驟,將各信道的上述離散聲響信號值變換為頻域的離散聲響信號值,并將各信道的上述后部混響預測值變換為頻域的后部混響預測值;以及后部混響除去步驟,對每個信道求上述頻域的離散聲響信號值的振幅譜和上述頻域的后部混響預測值的振幅譜的相對值,并將該相對值作為各信道的后部混響除去信號值的振幅譜預測值而輸出。由此,能夠計算后部混響除去信號值的振幅譜預測值。此外,在該情況下,優選在上述后部混響預測步驟中,計算線性預測值作為在離散時間n的信道w的后部混響預測值,所述線性預測值通過將由上述模型應用單元計算出的上述各線性預測系數和多個模擬白色化后的上述離散聲響信號值代入上述線性預測項而得到,上述頻域變換單元中,將模擬白色化后的各信道的上述離散聲響信號值變換為頻域的離散聲響信號值。由此,可以計算模擬白色化后的后部混響除去信號值的振幅譜預測值。這樣的值作為需要模擬白色化后的數據的系統的輸入值是合適的。此外,在本發明中,優選還具有復譜生成步驟,使用信道w的上述后部混響除去信號值的振幅譜預測值,和信道w的上述頻域的離散聲響信號值的相位信息,計算信道w的后部混響除去信號值的復譜預測值;以及時域變換步驟,計算將信道w的上述后部混響除去信號值的復譜預測值變換為時域后的信道w的后部混響除去信號估計值。由此,能夠得到將后部混響除去后的聲響信號的估計值(后部混響除去信號估計值)。此外,在該情況下,優選M》2,上述模型應用步驟是對多個信道分別計算上述各線性預測系數的步驟,上述后部混響預測步驟是對多個信道分別計算上述后部混響預測值的步驟,上述后部混響除去步驟是對多個信道分別計算上述后部混響除去信號值的振幅鐠預測值的步驟,上述復譜生成步驟是對多個信道分別計算上述后部混響除去信號值的復譜預測值的步驟,上述時域變換步驟是對多個信道分別計算上述后部混響除去信號估計值的步驟,該混響除去方法具有延遲量計算步驟,決定在將各信道的上述后部混響除去信號估計值分別以某一延遲量延遲后的情況下,延遲后的各信道的上述后部混響除去信號估計值的信道間互相關為極大的各信道的該延遲量。另外,對于不延遲的后部混響除去信號估計值,決定延遲量為0。由此,能夠校正在各信道中計算出的后部混響除去信號估計值的信道相互的延遲量。而且,在該情況下,將各信道的上述后部混響除去信號估計值延遲對各個信道計算出的上述延遲量,并計算延遲后的上述后部混響除去信號估計值(也包含延遲量0的后部混響除去信號估計值)之和,作為校正混響除去信號值。由此,混響除去信號的估計經度提高。此外,在本發明中,優選上述多階線性預測模型是,將Xw(n)設為與信道w(w=l,…,M)對應的離散時間n的離散聲響信號值,將xm(n)設為與信道m(m=1,…,M)對應的離散時間n的離散聲響信號值,將ew(n)設為與信道w以及離散時間n對應的預測誤差,將N設為正整數,將[']設為高斯記號,將cu,m(p)設為與xw(n)對應的線性預測項的信道m所對應的第p個線性預測系數,并且將D設為表示階長的常數的情況下的r算式n<formula>formulaseeoriginaldocumentpage14</formula>發明的效果以上,在本發明中在任何環境下都能夠進行精度高的混響除去。圖i是例示第一實施方式的混響除去裝置的功能結構的方框圖。圖2A是例示模型應用單元的功能結構的細節的方框圖。圖2B是例示延遲調節單元的功能結構的細節的方框圖。圖3是例示第一實施方式中的混響除去裝置10的硬件結構的方框圖。圖4是用于說明第一實施方式的混響除去處理的整體的流程圖。圖5是用于說明第一實施方式的混響除去處理的整體的流程圖。圖6A是用于說明圖4的步驟S1(模型應用步驟)的細節的流程圖。圖6B是用于說明圖6A的步驟S21(模擬白色化步驟)的細節的流程圖。圖7A是用于說明圖6B的步驟S31(第二線性預測系數計算步驟)的細節的流程圖。圖7B是用于說明圖4的步驟S4的細節的流程圖。圖8是例示第二實施方式的混響除去裝置的功能結構的方框圖。圖9是例示模型應用單元的功能結構的細節的方框圖。圖10是用于說明第二實施方式的混響除去處理的整體的流程圖。圖11是用于說明第二實施方式的混響除去處理的整體的流程圖。圖12A是表示第三實施方式的第二線性預測系數計算單元的功能結構的方框圖。圖12B是用于說明第三實施方式的[第二線性預測系數計算步驟(步驟S31)]的流程圖。圖13是表示第四實施方式的模型應用單元的功能結構的方框圖。圖14是用于說明第四實施方式的[模擬白色化步驟(步驟S21)]的流程圖。圖15是例示第五實施方式的混響除去裝置的功能結構的方框圖。圖16是用于說明第五實施方式的混響除去處理的整體的流程圖。圖17是例示第六實施方式的混響除去裝置的功能結構的方框圖。圖18是用于說明第六實施方式的混響除去處理的整體的流程圖。圖19是例示第七實施方式的混響除去裝置的功能結構的方框圖。圖20是例示圖19的模型應用單元的功能結構的細節的方框圖。圖21是用于說明第七實施方式的混響除去處理的整體的流程圖。圖22A是用于說明圖21的步驟S301(模型應用步驟)的細節的流程圖。圖22B是用于說明圖22A的步驟S311(模擬白色化步驟)的細節的流程圖。圖23A是將室內傳遞函數值h取作縱軸并將時間(ms)取作橫軸的曲線圖。圖23B是將合成傳遞函數值g取作縱軸并將時間(ms)取作橫軸的曲線圖。圖23C是將室內傳遞函數h和合成傳遞函數g的能量差取作縱軸并將時間(ms)取作橫軸的曲線圖。圖24A、圖24B分別是表示混響除去前的振幅譜值和語音(speech)波形的圖。圖24C、圖24D分別是表示本發明(M=l的情況)的混響除去后的振幅譜值和語音波形的圖。圖25A是表示實驗條件的圖。圖25B是表示語音識別結果(單詞錯誤率)的曲線圖。符號說明10、310、610、620、710混響除去裝置具體實施例方式以下,參照本發明的實施方式。[原理1〗首先,說明本發明的原理l。另外,這里原則上使用z變換標記(后述的式(5)以外)。如果將原聲響信號s(z)模型化,則成為以下的式(1)所示的、白色信號u(z)(預測誤差項)和短的(次數小的)自回歸(AR:Auto-Regressive)模型d(z)=1/(1-(3(z))的乘積。即,原聲響信號s(z)具有按照d(z)的短期自相關性。s(z)=u(z)/(l-i3(Z))=u(z)'d(z)…(l)另外,P(z)為如下的AR多項式。這里,q是線性預測的次數,b(i)是第i項的線性預測系數。[算式2]i=i在該情況下,傳感器(例如,麥克風)所觀測的聲響信號x,(z)表示為x(z):u(z).[d(z).h(z)]i=u(z).g(z)…(2)。另外,h(z)表示從聲響信號源到傳感器的室內傳遞函數,g(Z)假設滿足g(z)=d(z).h(z)…(3)。另外,g(z)稱作合成傳遞函數。由此,如果能夠忽略原聲響信號s(z)的按照d(z)的短期自相關性(如果能夠將原聲響信號s(z)視作白色信號),則式(2)可以如下地近似。x(z)^u(z).h(z)…(4)即,如果能夠將d(z)視作1,則由傳感器所觀測的聲響信號x(z)可以作為對白色信號u(z)進行比d(z)長的(次數大的)自回歸過程的結果而模型化。d(Z)越接近1則如式(4)這樣的模型化越恰當。在原理1中,通過模擬白色化(Pre-whitening)處理來抑制由傳感器所觀測的聲響信號x(z)的短期的自相關性。由此,使由傳感器所觀測的聲響信號x(z)的d(z)接近1,使得對于式(4)的模型的應用變得恰當。但是,如果以d(z)的自相關不太強的原聲響信號s(z)作為對象,則即使不進行模擬白色化處理,對于式(4)的模型的應用也在某種程度上是恰當的。在該情況下,4皮觀測的聲響信號可以通過傳感器數M=1的情況下的多階線性預測模型(通過將長時間區間中的各離散聲響信號值進行線性結合后的線性預測項、預測誤差項之和表示在該長時間區間的規定時間后的離散聲響信號值的線性預測模型)來近似。即,例如能夠如以下式(5)這樣,使被觀測的聲響信號模型化。另外,將n設為離散時間,將x,(n)設為與(根據需要而除去了短時間相關的)離散時間n對應的聲響信號,將ctu(p)設為線性預測系數,將N設為線性預測系數的數,將D設為階長(延遲),將e,(n)設為對應于離散時間n的預測誤差。此外,在式(5)的情況下,(n-N-D)以上且(n-l-D)以下的時間區間相當于多階線性預測^f莫型的定義中的"長時間區間",x,(n)相當于"長時間區間的規定時間后的離散聲響信號值"。<formula>formulaseeoriginaldocumentpage17</formula>這里,如果將式(2)的g(z)的直接聲音分量設為gd(z),將后部混響分量設為gr(z),則可以假定以下的式(6)。g(z):=g(z)+zTD.g(z)…(6)在該情況下,將式(5)的線性預測系數cc,,,(p)進行z變換后的ot(z)如以下的式(7)這樣表示。[算式4]其中,假定<formula>formulaseeoriginaldocumentpage18</formula>另外,gmin(z)和gmax(z)分別表示g(z)的最小相位分量(與Z平面上的單位圓內的0點對應的分量)和最大相位分量(與Z平面上的單位圓外的0點對應的分量)。此外,如前所述,通過^f莫擬白色化處理,g(z)近似室內傳遞函數h(z)。此外,一般室內傳遞函數h(z)為非最小相位(不僅具有最小相位分量而且也具有最大相位分量)。因此,g(z):=gmin(z)gmax(z)的假定為妥當。此外,min[gmax(Z)]表示將gmax(z)最小相位化的結果,并且表示gmax(z)的全部0點被繪制(plot)到它們的共軛逆的Z平面上的單位圓內的結果。這里,將式(7)的線性預測系數oc(z)與被模擬白色化處理后的觀測信號x,(z)=u(z)g(z)相乘并代入式(7)~(9),則得到以下的式子(10)。<formula>formulaseeoriginaldocumentpage18</formula>這里,gmax(z)/min[gmax(z)]為全通濾波器(相乘的信號的振幅被原樣保持且相位能夠變更的函數)。從而,可知fi(z)是具有與U(Z)相同的方差的白色信號。此外,如式(6)所示,Z—D'gr(Z)為后部混響分量所引起的分量。而且,因為聲響信號如式(2)所示,因此式(10)的振幅諳值近似于聲響信號的后部混響分量的振幅譜值。即,使用通過模擬白色化處理而除去了短時間相關的聲響信號,進行式(5)的多階線性預測模型的數值最佳化,從而求線性預測系數,并將其與模擬白色化處理后的觀測信號相乘,從而能夠求出振幅諮值近似于后部混響分量的信號。而且,通過將該估計出的振幅譜從觀測到的聲響信號x(z)的振幅譜中減去,從而可以得到后部混響被除去后的振幅譜。但是,在原理l的方法中,有時不能進行高精度的后部混響除去。以下說明其理由。上述式(10)是在將分析幀長設為無限長的情況下成立的關系式。在以有限長的分析幀單位來看的情況下,式(10)不一定完全成立。室內傳遞函數h(z)中最大相位分量越多,則式(10)右邊的全通濾波器gmax(z)/min[g皿(z)]的響應越長。因此,在以有限長的分析幀單位來看的情況下,室內傳遞函數h(z)中最大相位分量越多、全通濾波器gmax(z)/min[gmax(z)]的響應越長,則式(10)的左邊和右邊的背離則越大。通常上,原理1的方法以有限長的分析幀單位被執行。如果室內傳遞函數h(z)中最大相位分量少,則以分析幀單位來看的式(10)也比較近似,可以通過原理1的方法高精度地進行后部混響除去。但是,一般信號源和傳感器的距離越遠,則室內傳遞函數h(z)中最大相位分量越增加。在該情況下,以分析幀單位來看的式(10)的近似變得不成立,通過以式(10)成立為前提的原理1的方法進行的后部混響除去的精度降低。即,在從信號源到傳感器的室內傳遞函數中存在最大相位分量的情況下,不能使用僅由一個傳感器觀測到的單一信道的聲響信號構成完全的逆濾波器。這里,能夠構成逆濾波器等效于能夠計算上述線性預測系數。這例如公開在"M.MiyoshiandY.Kaneda,"InverseFilteringofRoomAcoustics,"IEEETrans,onAcoustics,"SpeechandSignalProcessing,36(2),pp.145-152,1988(以下稱作"參考文獻r)。另一方面,在參考文獻i中公開了在從信號源到傳感器的室內傳遞函數中存在最大相位分量的情況下,能夠使用由多個傳感器觀測到的多個信道的聲響信號構成逆濾波器。因此,在原理2中,采用上述多信道多階線性預測模型(傳感器數M》2的情況下的多階線性預測模型)作為線性預測模型,使用由多個傳感器觀測到的多個信道的聲響信號來求線性預測系數。由此,使用線性預測模型的后部混響除去處理成為可能。另外,在原理2的方法中,能夠求線性預測濾波器的情況不依賴于室內傳遞函數中的最大相位分量的大小。以下,說明該原理2。由傳感器m(m-l,…,M)觀測的聲響信號xm(z)可以如以下這樣模型化。另外,作為滿足gm(z)=d(z)hm(z)的合成傳遞函數,將hm(z)作為從聲響信號源到傳感器m的室內傳遞函數。<formula>formulaseeoriginaldocumentpage20</formula>由此,如果能夠忽視原聲響信號S(Z)的按照d(Z)的短期自相關性(如果能夠將原聲響信號S(Z)視作白色信號),則式(11)可以如以下這樣近似。<formula>formulaseeoriginaldocumentpage20</formula>即,如果能夠將d(z)視作1,則由傳感器m所觀測的聲響信號Xm(z)可以作為對白色信號u(z)進行比d(z)長的(次數大的)自回歸過程的結果而模型化。d(z)越接近1則如式(12)這樣的模型化越恰當。在原理2中,通過模擬白色化(Pre-whitening)處理來抑制由傳感器m所觀測的聲響信號xm(z)的短期的自相關性。由此,使由傳感器m所觀測的聲響信號Xm(z)的d(z)接近1,使得對于式(12)的模型的應用變得恰當。但是,如果以d(z)的自相關不太強的原聲響信號s(z)作為對象,則即使不進行模擬白色化處理,對于式(12)的模型的應用也在某種程度上是恰當的。另一方面,室內傳遞函數lv(z)中存在最大相位分量。如所述"參考文獻r所公開的,在室內傳遞函數hm(z)中存在最大相位分量的情況下,不能只使用僅由一個傳感器觀測到的單一信道的聲響信號構成逆濾波器,而僅在使用了多個信道的聲響信號的情況下能夠構成逆濾波器。如果將該情況應用于式(12)的^^型來考慮,則可以說僅在以多個信道的聲響信號為對象而構成了式(12)的模型的情況下,能夠計算正確的線性預測系^:,并且能夠預測、除去正確的后部混響信號。通過以上說明,在原理2中,通過多信道多階線性預測模型(通過將長時間區間中的M(M》2)個信道的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在該長時間區間的規定時間后的離散時間的離散聲響信號值的線性預測模型)來構成式(12)的模型。作為多信道多階線性預測模型,可以例示以下的式(13)。另外,式(13)的多信道多階線性預測模型為時域的模型。<formula>formulaseeoriginaldocumentpage20</formula>這里,n表示離散時間。此外,xw(n)相當于由傳感器w(w=1,...,M)觀測并在離散時間n被采樣了的信道w的離散聲響信號,或者將這些信號進行模擬白色化后的離散聲響信號。此外,xm(n)相當于由傳感器m觀測并在離散時間n被采樣了的離散聲響信號,或者將這些信號進行模擬白色化后的離散聲響信號。ew(n)是對應于傳感器w以及離散時間n的預測誤差,該預測誤差項以外的式(13)右邊的項相當于線性預測項。此外,M表示傳感器的總數。N-l是濾波器長(線性預測次數)。另外,[']為高斯記號,表示不超過的最大的整數。此外,ocw,m(p)是與xw(n)對應的線性預測項的傳感器m所對應的第p個線性預測系數。此外,D表示階長(延遲)。此外,在式(13)的情況下,(n-[N/M]-D)以上且(n-1-D)以下的時間區間相當于多信道多階線性預測模型的定義所示的"長時間區間",xw(n)相當于"長時間區間的規定時間后的離散聲響信號值"。在原理2中,使用多信道的離散聲響信號或將這些信號進行模擬白色化后的離散聲響信號,求這樣的多信道多階線性預測模型的線性預測系數ocw,m(p),并求多信道多階線性預測模型的線性預測項的值。該線性預測項的值為后部混響分量的預測值(后部混響預測值)。此后,求頻域中的離散聲響信號的振幅譜和后部混響預測值的振幅譜的相對值,并將其作為后部混響除去信號的振幅i普予貞測4直(例如,參照"S.F.Boll,"Suppressionofacousticnoiseinspeechusingspectralsubtraction,"IEEETrans,onAcoustics,SpeechandSignalProcessing,27(2),pp.113-120,1979")。通過這樣的方法,能夠高精度地提取對于語音識別處理等重要的直接聲音分量的振幅譜。從別的觀點說明上述原理1、2。首先,使用V次的FIR濾波器d(k)和白色信號u(n)如以下這樣表現與時域中的離散時間對n應的原聲響信號s(n)。[算式8]s(n)=Sd(k).u(n-k)-.姻如果使用該式子,則能夠如以下這樣將由傳感器m所觀測到的聲響信號xm(n)模型化。[算式9]<formula>formulaseeoriginaldocumentpage22</formula>(15)其中,[算式10]<formula>formulaseeoriginaldocumentpage22</formula>16)hm(n)表示傳感器m和聲源之間的脈沖響應。通過矩陣形式將式(15)改寫,則如以下這樣。<formula>formulaseeoriginaldocumentpage22</formula>(17)mm另外,<formula>formulaseeoriginaldocumentpage22</formula>[算式11]<formula>formulaseeoriginaldocumentpage22</formula>此外,[.]T表示矩陣.的轉置。如前所述,在原理l中,將被觀測的聲響信號例如式(5)這樣模型化。在式(5)中,求使預測誤差分量e,(n)的能量最小的線性預測系數cn,(p)等價于解以下的正規方程式。(E{x(n-l-D).xT(n+D)}).A=E{x(n_l-D)'x(n))…(18)另外,E{.}表示,的時間平均,A表示式(5)的線性預測系數a,,,(p)的矩陣形式<formula>formulaseeoriginaldocumentpage22</formula>,人而,可以如以下這樣求A。<formula>formulaseeoriginaldocumentpage22</formula>(19)如果將式(19)的(■)"內展開則如以下這樣。E{x(n-l普xT(n-1-D)}=G.E{U(n-1-D).U'r(n-l-D)卜GTiiii=(j2'G.G'i'…(20)u11這里,白色信號u(n)的自相關矩陣假定為E{U(n-1-D)UT(n-1-D)}=au2'I。另外,(Ju2表示u(n)的方差,I表示單位矩陣。另外,式(19)的E{x(n-1-D).x!(n))可以如以下這樣展開。E{x(n—1—D).x(n)}=G'E{U(n—l—D).UT(n)}.gT=cj2'G.gT…(21)另夕卜,glate,1=[g(D),g(D+l),...,g(T-I),O,...,O]t。即,g表示g(n)的第D個以后的要素,相當于后部混響。使用式(20)、(21),可以如以下這樣重寫式(19)的A。另外,()-'表示.的逆矩陣。A=(G'GT)_1'G'g…(22)111IMe.〗這里,將(5)的線性預測系數的矩陣形式A與聲響信號的矩陣形式X,(n)相乘,并取其方均則如下。曰(xT(n)'A)2)=||AT.G'E(U(n).lf(n)卜GT'A||1=||(Ju2.A','.C^G't.AII…咖=||T-'GT:(G.G'r.G.gT||Sllci、,'I卜IIgT'(G.gT廣.Gl卜Hgt||'"(24)uIat。,,1111lale,I=||a2'gT||2.,.(25)這里,II||表示矩陣■的乙2模方(norm)。此外,為了導出式(23),白色信號u(n)的自相關矩陣假定如E(U(n)'lf(n)"(J'I這樣展開。對于足夠長的聲響信號,該分解成立。此外,對于式(24)的導出,使用了式(22)和柯西-施瓦茲(Cauchy-Schwarz)的不等式。進而,對于式(25)的導出,使用了IIG,t■G,t)-1.G,ll為投影矩陣,其模方為1的情況。此外,(J表示白色信號u(n)的方差,&加,,為對應于后部混響的分量,因此式(25)的liau2.&祉/||2表示后部混響分量的功率。從而(5)的線性預測系數的矩陣形式A與聲響信號的矩陣形式X,(n)相乘,取其方均的值即使不能說是始終準確地估計后部混響分量的功率的值,也不是將后部混響分量的功率過大估計的值。多信道多階線性預測模型可以通過所述式(13)定式化。這里,將式(13)的[N/M]i殳為L,則式(13)如下。[算式12]<formula>formulaseeoriginaldocumentpage24</formula>在式(26)中,求4吏預測誤差分量ew(n)的能量為最小的線性預測系數aw,m(p)與解以下的正^見方程式等價。<formula>formulaseeoriginaldocumentpage24</formula>…(27)另外,X(n)-[X^n^X^nV^XMTCn)]7,A是式(26)的線性預測系數a,(p)的矩陣形式,<formula>formulaseeoriginaldocumentpage24</formula>。從而,Aw如以下這樣得到。另外,()+表示矩陣()的Moor-Penrose型一般化逆矩陣。<formula>formulaseeoriginaldocumentpage24</formula>(28)如果與M=1的情況同樣將式(28)展開,則Aw可以如以下這樣變形。<formula>formulaseeoriginaldocumentpage24</formula>另外,<formula>formulaseeoriginaldocumentpage24</formula>。此外,G是列滿秩(foilrank)。接著,使用估計出的線性預測系數oc,(p)的矩陣形式Aw,從由多個傳感器觀測到的多信道聲響信號來估計后部混響。因此,將向量X(n)的轉置和式(26)的線性預測系數a,(p)的矩陣形式Aw相乘,則如下。<formula>formulaseeoriginaldocumentpage24</formula>g…(31)<formula>formulaseeoriginaldocumentpage24</formula>…(32)另夕卜,對式(30)的導出使用式(29),對式(31)的導出使用Moor-Penrose型一般化逆矩陣的定義。這里,<formula>formulaseeoriginaldocumentpage24</formula>表示聲響信號的后部混響分量。從而,可知通過將式(28)的向量的轉置和式(26)的線性預測系數a,(p)的矩陣形式Aw相乘,從而能夠正確地估計聲響信號的后部混響分量。換言之,可知通過使用多信道多階線性模型,從而能夠始終正確地估計后部混響分量。接著,說明多階線性預測模型的D的值和聲響信號的短時間相關的關系。原理l、2的方法是以式(4)、(12)的近似成立為前提的方法。換言之,在原理l、2的方法中,在室內傳遞函數hm(n)和式(15)所示的合成傳遞函數gmU)的差(IIhm(n)|H|gm(n)|1)(mM)充分小的情況下,能夠進行正確的后部混響除去。圖23A是將室內傳遞函數值h取作縱軸并將時間(ms)取作橫軸的曲線圖。圖23B是將合成傳遞函數值g取作縱軸并將時間(ms)取作橫軸的曲線圖。此外,圖23C是將室內傳遞函數h和合成傳遞函數g的能量差取作縱軸并將時間(ms)取作橫軸的曲線圖。如圖23A所例示的,室內傳遞函數值h隨時間經過而指數衰減。此外,如圖23B所例示的,合成傳遞函數值g也隨時間經過而指數衰減。此外,如圖23C所例示的,在室內傳遞函數值h和合成傳遞函數值g大的時間,它們的能量差也大,在室內傳遞函數值h和合成傳遞函數值g小的時間,它們的能量差也小。即,隨時間的經過,室內傳遞函數h和合成傳遞函數g的能量差也減小。而且,在經過"某一時間"后,該能量差減小到相對于語音信號整體的能量能夠忽視的程度(規定閾值以下或小于規定閾值)。因此,為了進行正確的后部混響除去,最好將式(5)、(13)的多階線性預測模型的D設定為該"某一時間"以上。但是,室內傳遞函數h和合成傳遞函數g的能量比和d(z)未知,該"某一時間,,也不定。從而,一般從經驗法則來估計該"某一時間",并基于該估計來設定多階線性預測模型的D的值。而且,更理想的是,假設該"某一時間"的估計困難,并且通過所述模擬白色化來抑制d(z)分量。由此,能夠忽視室內傳遞函數h和合成傳遞函數g的能量差,并且能夠進行正確的后部混響除去的D的可設定范圍增大。另外,一般D的下限值為1,但如果能夠通過模擬白色化來充分抑制d(z)分量,則也可以是0=0。此外,作為多階線性預測模型的D的上限值,可以例示離散時刻n中的xm(n)的n+1+D時刻的混響分量在規定值(例如,比離散時刻n的xm(n)低60dB的值)以上或超過該規定值的值。[第一實施方式]接著,說明本發明的第一實施方式。第一實施方式是傳感器數M為M>2的情況下的實施方式。<硬件結構>圖3是例示本實施方式中的混響除去裝置10的硬件結構的方框圖。如圖3所例示的,本例的混響除去裝置10具有CPU(CentralProcessingUnit)11、輸入單元12、輸出單元13、輔助存儲單元14、ROM(ReadOnlyMemory)15、RAM(RandomAccessMemory)16和總線17。本例的CPU11具有控制單元lla、運算單元Ub以及寄存器11c,按照由寄存器llc讀入的各種程序來執行各種運算處理。此外,輸入單元12為輸入數據的輸入接口、鍵盤、鼠標等,輸出單元13是輸出數據的輸出接口等。輔助存儲裝置14例如為硬盤、MO(Magneto-Opticaldisc)、半導體存儲器等,具有存儲了使計算機作為混響除去裝置10起作用的程序的程序區域14a以及存儲各種數據的數據區域14b。此外,RAM16為SRAM(StaticRandomAccessMemory)、DRAM(DynamicRandomAccessMemory)等,具有存儲上述程序的程序區域16a以及存儲各種數據的數據區域16b。此外,總線17可通信地連接CPUll、輸入單元12、輸出單元13、輔助存儲裝置14、ROM15以及RAM16。另外,作為這樣的硬件的具體例子,例如,除了個人計算機之外,還可以例示服務器裝置和工作站等。<程序結構>如上所述,在程序區域14a、16a中存儲用于執行本方式的混響除去裝置10的各處理的混響除去程序。構成混響除去程序的各程序可以作為單一的程序列記載,或者也可以將至少一部分程序作為分別的模塊而存儲在庫(library)中。此外,各程序可以單獨實現各個功能,也可以由各程序進一步讀出其它庫來實現各功能。<硬件和程序的協作>CPU11(圖3)按照讀入的OS(OperatingSystem)程序,將輔助存儲裝置14的程序區域14a中存儲的上述程序寫入RAM16的程序區域16a中。同樣,CPUll將輔助存儲裝置14的數據區域14b中存儲的各種數據寫入RAM16的數據區域16b中。然后,被寫入該程序或數據的RAM16上的地址被存儲在CPU11的寄存器llc。CPU11的控制單元lla依次讀出存儲在寄存器llc中的這些地址,并/人讀出的地址所表示的RAM16上的區域中讀出程序或數據,由運算單元lib依次執行該程序所示的運算,并將該運算結果存儲在寄存器llc中。圖1是例示如這樣通過在CPU中讀入上述程序并執行而構成的混響除去裝置10的功能結構的方框圖。此外,圖2A是例示模型應用單元10b的功能結構的細節的方框圖,圖2B是例示延遲調節單元10i的功能結構的細節的方框圖。如圖1所例示的,混響除去裝置IO具有存儲器10a、模型應用單元10b、后部混響預測單元10c、頻域變換單元10d、后部混響除去單元10e、復:^普生成單元10f、時域變換單元10g、延遲量計算單元10h、延遲調節單元10i、存儲器10j、控制單元10k。此外,如圖2A所例示的,模型應用單元10b具有模擬白色化單元100和第一線性預測系數計算單元200,模擬白色化單元100具有第二線性預測系數計算單元IIO和逆濾波器處理單元120。此外,第二線性預測系數計算單元IIO具有自相關系數計算單元111、自相關系數平均化單元112、方程式運算單元113。此外,如圖2B所例示的,延遲調節單元10i具有延遲單元10ia、延遲校正單元10ib。這里,存儲器10a和存儲器lOj相當于輔助存儲裝置14、RAM16、寄存器llc、其它緩沖存儲器或閃存等其中一個、或將它們并用的存儲區域。此外,模型應用單元10b、后部混響預測單元10c、頻域變換單元10d、后部混響除去單元10e、復譜生成單元10f、時域變換單元10g、延遲量計算單元10h、延遲調節單元ioi以及控制單元lOk通過使CPUll執行混響除去程序而構成。此外,本方式的混響除去裝置10在控制單元10k的控制下執行各處理。此外,只要沒有特別表示,運算過程的各數據逐一被存儲、讀出到存儲器10j中,進行各運算處理。在存儲器10a或存儲器10j中存儲了X|(n)、cc,,2(p)等各數據,但它們與數據屬性、下標的值[例如,數據x,(n)的下標"1"]以及()內的各值[例如,數據Xi(n)的n]對應被存儲,通過指定它們從而能夠提取對應的數據。<混響除去處理>接著,說明本方式的混響除去處理。圖4、5是用于說明本方式的混響除去處理的整體的流程圖。此外,圖6A是用于說明圖4的步驟S1(模型應用步驟)的細節的流程圖,圖6B是用于說明圖6A的步驟S21(模擬白色化步驟)的細節的流程圖。此外,圖7A是用于說明圖6B的步驟S31(第二線性預測系數計算步驟)的細節的流程圖,圖7B是用于說明圖4的步驟S4的細節的流程圖。以下,使用這些圖說明本方式的混響除去處理。首先,由M(M>2)個傳感器分別觀測到的M個信道w(w=l,...,M)的聲響信號以規定的抽樣頻率被采樣,生成每個信道的離散聲響信號值Xl(n)...xM(n)。另外,n表示離散時間。生成的各信道的離散聲響信號值x,(n)...xM(n)分別被存儲在存儲器10a中。另外,在本方式中,事先取得進行混響除去的全部時間區間的離散聲響信號值x,(n)...xM(n),并存儲在存儲器10a中,并對每個分析幀執行以下的各步驟。但是,也可以實時地取得離散聲響信號值x!(n)...xM(n),同時執行以下各步驟。此外,混響除去裝置IO最終輸出的信息表示僅是后部混響除去信號的振幅譜還是也具有相位分量的聲響信號的信息存儲在存儲器10j中。在本方式中,將標記(flag)(數據)5存儲在存儲器10j中。然后,在輸出的信息僅是直接聲音的振幅譜的情況下設為5=1,在是也具有相位分量的聲響信號的情況下設為5=0。另外,混響除去裝置10最終輸出的信息也可以僅僅是后部混響除去信號的振幅譜的情況,例如可以例示將混響除去裝置10最終輸出的信息用作語音識別系統的輸入信息的情況。以下,說明本方式的后部混響除去處理。另外,以下,僅說明一個分析幀的處理步驟,但實際上對多個分析幀進行同樣的處理。此外,分析幀表示包含多個離散時間n的時間區間。在模型應用步驟中,模型應用單元10b使用從存儲器10a讀入的1分析幀的M信道的離散聲響信號值Xi(n)...xM(n),計算式(13)所示的多階線性預測模型的各線性預測系數oc^(p)...aw,M(p)(步驟S1)。以下,分層地說明該處理的細節。如圖6A所例示的,在模型應用步驟中,首先,模擬白色化(Pre-whitening)單元100(圖2A)抑制輸入的離散聲響信號值x,(n)...xM(n)所具有的短時間區間中的自相關分量,生成模擬白色化后的離散聲響信號值Xl,(n)...xM,(n)并輸出(模擬白色化步驟/步驟S21)。即,從各離散時間的上述離散聲響信號值Xi(n)...xM(n)中抑制與緊接著該離散時間n之前的短時間區間內的各離散聲響信號值具有自相關性的自相關分量,并生成模擬白色化后的離散聲響信號值x「(n)…xm,(n)。如前所述,多階線性預測模型與抑制了按照d(z)的短期自相關(短時間區間中的自相關分量)后的離散聲響信號非常一致。從而,從離散聲響信號值x,(n)...xM(n)中抑制這樣的短期自相關,在高精度地估計后部混響上是理想的。接著,上述模擬白色化后的離散聲響信號值Xl,U)...xM,(n)被輸入到第一線性預測系數計算單元200(圖2A)中,第一線性預測系數計算單元200使用該模擬白色化后的離散聲響信號值xr(n)...xM,(n)計算式(13)所示的多階線性預測模型的各線性預測系數ccw,,(p)…cu,M(p)并輸出(第一線性預測系數計算步驟/步驟S22)。另外,作為一例,將式U3)中的延遲D例如設為30ms(在抽樣頻率12000Hz的情況下,相當于300輕拍(tap)),將N例如設為300左右。此外,作為使用xf(n)…Xm,(n)計算ocw>1(p)…aw,m(p)的方法,可以例示自相關法(correlationmethod)和協方差法(covariancemethod)。此外,也可以4吏用MATLAB(注冊商標)等來進行該處理。接著,說明模擬白色化步驟(步驟S21)的細節。在本方式中,作為一例,通過線性預測來進行模擬白色化步驟。首先,如圖6B所例示的,第二線性預測系數計算單元110使用輸入的離散聲響信號值x,(n)…Xm(n)計算短時間線性預測模型的各線性預測系數b(1)…b(q)并輸出(第二線性預測系數計算步驟/步驟S31)。另外,"短時間線性預測模型"表示通過將短時間區間中的信道w的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在緊接著短時間區間之后的離散時間n的該信道w的離散聲響信號值的線性預測模型。這里,"短時間區間"比由多階線性預測模型的定義所示的"長時間區間,,短。在本方式中,^使用以下的短時間線性預測模型。<formula>formulaseeoriginaldocumentpage30</formula>…(33)另外,式(33)中的Xm,(n)的項相當于預測誤差項,除此以外的右邊的項相當于線性預測項。此外,b(i)表示線性預測項的第i個線性預測系數。此外,式(33)中的短時間區間根據離散聲響信號值x,(n)...xM(n)的短時間相關分量的序列長或功率而適當設定即可。作為一例,可以將短時間區間設為30ms(在抽樣頻率12000Hz的情況下,q=300)左右。在該情況下,通過以下的步驟S32能夠抑制在短時間區間30ms內具有自相關的初始反射聲音分量或直接聲音分量。—接著,對逆濾波器處理單元120(圖2A)中輸入各線性預測系數b(1)...b(q)、離散聲響信號值Xi(n)...xM(n)。逆濾波器處理單元120對將各線性預測系數b(1)…b(q)代入短時間線性預測^^莫型(式(33))而得到的逆濾波器<formula>formulaseeoriginaldocumentpage30</formula>…(34〉代入離散聲響信號值x,(n)...xM(n),并將由此得到的短時間線性預測模型的預測誤差項的值作為進行了模擬白色化的離散聲響信號值Xl,(n)...xM,(n)來計算并輸出(逆濾波器處理步驟/步驟S32)。接著,說明第二線性預測系數計算步驟(步驟S31)的細節。在本方式的例子中,使用自相關法執行第二線性預測系數計算步驟。但是,也可以使用協方差法等其它公知的線性預測系數計算方法來執行第二線性預測系數計算步驟。首先,如圖7A所例示的,首先,自相關系數計算單元111(圖2A)使用輸入的離散聲響信號值x,(n)...xM(n),對每個信道計算離散聲響信號值Xl(n)...xM(n)的自相關系數c,(i)...cM(i)并輸出(自相關系數計算步驟/步驟S41)。具體來說,例如自相關系數計算單元ill按照以下的式(35)計算自相關系數d(i)...cM(i)并輸出。另外,T是大于q(式(33)、(34))且小于1分析幀所具有的樣本數的自然數。此外,以下的運算例如在上述離散聲響信號值x,(n)...xM(n)乘以在nO、n》T的范圍內為0這樣的有限長的窗(漢明(hamming)窗等)之后進行。此外,i=0,1,…,q。[算式15]<formula>formulaseeoriginaldocumentpage31</formula>接著,對自相關系數平均化單元112(圖2A)輸入各信道的自相關系數C,(i)...CM(i),自相關系數平均化單元112計算將這些自相關系數C,(i)…CM(i)在信道之間平均之后的平均自相關系數c(i)并輸出(自相關系數平均化步驟/步驟S42)。該平均自相關系數c(i)的計算例如按照以下的式(36)進行。<formula>formulaseeoriginaldocumentpage31</formula>接著,如上述這樣求出的各平均自相關系數c(i)被輸入方程式運算單元113,方程式運算單元113使用各平均自相關系數c(i),如以下這樣,求Yule-Walker的方程式(正規方程式)的解,從而計算短時間線性預測模型的各線性預測系數b(1)…b(q)并輸出(方程式運算步驟/步驟S43)。<formula>formulaseeoriginaldocumentpage31</formula>如以上這樣,由于采用了使用將對每個信道生成的自相關系數c,(i)...CM(i)在信道之間平均之后的平均自相關系數c(i)計算各線性預測系數b(1)…b(q)的結構,因此與使用由任何一個信道生成的自相關系數的情況相比,線性預測系數b(1)...b(q)的計算精度提高,并且能夠進一步有效地抑制離散聲響信號值x,(n)…XM(n)所具有的按照d(z)的短期自相關。如前所述,這帶來后部混響除去的精度的提高(模型應用步驟(步驟S1)的細節說明結束)。在模型應用步驟(步驟Sl)之后,對后部混響預測單元10c輸入/人存儲器10a讀入的離散聲響信號值x,(n)...xM(n)、由模型應用步驟(步驟Sl)計算出的各線性預測系數ocw,i(p)...ocw,m(p)。然后,后吾卩'/'昆響子貞觀'J單元lOc將各線性預測系數aw,,(p)...aw,M(p)和離散聲響信號值x,(n)...xM(n)代入多階線性預測模型的線性預測項而得到的線性預測值,作為后部混響預測值rw(n)(w=1,...,M)計算并輸出(步驟S2)。在本方式中,由于使用式(13)的多階線性預測模型,因此后部混響預測單元lOc按照以下的式(38)求后部混響預測值rw(n)并輸出。[算式18]<formula>formulaseeoriginaldocumentpage32</formula>接著,對頻域變換單元10d輸入從存儲器10a讀入的離散聲響信號值x,(n)...xM(n)、由后部混響預測步驟(步驟S2)計算出的后部混響預測值r,(n)...rMU)。頻域變換單元10d將輸入的離散聲響信號值x,(n)...xM(n)變換為頻域的離散聲響信號值X,(f,t)...XM(f,t),并將后部混響預測值r!(n)...rM(n)變換為頻域的后部混響預測值&(f,t)...RM(f,t)(步驟S3)。在本方式中,例如使用窗長30ms的漢明窗等有限長的窗函數,通過短時間傅立葉變換(DFT:DiscreteFourierTransform)等進行這些向頻域的變換。頻域變換單元10d通過這些處理提取并輸出頻域的離散聲響信號值X,(f,t)...XM(f,t)的振幅譜IX)(f,t)I...IXM(f,t)l和相位信息argPd(f,t)]...arg[XM(f,t)]、以及頻域的后部混響預測值R,(f,t)...RM(f,t)的振幅譜IR,(f,t)I...IRM(f,t)l和相位信息arg[R,(f,t)]...arg[RM(f,t)]。另外,arg[.]表示-的輻角。接著,對后部混響除去單元lOe輸入頻域的離散聲響信號值的振幅譜Pd(f,t)|...|XM(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)i...|RM(f,t)|。然后,后部混響除去單元10e求頻域的離散聲響信號值的振幅譜IX,(f,t)|...|XM(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)l的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值^(f,t)|...|SM(f,t)|而輸出(步驟S4)。以下,例示該處理的細節。在步驟S4之后,控制單元10k讀出存儲器10j中存儲的標記5,并判斷該標記5是否是表示僅輸出振幅譜的標記,即是否5=1(步驟S5)。這里,如果5=1,則控制單元10k將在后部混響除去步驟(步驟S4)中由后部混響除去單元10e生成的后部混響除去信號值的振幅譜預測值IS"f,t)|...|SM(f,t)l作為混響除去裝置10的最終的輸出信息輸出(步驟S6),并結束該分析幀的處理。這樣輸出的振幅譜預測值IS,(f,t)|...|SM(f,t)l例如被傳送給接著在混響除去裝置10的后級的語音識別系統等應用,并變換為特征量。另一方面,如果5=0,則控制單元10k執行以下的步驟S7以后的處理。'在復譜生成步驟中,首先對復譜生成單元10f輸入從后部混響除去單元10e輸出(步驟S4)的后部混響除去信號值的振幅譜預測值IS,(f,t)|...|SM(f,t)|,和從頻域變換單元10d輸出(步驟S3)的頻域的離散聲響信號值的相位信息arg[Xi(f,t)]...arg[XM(f,t)]。復譜生成單元10f使用這些信息,按照以下的式(42),計算后部混響除去信號值的復"i普預測值S,(f,t)...SM(f,t)并輸出(步驟S7)。另外,exp(.)是以納披爾數為底的指數函數,j是虛數單位。Sjf,t)氣(f,t)l'exp(j'argD^(r,t)]).'-(42)[時域變換步驟(步驟S8)]在步驟S7之后,對時域變換單元10g輸入上述后部混響除去信號值的復譜預測值S,(f,t)...SM(f,t)。然后,時域變換單元10g計算將后部混響除去信號值的復譜預測值S,(f,t)…Sm(f,t)變換到時域后的后部混響除去信號估計值s,(n)...sM(n)并輸出(步驟S8)。另外,對時域的變換例如通過逆傅立葉變換進行。在步驟S8之后,對延遲量計算單元10h輸入后部混響除去信號估計值Sl(n)…sm(n)。然后,延遲量計算單元10h根據各信道決定使后部混響除去信號估計值51(n)...sM(n)的信道間互相關極大的后部混響除去信號估計值的延遲量t卜.tm(步驟S9)。以下示出該具體例子。首先,延遲量計算單元10h對輸入的分析幀內的后部混響除去信號估計值s,(n)...sM(n),求如以下的式(43)這樣的信道間相關函數Am(t)的函數值。另外,E{}是平均運算符。A(T):曰s(n).s(n+r)}…(43)接著,延遲量計算單元10h對各m求使信道間相關函數Am(t)為極大(例如最大)的t,作為tm。例如,在將使信道間相關函數Am(t)為最大的T作為Tm的情況下,延遲量計算單元10h計算ir=max{A"))…(44)并輸出。另外,max{}檢測的最大值。此外,Tm是信道m的后部混響除去信號估計值的延遲量,在延遲量中也包含Tm-O(延遲兩計算步驟(步驟S9)的具體例子的說明結束)。在步驟S9之后,各延遲量T,...TM和后部混響除去信號估計值Sl(n)...sM(n)被輸入到延遲調節單元10i(圖1)。然后,延遲調節單元10i的延遲單元lOia(圖2B)將各信道的后部混響除去信號估計值s,(n)...sM(n)分別延遲延遲量t,…tm,計算s,(n+Ti)...sM(n+tm)并輸出(步驟SIO)。接著,Si(n+t!)...sM(n+tm)被輸入到延遲校正單元10ib(圖2B),延遲校正單元lOib按照以下的式(45),計算s,(n+t,)...sM(n+tm)之和(步驟Sll),并將該和作為校正混響除去信號值s(n)輸出(步驟S12),并結束該分析幀的處理。各信道的后部混響信號中包含的誤差分量在統計上獨立的步驟的情況下,可以通過該操作來抑制誤差。<formula>formulaseeoriginaldocumentpage35</formula>接著,說明本發明的第二實施方式。第二實施方式是第一實施方式的變形例。第一實施方式的[后部混響預測步驟(步驟S2)]中,作為后部混響預測值rw(n)(wM,…,M),計算將各線性預測系數awj(p)…0Cw,M(p)和未進行模擬白色化的離散聲響信號值x,(n)...xM(n)代入多階線性預測模型的線性預測項而得到的線性預測值。此外,在[后部混響除去步驟(步驟S4)]中,求未進行模擬白色化的頻域的離散聲響信號值的振幅譜1X,(f,t)l...|XM(f,t)l和頻域的后部混響預測值的振幅譜IR4(f,t)|...|RM(f,t)l的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值IS,(f,t)|...|SM(f,t)|。而在第二實施方式中,在[后部混響預測步驟]中,作為后部混響預測值rw(n)(w=1,...,M),計算將各線性預測系數a^(p)...aw,M(p)和未進行模擬白色化的離散聲響信號值x,,(n)...xM,(n)代入多階線性預測模型的線性預測項而得到的線性預測值。此外,在第二實施方式中,在[后部混響除去步驟]中,求進行了模擬白色化后的頻域的離散聲響信號值的振幅譜IX,,(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)|的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值|S,(f,t)|...|SM(f,t)|。這樣得到的后部混響除去信號值的振幅譜預測值is,(f,t)|...|SM(f,t)l是短時間相關分量被抑制后(模擬白色化后)的值。因此,這樣得到的振幅譜預測值ISi(f,t)|...|SM(f,t)l適合作為對例如語音識別系統這樣的需要模擬白色化后的數據的系統的輸入。因為在這樣的系統中,不需要模擬白色化的前處理。這些是第一實施方式和第二實施方式的不同點。以下,以與第一實施方式的不同點為中心進行說明,對于與第一實施方式相同的事項省略說明。<^更件結構>與第一實施方式中說明的相同。4更件和程序的協作>本方式的混響除去裝置也通過將規定程序讀入計算機并執行而構成。圖8是例示本方式的混響除去裝置310的功能結構的方框圖。此外,圖9是例示模型應用單元310b的功能結構的細節的方框圖。另外,在圖8、9中,對與第一實施方式相同的部分使用與第一實施方式相同的標號。如圖8中所例示的,混響除去裝置310具有存儲器10a、模型應用單元310b、后部混響預測單元310c、頻域變換單元310d、后部混響除去單元310e、復譜生成單元310f、時域變換單元10g、延遲量計算單元10h、延遲調節單元10i、存儲器10j、控制單元10k。此外,如圖9所例示的,模型應用單元310b具有模擬白色化單元100和第一線性預測系數計算單元200,模擬白色化單元100具有第二線性預測系數計算單元110和逆濾波器處理單元120。此外,第二線性預測系數計算單元IIO具有自相關系數計算單元111、自相關系數平均化單元112、方程式運算單元113。模型應用單元310b和第一實施方式的模型應用單元10b的不同點在于,模型應用單元310b的逆濾波器處理單元120將模擬白色化后的離散聲響信號值x,,(n)...xM,(n)也傳送到后部混響預測單元310c和頻域變換單元310d。<混響除去處理>接著,說明本方式的混響除去處理。圖10、11是用于說明本方式的混響除去處理的整體的流程圖。以下,使用這些圖說明本方式的混響除去處理。[前處理]與第一實施方式同樣。[模型應用步驟(步驟S101)]在模型應用步驟中,模型應用單元310b使用從存儲器10a讀入的1分析幀的M信道的離散聲響信號值Xi(n)...XmU),計算式(13)所示的多階線性預測模型的各線性預測系數a^(p)...ctw,M(p)(步驟SIOI)。該處理與第一實施方式的[模型應用步驟(步驟Sl)]同樣,包含將離散聲響信號值Xl(n)...xM(n)模擬白色化的步驟。[后部混響預測步驟(步驟S102)]在模型應用步驟(步驟S101)之后,對后部混響預測單元310c輸入在模型應用步驟(步驟SIOI)中模擬白色化后的離散聲響信號值xr(n)...xM,(n)、由模型應用步驟(步驟SIOI)計算出的各線性預測系數ou,,(p)...aw,m(P)。然后,后部混響預測單元310c將各線性預測系數cxw,,(p)...aw,M(p)和模擬白色化后的離散聲響信號值x,,(n)...xM,(n)代入多階線性預測模型的線性預測項而得到的線性預測值,作為后部混響預測值rw(n)(w=1,...,M)計算并輸出(步驟S102)。在使用了式(13)的多階線性預測模型時,后部混響預測單元310c4姿照以下的式(46)求后部混響預測值rw(n)并輸出。M〖N/M]rw(n)=2]Saw,m(p).xm'(n-p-D)…(46)[頻域變換步驟(步驟S103)]接著,對頻域變換單元310d輸入在模型應用步驟(步驟S101)中模擬白色化后的離散聲響信號值x,,(n)...xM,(n)、由后部混響預測步驟(步驟S102)計算出的后部混響預測值ri(n)...rM(n)。頻域變換單元310d將輸入的模擬白色化后的離散聲響信號值x,,(n)...xM,(n)變換為頻域的離散聲響信號值X,,(f,t)...XM,(f,t),并將后部混響預測值r,(n)...rM(n)變換為頻域的后部混響預測值R,(f,t)...RM(f,t)(步驟S103)。頻域變換單元310d通過這些處理提取并輸出頻域的離散聲響信號值X,,(f,t)...XM,(f,t)的振幅譜Pd,(f,t)|...|XM,(f,t)l和相位信息arg[Xr(f,t)]...arg[XM,(f,t)]、以及頻域的后部混響預測值R,(f,t)...RM(f,t)的振幅譜IR,(f,t)|...|RM(f,t)l和相位信息arg[R,(f,t)]...arg[RM(f,t)]。[后部混響除去步驟(步驟S1(M)]接著,對后部混響除去單元310e輸入頻域的離散聲響信號值的振幅譜|Xr(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)|。然后,后部混響除去單元310e求頻域的離散聲響信號值的振幅譜IX,,(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)|的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值|S(f,t)|...|SM(f,t)|而輸出(步驟S104)。在步驟S104之后,控制單元lOk讀出存儲器10j中存儲的標記5,并判斷該標記5是否是表示僅輸出振幅譜的標記,即是否5=1(步驟S105)。這里,如果5=1,則控制單元10k將在后部混響除去步驟(步驟S104)中由后部混響除去單元310e生成的后部混響除去信號值的振幅譜預測值IS,(f,t)|...|SM(f,t)l作為混響除去裝置310的最終的輸出信息而輸出(步驟S106),并結束該分析幀的處理。另一方面,如果5=0,則控制單元10k執行以下的步驟S107以后的處理。在復譜生成步驟中,首先對復譜生成單元310f輸入從后部混響除去單元310e輸出(步驟S104)的后部混響除去信號值的振幅譜預測值IS,(f,t)|...|SM(f,t)I,和從頻域變換單元10d輸出(步驟S3)的頻域的離散聲響信號值的相位信息arg[Xr(f,t)]...arg[XM,(f,t)]。復譜生成單元310f使用這些信息,按照以下的式(47),計算后部混響除去信號值的復譜預測值S,(f,t)...SM(f,t)并輸出(步驟S107)。S(f,t)—S(f,OI.exp(j'arg[X,(f,t)]).-(47)時域變換步驟(步驟S108)、延遲量計算步驟(步驟S109)、延遲量調節步驟(步驟SllO、Sill)與第一實施方式的時域變換步驟(步驟S8)、延遲量計算步驟(步驟S9)、延遲量調節步驟(步驟SIO、Sll)相同。接著,說明本發明的第三實施方式。第三實施方式是第一、第二實施方式的變形例。在第一實施方式所例示的"第二線性預測系數計算步驟(步驟S31),,中,第二線性預測系數計算單元110使用將對每個信道生成的自相關系數c,(i)...cM(i)在信道之間平均后的平均自相關系數c(i),計算短時間線性預測模型的各線性預測系數b(1)…b(q)。而在第三實施方式的[第二線性預測系數計算步驟(步驟S31)]中,第二線性預測系數計算單元410計算離散聲響信號值的自相關系數,并使用該自相關系數,計算短時間線性預測模型的各線性預測系數,所述離散聲響信號值通過將由M個傳感器中最接近聲響信號的聲源的一個傳感器所觀測到的聲響信號,在多個時刻進行采樣而得到。這一點與第一實施方式不同。而且,該結構對第二實施方式也能夠應用。以下,僅說明作為與第一、第二實施方式的不同點的第二線性預測系數計算單元410的結構以及[第二線性預測系數計算步驟(步驟S31)]的處理,并對與第一、第二實施方式相同的事項省略說明。圖12A是表示本方式的第二線性預測系數計算單元410的功能結構的方框圖。另外,在圖12A中,對于與第一實施方式相同的部分使用與第一實施方式相同的符號。此外,圖12B是用于說明本方式的[第二線性預測系數計算步驟(步驟S31)]的流程圖。如圖12A所例示的,本方式的第二線性預測系數計算單元410具有自相關系數計算單元411和方程式運算單元113。在本實施方式的第二線性預測系數計算步驟中,首先,自相關系數計算單元411(圖12A)使用輸入了的離散聲響信號值A(n)...Xm(n),計算離散聲響信號值Xy(n)的自相關系數Cy(i)(i-O,1,...,q)(步驟S141),所述離散聲響信號值通過將由M(M>2)個傳感器中最接近聲響信號的聲源的一個傳感器y(y=1,M)所觀測到的聲響信號,在多個時刻進行采樣而得到。另外,最接近聲響信號的聲源的一個傳感器y的信息可以是自相關系數計算單元411所具備的固定信息,也可以是對自相關系數計算單元411提供的變動信息。接著,如上述這樣求出的各自相關系數C(i)被輸入到方程式運算單元113,方程式運算單元113使用各平均自相關系數c(i),求Yule-Walker的方程式(正規方程式)的解,從而計算短時間線性預測模型的各線性預測系數b(1)…b(q)并輸出(方程式運算步驟/步驟S142)。如以上這樣,在本方式中,采用了使用與最接近聲響信號的聲源的一個傳感器對應的聲響信號值的自相關系數,計算各線性預測系數b(1)...b(q)的結構。由此,與使用與其它傳感器對應的聲響信號值的自相關系數的情況相比,線性預測系數b(1)...b(q)的計算精度提高,能夠更有效地抑制離散聲響信號值x,(n)...xM(n)所具備的按照d(z)的短期自相關。如前所述,這使得后部混響除去的精度提高。接著,說明本發明的第四實施方式。第四實施方式是第一、第二實施方式的變形例。在第一實施方式的[模擬白色化步驟(步驟S21)]中,使用短時間線性預測模型進行了離散聲響信號值的模擬白色化。而在第四實施方式的[模擬白色化步驟(步驟S21)]中,使用倒譜平均值消去(CMS,CepstralMeanSubtraction)(例如,參照"B.S.Atal,"Effectivenessoflinearpredictioncharacteristicsofthespeechwaveforautomaticspeakeridentificationandverification,"JournalofAcousticalSocietyofAmerica,55(6),pp.1304-1312,1974.")進行離散聲響信號值的模擬白色化。這一點是與第一實施方式的不同點。而且,該結構對第二實施方式也能夠應用。以下,僅說明作為與第一、第二實施方式的不同點的模擬白色化單元510的結構以及^莫擬白色化步驟(步驟S21)]的處理,并對與第一、第二實施方式相同的事項省略說明。.圖13是表示本方式的模型應用單元500的功能結構的方框圖。另外,對于在圖13中與第一實施方式相同的部分使用與第一實施方式相同的標號。如圖13中例示的,本方式的模型應用單元500具有模擬白色化單元510和第一線性預測系數計算單元200。此外,模擬白色化單元510具有頻域變換單元511、時間平均化單元512、減法單元513、時域變換單元514。圖14是用于說明本方式的[模擬白色化步驟(步驟S21)]的流程圖。以下,使用該圖說明本方式的[模擬白色化步驟(步驟S21)]。首先,模擬白色化單元510的頻域變換單元511從存儲器10a讀入1分析幀的M信道的離散聲響信號值x,(n)...xM(n)。然后,頻域變換單元511通過短時間傅立葉變換等將離散聲響信號值x,(n)...xM(n)變換為頻域的離散聲響信號值Xi(f,t)...XM(f,t)并輸出(步驟S201)。另外,在通過短時間傅立葉變換而進行該處理的情況下,例如4吏用以下的式(48)。此外,F[]表示短時間傅立葉變換函數,Log[.]表示對數函數。<formula>formulaseeoriginaldocumentpage41</formula>…(48)接著,頻域的離散聲響信號值X,(f,t)...XM(f,t)被讀入到時間平均化單元512,時間平均化單元512按照以下的式(49),求頻域的離散聲響信號值X!(f,t)...XM(f,t)的時間平均Xm,(f),并輸出(步驟S202)。<formula>formulaseeoriginaldocumentpage41</formula>…(49)接著,頻域的離散聲響信號值X,(f,t)...XM(f,t)和它們的時間平均E{Xm(f,t)H皮讀入到減法單元513,減法單元513通過以下的式(50),計算Xm,(f,t)(m=1,…,M),并輸出(步驟S203)。<formula>formulaseeoriginaldocumentpage41</formula>50)接著,Xr(f,t)...XM,(f,t)被讀入到時域變換單元514,時域變換單元514通過逆傅立葉變換等將它們變換到時域,計算模擬白色化后的離散聲響信號值x,,(n)…Xm,(n),并輸出(步驟S204)。另外,在通過逆傅立葉變換進行該處理的情況下,例如使用以下的式(51)。此外,invF[']表示逆傅立葉變換函數,exp[]表示以納披爾數為底的指數函數。<formula>formulaseeoriginaldocumentpage41</formula>…(51)另外,在上述短時間傅立葉變換函數F[.]和逆傅立葉變換函數invF[]中使用窗長25ms的窗函數的情況下,可以除去25ms以內的初始反射分量以及短時間相關。此外,在將本方式應用于第二實施方式的情況下,由時域變換單元514生成的模擬白色化后的離散聲響信號值xr(n)...xM,(n)也被傳送到后部混響預測單元310c和頻域變換單元310d(圖8)。接著,說明本發明的第五實施方式。第五實施方式是將第四實施方式的模擬白色化方法應用于第一實施方式時的變形例。在第一實施方式的[頻域變換步驟(步驟S3)]中,將離散聲響信號值x,(n)...xM(n)變換為頻域的離散聲響信號值X,(f,t)...XM(f,t),并將后部混響預測值n(n)...rM(n)變換為頻域的后部混響預測值R!(f,t)...RM(f,t)。但是,在進行第四實施方式的模擬白色化的情況下,在該步驟中(步驟S201)中得到頻域的離散聲響信號值X!(f,t)...XM(f,t)。在第五實施方式中,借用在第四實施方式的模擬白色化的步驟中得到的頻域的離散聲響信號值X,(f,t)...XM(f,t),將頻域變換步驟的處理簡化。以下,以與此前說明的實施方式的不同點為中心進行說明,對于與它們相同的部分省略"i兌明。《埂件結構>與第一實施方式中說明的相同。<硬件和程序的協作>本方式的混響除去裝置也通過將規定程序讀入計算機并執行而構成。圖15是例示本方式的混響除去裝置610的功能結構的方框圖。另外,在圖15如圖15中所例示的,混響除去裝置610具有存儲器10a、模型應用單元500、后部混響預測單元10c、頻域變換單元510d、后部混響除去單元10e、復譜生成單元10f、時域變換單元10g、延遲量計算單元10h、延遲調節單元10i、存儲器10j、控制單元10k。<混響除去處理>接著,說明本方式的混響除去處理。圖16是用于說明本方式的混響除去處理的整體的流程圖。以下,使用該圖說明本方式的混響除去處理。[前處理]與第一實施方式同樣。[模型應用步驟(步驟S"1)]在模型應用步驟中,模型應用單元500使用從存儲器10a讀入的1分析幀的M信道的離散聲響信號值x,(n)...xM(n),計算式(13)所示的多階線性預測模型的各線性預測系數ocw,i(p)...aw,M(p)(步驟S211)。該處理中,模擬白色化處理如第四實施方式中說明的那樣,其它的處理與第一實施方式同樣。在模型應用步驟(步驟S211)之后,對后部混響預測單元10c輸入從存儲器10a讀出的離散聲響信號值Xl(n)...xM(n)、由模型應用步驟(步驟S211)計算出的各線性預測系數aw,i(p)…ocw,m(p)。然后,后部混響預測單元10c將各線性預測系數OCw,,(p)...cxw,M(p)和離散聲響信號值x,(n)...xM(n)代入多階線性預測模型的線性預測項而得到的線性預測值,作為后部混響預測值rw(n)(w=l,…,M)計算并輸^出(步驟S212)。接著,對頻域變換單元510d輸入由后部混響預測步驟(步驟S212)計算出的后部混響預測值n(n)...rM(n)。頻域變換單元510d將輸入的后部混響預測值ri(n)...rM(n)變換為頻域的后部混響預測值R,(f,t)...RM(f,t)(步驟S213)。頻域變換單元510d通過該處理提取并輸出頻域的后部混響預測值R!(f,t)...RM(f,t)的振幅譜IR!(f,t)|...|RM(f,t)l和相位信息arg[R,(f,t)]...arg[RM(f,t)〗。接著,對后部混響除去單元10e輸入從;漠擬白色化單元510的頻域變換單元511(圖13)傳送的頻域的離散聲響信號值的振幅譜IXr(f,t)|...|XM,|...|RM(f,t)|。然后,后部混響除去單元310e求頻域的離散聲響信號值的振幅譜IXr(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)l的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值IS,(f,t)|...|SM(f,t)|而輸出(步驟S214)。[標記判定步驟(步驟S215、S216)]本方式的[標記判定步驟(步驟S215、S216)]與第一實施方式的[標記判定步驟(步驟S5、S6)]相同。[其它步驟]其它步驟與第一實施方式相同。其中,與第一實施方式不同之處僅僅在于在[復譜生成步驟(步驟S7)]中,使用從才莫擬白色化單元510的頻域變4奐單元511(圖13)傳送的相位信息arg[X,(f,t)]...arg[XM(f,t)]。[第六實施方式]接著,說明本發明的第六實施方式。第六實施方式是將第四實施方式的模擬白色化方法應用于第二實施方式時的變形例。在第二實施方式的[頻域變換步驟(步驟S103)]中,將離散聲響信號值x,(n)...xM(n)變換為頻域的離散聲響信號值X,(f,t).,.XM(f,t),并將后部混響預測值r,(n)...rM(n)變換為頻域的后部混響預測值R,(f,t)...RM(f,t)。但是,在進行第四實施方式的模擬白色化的情況下,在該步驟中(步驟S201)中,得到頻域的離散聲響信號值X,(f,t)...XM(f,t)。在第六實施方式中,借用在第四實施方式的模擬白色化的步驟中得到的頻域的離散聲響信號值X,(f,t)...XM(f,t),將頻域變換步驟的處理簡化。以下,以與此前說明的實施方式的不同點為中心進行說明,對于與它們相同的部分省略說明。"更件結構>與第一實施方式中說明的相同。"更件和程序的協作>本方式的混響除去裝置也通過將規定程序讀入計算機并執行而構成。圖17是例示本方式的混響除去裝置620的功能結構的方框圖。在圖17中,對與此前說明的實施方式相同的部分使用與其相同的標號。如圖17中所例示的,混響除去裝置620具有存儲器10a、模型應用單元500、后部混響預測單元310c、頻域變換單元510d、后部混響除去單元310e、復譜生成單元310f、時域變換單元10g、延遲量計算單元10h、延遲調節單元10i、存儲器10j、控制單元10k。<混響除去處理>接著,說明本方式的混響除去處理。圖18是用于說明本方式的混響除去處理的整體的流程圖。以下,使用該圖說明本方式的混響除去處理。[前處理〗與第一實施方式同樣。[模型應用步驟(步驟S21)]在模型應用步驟中,模型應用單元310b使用從存儲器10a讀入的1分析幀的M信道的離散聲響信號值Xi(n)...XM(n),計算式(13)所示的多階線性預測模型的各線性預測系數ocw>1(p)...aW,M(p)(步驟S221)。該處理中,模擬白色化處理如第四實施方式中說明的那樣,其它的處理與第一實施方式同樣。在模型應用步驟(步驟S221)之后,對后部混響預測單元310c輸入在模型應用步驟(步驟S221)中模擬白色化后的離散聲響信號值x,,(n)...xM,(n)、由模型應用步驟(步驟S221)計算出的各線性預測系數otw,,(p)…ccW,M(p)。然后,后部混響預測單元310c將各線性預測系數aw,,(p)...aw,M(p)和模擬白色化后的離散聲響信號值A,(n)...xM,(n)代入多階線性預測才莫型的線性預測項而得到的線性預測值,作為后部混響預測值rw(n)(w=l,...,M)計算并輸出(步驟S222)。接著,對頻域變換單元510d輸入由后部混響預測步驟(步驟S222)計算出的后部混響預測值r!(n)...rM(n)。頻域變換單元510d將輸入的后部混響預測值r!(n)...rM(n)變換為頻域的后部混響預測值R^(f,t)...RM(f,t)(步驟S223)。頻域變換單元510d通過該處理提取并輸出頻域的后部混響預測值R'(f,t)...RM(f,t)的振幅譜l比(f,t)|.,.|RM(f,t)l和相位信息arg[R,(f,t)]...arg[RM(f,t)]。接著,對后部混響除去單元310e輸入頻域的離散聲響信號值的振幅i普|Xr(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR!(f,t)|...|RM(f,t)|。然后,后部混響除去單元310e求頻域的離散聲響信號值的振幅譜IX,,(f,t)|...|XM,(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)|...|RM(f,t)|的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測l直|S!(f,t)|...|SM(f,t)|而輸出(步驟S224)。另外,本步驟所使用的頻域的離散聲響信號值的振幅譜IXr(f,t)|...|XM,(f,t)l由模擬白色化單元510的減法單元513(圖13)傳送。本方式的[標記判定步驟(步驟S225、S226)]與第一實施方式的[標記判定步驟(步驟S5、S6)]相同。[其它步驟]其它步驟與第一實施方式相同。其中,與第一實施方式不同之處僅僅在于在[復譜生成步驟(步驟S7)]中,使用從模擬白色化單元510的減法單元513(圖13)傳送的相位信息arg[Xr(f,t)],..arg[XM,(f,t)]。接著,說明本發明的第七實施方式。第七實施方式是設]^=1,且不需要延遲量計算單元10h和延遲調節單元10i的第一-第六實施方式的變形例。作為該變形例,說明設為M-1,并對第二實施方式應用第四實施方式的模4以白色化方法,并且不存在延遲量計算單元10h和延遲調節單元10i的結構。但是,也可以采用在其它第一-第六實施方式或它們的組合中,設為M二l,并且不存在延遲量計算單元10h和延遲調節單元10i的結構。進而,也可以是雖然存在延遲量計算單元10h和延遲調節單元10i,但在M=1的情況下,不使它們起作用的結構。此外,以下,以與此前說明的實施方式的不同點為中心進行說明,對于與它們相同的部分省略說明。"更件結構>與第一實施方式相同。"更件和程序的協作>本方式的混響除去裝置也通過將M^定程序讀入計算機并執行而構成。圖19是例示本方式的混響除去裝置710的功能結構的方框圖。此外,圖20是例示圖19的模型應用單元800的功能結構的細節的方框圖。另外,在圖19、如圖19中所例示的,混響除去裝置710具有存儲器10a、模型應用單元800、后部混響預測單元310c、頻域變換單元310d、后部混響除去單元310e、復謹生成單元310f、時域變換單元10g、存儲器10j、控制單元10k。此外,模型應用單元800具有模擬白色化單元810和第一線性預測系凄t計算單元200。此外,模擬白色化單元810具有頻域變換單元811、時間平均化單元812、減法單元813、時域變換單元814。<混響除去處理>接著,說明本方式的混響除去處理。圖21是用于說明本方式的混響除去處理的整體的流程圖。此外,圖22A是用于說明圖21的步驟S301(模型應用步驟)的細節的流程圖,圖22B是用于說明圖22A的步驟S331(模擬白色化步驟)的細節的流程圖。以下,使用這些圖說明本方式的混響除去處理。在模型應用步驟中,模型應用單元800使用從存儲器10a讀入的1分析幀的離散聲響信號值"(n),計算式(5)所示的多階線性預測模型的各線性預測系數cx,,,(p)(步驟S301)。以下,分層地說明該處理的細節。如圖22A所例示的,在模型應用步驟中,首先,模擬白色化(Pre-hitening)單元810(圖20)抑制輸入的離散聲響信號值x!(n)所具有的短時間區間中的自相關分量,生成模擬白色化后的離散聲響信號值x,,并輸出(模擬白色化步驟/步驟S311)。即,從各離散時間的上述離散聲響信號值x,(n)中抑制與緊接著該離散時間n之前的短時間區間內的各離散聲響信號值具有自相關性的自相關分量,并生成模擬白色化后的離散聲響信號值xr(n)。接著,上述模擬白色化后的離散聲響信號值xr(n)被輸入到第一線性預測系數計算單元200(圖20)中,第一線性預測系數計算單元20(H吏用該模擬白色化后的離散聲響信號值xr(n)計算式(5)所示的多階線性預測模型的各線性預測系數a,,,(p)并輸出(第一線性預測系數計算步驟/步驟S312)。另外,作為一例,將式(5)中的延遲D例如設為25ms(在抽樣頻率12000Hz的情況下,相當于300輕拍(tap)),將各線性預測系數ocu(p)的數N例如設為5000左右。此外,作為計算各線性預測系數otu(p)的方法,可以例示自相關法(correlationmethod)和十辦方差法(covariancemethod)。jt匕外,也可以使用MATLAB(注冊商標)等來進行該處理。接著,說明模擬白色化步驟(步驟S311)的細節。在本方式中,作為一例,使用倒譜平均值消去(CMS,CepstralMeanSubtraction)來進行離散聲響信號值的模擬白色化。首先,模擬白色化單元810的頻域變換單元811從存儲器10a中讀出聲響信號1分析幀的1信道的離散聲響信號值x,(n)。然后,頻域變換單元811通過短時間傅立葉變換等將離散聲響信號值x,(n)變換為頻域的離散聲響信號值X,(f,t)并輸出(步驟S321)。另外,在通過短時間傅立葉變換進行該處理的情況下,例如使用以下的式(52)。此外,F[]表示短時間傅立葉變換函數,Log[.]表示對數函數。X(f,t)-Log[F[x(n)]]…腳1I接著,頻域的離散聲響信號值Xt(f,t)被讀入到時間平均化單元812,時間平均化單元812按照以下的式(53),求頻域的離散聲響信號值X!(f,t)的時間平均Xr(f),并輸出(步驟S322)。<formula>formulaseeoriginaldocumentpage48</formula>…(53)接著,頻域的離散聲響信號值X,(f,t)及其時間平均E{X,(f,t)}被讀入到減法單元813,減法單元513通過以下的式(54),計算Xr(f,t),并輸出(步驟S323)。<formula>formulaseeoriginaldocumentpage48</formula>.(54)接著,Xf(f,t)被讀入到時域變換單元514,時域變換單元814通過逆傅立葉變換等將它們變換到時域,計算模擬白色化后的離散聲響信號值xr(n),并輸出(步驟S324)。另外,在通過逆傅立葉變換進行該處理的情況下,例如使用以下的式(55)。此外,invF[.]表示逆傅立葉變換函數。<formula>formulaseeoriginaldocumentpage49</formula>另外,在上述短時間傅立葉變換函數F[]和逆傅立葉變換函數invF[.]中使用窗長25ms的窗函數的情況下,可以除去25ms以內的初始反射分量以及短時間相關。此外,在將本方式的例子中,由時域變換單元814生成的模擬白色化后的離散聲響信號值x,,(n)也被傳送到后部混響預測單元310c和頻域變換單元310d(圖19)([模型應用步驟(步驟S301)的細節]的說明結束)。在模型應用步驟(步驟S301)之后,對后部混響預測單元310c輸入由時域變換單元814生成的模擬白色化后的離散聲響信號值xr(n)、由模型應用步驟(步驟S301)計算出的各線性預測系數aw(p)。然后,如上述式(10)這樣,后部混響預測單元310c將各線性預測系^tocu(p)和模擬白色化后的離散聲響信號值xr(n)代入多階線性預測模型的線性預測項而得到的線性預測值,作為后部混響預測值r!(n)計算并輸出(步驟S302)。在本方式中,由于使用式(5)的多階線性預測模型,因此后部混響預測單元310c按照以下的式(56)求后部混響預測值r,(n)并輸出。<formula>formulaseeoriginaldocumentpage49</formula>接著,對頻域變換單元310d輸入由時域變換單元814(圖20)生成的模擬白色化后的離散聲響信號值Xl,(n)、由后部混響預測步驟(步驟S302)計算出的后部混響預測值r,(n)。頻域變換單元310d將輸入的模擬白色化后的離散聲響信號值x,,(n)變換為頻域的離散聲響信號值X,,(f,t),并將后部混響預測值n(n)變換為頻域的后部混響預測值R,(f,t)(步驟S303)。在本方式中,例如使用窗長25ms的漢明窗等有限長的窗函數,通過短時間傅立葉變換(DFT:DiscreteFourierTransform)等進行這些向頻域的變換。頻域變換單元310d通過這些處理提取并輸出頻域的離散聲響信號值X,,(f,t)的振幅譜IXi,(f,t)l和相位信息arg[Xr(f,t)]、以及頻域的后部混響預測值R,(f,t)的振幅譜IRi(f,t)l和相位信息arg[R,(f,t)]。[后部混響除去步驟(步驟S304)]接著,對后部混響除去單元310e輸入頻域的離散聲響信號值的振幅譜|X!,(f,t)l和頻域的后部混響預測值的振幅譜IR4(f,t)I。然后,后部混響除去單元310e求頻域的離散聲響信號值的振幅譜IXr(f,t)l和頻域的后部混響預測值的振幅譜IR,(f,t)l的每個傳感器的相對值,并將該相對值作為后部混響除去信號值的振幅譜預測值IS,(f,t)|而輸出(步驟S304)。該處理的細節與第一實施方式同樣。在步驟S304之后,控制單元10k讀出存儲器10j中存儲的標記5,并判斷該標記5是否是表示僅輸出振幅譜的標記,即是否5=1(步驟S305)。這里,如果5=1,則控制單元10k將在后部混響除去步驟(步驟S304)中由后部混響除去單元310e生成的后部混響除去信號值的振幅譜預測值jS,(f,t)l作為混響除去裝置710的最終的輸出信息輸出(步驟S306),并結束該分析幀的處理。這樣輸出的振幅譜預測值IS,(f,t)i例如被傳送給接著在混響除去裝置710的后級的語音識別系統等應用,并變換為特征量。另一方面,如果5=0,則控制單元10k執行以下的步驟S307以后的處理。在復譜生成步驟中,首先對復譜生成單元310f輸入從后部混響除去單元310e輸出(步驟S304)的后部混響除去信號值的振幅譜預測值IS,(f,t)|,和從頻域變換單元310d輸出(步驟S303)的頻域的離散聲響信號值的相位信息arg[Xr(f,t)]。復譜生成單元310f使用這些信息,按照以下的式(57),計算后部混響除去信號值的復鐠預測值Si(f,t)并輸出(步驟S307)。S(f,t)HS(f,t)lexp(j'arg[X(f,t)])"(57)1.!■1在步驟S307之后,對時域變換單元10g輸入上述后部混響除去信號值的復譜預測值Si(f,t)。然后,時域變換單元10g計算將后部混響除去信號值的復譜預測值S,(f,t)變換到時域后的后部混響除去信號估計值s,(n)并輸出(步驟S308)。另外,對時域的變換例如通過逆傅立葉變換進行。接著,示出用于表示M-1的情況下的本發明的效果的模擬結果。這里,通過對第二實施方式應用第四實施方式的模擬白色化方法的結構進行了模擬。在該模擬中,從連續發聲數據集(dataset)中取出女聲和男性的各自50個發聲,模擬3000輕拍的脈沖響應和巻積混響環境。此外,將式(5)的多階線性預測模—型的階長(延遲)設為25ms,并將線性預測系數ocu(p)的數N設為5000。此外,從時域到頻域的變換使用窗長25ms的短時間傅立葉變換。圖24表示該模擬結果。這里,圖24A、圖24B分別是表示混響除去前的振幅譜值和語音波形的圖。此外,圖24C、圖24D分別是表示本發明(M=1)的混響除去后的振幅譜值和語音波形的圖。另外,圖24A、圖24C的縱軸表示振幅譜值,橫軸表示時間(s)。此外,圖24B、圖24D的縱軸表示頻率(Hz),橫軸表示時間(s)。從這些圖也可知通過本發明高精度地抑制后部混響。接著,表示從語音識別的觀點來評價本發明的效果的模擬結果。在該模擬中,使用了用純凈(clean)聲音構筑的聲響模型。表1表示各個識別對象的單詞差錯率。混響語音、混響除去語音的單詞差錯率分別表示為"Rev.""Derev."。盡管聲響模型是從純凈語音學習的,但可知通過本發明大幅地改善了識別率。<table>tableseeoriginaldocumentpage51</column></row><table>[實—驗結果]接著,示出用于表示本發明的效果的實驗結果。該實驗關于不進行后部混響除去的情況(無處理)、設為M=1并對第二實施方式應用了第四實施方式的模擬白色化方法的方法(第七實施方式)、第一實施方式(M>2)中不進行延遲調節而使用了由一個信道(m=1)得到的后部混響除去信號估計值的情況(第一實施方式(無延遲調節))、以及第一實施方式(M>2)中進行延遲調節并進行了后部混響除去的情況下(第一實施方式(有延遲調節)),測定了各個語音識別率。圖25A是表示該實驗條件的圖。在該實驗中,假設了在縱3.5m、橫4.5m、高2.5m的室內,將四個麥克風1010(M=4)配置成一列,乂人111=1的麥克風1010(實線)按0.5m、1.0m、1.5m、2.0m的距離將四個揚聲器1020配置在一條直線上的情況。此外,從連續發生數據集中取出女性和男性的各自IOO個發聲,對其與模擬了的3000輕拍的脈沖響應進行巻積,從而生成后部混響語音。此外,在語音識別時,作為聲響模型自適應處理,使用了倒譜平均值消去(CMS,CepstralMeanSubtraction)(B.S.Atal,"Effectivenessoflinearpredictioncharacteristicsofthespeechwaveforautomaticspeakeridentificationandverification,"JournaloftheAcousticalSocietyofAmerica,Vol.55(6),pp.1304-1312,Jun1974.)。另外,在設為M-1,并對第二實施方式應用了第四實施方式的模擬白色化方法的方法(第七實施方式)中,使用了m=1的麥克風1010。圖25B是表示有關上述四個情況[無處理、第七實施方式、第一實施方式(無延遲調節)、第一實施方式(有延遲調節)]的語音識別結果(單詞差錯率)的曲線圖。另夕卜,在圖25B中,以麥克風1010(m=1)和各揚聲器1020的距離(m)作為橫軸,并以單詞差錯率(%)作為縱軸。如圖25B所例示的,在麥克風1010(m=1)和各揚聲器1020的距離比4交近的情況下,對于第七實施方式(M=1)的第一實施方式(M>2)(無延遲調節)以及第一實施方式(M>2)(有延遲調節)的單詞差錯率的改善量不大。但是,隨著麥克風1010(m=l)和各揚聲器1020的距離增加,傳遞函數中的最大相位分量(0點)增加,因此對于第七實施方式(M=l)的第一實施方式(M>2)(無延遲調節)的單詞差錯率的改善量變得顯著。進而,在第一實施方式(M>2)(有延遲調節)的情況下,可以進一步改善單詞差錯率。另外,本發明不限于上述各實施方式。例如,在各實施方式中,后部混響除去單元通過短時間傅立葉變換等將各數據變換到頻域而執行了各處理。但是,如果作為混響除去裝置的輸出而被請求的信號僅是直接聲音的振幅譜,則后部混響除去單元也可以將各數據進行z變換,并在z區域執行各處理。此外,在各實施方式中,在通過模擬白色化單元從離散聲響信號值中除去短時間相關之后,執行了各處理。但是,也可以使用未除去短時間相關的離散聲響信號值執行各處理。此外,上述各種處理不僅根據記載按照時間序列被執行,也可以根據執行處理的裝置的處理能力或需要來并行或單獨地執行。此外,也可以是將2個以上的實施方式結合的方式。此外,在不脫離本發明的主旨的范圍內當然能夠適當變更。此外,在通過計算機實現上述結構的情況下,各裝置應具有的功能的處理內容由程序所記述。而且,通過由計算機執行該程序從而在計算才幾上實現上述處理功能。記述了該處理內容的程序可以記錄在計算機可讀取的記錄介質中。作為計算機可讀取的記錄介質,例如,可以是磁記錄裝置、光盤、光磁記錄介質、半導體存儲器等任何裝置,具體來說,例如,作為磁記錄裝置可以使用硬盤裝置、軟盤、磁盤等,作為光盤可以使用DVD(DigitalVersatileDisc)、DVD-RAM(RandomAccessMemory)、CD-ROM(CompactDiscReadOnlyMemory)、CD-R(Recordable)/RW(Rewritable)等,作為光》茲記錄介質,可以使用MO(Magneto-Opticaldisc)等,作為半導體存儲器可以使用EEP-ROM(ElectronicallyErasableandProgrammable-ReadOnlyMemory)等。此外,該程序的流通例如通過販賣、轉讓、出借記錄了該程序的DVD、CD-ROM等可移動記錄介質來進行。進而也可以采用將該程序預先存儲在服務器計算機的存儲裝置中,經由網絡從服務器計算機將該程序傳送給其它的計算機,從而使該程序流通的結構。執行這樣的程序的計算機例如首先將記錄在可移動型記錄介質中的程序或從服務器計算機傳送的程序臨時存儲在自己的存儲裝置中。然后,在執行處理時,該計算機讀取自己的記錄介質中存儲的程序,并執行按照讀取的程序的處理。此外,作為該程序的其它實施方式,也可以由計算枳J人可移動記錄介質中直接讀出程序,并執行按照該程序的處理,而且也可以在每次從服務器計算機對該計算機傳送程序時,依次執行按照接收到的程序的處理。此外,也可以采用從服務器計算機不進行對該計算機的程序傳送,僅通過該執行指示和結果取得實現處理功能的所謂ASP(ApplicationServiceProvider)型的服務執行上述處理的結構。另外,在本方式中的程序中,假設包含供電子計算機的處理使用的符合程序的信息(雖不是對于計算機的直接指令但具有規定計算機的處理的性質的數據等)。此外,在該方式中,通過在計算機上執行規定的程序,從而構成本裝置,但也可以將這些處理內容的至少一部分由硬件實現。產業上的可利用性通過將本發明用作各種聲響信號處理系統的要素技術,從而能夠提高該系統整體的性能。作為可應用本發明的聲響信號處理系統,例如可舉出以下的系統。由環境所收錄的語音中始終含有混響(反射音),但以下所舉出的系統是假定在這樣的狀況下使用的例子。混響環境中的語音識別系統-將歌唱、樂器演奏、揚聲器演奏的樂曲的混響除去后預先存儲在存卡者器中,并對這些樂曲進行#:索或記譜的音樂信息處理系統對人發出的聲音進行反應而對機械傳送命令的機械控制接口以及機械和人的對話裝置-通過在混響環境下除去混響從而提高收聽容易度的助聽器-通過混響除去從而提高語音的明確度的電視會議系統等通信系統權利要求1.一種混響除去裝置,從伴隨后部混響的聲響信號中除去后部混響,其具有:存儲器,存儲離散聲響信號值,所述離散聲響信號值通過將由M(M≥1)個傳感器分別觀測的M個信道m(m=1,...,M)的上述聲響信號分別在多個時刻進行采樣而得到;模型應用單元,使用多個上述離散聲響信號值來計算信道w的多階線性預測模型的各線性預測系數,所述信道w的多階線性預測模型,是通過將長時間區間中的M個信道m的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在該長時間區間的規定時間后的離散時間n的信道w(w=1,...,M)的離散聲響信號值的線性預測模型;以及后部混響預測單元,將線性預測值作為在離散時間n的信道w的后部混響預測值而輸出,所述線性預測值通過將上述信道w的多階線性預測模型的各線性預測系數和多個上述離散聲響信號值代入上述信道w的多階線性預測模型的上述線性預測項而得到。2.如權利要求1所述的混響除去裝置,其中,上述模型應用單元具有模擬白色化單元,從各離散時間的上述離散聲響信號值中,抑制與緊接著該離散時間之前的短時間區間內的各離散聲響信號值具有自相關性的自相關分量,并生成模擬白色化后的離散聲響信號值;以及第一線性預測系數計算單元,使用上述模擬白色化后的離散聲響信號值,計算上述多階線性預測模型的各線性預測系數,上述短時間區間比上述長時間區間短。3.如權利要求2所述的混響除去裝置,其中,上述模擬白色化單元具有第二線性預測系數計算單元,使用上述離散聲響信號值來計算信道m的短時間線性預測模型的各線性預測系數,所述信道m的短時間線性預測模型,是通過將上述短時間區間中的信道m的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在緊接著上述短時間區間之后的離散時間n的該信道m的離散聲響信號值的線性預測模型;以及逆濾波處理單元,在通過將由上述第二線性預測系數計算單元計算出的上述各線性預測系數代入信道m的上述短時間線性預測模型而得到的逆濾波器中,代入該信道m的上述離散聲響信號值,并將由此得到的該短時間線性預測模型的上述預測誤差項的值作為該信道m的上述模擬白色化后的離散聲響信號值輸出。4.如權利要求3所述的混響除去裝置,其中,M>2,上述第二線性預測系數計算單元具有自相關系數計算單元,對每個信道計算上述離散聲響信號值的自相關系數;自相關系數平均化單元,計算將對每個信道求出的上述自相關系數在信道之間平均化后的平均自相關系數;以及方程式運算單元,使用上述平均自相關系數,計算上述短時間線性預測模型的各線性預測系數。5.如權利要求3所述的混響除去裝置,其中,M>2,上述第二線性預測系數計算單元具有自相關系數計算單元,計算離散聲響信號值的自相關系數,所述離散聲響信號值通過將由上述M個傳感器中最接近聲響信號的聲源的一個傳感器所觀測到的聲響信號,在多個時刻進行采樣而得到;以及方程式運算單元,使用上述自相關系數,計算上述短時間線性預測模型的各線性預測系數。6.如權利要求1所述的混響除去裝置,具有頻域變換單元,將各信道的上述離散聲響信號值變換為頻域的離散聲響信號值,并將各信道的上述后部混響預測值變換為頻域的后部混響預測值;以及后部混響除去單元,對每個信道求上述頻域的離散聲響信號值的振幅譜和上述頻域的后部混響預測值的振幅譜的相對值,并將該相對值作為各信道的后部混響除去信號值的振幅語預測值而輸出。7.如權利要求6所述的混響除去裝置,其中,上述后部混響預測單元計算線性預測值作為在離散時間n的信道w的后部混響預測值,所述線性預測值通過將由上述模型應用單元計算出的上述各線性預測系數和多個模擬白色化后的上述離散聲響信號值代入上述線性預測項而得到,上述頻域變換單元將模擬白色化后的各信道的上述離散聲響信號值變換為頻域的離散聲響信號值。8.如權利要求6所述的混響除去裝置,還具有復譜生成單元,使用信道w的上述后部混響除去信號值的振幅語預測值,和信道w的上述頻域的離散聲響信號值的相位信息,計算信道w的后部混響除去信號值的復語預測值;以及時域變換單元,計算將信道w的上述后部混響除去信號值的復譜預測值變換為時域后的信道w的后部混響除去信號估計值。9.如權利要求8所述的混響除去裝置,其中,M>2,上述模型應用單元對多個信道分別計算上述各線性預測系數,上述后部混響預測單元對多個信道分別計算上述后部混響預測值,上述后部混響除去單元對多個信道分別計算上述后部混響除去信號值的振幅i普子貞測4直,上述復譜生成單元對多個信道分別計算上述后部混響除去信號值的復語預測值,上述時域變換單元對多個信道分別計算上述后部混響除去信號估計值,該混響除去裝置具有延遲量計算單元,決定在將各信道的上述后部混響除去信號估計值分別以某一延遲量延遲后的情況下,延遲后的各信道的上述后部混響除去信號估計值的信道間互相關為極大的各信道的該延遲量。10.如權利要求9所述的混響除去裝置,具有延遲單元,將各信道的上述后部混響除去信號估計值延遲對各個信道計算出的上述延遲量;以及延遲校正單元,計算由上述延遲單元延遲后的上述后部混響除去信號估計值之和,作為校正混響除去信號值。11.如權利要求1所述的混響除去裝置,其中,M>2。12.如權利要求1所述的混響除去裝置,其中,上述多階線性預測模型是,將xw(n)設為與信道w(w=1,…,M)對應的離散時間n的離散聲響信號值,將Xm(n)設為與信道m(m=1,…,M)對應的離散時間n的離散聲響信號值,將ew(n)設為與信道w以及離散時間n對應的預測誤差,將N設為正整數,將[.]設為高斯記號,將cxw,m(p)設為與xw,(n)對應的線性預測項的信道m所對應的第p個線性預測系數,并且將D設為表示階長的常數的情況下的「算式241<formula>formulaseeoriginaldocumentpage5</formula>13.—種混響除去方法,從伴隨后部混響的聲響信號中除去后部混響,其具有離散聲響信號存儲步驟,在存儲器中存儲離散聲響信號值,所述離散聲響信號值通過將由M(M>1)個傳感器分別觀測的M個信道m(m=1,...,M)的上述聲響信號分別在多個時刻進行采樣而得到;模型應用步驟,使用多個上述離散聲響信號值來計算信道w的多階線性預測模型的各線性預測系數,所述信道w的多階線性預測模型,是通過將長時間區間中的M個信道m的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在該長時間區間的規定時間后的離散時間n的信道w的離散聲響信號值的線性預測模型;以及后部混響預測步驟,將線性預測值作為在離散時間n的信道w的后部混響預測值而輸出,所述線性預測值通過將上述信道w的多階線性預測模型的各線性預測系數和多個上述離散聲響信號值代入上述信道w的多階線性預測模型的上述線性預測項而得到。14.如權利要求13所述的混響除去方法,其中,上述模型應用步驟具有模擬白色化步驟,從各離散時間的上述離散聲響信號值中,抑制與緊接著該離散時間之前的短時間區間內的各離散聲響信號值具有自相關性的自相關分量,并生成模擬白色化后的離散聲響信號值;以及第一線性預測系數計算步驟,使用上述模擬白色化后的離散聲響信號值,計算上述多階線性預測模型的各線性預測系數,上述短時間區間比上述長時間區間短。15.如權利要求14所述的混響除去方法,其中,上述模擬白色化步驟具有第二線性預測系數計算步驟,使用上述離散聲響信號值來計算信道m的短時間線性預測模型的各線性預測系數,所述信道m的短時間線性預測模型,是通過將上述短時間區間中的信道m的各離散聲響信號值進行線性結合所得的線性預測項和預測誤差項之和,表現在緊接著上述短時間區間之后的離散時間n的該信道m的離散聲響信號值的線性預測模型;以及逆濾波處理步驟,在通過將由上述第二線性預測系數計算步驟計算出的上述各線性預測系數代入信道m的上述短時間線性預測模型而得到的逆濾波器中,代入該信道m的上述離散聲響信號值,并將由此得到的該短時間線性預測模型的上述預測誤差項的值作為該信道m的上述模擬白色化后的離散聲響信號值輸出。16.如權利要求15所述的混響除去方法,其中,M>2,上述第二線性預測系數計算步驟具有自相關系數計算步驟,對每個信道計算上述離散聲響信號值的自相關系數;自相關系數平均化步驟,計算將對每個信道求出的上述自相關系數在信道之間平均化后的平均自相關系數;以及方程式運算步驟,使用上述平均自相關系數,計算上述短時間線性預測模型的各線性預測系數。17.如權利要求15所述的混響除去方法,其中,M>2,上述第二線性預測系數計算步驟具有自相關系數計算步驟,計算離散聲響信號值的自相關系數,所述離散聲響信號值通過將由上述M個傳感器中最接近聲響信號的聲源的一個傳感器所觀測到的聲響信號,在多個時刻進行采樣而得到;以及方程式運算步驟,使用上述自相關系數,計算上述短時間線性預測模型的各線性預測系數。18.如權利要求13所述的混響除去方法,具有頻域變換步驟,將各信道的上述離散聲響信號值變換為頻域的離散聲響信號值,并將各信道的上述后部混響預測值變換為頻域的后部混響預測值;以及后部混響除去步驟,對每個信道求上述頻域的離散聲響信號值的振幅譜和上述頻域的后部混響預測值的振幅譜的相對值,并將該相對值作為各信道的后部混響除去信號值的振幅鐠預測值而輸出。19.如權利要求18所述的混響除去方法,其中,上述后部混響預測步驟是計算線性預測值作為在離散時間n的信道w的后部混響預測值的步驟,所述線性預測值通過將由上述模型應用步驟計算出的上述各線性預測系數和多個模擬白色化后的上述離散聲響信號值代入上述線性預測項而得到,上述頻域變換步驟中,將模擬白色化后的各信道的上述離散聲響信號值變換為頻域的離散聲響信號值。20.如權利要求18所述的混響除去方法,還具有復鐠生成步驟,使用信道w的上述后部混響除去信號值的振幅譜預測值,和信道w的上述頻域的離散聲響信號值的相位信息,計算信道w的后部混響除去信號值的復譜預測值;以及時域變換步驟,計算將信道w的上述后部混響除去信號值的復譜預測值變換為時域后的信道w的后部混響除去信號估計值。21.如權利要求20所述的混響除去方法,其中,M>2,上述模型應用步驟是對多個信道分別計算上述各線性預測系數的步驟,上迷后部混響預測步驟是對多個信道分別計算上述后部混響預測值的步驟,上述后部混響除去步驟是對多個信道分別計算上述后部混響除去信號值的振幅譜預測值的步驟,上述復譜生成步驟是對多個信道分別計算上述后部混響除去信號值的復鐠預測值的步驟,上述時域變換步驟是對多個信道分別計算上述后部混響除去信號估計值的步驟,該混響除去方法具有延遲量計算步驟,決定在將各信道的上述后部混響除去信號估計值分別以某一延遲量延遲后的情況下,延遲后的各信道的上述后部混響除去信號估計值的信道間互相關為極大的各信道的該延遲量。22.如權利要求21所述的混響除去方法,具有延遲步驟,將各信道的上述后部混響除去信號估計值延遲對各個信道計算出的上述延遲量;以及延遲校正步驟,計算由上述延遲步驟延遲后的上述后部混響除去信號估計值之和,作為校正混響除去信號值。23.如權利要求13所述的混響除去方法,其中,M>2。24.如權利要求13所述的混響除去方法,其中,上述多階線性預測模型是,將Xw(n)設為與信道w(w=l,...,M)對應的離散時間n的離散聲響信號值,將Xm(n)設為與信道m(m=l,…,M)對應的離散時間n的離散聲響信號值,將(n)設為與信道w以及離散時間n對應的預測誤差,將N設為正整數,將[]設為高斯記號,將ocw,m(p)設為與xw,(n)對應的線性預測項的信道m所對應的第p個線性預測系數,并且將D設為表示階長的常數的情況下的「算式251<formula>formulaseeoriginaldocumentpage8</formula>m=lp=l25.—種混響除去程序,使計算機執行權利要求13所述的混響除去方法的各步驟。26.—種計算機可讀取的記錄介質,存儲了權利要求25所述的混響除去程序。全文摘要模型應用單元(10b)使用離散聲響信號計算多階線性預測模型的各線性預測系數。接著,后部混響預測單元(10c)將各線性預測系數和離散聲響信號代入多階線性預測模型的線性預測項而得到的線性預測值作為后部混響預測值來計算。接著,頻域變換單元(10d)將離散聲響信號變換為頻域的離散聲響信號,并將后部混響預測值變換為頻域的后部混響預測值。然后,后部混響除去單元(10e)求頻域的離散聲響信號的振幅譜和頻域的后部混響預測值的振幅譜的相對值,并將該相對值作為后部混響除去信號的振幅譜預測值。文檔編號H04R3/00GK101385386SQ20078000603公開日2009年3月11日申請日期2007年3月5日優先權日2006年3月3日發明者三好正人,中谷智廣,木下慶介申請人:日本電信電話株式會社