直達聲提取裝置和混響聲提取裝置制造方法
【專利摘要】一種直達聲提取裝置,其配置有:譜轉換單元,用于將傅立葉變換后的直達聲中包含混響聲的輸入信號轉換成第一振幅譜信號(Lfa);低通濾波器單元(10),用于通過針對各頻率對所述第一振幅譜信號(Lfa)進行低通濾波處理來生成第二振幅譜信號(Lfa1);第一減法單元(18),用于通過從所述第一振幅譜信號(Lfa)中減去所述第二振幅譜信號(Lfa1)來計算第三振幅譜信號;以及逆傅立葉變換單元,用于根據基于相位譜信號和所述第三振幅譜信號所計算出的頻率譜信號來生成直達聲信號(Lfd)。
【專利說明】直達聲提取裝置和混響聲提取裝置
【技術領域】
[0001]本發明涉及一種直達聲提取裝置和混響聲提取裝置,尤其涉及可以從包含混響聲的輸入信號提取直達聲的直達聲提取裝置、以及可以從該輸入信號提取混響聲的混響聲提取裝置。
【背景技術】
[0002]在諸如禮堂等的容易出現混響聲的環境內播放音樂和進行演講等并且進行記錄的情況下,所記錄的聲學信號通常不僅包含直達聲而且還包含在該記錄期間卷積得到的混響聲。因此,在其它聲學環境下播放卷積有混響聲的聲學信號的情況下,直達聲的清晰度下降,這有可能造成在播放聲學信號時很難收聽。
[0003]在使用卷積有混響聲的演講聲音來進行語音識別等的情況下,問題在于演講聲音(內容)的識別率將由于因混響聲所引起的清晰度的下降而下降。
[0004]關于如上所述的卷積有混響聲的聲學信號,已知有用于降低混響聲的傳統技術(例如,參見專利文獻I)。使用該技術使得能夠通過降低混響聲來使直達聲清晰。
_5] 現有技術文獻_6] 專利文獻
[0007]專利文獻1:日本特開2010-74531
【發明內容】
[0008]發明要解決的問題
[0009]然而,根據專利文獻I所述的方法,為了降低輸入信號中所包含的混響聲,需要執行諸如偽白化處理、多步驟線性預測處理和后端混響預測處理等的各種信號處理。因此,需要大量處理負荷。因而,為了實際降低混響聲,需要諸如微處理器或數字信號處理器等的高性能裝置。就成本和其它因素而言,問題在于無法毫不改變地容易地使用專利文獻I的方法。
[0010]本發明是考慮到上述問題而作出的。本發明的目的是提供一種可以從包含混響聲的聲學信號中容易地提取直達聲或混響聲的直達聲提取裝置和混響聲提取裝置。
[0011]用于解決問題的方案
[0012]根據本發明,一種直達聲提取裝置,包括:傅立葉變換單元,用于對直達聲中包含混響聲的輸入信號進行傅立葉變換處理;譜變換單元,用于基于由所述傅立葉變換單元進行了傅立葉變換處理的所述輸入信號的具有實數和虛數的頻率譜,將所述輸入信號變換成第一振幅譜信號和相位譜信號;低通濾波器單元,用于通過使用預設的標準化截止頻率來針對各頻率對所述第一振幅譜信號進行低通濾波處理;第一限幅器單元,用于對由所述低通濾波器單元進行了低通濾波處理的第二振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;第一減法單元,用于通過從所述第一振幅譜信號中減去由所述第一限幅器單元對負側振幅進行了限制的所述第二振幅譜信號來計算第三振幅譜信號;第二限幅器單元,用于對由所述第一減法單元計算出的所述第三振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;逆譜變換單元,用于基于所述相位譜信號和由所述第二限幅器單元對負側振幅進行了限制的所述第三振幅譜信號,計算由具有實數和虛數的頻率譜構成的信號;以及逆傅立葉變換單元,用于對由所述逆譜變換單元計算出的信號進行逆傅立葉變換處理,以生成通過從所述輸入信號提取所述直達聲所獲得的直達聲信號。
[0013]本發明的直達聲提取裝置對直達聲中包含混響聲的輸入信號進行傅立葉變換,并且使用預設的標準化截止頻率對譜變換單元所計算出的第一振幅譜信號進行低通濾波處理。這樣,該直達聲提取裝置計算出針對各譜積分得到的信號(積分信號:第二振幅譜信號)。如此積分得到的信號等同于構成輸入信號的時間變化中的穩態成分的譜信號、即混響聲信號。
[0014]因此,第一減法單元通過從第一振幅譜信號中減去第二振幅譜信號所計算出的第三振幅譜信號是通過從輸入信號中減去混響聲所獲得的信號。該處理使得可以計算出等同于直達聲信號的信號。
[0015]因此,逆譜變換單元和逆傅立葉變換單元所生成的信號是通過從輸入信號提取直達聲所獲得的信號。結果,從直達聲中包含混響聲的輸入信號可以容易地提取出直達聲。
[0016]此外,通過調節標準化截止頻率,可以調節輸入信號中所包含的直達聲的提取時間。隨著標準化截止頻率的值變得越小,輸入信號中所包含的直達聲的提取時間變得越長,這使得能夠以不僅包含非穩態聲而且還包含穩態聲的方式進行直達聲的提取。由于以包含穩態聲的方式提取直達聲,因此與完全不包含穩態聲的直達聲相比,可以向該直達聲添加諸如音色和易聽性等的性質。在收聽者收聽該直達聲的情況下,該收聽者可以將該直達聲識別為無不適感的聲音。
[0017]發明的效果
[0018]本發明的直達聲提取裝置可以從直達聲中包含混響聲的輸入信號容易地提取直達聲。本發明的混響聲提取裝置可以從直達聲中包含混響聲的輸入信號容易地提取混響聲。
【專利附圖】
【附圖說明】
[0019]圖1是示出根據本發明實施例的聲學處理裝置的示意結構作為一個示例的框圖。
[0020]圖2是示意性示出在根據本發明實施例的FFT單元中對輸入信號進行短時間傅立葉變換處理的情況下的傅立葉變換長度和重疊長度的圖。
[0021]圖3是示出根據本發明實施例的頻譜域濾波單元的示意結構作為一個示例的框圖。
[0022]圖4(a)示出根據本發明實施的LPF單元中的針對各振幅譜的濾波器系數的一個示例;并且(b)示出HPF單元中的針對各振幅譜的濾波器系數的一個示例。
[0023]圖5(a)是示出根據本發明實施例的第一增益單元的放大和衰減的加權量的頻率變化的一個示例的圖;并且(b)是示出根據本發明實施例的第二增益單元的放大和衰減的加權量的頻率變化的一個示例的圖。
[0024]圖6是示出根據本發明實施例的輸入至頻譜域濾波單元的輸入信號的振幅、積分信號Lfal的振幅、微分信號Lfa2的振幅、直達聲信號Lfd的振幅和混響聲信號Lfr的振幅的時間變化作為示例的第一圖。
[0025]圖7是示出根據本發明實施例的輸入至頻譜域濾波單元的輸入信號的振幅、積分信號Lfal的振幅、微分信號Lfa2的振幅、直達聲信號Lfd的振幅和混響聲信號Lfr的振幅的時間變化作為示例的第二圖。
[0026]圖8是示出根據本發明實施例的輸入至頻譜域濾波單元的輸入信號的振幅、積分信號Lfal的振幅、微分信號Lfa2的振幅、直達聲信號Lfd的振幅和混響聲信號Lfr的振幅的時間變化作為示例的第三圖。
[0027]圖9是示出根據本發明實施例的輸入至頻譜域濾波單元的輸入信號的振幅、積分信號Lfal的振幅、微分信號Lfa2的振幅、直達聲信號Lfd的振幅和混響聲信號Lfr的振幅的時間變化作為示例的第四圖。
[0028]圖10是示出根據本發明實施例的聲學處理裝置中的輸入信號的振幅以及在該聲學處理裝置中提取出的直達聲信號的振幅和混響聲信號的振幅的時間變化作為示例的第一圖。
[0029]圖11是示出根據本發明實施例的聲學處理裝置中的輸入信號的振幅以及在該聲學處理裝置中提取出的直達聲信號的振幅和混響聲信號的振幅的時間變化作為示例的第二圖。
[0030]圖12是示出根據本發明實施例的聲學處理裝置中的輸入信號的振幅以及在該聲學處理裝置中提取出的直達聲信號的振幅和混響聲信號的振幅的時間變化作為示例的第三圖。
[0031]圖13是示出根據本發明實施例的聲學處理裝置中的輸入信號的振幅以及在該聲學處理裝置中提取出的直達聲信號的振幅和混響聲信號的振幅的時間變化作為示例的第四圖。
[0032]圖14是示出根據本發明實施例的聲學處理裝置中的輸入信號的振幅以及在該聲學處理裝置中提取出的直達聲信號的振幅和混響聲信號的振幅的時間變化作為示例的第五圖。
[0033]圖15(a)是示意性示出圖14所示的直達聲信號的波形根據標準化截止頻率的值的調節狀態而改變的情形以及輸入信號的圖;并且(b)是示意性示出圖14所示的混響聲信號的波形根據標準化截止頻率的值的調節狀態而改變的情形以及輸入信號的圖。
【具體實施方式】
[0034]以下示出作為根據本發明的直達聲提取裝置和混響聲提取裝置的示例的聲學處理裝置。將參考附圖來詳細說明該聲學處理裝置。
[0035]順便提及,在諸如語音或樂器聲等的直達聲中卷積有混響聲的情況下,在頻率譜內向諸如語音和樂器聲等的非穩態信號添加與混響時間相對應的穩態信號。本實施例的聲學處理裝置從輸入信號提取或分離非穩態信號以提取直達聲;并且從輸入信號提取或分離穩態信號以提取混響聲。
[0036]圖1是示出聲學處理裝置的示意結構的框圖。如圖1所示,聲學處理裝置I包括FFT單元(傅立葉變換單元和頻譜變換單元)3、頻譜域濾波單元4和IFFT單元(逆傅立葉變換單元和逆譜變換單元)5a和5b。[0037]從圖中未示出的聲源單元將兩通道(L通道和R通道)的輸入信號L和R輸入至FFT單元3 ;在兩通道的輸入信號L和R中,在直達聲(例如,諸如演講等的語音)中卷積有(或包含有)混響聲(例如,演講中的反射聲)。FFT單元3被設計成使用窗函數對卷積有混響聲的兩通道的輸入信號L和R各自進行加權。
[0038]在使用了窗函數進行加權之后,FFT單元3對輸入信號L和R各自進行短時間傅立葉變換處理,由此將輸入信號L和R從時域變換成頻域并且計算具有實數和虛數的頻率譜。圖2是示意性示出在FFT單元3中對輸入信號L (或輸入信號R)進行短時間傅立葉變換處理的情況下的傅立葉變換長度和重疊長度的圖。在這種情況下,由于FFT單元3對輸入信號進行傅立葉變換處理,因此FFT單元3用作本發明的傅立葉變換單元。
[0039]此外,FFT單元3將通過頻域轉換所計算出的兩通道的頻率譜變換成振幅譜信號Lfa和Rfa (第一振幅譜信號)和相位譜信號Lfp和Rfp。然后,FFT單元3將變換后的兩通道的振幅譜信號Lfa和Rfa輸出至頻譜域濾波單元4。此外,FFT單元3將兩通道的相位譜信號Lfp和Rfp輸出至IFFT單元5a和IFFT單元5b。在這種情況下,FFT單元3將輸入信號變換成振幅譜信號Lfa和Rfa和相位譜信號Lfp和Rfp。因此,FFT單元3用作本發明的譜變換單元。
[0040]圖3是示出頻譜域濾波單元4的示意結構的框圖。頻譜域濾波單元4被設計成通過針對各譜執行簡單濾波處理來提取非穩態信號和穩態信號。順便提及,在頻譜域濾波單元4所進行的處理中,僅對振幅譜信號Lfa和Rfa進行濾波處理,并且不對相位譜信號Lfp和Rfp進行濾波處理。
[0041]如圖3所示,頻譜域濾波單元4包括LPF單元(低通濾波器單元)10、HPF單元(高通濾波器單元)11、第一限幅器單元12、第二限幅器單元13、第三限幅器單元14、第四限幅器單元15、第一增益單元16、第二增益單元17、第一減法單元18和第二減法單元19。圖3僅示出被設計成對振幅譜信號Lfa進行處理的功能單元(LPF單元10、HPF單元11、限幅器單元12?15、增益單元16和17、以及減法單元18和19)。圖3沒有示出被設計成對振幅譜信號Rfa進行處理的功能單元。然而,設置有相同的功能單元以對振幅譜信號Rfa進行處理,并且執行相同的濾波處理。
[0042]LPF單元10被設計成基于預定的標準化截止頻率來對從FFT單元3輸入的振幅譜信號Lfa進行針對各譜(各頻率)的低通濾波處理。第一限幅器單元12被設計成對由LPF單元10進行了低通濾波處理的振幅譜信號(第二振幅譜信號)的負側振幅進行限制,由此使該振幅為零。第一增益單元16被設計成使負側振幅受到限制的振幅譜信號的振幅放大或衰減。這樣,在LPF單元10中,對振幅譜信號Lfa執行了低通濾波處理。結果,生成了針對各譜進行了積分的信號(積分信號:第二振幅譜信號)Lfal。
[0043]第一減法單元18在從FFT單元3輸入的振幅譜信號Lfa中減去從第一增益單元16輸入的積分信號Lfal,由此計算隨著時間而改變的非穩態譜信號(第三振幅譜信號)。然后,第二限幅器單元13對第一減法單元18所計算出的譜信號(第三振幅譜信號)的負側振幅進行限制,由此使該振幅為零。將由第二限幅器單元13對振幅進行了限制的信號作為直達聲信號Lfd輸出至IFFT單元5a。
[0044]HPF單元11被設計成基于預定的標準化截止頻率來對從FFT單元3輸入的振幅譜信號Lfa進行針對各譜(各頻率)的高通濾波處理。第三限幅器單元14被設計成對由HPF單元11進行了高通濾波處理的振幅譜信號(第四振幅譜信號)的負側振幅進行限制,由此使該振幅為零。第二增益單元17被設計成使負側振幅受到限制的振幅譜信號的振幅放大或衰減。這樣,在HPF單元11中,對振幅譜信號Lfa執行了高通濾波處理。結果,生成了針對各譜進行了微分的信號(微分信號:第四振幅譜信號)Lfa2。
[0045]第二減法單元19在從FFT單元3輸入的振幅譜信號Lfa中減去從第二增益單元17輸入的微分信號Lfa2,由此計算隨著時間而略微改變的穩態譜信號(第五振幅譜信號)。然后,第四限幅器單元15對第二減法單元19所計算出的譜信號(第五振幅譜信號)的負側振幅進行限制,由此使該振幅為零。將由第四限幅器單元15對振幅進行了限制的信號作為混響聲信號Lfr輸出至IFFT單元5b。
[0046]順便提及,LPF單元10中的各振幅譜的低通濾波器的標準化截止頻率和HPF單元11中的各振幅譜的高通濾波器的標準化截止頻率是用于調節直達聲和混響聲的分割時間的標準化截止頻率(或者用于調節直達聲的提取時間并且調節混響聲的提取時間的標準化截止頻率)。此外,在第一增益單元16和第二增益單元17中,通過改變放大和衰減的加權量,調節直達聲和混響聲的混合比率(或者調節直達聲中所包含的混響聲的百分比、以及調節混響聲中所包含的直達聲的百分比)成為可能。
[0047]圖4(a)示出根據本實施例的LPF單元10中的針對各振幅譜的濾波器系數的一個示例。圖4(b)示出根據本實施例的HPF單元11中的針對各振幅譜的濾波器系數的一個例。圖4(a)和4(b)所的LPF單兀10和HPF單兀11是一階Butterworth(巴特沃茲)濾波器。如圖4所示,LPF單元10和HPF單元11的標準化截止頻率改變為0.000001、
O.000002,0. 000004……和0.0655。隨著截止頻率的值變得越小,直達聲的提取時間和混響聲的提取時間變得越長。順便提及,在本實施例的頻譜域濾波單元4中,LPF單元10和HPF單元11的截止頻率被設置成在振幅譜內相同。然而,LPF單元10和HPF單元11的截止頻率可以針對各振幅譜獨立地設置。
[0048]圖5 (a)是示出根據本實施例的第一增益單元16的放大和衰減的加權量的頻率變化的一個示例的圖。圖5(b)是示出第二增益單元17的放大和衰減的加權量的頻率變化的一個示例的圖。如圖5(a)和5(b)所示,在本實施例的第一增益單元16和第二增益單元17中,隨著增益(信號電平)變得越小,混合量變得越大。此外,如圖5(a)和5(b)所示,在直達聲側的第一增益單元16中,在500Hz以下的振幅譜處,很難執行直達聲和混響聲的分離。
[0049]圖6~9示出頻譜域濾波單元4的各部件的操作的示例,并且是示出作為示例的輸入至頻譜域濾波單元4的輸入信號(振幅譜信號Lfa)的振幅、積分信號Lfal的振幅、微分信號Lfa2的振幅、直達聲信號Lfd的振幅和混響聲信號Lfr的振幅的時間變化的圖。圖6~9所示的波形全部是觀察IkHz附近的振幅譜的時間變化的結果。
[0050]順便提及,在圖6~9所示的操作的示例中,輸入信號的采樣率為44. IkHz,FFT單元3的傅立葉變換長度為4096個采樣,重疊長度為作為傅立葉變換長度的15/16的3840個采樣,并且傅立葉變換的窗函數是Blackman (布萊克曼)。圖6~8所示的輸入信號是再現時間為I秒的IkHz的正弦波。圖9所示的輸入信號為音樂。
[0051]圖8和9所示的是在第一增益單元16和第二增益單元17中針對圖5(a)和5(b)所示的各譜(各頻率)執行加權的情況。圖6和7所示的是在第一增益單元16和第二增益單元17中不執行加權的情況,其中針對所有振幅譜的增益(信號電平)均被設置為OdB。[0052]首先,對于圖6(a)所示的直達聲側的信號,LPF單元10進行低通濾波處理以對呈矩形的輸入信號Lfa執行積分處理。因此,提取矩形的輸入信號Lfa的上升部分,并且生成振幅逐漸上升的積分信號Lfal。之后,在第一減法單元18中,從輸入信號Lfa中減去積分信號Lfal。因此,從輸入信號Lfa的矩形中減去了積分信號Lfal的逐漸上升部分的振幅。結果,提取出矩形的信號的上升部分即非穩態成分作為直達聲信號Lfd。
[0053]順便提及,第一減法單元18所進行的減法處理使直達聲信號Lfd的振幅為負。然而,由于第二限幅器單元13對該振幅進行了限制并且使其為零,因此如圖6(a)所示,直達聲信號Lfd的值不為負。
[0054]然后,對于圖6(b)所示的混響聲側的信號,HPF單元11進行高通濾波處理以對呈矩形的輸入信號Lfa執行微分處理。因此,生成具有矩形的輸入信號Lfa的急劇上升部分以及隨后逐漸衰減部分的微分信號Lfa2。之后,在第二減法單元19中,從輸入信號Lfa中減去微分信號Lfa2。因此,從輸入信號Lfa的矩形中減去了微分信號Lfa2的急劇上升部分等的振幅。結果,提取出除矩形的信號的上升部分以外的部分即穩態成分作為混響聲信號Lfr0
[0055]順便提及,第二減法單元19所進行的減法處理也使混響聲信號Lfr的振幅為負。然而,由于第四限幅器單元15對該振幅進行了限制并且使其為零,因此如圖6(b)所示,混響聲信號Lfr的值不為負。
[0056]圖7是示出在圖6所示的狀態下改變HPF單元11和LPF單元10的標準化截止頻率的情況的圖。更具體地,將圖7(b)所示的HPF單元11的標準化截止頻率設置為0.0041,這是比圖6(b)所示的HPF單元11的標準化截止頻率0.0082低的值。將圖7(a)所示的LPF單元10的標準化截止頻率設置為0.0164,這是比圖6 (a)所示的LPF單元10的標準化截止頻率0.0082高的值。
[0057]如圖6和7所示,隨著標準化截止頻率變得越低,濾波器的響應變得越慢,并且對信號的上升的響應變得越長。隨著標準化截止頻率變得越高,濾波器的響應變得越快,并且對信號的上升的響應變得越短。這樣,調節了截止頻率,因而可以調節直達聲和混響聲的分割時間(或者調節直達聲的提取時間并且調節混響聲的提取時間)。
[0058]圖8是示出在圖6所示的狀態下設置第一增益單元16和第二增益單元17中的針對各譜的加權量的情況的圖。隨著加權量的設置,在直達聲和混響聲中產生與該加權量相對應的偏移(或振幅的上升)。因此,向圖8(a)所示的直達聲信號Lfd添加了伴隨有該偏移的混響聲(如圖8(a)所示的高度為LI的振幅的上升)。向圖8(b)所示的混響聲信號Lfr添加了伴隨有該偏移的直達聲(如圖8(b)所示的高度為LI的振幅的上升)。這樣,借助于隨著加權量的設置所產生的偏移,可以調節直達聲和混響聲的混合比率(或者調節直達聲中所包含的混響聲的百分比、以及調節混響聲中所包含的直達聲的百分比)。
[0059]圖9是示出在圖8所示的狀態下、輸入信號為音樂信號并且提取隨著時間而衰減的IkHz附近的成分的情況的圖。如圖9(a)所示,關于直達聲側的信號,在振幅大的前半部分中提取直達聲的信號。如圖9(b)所示,關于混響聲側的信號,在輸入信號的振幅衰減的后半部分中提取混響聲的信號。
[0060]IFFT單元5a基于由頻譜域濾波單元4進行濾波后的直達聲構成的振幅譜信號(直達聲信號Lfd和Rfd)以及從FFT單元3獲取到的相位譜信號Lfp和Rfp來轉換成具有實數和虛數的頻率譜;并且通過使用窗函數來執行加權處理。然后,IFFT單元5a對進行了加權處理的信號進行短時間逆傅立葉變換處理和重疊相加處理,由此將該信號從頻域轉換成時域并且生成由直達聲構成的直達聲信號Ld和Rd。
[0061]同樣,IFFT單元5b基于由頻譜域濾波單元4進行濾波后的混響聲構成的振幅譜信號(混響聲信號Lfr和Rfr)以及從FFT單元3獲取到的相位譜信號Lfp和Rfp來轉換成具有實數和虛數的頻率譜;并且通過使用窗函數來執行加權處理。然后,IFFT單元5b對進行了加權處理的信號進行短時間逆傅立葉變換處理和重疊相加處理,由此將該信號從頻域轉換成時域并且生成由混響聲構成的混響聲信號Lr和Rr。
[0062]順便提及,IFFT單元5a和5b基于振幅譜信號和相位譜信號來執行轉換成具有實數和虛數的頻率譜的處理。因此,IFFT單元5a和5b與本發明的逆譜變換單元相對應。此夕卜,IFFT單元5a和5b對進行了加權處理的信號執行短時間逆傅立葉變換處理。因此,IFFT單元5a和5b與本發明的逆傅立葉變換單元相對應。
[0063]圖10?14是示出針對聲學處理裝置I的輸入信號的振幅以及在聲學處理裝置I中提取出(生成)的直達聲信號和混響聲信號的振幅的時間變化的圖。圖10和11示出輸入再現時間為I秒的IkHZ的正弦波作為輸入信號的情況。圖12和13示出輸入音樂作為輸入信號的情況。圖14示出輸入禮堂(或容易出現混響聲的環境)內的脈沖響應作為輸入信號的情況。
[0064]在圖10?14的情況中,HPF單元11和LPF單元10的標準化截止頻率全部為
0.0082。圖10、12和14示出不執行針對各譜的加權處理的情況。圖11和13示出執行針對各譜(針對各頻率)的加權處理的情況。
[0065]在圖10?14的情況中,IFFT單元5a和5b的逆傅立葉變換長度是4096個采樣,重疊長度是作為逆傅立葉變換長度的15/16的3840個采樣,并且逆傅立葉變換的窗函數是Blackman。這些設置同樣適用于FFT單元3。
[0066]圖10和11示出針對矩形的輸入信號的振幅的時間變化來提取作為非穩態成分的直達聲信號和作為穩態成分的混響聲信號的情形。與圖10所示的直達聲信號和混響聲信號相對比,圖11所示的直達聲信號和混響聲信號的振幅的值因針對各譜的加權處理而發生偏移。因此,在偏移部分(或者在圖11的情況中為直達聲信號的振幅和混響聲信號的振幅上升了 L2的高度的部分)中,包含了具有直達聲和混響聲的混合的部分。根據第一增益單元16和第二增益單元17所進行的加權處理,可以調節直達聲和混響聲的混合比率。
[0067]在圖12和13中,針對音樂(輸入信號)的波形,可以確認通過提取直達聲和混響聲所獲得的波形。在分別收聽分離的直達聲和混響聲的情況下,可以確認音樂的直達聲和混響聲這兩者。可以通過聽覺來識別直達聲和混響聲的提取(或分離)。
[0068]在圖13的情況下,可以執行針對各譜的加權的設置。因此,可以確認在直達聲中部分添加了混響聲并且在混響聲中部分添加了直達聲的情況下所獲得的波形(與圖12相t匕,圖13中的直達聲信號和混響聲信號的振幅的高度變高)。因此,確認為可以通過設置針對各譜的加權來調節直達聲和混響聲的混合比率。即使收聽圖13所示的直達聲和混響聲,也可以確認根據混合比率混合了直達聲和混響聲的輸出聲音。
[0069]在圖14的情況下,輸入禮堂內的脈沖響應作為輸入信號。由于該脈沖響應,因此存在輸入非常短的信號時的輸出,并且該輸出具有使振幅在短時間段內收斂的性質。然而,由于在作為容易出現混響聲的環境的禮堂內的脈沖響應,因此除了直達聲以外,還將包含大量混響聲。
[0070]在圖14中,可以確認以下的直達聲和混響聲,其中該直達聲為與輸入信號的振幅的收斂相比、振幅在更短時間段內收斂的直達聲,以及該混響聲為與直達聲的振幅的收斂相比、振幅維持了更長時間段的混響聲。在圖14的情況下,將HPF單元11和LPF單元10的標準化截止頻率設置為0.0082。然而,通過調節標準化截止頻率的值,可以調節直達聲的提取時間和混響聲的提取時間。
[0071]圖15(a)是示意性示出圖14所示的直達聲的波形根據標準化截止頻率的值的調節狀態而改變的情形以及輸入信號的圖。如圖15(a)所示,隨著標準化截止頻率的值變得越大,脈沖響應的振幅收斂所需的時間變得越短。隨著標準化截止頻率的值變得越小,脈沖響應的振幅收斂所需的時間變得越長,表現出接近輸入信號的振幅的收斂狀態的波形形狀。
[0072]這樣,通過調節標準化截止頻率的值,可以改變輸入信號中的直達聲的提取時間。因此,隨著標準化截止頻率的值減小,輸入信號中的直達聲的提取時間變得越長,從而使得能夠以不僅包含非穩態聲還包含穩態聲的方式提取直達聲。例如,在圖14所不的程度上,執行包含穩態聲的直達聲的提取。因此,與完全不包含穩態聲的直達聲相比,可以向直達聲添加諸如音色和易聽性等的這些性質。在收聽者收聽該直達聲的情況下,該收聽者可以將該直達聲識別為無不適感的聲音。
[0073]圖15(b)是示意性示出圖14所示的混響聲的波形根據標準化截止頻率的值的調節狀態而改變的情形以及輸入信號的圖。如圖15(b)所示,隨著標準化截止頻率的值變得越大,混響聲的振幅越早開始增大,并且混響聲的振幅的增大趨于越早急劇上升。隨著標準化截止頻率的值變得越小,混響聲的振幅的增大(或上升部分)變得越緩和。
[0074]因此,通過調節標準化截止頻率的值,可以改變輸入信號中的直達聲的提取時間。通過減小標準化截止頻率的值,可以降低混響聲信號中所包含的直達聲的影響。通過增大標準化截止頻率的值,可以提取包含少量直達聲的混響聲信號。
[0075]盡管已經參考附圖詳細說明了本發明,但本發明的直達聲提取裝置和混響聲提取裝置不限于以上實施例。對于本領域普通技術人員而言顯而易見,可以如這里所述對本發明進行各種修改或改變。因此,所有這些修改或改變均應被視為在本發明的范圍內。
[0076]通過利用本發明的直達聲提取裝置和混響聲提取裝置,還可以構建各種聲學環境。例如,利用直達聲提取裝置從直達聲中包含混響聲的輸入信號中提取直達聲信號;將該直達聲信號從配置在收聽者附近的位置的揚聲器輸出。結果,與將該輸入信號毫不改變地從揚聲器輸出的情況相比,可以使發聲更加清晰,由此使得收聽者能夠容易地收聽。此外,利用混響聲提取信號從該輸入信號提取混響聲信號;并且將該混響聲信號從配置在遠離收聽者的位置的揚聲器輸出。結果,可以以有效方式輸出混響聲。
[0077]附圖標記說明
[0078]L···聲學處理裝置(直達聲提取裝置和混響聲提取裝置)
[0079]3…FFT單元(傅立葉變換單元和譜變換單元)
[0080]4…頻譜域濾波單元
[0081]5a, 5b…IFFT單元(逆傅立葉變換單元和逆譜變換單元)[0082]10..LPF單元(低通濾波器單元)[0083]11..HPF單元(高通濾波器單元)[0084]12..第一限幅器單元[0085]13..第二限幅器單元[0086]14..第三限幅器單元[0087]15..第四限幅器單元[0088]16..第一增益單元[0089]17..第二增益單元[0090]18..第一減法單元[0091]19..第二減法單元[0092]L, R…輸入信號[0093]Lfa,Rfa…振幅譜信號[0094]Lfp, Rfp…相位譜信號[0095]Lfal…積分信號[0096]Lfa2…微分信號[0097]Lfd, Ld, Rfd, Rd…直達聲信號[0098]Lfr, Lr, Rfr, Rr…混響聲信號
12
【權利要求】
1.一種直達聲提取裝置,包括:傅立葉變換單元,用于對直達聲中包含混響聲的輸入信號進行傅立葉變換處理;譜變換單元,用于基于由所述傅立葉變換單元進行了傅立葉變換處理的所述輸入信號的具有實數和虛數的頻率譜,將所述輸入信號變換成第一振幅譜信號和相位譜信號;低通濾波器單元,用于通過使用預設的標準化截止頻率來針對各頻率對所述第一振幅譜信號進行低通濾波處理;第一限幅器單元,用于對由所述低通濾波器單元進行了低通濾波處理的第二振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;第一減法單元,用于通過從所述第一振幅譜信號中減去由所述第一限幅器單元對負側振幅進行了限制的所述第二振幅譜信號來計算第三振幅譜信號;第二限幅器單元,用于對由所述第一減法單元計算出的所述第三振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;逆譜變換單元,用于基于所述相位譜信號和由所述第二限幅器單元對負側振幅進行了限制的所述第三振幅譜信號,計算由具有實數和虛數的頻率譜構成的信號;以及逆傅立葉變換單元,用于對由所述逆譜變換單元計算出的信號進行逆傅立葉變換處理,以生成通過從所述輸入信號提取所述直達聲所獲得的直達聲信號。
2.根據權利要求1所述的直達聲提取裝置,其中,還包括:第一增益單元,用于通過針對各頻率使由所述第二限幅器單元對負側振幅進行了限制的所述第三振幅譜信號的振幅放大或衰減,來對所述第三振幅譜信號進行加權,其中,所述逆譜變換單元基于所述相位譜信號和由所述第一增益單元加權后的所述第三振幅譜信號,來計算由具有實數和虛數的頻率譜構成的信號。
3.一種混響聲提取裝置,包括:傅立葉變換單元,用于對直達聲中包含混響聲的輸入信號進行傅立葉變換處理;譜變換單元,用于基于由所述傅立葉變換單元進行了傅立葉變換處理的所述輸入信號的具有實數和虛數的頻率譜,將所述輸入信號變換成第一振幅譜信號和相位譜信號;高通濾波器單元,用于通過使用預設的標準化截止頻率來針對各頻率對所述第一振幅譜信號進行高通濾波處理;第三限幅器單元,用于對由所述高通濾波器單元進行了高通濾波處理的第四振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;第二減法單元,用于通過從所述第一振幅譜信號中減去由所述第三限幅器單元對負側振幅進行了限制的所述第四振幅譜信號來計算第五振幅譜信號;第四限幅器單元,用于對由所述第二減法單元計算出的所述第五振幅譜信號的負側振幅進行限制,從而使該負側振幅為零;逆譜變換單元,用于基于所述相位譜信號和由所述第四限幅器單元對負側振幅進行了限制的所述第五振幅譜信號,計算由具有實數和虛數的頻率譜構成的信號;以及逆傅立葉變換單元,用于對由所述逆譜變換單元計算出的信號進行逆傅立葉變換處理,以生成通過從所述輸入信號提取所述混響聲所獲得的混響聲信號。
4.根據權利要求3所述的混響聲提取裝置,其中,還包括:第二增益單元,用于通過針對各頻率使由所述第四限幅器單元對負側振幅進行了限制的所述第五振幅譜信號的振幅放大或衰減,來對所述第五振幅譜信號進行加權, 其中,所述逆譜變換單元基于所述相位譜信號和由所述第二增益單元加權后的所述第五振幅譜信號,來計算由具有實數和虛數的頻率譜構成的信號。
【文檔編號】G10L21/0232GK103503066SQ201280015523
【公開日】2014年1月8日 申請日期:2012年6月14日 優先權日:2011年7月1日
【發明者】橋本武志, 渡邊哲生, 笛木俊宏 申請人:歌樂株式會社