掩蔽聲數據產生裝置及系統和用于產生掩蔽聲數據的方法
【技術領域】
[0001]本發明涉及聲音掩蔽技術。
【背景技術】
[0002]存在一種通過發射聲音(掩蔽聲)以阻礙通過聲音(例如,語音)傳輸信息來防止會話被偷聽的聲音掩蔽技術。
[0003]JP-A-2006-267174、JP-A-2010-217883 和 JP-A-06-186986 作為涉及掩蔽聲的產生的文獻的示例。在JP-A-2006-267174中,提出了一種技術,該技術通過對掩蔽聲執行頻率濾波處理以使得掩蔽聲和背景噪聲的頻譜與話語者(對話者)的語音的頻譜相同來產生幾乎不使第三者感覺到不愉快的掩蔽聲。在JP-A-2010-217883中,提出了一種技術,該技術通過將表示從房間接收的各個頻帶的目標聲音信號的包絡的包絡信號劃分為多幀以及將噪聲乘以通過隨機地改變其中信號的振幅大于或等于下限閾值且小于或等于上限閾值的幀的排列順序所獲得的包絡信號來產生不導致吵鬧和不自然的掩蔽聲。在JP-A-06-186986中,提出了一種技術,該技術產生不用于聲音掩蔽的聲音而是產生作為降低阻礙通過擴音器再現電有效信號的車輛的運轉噪聲的影響的聲音、其中根據車輛的瞬時速度單獨地調整各個頻帶的水平的聲音。
[0004]在作為現有技術的JP-A-2006-267174、JP-A-2010-217883 和 JP-A-06-186986 示出的技術中,根據掩蔽聲的產生的相同規則針對所有頻帶執行處理。然而,并非語音的所有頻帶都對通過語音的信息傳輸起到等同的作用。另外,并非掩蔽聲的所有頻帶都等同地向收聽者提供不愉快和不和諧的感覺。
[0005]本發明的目的是提供一種技術,與不考慮掩蔽聲的各個頻帶對信息傳輸或對向收聽者提供的不愉快和不和諧的感覺的作用而產生的掩蔽聲相比,該技術產生具有高掩蔽效率的掩蔽聲或具有較少不愉快和不和諧的掩蔽聲。
【發明內容】
[0006]為了實現以上目的,根據本發明,提供了一種掩蔽聲數據產生裝置,該裝置包括:
[0007]源聲數據獲得部分,其獲得表示在掩蔽聲數據的產生中使用的聲音的源聲數據;
[0008]話語者聲數據獲得部分,其獲得表示作為掩蔽目標的話語者語音的話語者聲數據;
[0009]頻帶水平指定部分,其指定話語者聲數據中的兩個或更多個頻帶的各個水平;以及
[0010]頻帶水平設置部分,其基于由頻帶水平指定部分指定的話語者聲數據中的各頻帶的各個水平根據各預定規則來設置與話語者聲數據中的兩個或更多個頻帶相對應的在源聲數據中的兩個或更多個頻帶的各個水平,并且產生表示掩蔽聲的掩蔽聲數據,
[0011]其中,頻帶水平設置部分根據彼此不同的各預定規則來設置源聲數據中的兩個或更多個頻帶中的至少兩個頻帶的各個水平。
[0012]根據本發明,還提供了一種用于產生掩蔽聲數據的方法,該方法包括以下步驟:
[0013]獲得表示在掩蔽聲數據的產生中使用的聲音的源聲數據;
[0014]獲得表示作為掩蔽目標的話語者的語音的話語者聲數據;
[0015]指定話語者聲數據中的兩個或更多個頻帶的各個水平;以及
[0016]基于通過指定步驟指定的話語者聲數據中的各頻帶的各個水平根據各預定規則來設置與話語者聲數據中的兩個或更多個頻帶相對應的在源聲數據中的兩個或更多個頻帶的各個水平,以產生表示掩蔽聲的掩蔽聲數據,
[0017]其中,在設置步驟中,根據彼此不同的各預定規則來設置源聲數據中的兩個或更多個頻帶中的至少兩個頻帶的各個水平。
[0018]根據本發明,還提供了一種掩蔽聲產生系統,該系統包括:
[0019]聲接收裝置,其通過接收作為掩蔽目標的話語者語音來產生話語者聲數據并輸出話語者聲數據;
[0020]掩蔽聲數據產生裝置,其產生表示掩蔽聲的掩蔽聲數據;以及
[0021]發聲裝置,其發出通過掩蔽聲數據產生裝置產生的掩蔽聲數據作為掩蔽聲,
[0022]其中掩蔽聲數據產生裝置包括:
[0023]源聲數據獲得部分,其獲得表示在掩蔽聲數據的產生中使用的聲音的源聲數據;
[0024]話語者聲數據獲得部分,其獲得從聲接收裝置輸出的話語者聲數據;
[0025]頻帶水平指定部分,其指定話語者聲數據中的兩個或更多個頻帶的各個水平;
[0026]頻帶水平設置部分,其基于由頻帶水平指定部分指定的話語者聲數據中的各頻帶的各個水平根據各預定規則來設置與話語者聲數據中的兩個或更多個頻帶相對應的在源聲數據中的兩個或更多個頻帶的各個水平,并且產生表示掩蔽聲的掩蔽聲數據;以及
[0027]輸出部分,其將通過頻帶水平設置部分產生的掩蔽聲數據輸出至發聲裝置;并且
[0028]其中,頻帶水平設置部分根據彼此不同的各預定規則來設置源聲數據中的兩個或更多個頻帶中的至少兩個頻帶的各個水平。
[0029]根據本發明,根據掩蔽聲的各個頻帶對信息的傳輸或對給收聽者帶來不愉快和不和諧的感覺的作用,產生了這樣一種掩蔽聲,其中根據針對各個頻帶的不同規則調整了各頻帶的水平。這導致具有高掩蔽效率的掩蔽聲或具有較少不愉快和不和諧的掩蔽聲的產生。
【附圖說明】
[0030]圖1是示出根據實施例的掩蔽聲產生系統的構造的框圖。
[0031]圖2是示出根據實施例的掩蔽聲數據產生裝置使用的參數的圖。
[0032]圖3是示出根據實施例的掩蔽聲數據產生裝置使用的參數的圖。
[0033]圖4是示出根據實施例的掩蔽聲數據產生裝置使用的參數的圖。
[0034]圖5是示出根據第一修改示例的掩蔽聲產生系統的構造的框圖。
[0035]圖6是示出根據第二修改示例的掩蔽聲產生系統的構造的框圖。
[0036]圖7是示出根據第三修改示例的掩蔽聲產生系統的構造的框圖。
[0037]圖8是示出根據第四修改示例的掩蔽聲產生系統的構造的框圖。
[0038]圖9是示出根據第五修改示例的掩蔽聲產生系統的構造的框圖。
[0039]圖10是示出根據第六修改示例的掩蔽聲產生系統的構造的框圖。
[0040]圖11是示出根據第七修改示例的掩蔽聲產生系統的構造的框圖。
[0041]圖12是示出根據第八修改示例的掩蔽聲產生系統的構造的框圖。
[0042]圖13是示出掩蔽聲數據產生裝置使用的參數的圖。
[0043]圖14是示出掩蔽聲數據產生裝置使用的參數的圖。
[0044]圖15是示出掩蔽聲數據產生裝置使用的參數的圖。
[0045]圖16是示出掩蔽聲數據產生裝置使用的參數的圖。
[0046]圖17是示出掩蔽聲數據產生裝置的操作的概要的流程圖。
【具體實施方式】
[0047][1、實施例]
[0048]下文中,將對根據本發明的實施例的掩蔽聲產生系統I的構造和操作進行描述。圖1是示出掩蔽聲產生系統I的構造的框圖。掩蔽聲產生系統I包括掩蔽聲數據產生裝置11、麥克風12、存儲裝置13和擴音器14。掩蔽聲數據產生裝置11產生表示掩蔽聲的聲數據(下文中稱作“掩蔽聲數據”)。麥克風12是通過接收話語者A的語音(掩蔽目標的語音)的聲音來產生聲數據(下文中稱作“話語者聲數據”)的聲接收裝置。存儲裝置13存儲表示用作用于產生掩蔽聲數據的源的聲音的聲數據(下文中稱作“源聲數據”)。擴音器14是發聲裝置,其向收聽者B (作為阻礙話語者A的語音內容的傳輸的目標的對立方)所在的空間發出通過由掩蔽聲數據產生裝置11產生的掩蔽聲數據表示的聲音作為掩蔽聲。
[0049]存儲在存儲裝置13中的源聲數據是通過對表示具有各種屬性的人(諸如具有低音調的人和具有高音調的人、男人和女人以及成人和兒童)閱讀包括幾乎相同的元音聲和輔音聲的標準日文文本的語音的聲數據執行使語音模糊的處理(例如,使沿著時間軸的方向以恒定時間長度劃分的塊中的數據逆轉或使塊的順序交換的處理)所產生的數據。
[0050]掩蔽聲數據產生裝置11包括輸入接口(IF)111、BPF 112-1至112-m和LD 113-1至113-m。輸入IF 111接收通過麥克風12產生的話語者聲數據的輸入。BPF 112-1至112-m(下文中統稱為“BPF112”)是將從輸入IF 111輸入的話語者聲數據劃分為m(其中
2)個頻帶并且針對各個頻帶產生聲數據(下文中稱作“頻帶話語者聲數據”)的一組帶通濾波器。LD 113-1至113-m(下文中統稱為“LD 113”)是指定通過BPF 112產生的頻帶話語者聲數據的各個水平的水平檢測器。輸入IF 111構成話語者聲數據獲得部分。BPF112和LD 113構成頻帶水平指定部分。
[0051]掩蔽聲數據產生裝置11還包括輸入IF 114、再現器115、8??116-1至11611和^:117-1至117-m。輸入IF 114接收存儲在存儲裝置13中的源聲數據的輸入。再現器115按順序讀取和輸出輸入至輸入IF 114中的源聲數據。BPF 116-1至116-m(下文中統稱為“BPF116”)是將從再現器115輸出的源聲數據劃分為m個頻帶并針對各個頻帶產生聲數據(下文中稱作“頻帶源聲數據”)的一組帶通濾波器。LC 117-1至117-m(下文中統稱為“LC 117”)是這樣的電路(水平控制器),其基于由LD 113-1至113-m中的具有與LC 117對應的分支編號的LD 113指定的頻帶話語者聲數據的水平來改變通過BPF116-1至116_m中的具有與LC 117對應的分支編號的BPF 116產生的頻帶源聲數據的水平。輸入IF 114構成源聲數據獲得部分。
[0052]掩蔽聲數據產生裝置11還包括加法器118和輸出IF 119。加法器118通過將其水平被LC 117改變的多個頻帶源聲數據相加來產生表示掩蔽聲的聲數據(下文中稱作“掩蔽聲數據”)。輸出IF 119將由加法器118產生的掩蔽聲數據輸出至擴音器14。加法器118與BPF 116和LC 117 —起構成頻帶水平設置部分。
[0053]每個頻帶的BPF 112、LD 113, BPF 116和LC 117彼此——對應。具體地說,假設k是I < k<m中的任意自然數,LD 113-k從BPF112-k獲得頻帶話語者聲數據并指定該頻帶話語者聲數據的水平。LC117-k基于由LD 113-k指定的頻帶話語者聲數據的水平從BPF116-k獲得頻帶源聲數據并改變該頻帶源聲數據的水平。
[0054]LC 117-1至117-m中的每一個具有存儲器。存儲器存儲在LC117-1至117-m中的每一個中設置的水平改變參數。對應于LC 117-1至117-m中的每一個的水平改變參數包括增益指定函數GR-1至GR-m(下文中統稱為“增益指定函數GR”)和時間常數TC-1至TC-m (下文中統稱為“時間常數TC”)。
[0055]增益指定函數GR-1至GR-m是表示由LD 113-1至113_m中的每一個指定的頻帶話語者聲數據的水平(下文中稱作“參考信號電平”)與在LC 117-1至117-m改變由BPF116-1至116-m中的每一個獲得的頻帶源聲數據的水平的情況下的增益的收斂值(下文中稱作“目標增益”)之間的對應關系的函數。時間常數TC-1至TC-m是表示在收斂至通過增益指定函數GR-1至GR-m確定的目標增益之前通過LC117-1至117_m改變水平的過程中增益的響應速度的數值。LC 117-1至117-m中的每一個控制頻帶源聲數據在各個頻帶中的水平,以使得該水平以由時間常數TC表示的響應速度收斂至對應于由增益指定函數GR表示的參考信號電平的目標增益。增益指定函數GR-1至GR-m中的至少兩個彼此不同,以獲得期望的掩蔽聲數據。另外,關于時間常數TC-1至TC-m,時間常數TC-1至TC-m中的至少兩個彼此不同,以獲得期望的掩蔽聲數據。
[0056]圖2通過各個曲線圖示出了增益指定函數GR的三個示例((a)至(C))。圖2中的曲線圖(a)具有目標增益的下限。當參考信號電平小于或等于12時,將恒定值gl作為目標增益輸出,而不管參考信號電平的幅度如何。曲線圖(b)也具有目標增益的下限。當參考信號電平小于或等于I1G1C I2)時,將恒定值gl作為目標增益輸出,而不管參考信號電平的幅度如何。曲線圖(C)具有目標增益的上限。當參考信號電平大于或等于13(12<13)時,將恒定值g2(gl< g2)作為目標增益輸出,而不管參考信號電平的幅度如何。
[0057]在圖2中的曲線(a)至(C)示出的增益指定函數GR的三個示例之間的比較中,相對于參考信號電平的整個區中的參考信號電平的相同輸入,與曲線圖(a)相比,曲線圖(b)輸出相同或更大的目標增益,并且與曲線圖(b)相比,曲線圖(C)輸出相同或更大的目標增益。因此,在聲音掩蔽中,在針對將被阻礙傳輸的語音中較不重要的信息的頻帶的LC 117中,例如將曲線圖(a)的增益指定函數