專利名稱:一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及信號(hào)處理領(lǐng)域,特別是一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置。
背景技術(shù):
語音是人類交流最自然的手段,但在語音通信、語音識(shí)別等實(shí)際應(yīng)用中,往往存在著各種各樣的環(huán)境噪聲。當(dāng)這些環(huán)境噪聲較強(qiáng)時(shí),會(huì)嚴(yán)重影響語音通信的質(zhì)量和識(shí)別的正確率。例如在工廠、集會(huì)等嘈雜環(huán)境中,不但語音通信的音質(zhì)、可懂度會(huì)顯著變差,語音識(shí)別器的識(shí)別率也會(huì)急劇下降。語音增強(qiáng)是一種常用的減少環(huán)境噪聲影響、提高語音通信質(zhì)量的方法,也可以用于識(shí)別前語音的預(yù)處理,以提高語音識(shí)別器的識(shí)別率。目前語音增強(qiáng)方法主要包括兩類,一類是基于單麥克風(fēng)的語音增強(qiáng)方法,包括譜減法、維納濾波、MMSE、卡爾曼濾波、小波變換等,這類方法利用單麥克風(fēng)接收語音信號(hào),通過時(shí)域、頻域、小波變換域等濾波和處理來抑制噪聲,提高語音的質(zhì)量;另一類是基于麥克風(fēng)陣列的語音增強(qiáng)方法,這類方法將陣列信號(hào)處理技術(shù)應(yīng)用到語音增強(qiáng)中,利用多個(gè)麥克風(fēng)接收到的語音信號(hào)里包含的空間相位信息對輸入語音進(jìn)行空間濾波,形成具有指向性的空間波束,對指定方向上的語音信號(hào)進(jìn)行增強(qiáng),同時(shí)抑制其他方向上的干擾,可提供比傳統(tǒng)語音增強(qiáng)方法更好的噪聲抑制效果?,F(xiàn)有的語音增強(qiáng)技術(shù)能在一定程度上提高帶噪語音的質(zhì)量,但由于這些技術(shù)均基于麥克風(fēng)等空氣傳導(dǎo)的語音傳感器,在接收信號(hào)中,環(huán)境噪聲直接疊加在語音信號(hào)上,因此隨著環(huán)境噪聲的增強(qiáng),其性能不可避免地下降,特別在強(qiáng)噪聲環(huán)境下,現(xiàn)有的語音增強(qiáng)技術(shù)仍很難取得好的效果O為了能適應(yīng)強(qiáng)噪聲環(huán)境下的語音通信,一些語音通信系統(tǒng)采用了非空氣傳導(dǎo)的語音傳感器,如喉部送話器和骨傳導(dǎo)語音傳感器等。這些語音傳感器在使用時(shí)緊貼使用者的喉部、顎骨等部位,使用者說話時(shí)聲帶振動(dòng)帶動(dòng)傳感器中的簧片發(fā)生形變,將簧片的振動(dòng)轉(zhuǎn)化為電信號(hào)即可得到語音信號(hào)。由于空氣中傳導(dǎo)的聲波無法使這類語音傳感器的簧片發(fā)生形變,因此這類語音傳感器不受聲學(xué)噪聲的影響,具有很強(qiáng)的抗干擾能力,常用于坦克、工廠等強(qiáng)噪聲環(huán)境中的語音通信和語音識(shí)別。但由于非空氣傳導(dǎo)語音傳感器檢測到的語音信號(hào)在傳播信道的特性上與說話時(shí)聲道的特性有較大的不同,因此與麥克風(fēng)等空氣傳導(dǎo)語音傳感器接收到的語音相比自然度差,聽起來并不舒適。
實(shí)用新型內(nèi)容針對現(xiàn)有基于空氣傳導(dǎo)語音傳感器的語音增強(qiáng)技術(shù)在強(qiáng)噪聲環(huán)境中效果不佳和非空氣傳導(dǎo)語音傳感器音質(zhì)差等不足,本實(shí)用新型提供了一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置。本實(shí)用新型體積小、抗噪聲能力強(qiáng)、語音質(zhì)量好、使用方便,可以廣泛用于各種強(qiáng)噪聲環(huán)境下的語音通信、記錄、識(shí)別等場合。本實(shí)用新型具體技術(shù)方案如下。一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置,空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器均各自與多路數(shù)據(jù)采集模塊連接,多路數(shù)據(jù)采集模塊與數(shù)據(jù)處理裝置連接,其中,空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號(hào),多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號(hào),數(shù)據(jù)處理裝置用于對多路數(shù)據(jù)采集模塊采集的數(shù)據(jù)進(jìn)行處理并對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)并輸出。進(jìn)一步的,上述可用于強(qiáng)噪聲環(huán)境的語音采集裝置中,所述數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊,空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接,噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接,聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接;其中,噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型,聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正,語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng),聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型,并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整。進(jìn)一步的,所述數(shù)據(jù)處理裝置包括DSP處理芯片。進(jìn)一步的,所述多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片。進(jìn)一步的,所述空氣傳導(dǎo)語音傳感器采用麥克風(fēng),所述非空氣傳導(dǎo)語音傳感器采用喉部送話器。本實(shí)用新型將空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器相結(jié)合,首先建立空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型,在增強(qiáng)時(shí)利用非空氣傳導(dǎo)語音傳感器檢測語音來準(zhǔn)確估計(jì)聲學(xué)噪聲模型,并據(jù)此對聯(lián)合模型的參數(shù)進(jìn)行修正,然后利用修正后的聯(lián)合模型對輸入的空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)。由于同時(shí)利用了空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音來恢復(fù)語音信號(hào),因此與現(xiàn)有技術(shù)相比,本實(shí)用新型提供的方法能在強(qiáng)噪聲環(huán)境中輸出音質(zhì)更好的語音信號(hào)。上述可用于強(qiáng)噪聲環(huán)境的語音采集裝置的語音增強(qiáng)方法,具體包含以下步驟:步驟1:建立干凈環(huán)境下空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型;步驟2:根據(jù)非空氣傳導(dǎo)語音傳感器檢測的語音信號(hào),估計(jì)當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號(hào)的噪聲模型;步驟3:利用步驟2得到的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正;步驟4:用修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音信號(hào)進(jìn)行增強(qiáng),并輸出增強(qiáng)后的語音信號(hào)。進(jìn)一步的,上述步驟I中空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型,為空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合概率模型或它們之間的映射關(guān)系。進(jìn)一步的,上述步驟I中聯(lián)合模型的建立,包含以下步驟:步驟1.1:采集同步、干凈的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)作為訓(xùn)練數(shù)據(jù);[0020]步驟1.2:對步驟1.1中采集的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)進(jìn)行分幀,提取每幀語音的聲道參數(shù)和激勵(lì)參數(shù);步驟1.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵(lì)參數(shù)分別訓(xùn)練聲道參數(shù)和激勵(lì)參數(shù)的聯(lián)合模型。上述步驟2中當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號(hào)的噪聲模型估計(jì),包含以下步驟:步驟2.1:同步采集空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音;步驟2.2:利用非空氣傳導(dǎo)語音傳感器檢測的語音數(shù)據(jù)進(jìn)行語音的端點(diǎn)檢測;步驟2.3:依據(jù)步驟2.2檢測的語音端點(diǎn),提取空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段;步驟2.4:利用步驟2.3中得到的空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段數(shù)據(jù),估計(jì)噪聲的統(tǒng)計(jì)模型。上述步驟3中,根據(jù)空氣傳導(dǎo)語音傳感器檢測語音信號(hào)的噪聲模型和步驟I中訓(xùn)練得到的聲道參數(shù)聯(lián)合模型,采用模型補(bǔ)償技術(shù)對聲道參數(shù)聯(lián)合模型的參數(shù)進(jìn)行修正。上述步驟4中的空氣傳導(dǎo)語音傳感器檢測語音信號(hào)增強(qiáng),具體包含以下步驟:步驟4.1:利·用修正前和修正后的聲道參數(shù)聯(lián)合模型,以及當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù),按選定的優(yōu)化準(zhǔn)則估計(jì)干凈的空氣傳導(dǎo)語音傳感器檢測語音聲道參數(shù);步驟4.2:求出當(dāng)前非空氣傳導(dǎo)語音傳感器檢測語音的激勵(lì)參數(shù);步驟4.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音激勵(lì)參數(shù)的聯(lián)合模型,將非空氣傳導(dǎo)語音傳感器檢測語音的激勵(lì)參數(shù)映射為空氣傳導(dǎo)語音傳感器檢測語音的激勵(lì)參數(shù),并重構(gòu)空氣傳導(dǎo)語音傳感器檢測語音的激勵(lì);步驟4.4:利用步驟4.3得到的空氣傳導(dǎo)語音傳感器檢測語音的激勵(lì)和步驟4.1得到的空氣傳導(dǎo)語音傳感器檢測語音聲道參數(shù),合成增強(qiáng)后的語音。進(jìn)一步優(yōu)選的,上述步驟4.1中的優(yōu)化準(zhǔn)則為最小均方誤差準(zhǔn)則。上述方法中,空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音聯(lián)合模型的參數(shù),在聲學(xué)噪聲小于預(yù)設(shè)門限時(shí)采用模型自適應(yīng)技術(shù)進(jìn)行調(diào)整。與現(xiàn)有技術(shù)相比,本實(shí)用新型有以下主要優(yōu)點(diǎn):(I)體積小,使用方便。與基于麥克風(fēng)陣列的語音增強(qiáng)相比,本實(shí)用新型使用一個(gè)空氣傳導(dǎo)語音傳感器和一個(gè)非空氣傳導(dǎo)語音傳感器,可以按人頭部的構(gòu)造設(shè)計(jì)成緊湊的耳機(jī),體積更小,使用更方便。(2)與基于空氣傳導(dǎo)語音傳感器的語音增強(qiáng)相比,抗噪聲的能力更強(qiáng)。本實(shí)用新型將空氣傳導(dǎo)語音傳感器與非空去傳導(dǎo)傳感器相結(jié)合,而空氣中傳導(dǎo)的聲波不會(huì)對非空氣傳導(dǎo)的傳感器產(chǎn)生影響,因而具有很強(qiáng)的抗噪聲能力,在強(qiáng)噪聲環(huán)境中仍能得到較清晰的語
曰 (3)與基于非空氣傳導(dǎo)語音傳感器的語音增強(qiáng)相比,語音質(zhì)量更好。本實(shí)用新型在語音增強(qiáng)時(shí)利用了非空氣傳導(dǎo)語音和空氣傳導(dǎo)語音之間的映射關(guān)系來重建干凈語音,因此與基于非空氣傳導(dǎo)語音傳感器的語音增強(qiáng)方法相比具有更好的自然度。
圖1為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)裝置結(jié)構(gòu)圖;圖2為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法流程圖;圖3為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中建立語音聯(lián)合模型的流程圖;圖4為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中建立噪聲模型的流程圖;圖5為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)的流程圖。
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例對本實(shí)用新型的具體實(shí)施步驟作進(jìn)一步說明,但本實(shí)用新型的實(shí)施和保護(hù)范圍不限于此。本實(shí)用新型實(shí)施例提供的語音增強(qiáng)裝置的系統(tǒng)結(jié)構(gòu)圖如圖1所示,包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置,其中數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊,其中空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接,噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接,聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接??諝鈧鲗?dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號(hào),上述實(shí)施例中,空氣傳導(dǎo)語音傳感器采用麥克風(fēng)實(shí)現(xiàn),非空氣傳導(dǎo)語音傳感器采用喉部送話器實(shí)現(xiàn);多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號(hào),上述實(shí)施例中,多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片來實(shí)現(xiàn);噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型,聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型中對應(yīng)于空氣傳導(dǎo)語音的參數(shù)進(jìn)行修正,語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng),聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型,并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整,上述實(shí)施例中,噪聲模型估計(jì)模塊,聯(lián)合模型修正模塊,語音增強(qiáng)模塊,聯(lián)合模型訓(xùn)練和自適應(yīng)模塊在DSP芯片中實(shí)現(xiàn)。上述實(shí)施例中,語音增強(qiáng)方法如圖2所示,采用如下步驟來實(shí)現(xiàn):步驟1:建立干凈環(huán)境下空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型,其流程如圖3所示,具體可分為以下步驟:步驟1.1:采集同步、干凈的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。上述實(shí)施例中,在安靜的環(huán)境下通過多路數(shù)據(jù)采集芯片同步采集麥克風(fēng)和喉部送話器收集的語音數(shù)據(jù)作為聯(lián)合模型的訓(xùn)練數(shù)據(jù)。步驟1.2:對步驟1.1中采集的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)進(jìn)行分幀,提取每幀語音的聲道參數(shù)和激勵(lì)參數(shù)。上述實(shí)施例中,將空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音按IOms的間隔進(jìn)行分幀,對于聲道參數(shù),采用線性預(yù)測分析法提取一幀空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的線性預(yù)測系數(shù)(即LPC系數(shù))。將原始語音通過LPC分析濾波器,得到預(yù)測殘差的幅度譜即為所需的激勵(lì)參數(shù)。步驟1.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵(lì)參數(shù)分別訓(xùn)練聲道參數(shù)聯(lián)合模型和激勵(lì)參數(shù)聯(lián)合模型??諝鈧鲗?dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音參數(shù)的聯(lián)合模型可以采用聯(lián)合概率模型或它們之間的映射關(guān)系來表示,上述實(shí)施例中,使用高斯模型來對空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵(lì)參數(shù)進(jìn)行建模,具體方法如下:對于聲道參數(shù)的聯(lián)合模型訓(xùn)練,首先將同一時(shí)刻空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的LPC參數(shù)轉(zhuǎn)換為線性預(yù)測倒譜系數(shù)(即LPCC系數(shù)),將兩者合并為一個(gè)聯(lián)合矢量,記為C=[ClT,c2T]T,其中C1為空氣傳導(dǎo)語音傳感器檢測語音的LPCC系數(shù),C2為非空氣傳導(dǎo)語音傳感器檢測語音的LPCC系數(shù),然后使用J個(gè)高斯模型來擬合這個(gè)聯(lián)合矢量的概率分布。令λ ^表示第j個(gè)高斯模型,則其模型參數(shù)包括高斯函數(shù)的均值、方差和該高斯模型的先驗(yàn)概率。高斯模型的參數(shù)有多種成熟的訓(xùn)練方法,上述實(shí)施例中,采用以下步驟來訓(xùn)練J個(gè)高斯模型的參數(shù):步驟1.3.1:將所有訓(xùn)練用的聯(lián)合矢量分成J個(gè)群,每個(gè)群使用一個(gè)高斯模型來擬合其概率分布,求出該群中所有聯(lián)合矢量的均值和方差作為高斯函數(shù)的均值和方差,該群中包含的聯(lián)合矢量的個(gè)數(shù)與所有訓(xùn)練用的聯(lián)合矢量個(gè)數(shù)之比為該高斯模型的先驗(yàn)概率。步驟1.3.2:根據(jù)上一步所得的高斯模型參數(shù)對所有訓(xùn)練用的聯(lián)合矢量重新劃分所屬的群,其原則是如果某一聯(lián)合矢量c屬于群j,則有P(c I λ P >P(c| Ai), i Φ j。步驟1.3.3:如果迭代次數(shù)達(dá)到預(yù)設(shè)值,則當(dāng)前的高斯模型參數(shù)即為訓(xùn)練好的高斯模型參數(shù)。否則,按步驟1.3.2的分群結(jié)果重新計(jì)算所有高斯模型的均值、方差和先驗(yàn)概率,并轉(zhuǎn)步驟1.3.2。對于激勵(lì)參數(shù)的聯(lián)合概率模型訓(xùn)練,將同一時(shí)刻空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的激勵(lì)的幅度譜合并為一個(gè)聯(lián)合矢量,記為s=[SlT, s2T]T,其中S1為空氣傳導(dǎo)語音傳感器檢測語音激勵(lì)的幅度譜,S2為非空氣傳導(dǎo)語音傳感器檢測語音激勵(lì)的幅度譜。使用K個(gè)高斯模型來擬合該聯(lián)合矢量的概率分布,采用與聲道參數(shù)相同的訓(xùn)練方法,可以得到激勵(lì)參數(shù)的K個(gè)高斯模型的參數(shù)。步驟2:根據(jù)非空氣傳導(dǎo)語音傳感器檢測的語音信號(hào),估計(jì)當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號(hào)的噪聲模型,其流程如圖4所示,具體步驟如下:步驟2.1:同步采集空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音。上述實(shí)施例中,通過數(shù)據(jù)采集芯片同時(shí)采集的麥克風(fēng)語音信號(hào)和喉部送話器語音信號(hào),并送入噪聲模型估計(jì)模塊進(jìn)行噪聲模型的估計(jì);步驟2.2:利用非空氣傳導(dǎo)語音傳感器檢測的語音數(shù)據(jù)進(jìn)行語音的端點(diǎn)檢測。由于非空氣傳導(dǎo)語音傳感器檢測的語音信號(hào)不受聲學(xué)環(huán)境噪聲的影響,因此可以在有聲學(xué)噪聲的環(huán)境下準(zhǔn)確地檢測出語音的端點(diǎn)。語音端點(diǎn)檢測有多種方法,上述實(shí)施例中,采用經(jīng)典的基于能量和過零率的方法對喉部送話器檢測到的語音進(jìn)行端點(diǎn)檢測;步驟2.3:依據(jù)步驟2.2檢測的語音端點(diǎn),提取空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段。由于空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音同步采集,因此兩者語音的端點(diǎn)在時(shí)間上是 一致,依據(jù)步驟2.2檢測的語音端點(diǎn)可以檢測出空氣傳導(dǎo)語音傳感器檢測語音的無話音段,即純噪聲信號(hào)。步驟2.4:利用步驟2.3中得到的空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段數(shù)據(jù),估計(jì)噪聲的統(tǒng)計(jì)模型。上述實(shí)施例中,僅對噪聲的聲道參數(shù)進(jìn)行建模,建模模型采用單高斯函數(shù),提取若干幀純噪聲信號(hào)的聲道參數(shù)并計(jì)算其均值和方差,即可得到噪聲聲道參數(shù)的高斯模型。步驟3:利用步驟2得到的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正,使其與當(dāng)前的使用環(huán)境匹配。上述步驟在聯(lián)合模型修正模塊完成,根據(jù)空氣傳導(dǎo)語音傳感器檢測語音信號(hào)的噪聲模型和步驟I中訓(xùn)練得到的聲道參數(shù)聯(lián)合模型,采用模型補(bǔ)償技術(shù)對聲道參數(shù)聯(lián)合模型的參數(shù)進(jìn)行修正,使其與當(dāng)前的使用環(huán)境匹配。上述實(shí)施例中,非空氣傳導(dǎo)傳感器檢測語音被認(rèn)為未受到聲學(xué)噪聲的影響,因此非空氣傳導(dǎo)傳感器檢測語音中的噪聲設(shè)置為0,模型補(bǔ)償中所用到的噪聲參數(shù)均按此設(shè)置提取。此外,聲道參數(shù)聯(lián)合模型中的高斯模型先驗(yàn)概率保持不變,激勵(lì)參數(shù)的聯(lián)合模型不進(jìn)行修正。模型補(bǔ)償技術(shù)在語音識(shí)別中已得到廣泛的應(yīng)用,對于聲道參數(shù),上述實(shí)施例中采用了一種適用于線性預(yù)測系數(shù)(LPCC)的模型補(bǔ)償技術(shù)來對GMM中的高斯模型參數(shù)進(jìn)行修正(見參考文獻(xiàn):Ivandro Sanches.Noise-Compensated Hidden Markov Models.1EEETRANSACTIONS ON SPEECH AND AUDIO PROCESSING, 2000,8 (5):533_540),具體方法如下:(I)均值的補(bǔ)償令cs表示線性倒譜域中高斯模型的均值,則其修正按以下步驟來進(jìn)行:步驟3.1A:用式(I)將Cs從LPCC域變換到LPC域
權(quán)利要求1.一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其特征在于包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置,空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器均各自與多路數(shù)據(jù)采集模塊連接,多路數(shù)據(jù)采集模塊與數(shù)據(jù)處理裝置連接,其中,空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號(hào),多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號(hào),數(shù)據(jù)處理裝置用于對多路數(shù)據(jù)采集模塊采集的數(shù)據(jù)進(jìn)行處理并對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)并輸出。
2.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其特征在于所述數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊,空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接,噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接,聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接;其中,噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型,聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正,語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng),聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型,并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整。
3.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其特征在于所述數(shù)據(jù)處理裝置包括DSP處理芯片。
4.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其特征在于所述多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片。
5.根據(jù)權(quán)利要求Γ4任一項(xiàng)所述 的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,其特征在于所述空氣傳導(dǎo)語音傳感器采用麥克風(fēng),所述非空氣傳導(dǎo)語音傳感器采用喉部送話器。
專利摘要本實(shí)用新型公開一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置,所述裝置包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊、噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊,非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接,噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接,聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接。本實(shí)用新型與現(xiàn)有技術(shù)相比,具有體積更小,使用更方便,抗噪聲能力更強(qiáng),語音質(zhì)量更好等優(yōu)點(diǎn)。
文檔編號(hào)G10L25/84GK203165457SQ201320107350
公開日2013年8月28日 申請日期2013年3月8日 優(yōu)先權(quán)日2013年3月8日
發(fā)明者張軍, 朱穎莉, 寧更新, 馮義志, 余華, 韋崗 申請人:華南理工大學(xué)