專利名稱:一種語音模數轉換方法及裝置的制作方法
技術領域:
本發明涉及語音處理領域中的語音模擬信號轉換為數字信號的方法 及裝置,尤其涉及一種基于自適應增量調制編碼的數模轉換方法及裝置。
背景技術:
隨著多媒體技術和視頻電子產品的發展,攝像頭在多個領域得到越來
越多的應用,目前市場上的攝像頭主要是通過USB接口實現視頻流的傳輸 和在主機端的圖象顯示,大多數的攝像頭沒有音頻功能或是直接將麥克風 連接到電腦聲卡上作為音頻輸入,也有用較復雜、成本較高的音頻編解碼 器作為音頻模數轉換裝置。另外攝像頭的音頻功能的使用主要集中在語音 采樣編碼和傳輸上,經A/D轉換后得到的數字語音信號通過USB接口傳 送至PC,對帶寬上的要求不是很高。
自適應增量調制(ADM)是在增量調制的基礎上加入自適應功能的一 種調制方法,增量調制是對實際的采樣信號與預測的采樣信號之差的極性 進行編碼,其增量調制的量階是固定的,自適應增量調制根據輸入信號幅 度的變化大小,即斜率變化大小自動調整量階的大小,有效克服了增量調 制波形編碼過程中因斜率過大所產生的過載失真,同時可變的量階也減小 了量化噪聲。
相對于現有技術中經常使用的脈沖編碼調制(PCM)、增量求和調制 等A/D轉換技術來說,自適應增量調制在硬件實現上更為簡單,資源消耗 更小,但自適應增量調制也存在一定的缺點,主要表現在通過自適應增量 調制得到的語音數字信號信噪比仍然較低,在語音效果上還是有一定的差 距。
發明內容
本發明的目的是為了解決自適應增量調制編碼調制得到的語音數字信 號信噪比低、語音效果稍差的問題。
本發明公開了一種語音模數轉換方法,該方法包括-
步驟一對輸入的模擬語音信號與預測模擬語音信號的比較結果進行過采樣;
步驟二對采樣后輸出的數字語音信號進行自適應增量調制; 步驟三對經自適應增量調制的數字語音信號做降采樣濾波處理后輸出。
該方法所述步驟一之前還包括生成預測模擬語音信號的步驟。
所述的預測模擬語音信號通過對步驟二自適應增量調制的數字語音信 號進行D/A轉換后生成。
所述步驟二中的自適應增量調制是指根據數字語音信號變化規律做量 階調整,當語音信號波形斜率較大時相應增大量階,斜率較小時減小量階。
所述量階調整時若數字語音信號波形斜率過大且連續以默認最大量階 進行量化編碼,同時又未出現溢出,則將默認的量階最大值擴大一倍。
所述步驟三中降采樣濾波處理采用半帶濾波器多級級聯的方法。 一種應用如權利要求1所述方法的語音模數轉換裝置,其特征在于, 該裝置包括比較器101、采樣模塊102、增量調制模塊103、降采樣濾波模 塊104和D/A轉換模塊105;
模擬語音信號首先通過比較器101、采樣模塊102、增量調制模塊103、 D/A轉換模塊105和比較器101形成的反饋系統生成預測模擬語音信號, 所述預測模擬語音信號再與模擬語音信號一起輸入比較器101中進行比 較,比較后輸出的信號依次通過采樣模塊102、增量調制模塊103之后分 別輸入D/A轉換模塊105和降采樣濾波模塊104,其中經D/A轉換模塊 105生成預測模擬語音信號輸入至比較器IOI,經降采樣濾波模塊104降采 樣處理后再經數據線輸出。
所述降采樣濾波模塊104可采用兩級半帶濾波器級聯結構。 所述降采樣濾波模塊104可采用多級半帶濾波器級聯結構。
本發明提供了在自適應增量調制編碼基礎上的一種語音模數轉換方 法和裝置,所述方法中采用過采樣技術,在實際的芯片設計中容易實現, 由于語音信號本身的頻率較低,所以過采樣技術易于實現,當采樣間隔降 低到一定值時,相鄰兩個采樣點的差值就能降低到一定幅度之內,這樣就 可以更精確的近似跟蹤源信號,減小量化誤差;從頻譜的角度看,提高采 樣頻率可以降低信號頻帶內的噪聲功率,過采樣后的量化噪聲被擴展到較寬的頻帶范圍內,而在信號頻帶內信號功率未發生變化,由此提高了信號 信噪比。
本發明所述裝置通過設置采樣模塊102,對信號采用過采樣技術,減 少量化誤差;在增量調制模塊103中設置量階控制模塊201,實現可變的 最大量階步長,在信號斜率過大的情況下進一步減小過載失真,同時在斜 率變化較小時保證量化噪聲足夠小;對自適應增量調制的數字語音信號做 降采樣濾波處理,降低到合適的采樣速率,消除一部分高頻噪聲,提高信 噪比。
圖1是本發明具體實施方式
結構示意圖。
具體實施例方式
下面結合附圖對本發明的具體實施方式
做詳細描述。
本發明所述語音模數轉換裝置,如圖1所示,包括比較器IOI、采樣 模塊102、增量調制模塊103、降采樣濾波模塊104和D/A轉換模塊105;
其中,增量調制模塊103包括量階控制模塊201和積分器202;降采 樣濾波模塊104采用了兩級或多級半帶濾波器級聯形式。
所述語音模數轉換裝置的具體工作流程如下
首先,模擬語音信號XI (t)輸入比較器101,與預測模擬語音信號 X2 (t)在比較器IOI中做比較;其中所述預測模擬語音信號X2 (t)是經 采樣模塊102采樣,增量調制模塊103調制,且經D/A轉換模塊105轉換 后得到的模擬語音信號。
然后,將比較后得到的模擬語音信號e (t)在采樣模塊102通過過采 樣頻率進行采樣,得到lbit的l、 O信號,即ADM碼流,l表示輸入信號 幅度大于預測信號,O表示輸入信號幅度小于預測信號。
將所述采樣后得到的數字采樣信號e (n)輸入增量調制模塊103,在 增量調制模塊103中,量階控制模塊201輸出的可變量階的最大值通常是 一個默認值,在本實施方式中,經過過采樣后,由于采樣間隔減小,所需 的量階也相應變小,假定默認量階的最大值為2n,若出現斜率過大,連續 出現以默認最大量階進行量化編碼的情況,同時又未出現溢出,則將默認 的量階最大值擴大一倍。量階控制模塊201根據采樣得到的數字采樣信號的變化規律做相應的量階調整,如果連續出現使用3次默認最大量階做積 分則將量階的最大值擴大一倍,并將調整后信號輸入積分器202積分得到 預測數字語音信號x[n],預測數字語音信號x[n]被分別輸入到降采樣濾波 模塊104和D/A轉換模塊105。
輸入到D/A轉換模塊105的預測數字語音信號x[n]經轉換后輸出預測 模擬信號X2(t),所述預測模擬信號X2(t)被輸入到比較器101中作為與模 擬語音信號Xl(t)相比較的信號,在此比較器101、采樣模塊102、增量調 制模塊103、 D/A轉換模塊105和比較器101形成一個循環反饋系統。
預測數字語音信號x[n]同時被輸入降采樣濾波模塊104,由于之前的 處理過程中使用了過采樣技術,所以還需通過降采樣處理將采樣頻率降到 合適的頻率上,在此處可采用半帶濾波器多級級聯的形式,預測數字語音 信號x[n]每經過一級濾波處理同時降低一半的采樣率,在級聯的半帶濾波 器的選擇上要求最后一級的半帶FIR濾波器有較好的滾降系數,較窄的過 渡帶帶寬。本實施例采用的是兩級濾波器級聯的結構。
最后將從降采樣濾波模塊104輸出的語音信號通過數據線送至PC機 播放、傳輸或錄音。
本發明還提供了一種在消耗較小的資源代價的前提下得到適用于語音 對話傳輸和錄音等功能的語音模數轉換的方法,本實施例結合攝像頭DSP 芯片對語音模數轉換的方法做詳細描述。
步驟一、對輸入的模擬語音信號Xl(t)與預測模擬語音信號X2(t)的比 較結果進行過采樣;
此步驟中,通過采用過采樣技術提高采樣率達到減小量化誤差的目的, 由于語音信號本身的頻率較低,所以過采樣技術容易實現,在系統中給予 音頻裝置部分更高的時鐘頻率,充分利用系統本身的時鐘資源;當采樣間 隔降低到一定值時,相鄰兩個采樣點的插值就能降低到一定幅度之內,這 樣就可以更精確的近似跟蹤原信號,減小量化誤差;同時,提高采樣率可 以降低信號頻帶內的噪聲功率,過采樣后的量化噪聲被擴展到較寬的頻帶 范圍內,而在信號頻帶內信號功率未發生改變,由此可以提高信噪比。
步驟二、根據輸入增量調制模塊103中的信號e(n)變化規律做相應的 量階調整;
自適應增量調制ADM —個重要的特性就是采用了可變的量階來應對 不同斜率情況下的失真問題。在語音波形斜率較大時相應增大量階,斜率較小時減小量階;為了實現量階以2倍的數值取值,通常可變量階的最大 值是一個默認值,目的是為了防止輸入波形幅度過大超出增量調制的范圍 時,產生溢出導致量階持續增大。在本發明中,經過過采樣后,由于采樣 間隔減小,所需的量階也相應變小,假定默認量階的最大值為2m,若出 現斜率過大,連續以默認最大量階進行量化編碼的情況,同時又未出現溢 出,則將默認的量階最大值擴大一倍;在處理一般的語音信號幅度變化時, 使用默認的較小的量階,使得量化噪聲較小,對一些比較特殊的存在幅度 變化較大的情況下通過擴大到最大量階的值來減小過載失真。
步驟三、對自適應增量調制的數字語音信號做降采樣濾波處理;
此步驟中,做降采樣濾波處理,將語音信號降低到合適的采樣頻率, 消除一部分高頻噪聲,提高信噪比。
經過步驟一過采樣和步驟二自適應增量調制之后需要將得到的語音信 號降采樣并濾波,降低采樣率以節約帶寬,同時對信號做濾波處理也可消 除一部分高頻噪聲,提高了信噪比,減少失真,使得波形更加平滑,本發 明在此步驟中采用了多級級聯的半帶濾波器實現所述功能。
步驟四、數字語音信號輸出。
將經過降采樣濾波處理后的數字音頻信號通過USB總線送至PC機播 放或錄音等。
本發明所述的語音模數轉換的方法及其實現裝置可具體結合攝像頭 DSP芯片,在充分利用資源的情況下,使攝像頭具有音頻功能,并將得到 的語音信號通過USB接口傳至PC,且對帶寬上要求不高。
以上內容是結合具體的優選實施方式對本發明所作的進一步詳細說 明,不能認定本發明的具體實施只局限于這些說明。對于本發明所屬技術 領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若 千簡單推演或替換,都應當視為屬于本發明的保護范圍。
8
權利要求
1、一種語音模數轉換方法,該方法包括步驟一對輸入的模擬語音信號與預測模擬語音信號的比較結果進行過采樣;步驟二對采樣后輸出的數字語音信號進行自適應增量調制;步驟三對經自適應增量調制的數字語音信號做降采樣濾波處理后輸出。
2、 根據權利要求1所述的一種語音模數轉換方法,其特征在于該方法所 述步驟一之前還包括生成預測模擬語音信號的步驟。
3、 根據權利要求2所述的一種語音模數轉換方法,其特征在于所述的預 測模擬語音信號通過對步驟二自適應增量調制的數字語音信號進行D/A轉換后 生成。
4、 如權利要求1所述一種語音模數轉換方法,其特征在于,所述步驟二中 的自適應增量調制是指根據數字語音信號變化規律做量階調整,當語音信號波 形斜率較大時相應增大量階,斜率較小時減小量階。
5、 如權利要求4所述一種語音模數轉換方法,其特征在于,所述量階調整時若數字語音信號波形斜率過大且連續以默認最大量階進行量化編碼,同時又 未出現溢出,則將默認的量階最大值擴大一倍。
6、 如權利要求1所述一種語音模數轉換方法,其特征在于,所述步驟三中降采樣濾波處理采用半帶濾波器多級級聯的方法。
7、 一種應用如權利要求1所述方法的語音模數轉換裝置,其特征在于,該 裝置包括比較器(101)、采樣模塊(102)、增量調制模塊(103)、降采樣濾波 模塊(104)和D/A轉換模塊(105);模擬語音信號首先通過比較器(101)、采樣模塊(102)、增量調制模塊(103)、 D/A轉換模塊(105)和比較器(101)形成的反饋系統生成預測模擬語音信號, 所述預測模擬語音信號再與模擬語音信號一起輸入比較器(101)中進行比較, 比較后輸出的信號依次通過采樣模塊(102)、增量調制模塊(103)之后分別輸 入D/A轉換模塊(105)和降采樣濾波模塊(104),其中經D/A轉換模塊(105) 生成預測模擬語音信號輸入至比較器(101),經降采樣濾波模塊(104)降采樣 處理后再經數據線輸出。
8、 如權利要求7所述一種語音模數轉換的裝置,其特征在于,所述增量調 制模塊(103)包括量階控制模塊(201)和積分器(202),量階控制模塊(201) 根據采樣得到的數字采樣信號的變化規律做量階調整,并將調整后的信號輸入 積分器(202)積分得到預測數字語音信號。
9、如權利要求7所述一種語音模數轉換的裝置,其特征在于,所述降采樣濾波模塊(104)可采用兩級半帶濾波器級聯結構。
10、如權利要求7所述一種語音模數轉換的裝置,其特征在于,所述降采 樣濾波模塊(104)可采用多級半帶濾波器級聯結構。
全文摘要
本發明公開了一種語音模數轉換方法,首先對輸入的模擬語音信號與預測模擬語音信號的比較結果進行過采樣,然后對采樣后輸出的數字語音信號進行自適應增量調制,最后對經自適應增量調制的數字語音信號做降采樣濾波處理后輸出。所述方法中采用過采樣技術,在實際的芯片中容易實現,由于語音信號本身的頻率較低,所以過采樣技術容易實現,當采樣間隔降低到一定值時,相鄰兩個采樣點的差值就能降低到一定幅度之內,可以更精確的近似跟蹤源信號,減小量化誤差;提高采樣頻率可以降低信號頻帶內的噪聲功率,過采樣后的量化噪聲被擴展到較寬的頻帶范圍內,而在信號頻帶內信號功率未發生變化,由此提高了信號信噪比。
文檔編號G10L19/14GK101499282SQ200810065328
公開日2009年8月5日 申請日期2008年2月3日 優先權日2008年2月3日
發明者劉敬波, 亮 彭, 李漢光, 嶺 石, 羅碧強, 亮 胡 申請人:深圳艾科創新微電子有限公司