一種基于dct的語音篡改恢復方法

文檔序號：9548990閱讀：592來源：國知局

一種基于dct的語音篡改恢復方法
【技術領域】
[0001] 本發明在給出了一種對語音內容真實性和完整性認證方法的同時，給出了對被攻擊信號進行篡改恢復的方法，保障了數字語音內容的安全性，對被攻擊內容的恢復使語音的內容更真實可靠。
【背景技術】
[0002] 數字語音信號作為一種信息載體廣泛應用在電話通訊、新聞報導等方面，已經成為人們日常生活不可分割的一部分。由于自身特點等原因，語音信號容易引起攻擊者的興趣而被攻擊，被攻擊的信號表達的意義和原始信號會有很大區別，甚至完全相反。這些給人們的生活帶來了不便，增加了不和諧因素。于是，需要一種技術來對語音信號的真實性和完整性進行認證。同時，對被攻擊信號的篡改恢復，將給人們的生活帶來諸多便利。因此，可恢復的語音內容認證算法更具有研究意義和實用價值。
[0003] 文南犬 "Authenticity examination of compressed audio recordings using detection of multiple compression and encoders' identification" （Korycki R，Forensic Science International. Vol. 238, pp. 33-46, 2014)針對壓縮的音頻信號提出了一種內容認證算法，基于MDCT系數的統計特征以及其它一些從壓縮信號中提取的參數來對音頻內容進行取證。該方法提高了水印系統的魯邦性。然而，由于認證過程需要大量的樣本進行訓練，限制了其在實際生活中的應用。文獻" Content-dependent watermarking scheme in compressed speech with identifying manner and location of attacks'，（Chen 0 T-C, Chia-Yi, Chia-Hsiung Liu, IEEE Transactions on Audio, Speech, and Language Processing. Vol. 15, no. 5, pp. 1605-1616, 2007)基于壓縮編碼技術提出了一種語音內容取證方法。一方面，該方法的水印信息在語音壓縮過程中生成，對于采用不同方法壓縮的語音信號，或者未被壓縮的信號，該方法沒有取證能力。另一方面，水印嵌入基于LSB的方法。由于LSB的水印嵌入方法是脆弱的，信號處理操作會被認為是惡意攻擊，于是該方法在應用中存在局限性。以上方法對于檢測到的惡意攻擊，都不具有篡改恢復的能力。為此，研究具有篡改恢復能力的數字語音取證技術，不僅具有重要研究意義和實用價值，對提高數字語音內容的可靠性也具有積極作用。

【發明內容】

[0004] 本發明的目的在于提供一種基于DCT的語音內容篡改恢復算法，該算法首先能夠對惡意攻擊進行有效監測并定位，然后對監測到的被攻擊內容進行篡改恢復，以此來實現數字語音內容的真實性和完整性認證，并提高數字語音認證的可靠性。
[0005] 為實現這樣的目的，本發明給出了基于DCT的數字語音壓縮方法，利用壓縮信號來恢復被攻擊的內容，設計了一種具有篡改恢復能力的數字語音取證方法。
[0006] -種基于DCT的數字語音篡改恢復方法，能夠對惡意攻擊進行有效監測并定位，以此來實現對數字語音內容的真實性和完整性取證，并通過對被攻擊內容的篡改恢復使取證的結果更加真實可信，包括如下具體步驟：
[0007] (1)信號壓縮：首先將原始語音信號A分為不重疊的P幀，第i幀記為A1;同時對A 進行重采樣操作，重采樣采用的采樣頻率F'小于原始信號采樣頻率F，采樣后的信號記為 A';接著將A'分為不重疊的P幀，并對每幀進行DCT ;取前M個低頻系數作為該幀的壓縮信號；將各幀的壓縮信號置亂，置亂后第i幀A1對應的壓縮信號記為C 1;
[0008] ⑵嵌入幀號和壓縮信號：將Ai分為4段，記為Al 42;、六3;和A4 i;A ;對應的幀號 i作為第i幀的標識嵌入在AljP A2 i中；同時，第i幀A i對應的壓縮信號C i嵌入到A3 4口八4沖；嵌入后的信號記為WA ;
[0009] (3)內容認證：首先將待檢測語音信號WA分為不重疊的P幀，第i幀記為1心;并將每幀分為4段，分別記為WAlpWASpWASjP WA4 1;從WAl JP WA2 i中提取幀號，同時從WA3 i 和歡七中提取壓縮信號。若從WAl JPWAS1中提取的幀號相同，同時，從WASjPWAl中提取壓縮信號也相同，則表明該幀的內容是真實的，并跳入第i+Ι幀WA 1+1進行內容認證操作；否則，則說明該幀被惡意攻擊；
[0010] (4)篡改恢復：在檢測到被攻擊的內容之后，搜索找到下一個能夠通過認證的幀，并提取該幀的幀號和上一個能通過認證的幀的幀號，兩個幀號之差就是被攻擊的信號；根據壓縮信號置亂的方法，找到被攻擊幀的壓縮信號嵌入的位置；提取壓縮信號并恢復被攻擊的內容，來實現篡改恢復。
[0011] 與現有的語音內容取證算法相比，本發明首先通過各幀的幀號來監測被攻擊的信號，提高了篡改定位的精度；通過提取與被攻擊信號對應的壓縮信號，來恢復被攻擊的內容，提高了算法的篡改恢復能力，也確保了被攻擊的信號的可讀性和認可度。既能夠篡改監測有能夠篡改恢復，有利于本發明在日常生活中的推廣應用。
【附圖說明】
[0012] 圖1為語音信號壓縮過程框圖。
[0013] 圖2為幀號和水印嵌入過程框圖。
[0014] 圖3為語音內容取證過程框圖。
[0015] 圖4為篡改定位和篡改恢復方法。
[0016] 圖5為本發明選取的含水印語音信號。
[0017] 圖6為刪除攻擊后的含水印語音信號。
[0018] 圖7為替換攻擊后的含水印語音信號。
[0019] 圖8為刪除攻擊后的篡改定位結果。
[0020] 圖9為替換攻擊后的篡改定位結果。
[0021] 圖10為刪除攻擊后的篡改恢復結果。
[0022] 圖11為替換攻擊后的篡改恢復結果。
[0023] 圖12為樣本值的分塊方法圖。
[0024] 圖13為樣本值分塊方法舉例圖。
[0025] 圖14為不同類型含水印語音信號的ODG值和SDG值圖。
[0026] 圖15為常規信號處理后水印提取的BER值圖。
【具體實施方式】
[0027] 以下結合附圖和實施例對本發明的技術方案作進一步描述。
[0028] 1、信號壓縮：
[0029] (1)將原始語音信號A = {ai，1彡1彡L}分為P幀，第i幀記為A1, A1 = {blit，1彡t彡L/P}，其中blit表示為A i的第t個樣本。
[0030] (2)對A進行重采樣操作，重采樣的采樣頻率F'小于原始信號采樣頻率F，采樣后的信號記為^，其長度記為UU =L /F。將Y分為不重疊的P幀，第i幀記為 Ar ,,
[0031] (3)對A' i進行DCT，所得系數記為D1= 彡j彡L' /P};取前M個系數并記為 Gi，Gi = {g i, j I gi, j = d i, jl < j < M}，M < < L ' /P。Gi 既是弟 i 幀 A ;壓縮后的{曰可。信號壓縮過程如圖1所示。
[0032] 2、嵌入幀號和壓縮信號：
[0033] (1)將 Aj為 4 段，分別記為 Al JPAS1 的長為 N，A3 JPA4^ 長為6M。將A3JP A4 i等分為M個子段，每個子段含有6個樣本點，第j個子段記為33/和 AA： . I ^ j ^ M0
[0034] ⑵第i幀幀號i表示為Yi= {y ^ y2,…，yN} 作為第i幀的標識。Y i中的各元素可以由下式得到：
[0035] i = Y1 · 10N ^y2IOn 2+··· +yN
[0036] 記Ali的前N個樣本點為al ^al2, "·，α1Ν。用y^y；；，"·，γΝ依次代替這N個樣本點的倒數第二位的整數值，以此來完成Y 1的嵌入。用同樣的方法將Y i嵌入到Α2 i中。
[0037] (3)對壓縮信號G1 (1彡i彡P)采用混沌地址索引的方法進行置亂。混沌序列由下式Logistic混沌映射生成，其中X。表示混沌序列的初值。
[0038] χ1+1= μ X J (I-X1), 3. 5699 μ 4
[0039] 記X = U11 I = 1, 2,…，Ρ}，將X1Q彡1彡Ρ)按照下式從大到小排列，其中c(l)

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：張帆;劉正輝;王靜;何俊杰;祁傳達;
技術所有人：信陽師范學院;
我是此專利的發明人

上一篇：一種基于智能終端的實時變聲方法
上一篇：使用對齊的前瞻部分將音頻信號編碼及解碼的裝置與方法

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！