一種基于dct的語音篡改恢復方法
【技術領域】
[0001] 本發明在給出了一種對語音內容真實性和完整性認證方法的同時,給出了對被攻 擊信號進行篡改恢復的方法,保障了數字語音內容的安全性,對被攻擊內容的恢復使語音 的內容更真實可靠。
【背景技術】
[0002] 數字語音信號作為一種信息載體廣泛應用在電話通訊、新聞報導等方面,已經成 為人們日常生活不可分割的一部分。由于自身特點等原因,語音信號容易引起攻擊者的興 趣而被攻擊,被攻擊的信號表達的意義和原始信號會有很大區別,甚至完全相反。這些給人 們的生活帶來了不便,增加了不和諧因素。于是,需要一種技術來對語音信號的真實性和完 整性進行認證。同時,對被攻擊信號的篡改恢復,將給人們的生活帶來諸多便利。因此,可 恢復的語音內容認證算法更具有研究意義和實用價值。
[0003] 文南犬 "Authenticity examination of compressed audio recordings using detection of multiple compression and encoders' identification" (Korycki R,Forensic Science International. Vol. 238, pp. 33-46, 2014)針對壓縮的音頻信號 提出了一種內容認證算法,基于MDCT系數的統計特征以及其它一些從壓縮信號中提取 的參數來對音頻內容進行取證。該方法提高了水印系統的魯邦性。然而,由于認證過程 需要大量的樣本進行訓練,限制了其在實際生活中的應用。文獻" Content-dependent watermarking scheme in compressed speech with identifying manner and location of attacks',(Chen 0 T-C, Chia-Yi, Chia-Hsiung Liu, IEEE Transactions on Audio, Speech, and Language Processing. Vol. 15, no. 5, pp. 1605-1616, 2007)基于壓縮編 碼技術提出了一種語音內容取證方法。一方面,該方法的水印信息在語音壓縮過程中生成, 對于采用不同方法壓縮的語音信號,或者未被壓縮的信號,該方法沒有取證能力。另一方 面,水印嵌入基于LSB的方法。由于LSB的水印嵌入方法是脆弱的,信號處理操作會被認 為是惡意攻擊,于是該方法在應用中存在局限性。以上方法對于檢測到的惡意攻擊,都不具 有篡改恢復的能力。為此,研究具有篡改恢復能力的數字語音取證技術,不僅具有重要研究 意義和實用價值,對提高數字語音內容的可靠性也具有積極作用。
【發明內容】
[0004] 本發明的目的在于提供一種基于DCT的語音內容篡改恢復算法,該算法首先能夠 對惡意攻擊進行有效監測并定位,然后對監測到的被攻擊內容進行篡改恢復,以此來實現 數字語音內容的真實性和完整性認證,并提高數字語音認證的可靠性。
[0005] 為實現這樣的目的,本發明給出了基于DCT的數字語音壓縮方法,利用壓縮信號 來恢復被攻擊的內容,設計了一種具有篡改恢復能力的數字語音取證方法。
[0006] -種基于DCT的數字語音篡改恢復方法,能夠對惡意攻擊進行有效監測并定位, 以此來實現對數字語音內容的真實性和完整性取證,并通過對被攻擊內容的篡改恢復使取 證的結果更加真實可信,包括如下具體步驟:
[0007] (1)信號壓縮:首先將原始語音信號A分為不重疊的P幀,第i幀記為A1;同時對A 進行重采樣操作,重采樣采用的采樣頻率F'小于原始信號采樣頻率F,采樣后的信號記為 A';接著將A'分為不重疊的P幀,并對每幀進行DCT ;取前M個低頻系數作為該幀的壓縮 信號;將各幀的壓縮信號置亂,置亂后第i幀A1對應的壓縮信號記為C 1;
[0008] ⑵嵌入幀號和壓縮信號:將Ai分為4段,記為Al 42;、六3;和A4 i;A ;對應的幀號 i作為第i幀的標識嵌入在AljP A2 i中;同時,第i幀A i對應的壓縮信號C i嵌入到A3 4口 八4沖;嵌入后的信號記為WA ;
[0009] (3)內容認證:首先將待檢測語音信號WA分為不重疊的P幀,第i幀記為1心;并 將每幀分為4段,分別記為WAlpWASpWASjP WA4 1;從WAl JP WA2 i中提取幀號,同時從WA3 i 和歡七中提取壓縮信號。若從WAl JPWAS1中提取的幀號相同,同時,從WASjPWAl中提 取壓縮信號也相同,則表明該幀的內容是真實的,并跳入第i+Ι幀WA 1+1進行內容認證操作; 否則,則說明該幀被惡意攻擊;
[0010] (4)篡改恢復:在檢測到被攻擊的內容之后,搜索找到下一個能夠通過認證的幀, 并提取該幀的幀號和上一個能通過認證的幀的幀號,兩個幀號之差就是被攻擊的信號;根 據壓縮信號置亂的方法,找到被攻擊幀的壓縮信號嵌入的位置;提取壓縮信號并恢復被攻 擊的內容,來實現篡改恢復。
[0011] 與現有的語音內容取證算法相比,本發明首先通過各幀的幀號來監測被攻擊的信 號,提高了篡改定位的精度;通過提取與被攻擊信號對應的壓縮信號,來恢復被攻擊的內 容,提高了算法的篡改恢復能力,也確保了被攻擊的信號的可讀性和認可度。既能夠篡改監 測有能夠篡改恢復,有利于本發明在日常生活中的推廣應用。
【附圖說明】
[0012] 圖1為語音信號壓縮過程框圖。
[0013] 圖2為幀號和水印嵌入過程框圖。
[0014] 圖3為語音內容取證過程框圖。
[0015] 圖4為篡改定位和篡改恢復方法。
[0016] 圖5為本發明選取的含水印語音信號。
[0017] 圖6為刪除攻擊后的含水印語音信號。
[0018] 圖7為替換攻擊后的含水印語音信號。
[0019] 圖8為刪除攻擊后的篡改定位結果。
[0020] 圖9為替換攻擊后的篡改定位結果。
[0021] 圖10為刪除攻擊后的篡改恢復結果。
[0022] 圖11為替換攻擊后的篡改恢復結果。
[0023] 圖12為樣本值的分塊方法圖。
[0024] 圖13為樣本值分塊方法舉例圖。
[0025] 圖14為不同類型含水印語音信號的ODG值和SDG值圖。
[0026] 圖15為常規信號處理后水印提取的BER值圖。
【具體實施方式】
[0027] 以下結合附圖和實施例對本發明的技術方案作進一步描述。
[0028] 1、信號壓縮:
[0029] (1)將原始語音信號A = {ai,1彡1彡L}分為P幀,第i幀記為A1, A1 = {blit,1彡t彡L/P},其中blit表示為A i的第t個樣本。
[0030] (2)對A進行重采樣操作,重采樣的采樣頻率F'小于原始信號采樣頻率F,采樣后 的信號記為^,其長度記為UU =L /F。將Y分為不重疊的P幀,第i幀記為 Ar ,,
[0031] (3)對A' i進行DCT,所得系數記為D1= 彡j彡L' /P};取前M個系數并 記為 Gi,Gi = {g i, j I gi, j = d i, jl < j < M},M < < L ' /P。Gi 既是弟 i 幀 A ;壓縮后的{曰可。 信號壓縮過程如圖1所示。
[0032] 2、嵌入幀號和壓縮信號:
[0033] (1)將 Aj為 4 段,分別記為 Al JPAS1 的長為 N,A3 JPA4^ 長為6M。將A3JP A4 i等分為M個子段,每個子段含有6個樣本點,第j個子段記為33/和 AA: . I ^ j ^ M0
[0034] ⑵第i幀幀號i表示為Yi= {y ^ y2,…,yN} 作為第i幀的標識。Y i中的各元 素可以由下式得到:
[0035] i = Y1 · 10N ^y2IOn 2+··· +yN
[0036] 記Ali的前N個樣本點為al ^al2, "·,α1Ν。用y^y;;,"·,γΝ依次代替這N個樣本點 的倒數第二位的整數值,以此來完成Y 1的嵌入。用同樣的方法將Y i嵌入到Α2 i中。
[0037] (3)對壓縮信號G1 (1彡i彡P)采用混沌地址索引的方法進行置亂。混沌序列由 下式Logistic混沌映射生成,其中X。表示混沌序列的初值。
[0038] χ1+1= μ X J (I-X1), 3. 5699 μ 4
[0039] 記X = U11 I = 1, 2,…,Ρ},將X1Q彡1彡Ρ)按照下式從大到小排列,其中c(l)