一種基于C-MAC特征的AACHuffman域隱寫分析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字媒體信息內(nèi)容安全技術(shù)領(lǐng)域,特別涉及一種判別AAC音頻是否經(jīng) 過秘密信息隱寫的方法。 技術(shù)背景:
[0002] 在移動通信中,各類音頻和語音會話業(yè)務(wù)已經(jīng)占據(jù)了巨大比例。3GPP組織指定采 用AAC(Advanced Audio Coding,高級音頻編碼)作為移動互聯(lián)網(wǎng)的音頻壓縮編碼標(biāo)準(zhǔn)之 一,使得AAC壓縮音頻數(shù)據(jù)在網(wǎng)絡(luò)上被大量的傳播,同時面向AAC音頻的隱寫算法也逐漸涌 現(xiàn),給音頻隱寫分析帶來了新的挑戰(zhàn)。與MP3相比,AAC的壓縮性能更加高效,已經(jīng)被各大平 臺所支持,如YouTube,iPhone等。AAC的隱寫嵌入域主要包括MDCT系數(shù)、量化參數(shù)以及 Huff man域等。AAC音頻Huffman編碼過程是對量化后MDCT系數(shù)進(jìn)行無損壓縮編碼,通過對 MDCT系數(shù)進(jìn)行比例因子帶劃分和分區(qū)合并,為每個比例因子帶選擇合適的碼書進(jìn)行編碼, 實(shí)現(xiàn)數(shù)據(jù)的高效壓縮。通過對已有的針對Huffman域的隱寫算法進(jìn)行分析發(fā)現(xiàn),平均嵌入容 量可達(dá)到0.6Kb/s。由于隱寫算法僅對碼書的選擇進(jìn)行調(diào)整,且Huffman編碼是無損編碼,因 此通過對Huffman碼書的修改不會對聽覺感知造成影響,具有良好的隱蔽性和嵌入容量。
[0003] 目前針對AACHuffman域的隱寫分析方法還未見公開文獻(xiàn)。由于Huffman域隱寫算 法僅對比例因子帶碼書進(jìn)行修改,并沒有改變相應(yīng)的MDCT系數(shù)值,因此現(xiàn)有的針對AAC音頻 MDCT系數(shù)的隱寫分析方法并不適用。
[0004] 在AAC首頻Huffman編碼過程中,碼書的選擇是以編碼后比特?cái)?shù)最少為目標(biāo)的,而 針對Huffman域的隱寫方法通過對碼書的控制性選擇,一定會導(dǎo)致碼書之間的相關(guān)統(tǒng)計(jì)特 性發(fā)生變化?;谝陨峡紤],采用基于幀內(nèi)相鄰比例因子帶碼書的Markov轉(zhuǎn)移概率矩陣作 為隱寫分析特征,可實(shí)現(xiàn)針對Huffman域碼書選擇的隱寫方法的有效檢測。為了減少音頻內(nèi) 容對碼書轉(zhuǎn)移概率的影響,使特征更加穩(wěn)定,引入重壓縮校準(zhǔn)機(jī)制來提高隱寫分析特征的 敏感性。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對目前面向AAC隱寫分析方法相對缺少的問題,本發(fā)明提出了一種C-MAC 特征的AAC Huffman域隱寫分析方法。
[0006] 本發(fā)明所采用的技術(shù)方案是:一種基于C-MAC特征的AACHuffman域隱寫分析方法, 其特征在于:針對AAC音頻Huffman域的兩種修改比例因子帶碼書的隱寫算法,提出基于重 壓縮校準(zhǔn)的相鄰比例因子帶碼書間轉(zhuǎn)移概率的AAC隱寫分析特征,采用支持向量機(jī)進(jìn)行分 類預(yù)測,實(shí)現(xiàn)了面向AAC Huffman域的隱寫分析;其具體實(shí)現(xiàn)包括以下步驟:
[0007] 步驟1:獲得待測AAC音頻片段此的碼率R;
[0008] 步驟2:針對此中每個數(shù)據(jù)幀提取其比例因子帶的碼書序號,構(gòu)建碼書序列0:,計(jì)算 序列 Dj^MAC 特征 MAC-Fi;
[0009] 步驟3:對仏片段進(jìn)行R碼率重壓縮,即對Ml進(jìn)行解碼,獲得解碼后的WAV音頻,再對 WAV音頻采用施的編碼碼率R進(jìn)行AAC編碼壓縮獲得校準(zhǔn)后AAC音頻M2;
[0010] 步驟4:對M2音頻提取MAC特征MAC-F2;
[0011] 步驟5:計(jì)算MAC-F^MAC-F2的差值,獲得施音頻片段的C-MAC隱寫分析特征;
[0012] 步驟6:分類器訓(xùn)練;
[0013]步驟7:隱寫分析檢測。
[0014] 作為優(yōu)選,步驟2的具體實(shí)現(xiàn)過程為:
[0015] 將AAC音頻幀中所有比例因子帶碼書序號記為S={C1. . .Cj. . .CN},其中表示按 時序順序排列在第j個位置的碼書序號,W e [ 1,10];采用一階Markov鏈對幀內(nèi)比例因子帶 碼書序號S進(jìn)行建模,用狀態(tài)轉(zhuǎn)移概率對碼書出現(xiàn)的相關(guān)性進(jìn)行量化表示;以碼書的序號作 為Markov鏈的狀態(tài),則相鄰碼書之間狀態(tài)的轉(zhuǎn)移概率為:
[0017] 其中Pra/e表示當(dāng)?shù)趈個碼書序號是β時,第j+Ι個碼書序號為α的概率:
[0018] 根據(jù)公式1,對于碼書序列S,可獲得一個102維的狀態(tài)轉(zhuǎn)移矩陣A1J:
[0020] 其中元素 eij表示序列S中第i個碼書轉(zhuǎn)移到第j個碼書的概率,通過提取AAC音頻中 幀內(nèi)比例因子帶Huffman碼書Markov轉(zhuǎn)移概率矩陣,即MAC特征矩陣,作為對Huffman碼書修 改隱寫分分類特征;
[0021] 作為優(yōu)選,步驟5的具體實(shí)現(xiàn)包括以下子步驟:
[0022] 步驟5.1:引入重壓縮校準(zhǔn)機(jī)制構(gòu)建C-MAC特征矩陣;
[0023] 將待測音頻重壓縮前后的MAC特征矩陣進(jìn)行差值計(jì)算所獲得的校準(zhǔn)后MAC特征,即 C-MAC特征;
[0024] 步驟5.2:基于長短幀分布的特征融合;
[0025] 將AAC數(shù)據(jù)幀分為2個集合:長幀集合Fi和短幀集合Fs,對其分別構(gòu)造 C-MAC特征矩 陣Μι和Ms,其中,M, = …,…,, = {s的,s圬sb/,...,5的},為長 幀集合Fi中第i個比例因子帶碼書序號,N為內(nèi)比例因子帶數(shù)量,為短幀集合Fs中第j 個比例因子帶碼書序號,Μ為匕幀內(nèi)比例因子帶數(shù)量;在構(gòu)建隱寫分析特征時,對長幀集合h 和短幀集合Fs分別進(jìn)行處理,提取總共2*10*10 = 200維隱寫分析特征矩陣。
[0026] 作為優(yōu)選,步驟6的具體實(shí)現(xiàn)包括以下步驟:
[0027] 步驟6.1:輸入WAV樣本,分別生成cover樣本和對應(yīng)的stego樣本,并按照步驟5.1 中的方法提取C-MAC分類特征;
[0028] 步驟6.2:經(jīng)過步驟6.1過程后,得到訓(xùn)練集樣本和數(shù)量相等的兩種不同嵌入算法 的載密樣本,然后隨機(jī)選擇不同數(shù)量的stego樣本和cover樣本使用SVM分類器訓(xùn)練隱寫分 析模型。
[0029] 作為優(yōu)選,步驟7的具體實(shí)現(xiàn)包括以下步驟:
[0030] 步驟7.1:提取待測樣本的隱寫分析特征集合;
[0031 ]步驟7.2:將特征輸入構(gòu)建好的隱寫分析模型,得到樣本的隱寫判斷結(jié)果。
[0032]相對于現(xiàn)有技術(shù),本發(fā)明的有益效果為:
[0033]根據(jù)目前調(diào)研結(jié)果,針對AAC Huffman域的隱寫分析方法還未見公開文獻(xiàn),本發(fā)明 針對AAC Huffman域提出了一種新的隱寫分析方法,針對基于Huffman碼書的隱寫方法具有 較好的檢測效果,針對文獻(xiàn)[1]和文獻(xiàn)[2]的隱寫算法,在相對嵌入率達(dá)到50%時,檢測正確 率可達(dá)95%以上。并且,本發(fā)明提出的隱寫分析方法具有較好的魯棒性,不受編碼碼率及編 碼器類型的影響。
[0034] [文獻(xiàn)1 ] Zhu J,Wang R,Li J,et al · A Huffman coding sect ion-based steganography for AAC audio[J]. Information Technology Journal.2011,10(10): 1983-1988.
[0035] [文南犬 2]Tang B T , Guo L , Liu Z H. An information hiding method in advanced audio coding(AAC)[J].Technical Acoustics,2008,27(4):533-538.
【附圖說明】
[0036] 圖1是本發(fā)明現(xiàn)有技術(shù)的AAC編解碼流程圖;
[0037] 圖2是本發(fā)明實(shí)施例的載體音頻與載密音頻的MAC特征(96kbps,文獻(xiàn)[1 ]算法);
[0038] 圖3是本發(fā)明實(shí)施例的載體音頻與載密音頻的MAC特征(96kbps,文獻(xiàn)[2]算法);
[0039] 圖4是本發(fā)明實(shí)施例的載體音頻與載密音頻的C-MAC特征(96kbps,文獻(xiàn)[1 ]算法);
[0040] 圖5是本發(fā)明實(shí)施例的載體音頻與載密音頻的C-MAC特征(96kbps,文獻(xiàn)[2]算法);
[0041] 圖6是本發(fā)明實(shí)施例的隱寫分析特征提取流程圖。
【具體實(shí)施方式】
[0042]為了便于本領(lǐng)域普通技術(shù)人員理解和實(shí)施本發(fā)明,下面結(jié)合附圖及實(shí)施例對本發(fā) 明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實(shí)施示例僅用于說明和解釋本發(fā)明,并不 用于限定本發(fā)明。
[0043]本發(fā)明的隱寫分析檢測方法基于AAC音頻,在
【發(fā)明內(nèi)容】
陳述之前需要對AAC的編解 碼原理進(jìn)行介紹。
[0044] 請見圖1,為AAC編碼原理示意圖,其編碼過程包括5個主要步驟:心理聲學(xué)模型分 析、濾波器MDCT變換、TNS預(yù)測等可選編碼模塊、MDCT系數(shù)量化和Huffman編碼;其中MDCT變 換和量化過程是AAC編碼的核心處理過程。AAC采用時域混疊編碼方式,對輸入的脈沖編碼 調(diào)制時域信號進(jìn)行分幀操作,每幀1024個抽樣信號,與前一幀共同構(gòu)成2048個抽樣信號,對 這2048個抽象信號進(jìn)行加窗操作和MDCT變換獲得1024個MDCT系數(shù)。心理聲學(xué)模型與濾波器 并行工作,通過對輸入的時域信號進(jìn)行臨界頻帶間的掩蔽效應(yīng)計(jì)算,得到相應(yīng)的感知熵 (PE)以確定加窗操作中的窗類型,并確定每次進(jìn)行MDCT變換的長度。對得到的1024個MDCT 數(shù)據(jù)進(jìn)行時域噪聲整形(TNS)、預(yù)測、量化、Huffman編碼等過程生成音頻壓縮碼流,通過AAC 格式標(biāo)準(zhǔn)格式封裝成AAC壓縮數(shù)據(jù),進(jìn)行實(shí)時傳輸或存儲;相關(guān)術(shù)語解釋如下表1;
[0045]表1相關(guān)術(shù)語解釋
[0046]
[0047] 基于上述理論,本發(fā)明提供的一種基于C-MAC特征的AACHu f f man域隱寫分析方法, 其特征在于:針對AAC音頻Huffman域的兩種修改比例因子帶碼書的隱寫算法,提出基于重 壓縮校準(zhǔn)的相鄰比例因子帶碼書間轉(zhuǎn)移概率的AAC隱寫分析特征,采用支持向量機(jī)進(jìn)行分 類預(yù)測,實(shí)現(xiàn)了面向AAC Huffman域的隱寫分析;
[0048] 請見圖6,本發(fā)明的具體實(shí)現(xiàn)包括以下步驟:
[0049] 步驟1:獲得待測AAC音頻片段此的碼率R;
[0050] 步驟2:針對此中每個數(shù)據(jù)幀提取其比例因子帶的碼書序號,構(gòu)建碼書序列0:,計(jì)算 序列 Dj^MAC 特征 MAC-Fi;
[0051 ] 步驟3:對仏片段進(jìn)行R碼率重壓縮,即對Ml進(jìn)行解碼,獲得解碼后的WAV音頻,再對 WAV音頻采用此的編碼碼率R進(jìn)行AAC編碼壓縮獲得校準(zhǔn)后AAC音頻M2;
[0052] 步驟4:對M2音頻提取MAC特征MAC-F2;
[0053] 步驟5:計(jì)算MAC-F^MAC_F2的差值,獲得此音頻片段的C-MAC隱寫分析特征;
[0054]步驟6:分類器訓(xùn)練;
[0055] 步驟7:隱寫分析檢測。
[0056]以下結(jié)合具體實(shí)施例對本發(fā)明做進(jìn)一步的闡述;
[0057] 1:特征提取方法;
[0058] 1.1:特征提??;
[0059] 1.1.1:構(gòu)建一次壓縮幀內(nèi)比例因子帶碼書矩陣;
[0060] 將AAC音頻幀中所有比例因子帶碼書序號記為S={C1. . .Cj. . .cN},其中表示按 時序順序排列在第j個位置的碼書序號。在AAC的Huffman編碼過程中,共包含12個碼書,碼