本發明涉及多媒體信息安全領域,具體涉及一種自適應音頻空域隱寫方法。
背景技術:
音頻隱寫是信息隱藏技術的一個重要分支。音頻信號作為日常生活中不可缺少的傳播媒介,其信號中包含的信息冗余使音頻成為了信息隱藏的良好載體。目前的音頻隱寫方法以嵌入信息時所采用的域劃分,可分為:空域音頻隱藏、壓縮域音頻隱藏等。現有的空域信息隱藏方法采用的大多是最低有效位修改法(LSB),且其嵌入位置的選擇是由隨機序列決定的。由于隨機序列的不確定性,音頻信號中人耳聽覺上敏感的樣本也有可能會被改動,從而導致音頻聽覺質量及安全性的降低。
技術實現要素:
為了克服上述現有技術的不足,本發明提出一種自適應音頻空域隱寫方法,該隱寫方法為空域音頻隱藏,主要載體為WAV音頻。本發明提出的WAV音頻空域自適應隱寫方法可有效地實現在音頻信號的信息冗余位進行信息的嵌入,從而避開音頻信號的聽覺敏感位置,有效減小隱寫時損失的音頻質量,安全性也會有所提升。
為了實現上述發明目的,采用的技術方案如下:
一種自適應音頻空域隱寫方法,包括秘密信息的嵌入和提取兩個步驟,所述秘密信息的嵌入包括如下子步驟:(11)高比特率AAC壓縮原始WAV音頻;(12)原始WAV音頻與經過一次高比特率AAC壓縮解壓的WAV音頻樣本值相減得殘差;(13)選定信息編碼工具STC的嵌入載體;(14)根據殘差設計STC修改嵌入載體樣本值的代價;(15)設置嵌入率并計算需嵌入的秘密信息長度;(16)利用STC進行秘密信息的嵌入。
所述步驟(11)對原始WAV音頻進行高比特率AAC壓縮;
所述步驟(12)獲得原始WAV音頻和經過一次高比特率AAC壓縮解壓后的WAV音頻樣本之間的殘差,具體步驟如下:分別用十進制讀取原始WAV音 頻和經過一次AAC壓縮的WAV音頻的所有樣本,可得序列X={x1,x2,x3,…,xn}及X’={x′1,x′2,x′3,…,x′n},兩種WAV音頻的樣本總數相同,統一用n表示,其中對xi及x′i分別表示兩種WAV音頻第i個樣本的十進制整數值。序列X與序列X’相減可得殘差序列Residual,可表示為{r1,r2,r3,…,rn},n表示WAV音頻的樣本總數,其中對ri=xi-x’i;
所述步驟(13)選取原始WAV音頻文件的所有樣本值作為信息編碼工具STC的嵌入載體,即序列X={x1,x2,x3,…,xn},n為WAV音頻樣本總數;
所述步驟(14)根據所得的殘差序列Residual設計STC修改嵌入載體樣本值的代價,設計原則如下:
(Ⅰ)對于原始WAV音頻第i個樣本值xi,修改的代價包含三種代價:在原值上加1的代價、保持不變的代價、在原值上減1的代價;
(Ⅱ)對于原始WAV音頻第i個樣本值xi,根據其相應的殘差序列Residual中第i個殘差值Ri,上述三種代價的設定如下:
情況1:樣本值xi在原值上加1的代價為:
情況2:樣本值xi保持不變的代價均為0
情況3:樣本值xi在原值上減1的代價為:
所述步驟(15)設置秘密信息的嵌入率ratio,其中ratio表示原始WAV音頻平均每個樣本修改的比特數,單位為bps(bit per sample)。計算需嵌入的秘密信息的長度,記為m,m由WAV音頻樣本總數n和嵌入率ratio決定,即:m=[n×ratio]。
所述步驟(16)依據設定好的代價及應嵌入的m比特秘密信息對選定的嵌入載體做STC操作,實現最小化所有樣本的修改代價之和,從而自適應選取嵌入載體中的若干位進行修改以達到秘密信息嵌入的目的。
所述秘密信息的提取包括如下子步驟:(21)獲取隱寫WAV音頻的提取載體;(22)獲取隱寫WAV音頻所嵌入的秘密信息的長度;(23)利用信息編碼工具STC對所述提取載體進行信息提取。
所述步驟(21)讀取隱寫后的WAV音頻,得到序列Y={y1,y2,y3,…,yn},其中n表示隱寫WAV音頻的樣本總數,可知隱寫后WAV音頻的樣本總數與原始WAV音頻的樣本總數保持一致;將所有的樣本值作為STC操作的提取載體;
所述步驟(22)獲取嵌入率ratio,其中ratio單位為bps(bit per sample),表示原始WAV音頻平均每個樣本修改的比特數;計算隱寫WAV音頻嵌入的秘密信息的長度m,其中m=[n×ratio]。
所述步驟(23)對提取載體進行STC解碼操作,其中STC工具可根據提取載體的值與嵌入的秘密信息長度還原嵌入的m比特秘密信息。
與現有技術相比,本發明的有益效果是:本發明基于信息編碼工具STC及高質量壓縮編碼AAC,選取WAV音頻的單個樣本作為嵌入單元,根據原始WAV音頻與經過一次AAC高比特率壓縮并解壓后的WAV音頻樣本之間的差值設計STC修改嵌入載體的代價,從而使STC工具可自適應地修改WAV音頻樣本的若干位,避免了基于隨機序列修改的LSB方法的隨機性,可有效地實現在音頻信號的信息冗余位進行信息的嵌入,從而保護了音頻信號聽覺敏感位置,有效減小隱寫時損失的音頻質量,安全性也會有所提升。
本發明的原理是經過一次高質量AAC壓縮并解壓的WAV音頻保留下來的信號為原始WAV音頻中與人耳感知系統相關的信息位,原始WAV音頻信號與其的差值可判定為感知無關部分也即冗余部分。根據殘差設定WAV音頻各樣本修改的代價可使STC工具自適應地選擇嵌入載體中的冗余部分進行修改,從而獲得更好的人耳聽覺質量。其中信息編碼工具STC的特點是,設定的樣本修改代價越大,該樣本被修改的幾率就越低。
附圖說明
圖1所示為采用本發明進行秘密信息嵌入、提取的算法流程示意圖。
圖2(a)所示為原始WAV音頻的信號波形。
圖2(b)所示為經過一次高比特率AAC壓縮解壓后的WAV音頻的信號波形。
圖2(c)所示為圖2 (a)和圖2 (b)信號之間的殘差。
圖2(d)所示為嵌入率為0.3bps時原始WAV音頻各信號段的修改率。由圖可知修改的樣本點集中在樣本值變化較為復雜的信號段,其間包含更多的冗余信息,例如[6000,8000]范圍內的樣本;而對于接近靜音聽覺敏感的樣本值,例如處于[0,2000]及[12000,14000]范圍內的樣本,修改的樣本比例低于0.7%。
具體實施方式
下面結合附圖對本發明做進一步的描述,但本發明的實施方式并不限于此。
圖1所示為采用本發明進行秘密信息嵌入、提取的算法流程示意圖。
一種自適應音頻空域隱寫方法,包括秘密信息的嵌入和提取兩個步驟,其中秘密信息的嵌入包括如下子步驟:(11)高比特率AAC壓縮原始WAV音頻;(12)原始WAV音頻與經過一次高比特率AAC壓縮的WAV音頻樣本值相減得殘差;(13)選定信息編碼工具STC的嵌入載體;(14)根據殘差設計STC修改嵌入載體樣本值的代價;(15)設置嵌入率并計算需嵌入的秘密信息長度;(16)利用STC進行秘密信息的嵌入。
每個步驟具體說明如下:
(11)利用neroAACEnc軟件以最高比特率400,000bps對原始WAV音頻進行AAC音頻壓縮,并用neroAACDec軟件對壓縮后的AAC音頻進行解碼,得到經過一次高比特率AAC壓縮并解壓的WAV音頻;
(12)分別用十進制讀取原始WAV音頻和經過一次高比特率AAC壓縮并解壓的WAV音頻的所有樣本值,可得序列X={x1,x2,x3,…,xn}及X’={x′1,x′2,x′3,…,x′n},其中n表示WAV音頻的樣本總數,兩種WAV音頻的樣本總數相同,且對xi及x′i皆為整數。序列X與序列X’的信號波形如圖2(a)和圖2(b)所示。序列X與序列X’相減可得殘差序列Residual,表示為{r1,r2,r3,…,rn},n為WAV音頻樣本總數,其中ri=xi-x’i。圖2(c)為所述殘差的波形示意圖;
(13)選定原始WAV音頻的所有樣本值作為信息編碼工具STC的嵌入載體,即序列X={x1,x2,x3,…,xn}表示,n為WAV音頻樣本總數;
(14)根據殘差Residual序列設計嵌入載體各樣本值被信息編碼工具STC 修改的代價。具體設計原則如下:
(Ⅰ)對于原始WAV音頻第i個樣本值xi,修改的代價包含三種代價:在原值上加1的代價、保持不變的代價、在原值上減1的代價;
(Ⅱ)對于原始WAV音頻第i個樣本值xi,依據相應的殘差序列Residual中第i個殘差值ri,上述三種代價的設定如下:
情況1:樣本值xi在原值上加1的代價為:
情況2:樣本值xi保持不變的代價均為0
情況3:樣本值xi在原值上減1的代價為:
(15)設置秘密信息的嵌入率ratio,其中ratio表示原始WAV音頻平均每個樣本修改的比特數,單位為bps(bit per sample)。計算原始WAV音頻需嵌入的秘密信息長度,記為m,其中m由嵌入率ratio和原始WAV音頻樣本總數n決定,即:m=[n×ratio]。
(16)依據設定好的代價和當前所需嵌入的m比特秘密信息對選定的嵌入載體做STC操作,其中STC工具可選取嵌入載體的若干位進行修改以達到秘密信息嵌入的目的。
本發明秘密信息的提取包括步驟:(21)獲取隱寫WAV音頻的提取載體;(22)獲取隱寫WAV音頻所嵌入的秘密信息的長度;(23)利用信息編碼工具STC對所述提取載體進行信息提取。
每個步驟具體說明如下:
(21)讀取隱寫后的WAV音頻,得到序列Y={y1,y2,y3,…,yn},其中n表示隱寫后WAV音頻的樣本總數,可知隱寫后WAV音頻的樣本總數與原始WAV音頻的樣本總數保持一致;將所有的樣本值作為STC操作的提取載體;
(22)獲取秘密信息嵌入率ratio,計算隱寫WAV音頻嵌入的秘密信息長度m,其中m=[n×ratio];
(23)對提取載體進行STC操作,其中STC工具可根據提取載體的值與嵌入的秘密信息長度還原嵌入的m比特秘密信息。下面將結合具體的實驗數據對本發明做更進一步的分析說明:
1、音頻集合:
本實施例中,利用了10000個單聲道長度為4秒的音樂及10000個單聲道長度為4秒的語音做測試。
2、隱寫工具及方法
最低有效位修改法(LSB)
本發明提出的自適應音頻空域隱寫方法
3、通用型隱寫分析特征
“Q.Z.Liu,A.H.Sung,and M.Y.Qiao.Temporary derivative-based spectrum and mel-cepstrum audio steganalysis.Information IEEE Transactions on Information Forensics and Security,vol.4,no.3,pp.369-368,Sept.2009.”論文提出了[D-MC]隱寫分析特征。
“Q.Z.Liu,A.H.Sung,and M.Y.Qiao.Derivative-based audio stegnalysis.ACM Transactions on Multimedia Computing Communications and Applications,vol.7,no.3,pp.18:1-18:19,Sept.2011.”論文提出了[2D-Markov]隱寫分析特征。
“W.Luo,H.Li,Q.Yan,R.Yang,and J.Huang.Improved audiosteganalytic feature and its applications in audio forensics.Tech.Rep.,Sun Yat-Sen University,Guangzhou,P.R.China,510006,2016.”技術報告提出了[Combined time&frequency]隱寫分析特征。
4、安全性能分析:
利用LSB最低有效位、本發明提出的自適應音頻空域隱寫方法生成不同嵌入容量的隱寫音頻,嵌入率分別設為0.1bps、0.3bps、0.5bps。針對每一種情況,采用三種通用的隱寫分析特征,一半樣本作為訓練集,另一半樣本作為測試集,采用集成分類器進行訓練測試,下表1列出了各種情況下隱寫音頻的檢測率。可以看出采用本發明描述的隱寫方法隱寫的音頻檢測率與基于LSB匹配的空域隱寫方法相比均有降低,安全性更好。
表1
5、音頻質量分析:
利用LSB最低有效位、本發明提出的自適應音頻空域隱寫方法生成不同嵌入容量的隱寫音頻,嵌入率分別為0.1bps、0.3bps、0.5bps。針對每一種情況,計算各隱寫WAV音頻與原始WAV音頻的信噪比(單位:dB)及樣本修改率。下表2列出了各種情況下的信噪比(單位:dB)和修改率。可以看出采用本發明描述的隱寫方法后,隱寫WAV音頻的信噪比增加,修改率降低,音頻質量有所提升。
表2
以上所述的本發明的實施方式,并不構成對本發明保護范圍的限定。任何在本發明的精神原則之內所作出的修改、等同替換和改進等,均應包含在本發明的權利要求保護范圍之內。