一種基于證據推理的隱寫檢測方法
【專利摘要】本發明涉及一種基于證據推理的隱寫檢測方法。通過使用不確定性問題的理論和技術解決通用隱寫檢測問題,提高通用隱寫檢測的可靠性以及檢測率。首先對通用隱寫檢測中的不確定性因素進行綜合分析,給出了通用隱寫檢測問題中的不確定性情況;其次構建基于不確定性推理的隱寫檢測模型,將證據理論原理應用于隱寫檢測中,設計了基于證據推理的通用隱寫檢測方法。通過使用本發明提出的方法,實現了MP3格式的音頻通用隱寫檢測的目的,對網絡媒體內容進行監管。
【專利說明】—種基于證據推理的隱寫檢測方法
[0001]本發明涉及音頻隱寫檢測中一種基于證據推理的隱寫檢測方法,屬于隱寫檢測領域。
【背景技術】
[0002]伴隨互聯網的蓬勃發展,網絡媒體以其信息豐富、傳播及時、涵蓋范圍廣、互動性強等特點,迅速成為信息傳播的主流,成為人們日常獲取信息和知識的主要通道,對社會政治經濟文化生活的各個方面產生了廣泛而深刻的影響。然而,隨著網絡媒體社會影響力的日益擴大,也出現了許多不良媒體內容,日益凸顯出諸多問題。一方面,對網絡媒體內容的監管比較薄弱,不少網絡媒體在發布有益信息的同時,也發布了一些虛假甚至不良信息,造成網上信息污染嚴重;另一方面,網絡媒體,尤其是音頻、視頻和圖像等多媒體中含有大量冗余信息,極易被恐怖分子、商業間諜等不法分子利用作為載體傳播隱秘信息、進行文化滲透,對國家和個人安全造成很大威脅。
[0003]為保證對互聯網信息的監控、遏制隱寫術的非法應用、打擊恐怖主義、維護國家和社會的安全,如何對信息網絡中的海量多媒體數據進行隱蔽信息的監測,及時阻斷可能存在的非法信息通信已成為一個迫切需要解決的問題。隱寫檢測是針圖像、視頻和音頻等多媒體數據,在對信息隱藏算法或隱藏的信息一無所知的情況下,僅僅是對可能攜秘的載體進行檢測或者預測,以判斷載體中是否攜帶秘密信息。隱寫檢測技術作為隱寫術的對立技術,可以有效防止隱寫術的濫用,在信息對抗中具有重要意義,對于隱寫檢測技術的研究也一直是信息隱藏領域的研究熱點。
[0004]傳統的隱秘信息檢測方法是專門針對某一類的信息嵌入方法,是專用隱寫檢測。這種檢測方法是根據隱秘信息在嵌入時所引起的音頻數據統計特性的變化特征來進行檢測。這種專用隱寫方法的檢測率通常比較高,但是適用性和實用性比較差。在復雜多樣的網絡環境中進行檢測時,我們并不知道音頻文件是經過哪種隱寫方法生成。隨著隱寫技術的不斷發展,這種專門針對特定嵌入方法的隱寫檢測方法已不能很好的滿足網絡安全監管的需要,因此研究通用隱寫檢測方法有著更為重要的意義。通用隱寫檢測技術相對于專用隱寫檢測技術,有著很好的適用性,在網絡監管中,可以作為信道傳輸的篩選工具,當檢測到傳輸文件存在不安全隱寫信息時,即使秘密信息的內容未被破譯,網絡監管人員也可以隨時中斷信息傳輸,并且在后期對不安全文件來源與去向進行追查。
[0005]另一方面,伴隨著網絡媒體的壓縮技術飛速發展,壓縮域的數字水印技術和隱寫技術的研究也在不斷的成熟,在音頻格式中,現在使用最為廣泛的壓縮域信息隱藏方法的是MP3格式的壓縮隱藏,越來越多的不法分子利用MP3壓縮域隱寫技術傳輸隱秘信息。MP3壓縮域的隱寫技術是將隱藏信息在音頻壓縮過程中進行嵌入的的一種技術。在壓縮域嵌入隱秘信息可以避免感知編碼對隱藏信息的攻擊,比如在JPEG圖像壓縮中對量化因子和變換域系數修改的壓縮過程中嵌入秘密信息能有效的抗JPEG解壓縮與再壓縮的攻擊。
[0006]為了能夠更好的對MP3壓縮格式進行更好的檢測,本文提出了一種基于證據推理的MP3音頻隱寫檢測方法。
【發明內容】
[0007]本發明的目的是,提出一種基于證據推理的音頻隱寫檢測方法,實現了 MP3格式的音頻實現通用隱寫檢測的目的,同時具有更加廣泛的適用性。
[0008]本發明的技術方案如下:
[0009]一種基于證據推理的隱寫檢測方法,包括如下步驟:
[0010]第一步,構建有效證據特征集;
[0011]第二步,生成證據矩陣;
[0012]第三步,證據融合;
[0013]1、證據選擇:
[0014]A、所選取的證據支持對不同方面的決策;
[0015]B、所選擇的證據可以對判決提供有效良好的支持;
[0016]優選證據特征集如下:
[0017]Setl Markov 特征的證據;
[0018]Set2 領域聯合密度特征的證據;
[0019]Set3 多項式擬合差值特征的證據;
[0020]2、構造BPA函數
[0021 ]通過改造后驗概率SVM,得到BPA函數;
[0022]實現SVM后驗概率的輸出如下:
【權利要求】
1.一種基于證據推理的隱寫檢測方法,其特征在于包括如下步驟: 步驟一,構建有效證據特征集; 步驟二,生成證據矩陣; 步驟三,證據融合。
2.根據權利要求1所述的一種基于證據推理的隱寫檢測方法,其特征在于,在所述步驟一中: (1)證據選擇 A、所選取的證據支持對不同方面的決策; B、所選擇的證據可以對判決提供有效良好的支持; 優選證據特征集如下: Setl Markov特征的證據; Set2 領域聯合密度特征的證據; Set3 多項式擬合差值特征的證據; (2)構造BPA函數 通過改造后驗概率SVM,得到BPA函數; 實現SVM后驗概率的輸出如下:
其中:A、B可以通過最小化已知訓練數據和其決策值f的負的對數似然函數得到:
其中:A=i+cxp(!i/:.+^,A=+’為樣本類標簽; 然而,這種后驗概率輸出僅體現了絕對判別的概率,沒有考慮SVM判別的不確定性,因此,對以上輸出進行改造; 判決的不確定性通常與檢測樣本、訓練樣本、分類器等因素有關,因此,對以下因素不確定性進行描述: 根據SVM識別誤差定義,設分類器不確定因子為usvm,得到SVM分類器的不 確定因子計算式:
其中=Nsv為支持向量的數量,N為訓練樣本的數量; 即使是同一種分類器中,由于訓練樣本的不同,所得到的分類規則也不相同,所以,設訓練樣本不確定性因子為:
其中:Ν為測試樣本數,N’為錯檢樣本數,η為檢測次數; 在檢測判決的時候,在分類器邊界的樣本容易被錯判,這是因為,在分類器邊界的樣本,在判決為“O”和“ I ”的概率差距比較小,所以,我們通過“O”和“ I ”檢測概率差描述檢測樣本的不確定性; 其中=P1為有隱寫的概率,Po為無隱寫的概率,設檢測樣本不確定因子為:
Uaud1 =I PrP01 (5) 根據式⑵~(5),可以得到不確定性的輸出式:
其中:θ表示為動態的不確定因子,Θ e (0,1),k表示約束因子,將Θ限制在(0, I)的取值范圍中,不同的檢測音頻Uaudi。取值不同,Θ隨著Uaudi。呈動態變化; 通過公式(I)~(5)得到BPA函數輸出:
根據式(J)~O)計算得到BPA函數輸出值,即Imi (O),Hii (I),Hii (Θ)} (i = 1,2, 3); (3)證據融合和決策 在決策判決的時候,為了降低沖突證據對判決影響,設計了降低證據沖突影響的證據融合規則,此辨識框架?下,冪集2Θ = {A1;A2,A3} ,BPA函數中的Iii1, m2,…mn正交和如下:m = Int 十 /";;十...ιηηΛ ? Oth 融合規則如下:
根據融合的結果,通過下式進行隱寫判決:j無隱寫,w(0) w(l)(U)
I有β#’寫,m(0) ^ m(l)
【文檔編號】G10L19/018GK104183244SQ201410407847
【公開日】2014年12月3日 申請日期:2014年8月18日 優先權日:2014年8月18日
【發明者】張登銀, 王奕權, 孫斌 申請人:南京郵電大學