基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法及提取方法
【專利摘要】本發(fā)明提供基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法算法的水印嵌入方法和提取方法,主要步驟具有:構(gòu)建多組兼有偽裝屬性和標(biāo)識屬性的相關(guān)操作的子方案;為每組子方案設(shè)置一個(gè)索引號并按升序排列得到一個(gè)初始方案序列;計(jì)算密鑰信息的BKDR哈希值并且將其對初始子方案序列進(jìn)行排序運(yùn)算得到自適應(yīng)方案序列;根據(jù)自適應(yīng)方案序列表來順序循環(huán)嵌入水印信息。優(yōu)點(diǎn)在于具有篡改定位的功能,以及應(yīng)用偽裝技術(shù)實(shí)現(xiàn)了增強(qiáng)格式化文本文檔水印的魯棒性安全性目標(biāo),解決了格式化文本水印普遍存在的通過調(diào)整格式嵌入水印的方法所導(dǎo)致的水印信息易被非法提取進(jìn)而被破解的問題。
【專利說明】基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法及提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)信息安全領(lǐng)域,用于對文本文檔的數(shù)字版權(quán)保護(hù)、數(shù)據(jù)完整性 鑒別以及安全的隱蔽通信。特別涉及一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法及提 取方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,大量的信息數(shù)據(jù)需要借助網(wǎng)絡(luò)傳輸,有研究表明,在 傳播的信息量中有80%以上是通過文字承載的,國家安全部門、企事業(yè)單位等將有大量的 文字材料,比如一些重要文件、軍事機(jī)密、商業(yè)機(jī)密、電子合同等,也是以各種方式與互聯(lián)網(wǎng) 連接,可以實(shí)現(xiàn)企業(yè)用戶和互聯(lián)網(wǎng)用戶資源的互訪與某些開放資源的共享。網(wǎng)絡(luò)在給我們 帶來的方便的同時(shí),也帶來了數(shù)據(jù)安全方面的新危險(xiǎn)和新挑戰(zhàn)?;ヂ?lián)網(wǎng)上的某些用戶出于 不良動機(jī),入侵各重要部門、企事業(yè)單位與網(wǎng)絡(luò)連接的計(jì)算機(jī)系統(tǒng)和設(shè)備,盜取國家機(jī)密信 息和企業(yè)的商業(yè)秘密,非法使用網(wǎng)絡(luò)資源等,給國家和企業(yè)造成巨大的損失。數(shù)字水印,作 為知識產(chǎn)權(quán)保護(hù)和信息安全維護(hù)的一種重要技術(shù)近幾年發(fā)展迅速。數(shù)字水印技術(shù)利用數(shù)字 產(chǎn)品存在的冗余度來嵌入信息,達(dá)到信息安全保護(hù)的目的。
[0003] 目前,人們對數(shù)字水印的研究主要集中在圖像水印、視頻水印、音頻水印等。然而, 由于文本中存在的冗余信息較少,在進(jìn)行算法設(shè)計(jì)時(shí)有很大的局限性,故文本水印的研究 相對而言比較落后,成果數(shù)量有限。但是,文字在人類所有的傳播媒介中占據(jù)著極為重要的 地位,而且,隨著電子商務(wù)和電子政務(wù)的出現(xiàn),一些重要的信息、文件甚至是機(jī)密等都通過 網(wǎng)上傳輸。這些文本信息可能涉及到個(gè)人和集體的利益甚至是國家的安危,因此,對這些文 本信息進(jìn)行安全保護(hù)極為重要。目前,盡管文本水印技術(shù)的研究滯后于數(shù)字水印技術(shù)的其 他領(lǐng)域,但是也取得了一些進(jìn)展。
[0004] 1994年,Maxemchuk N. F提出了文本數(shù)字水印的思想(Maxemchuk N. F. Electronic Document Distribution[J]. AT&T Technical Journal, 1994,73(5):73_80.),在此之 后,Brassil. J等人發(fā)表多篇文章,進(jìn)一步擴(kuò)展了文本數(shù)字水印的概念,并且提出了多 種文本數(shù)字水印算法(Brassil J,Low S H, Maxemchuk N F. Copyright Protection for the Electronic Distribution of Text Documents[J]. Proceedings of the IEEE,1999,87 (7): 1181 - 1196. Maxemchuk N F, Low S. Marking Text Documents[C]. International Conference on Image Processing, Santa Barbara Calif, 1997, 26-29. Brassil.J,L.0'Gorman. Watermarking document images with bounding box expansion[C]. Information Hiding of Lecture Notes in Computer Science,Sprinte r-Verlag, 1996, Vol. 1174:227-235.)。如今,對文本水印的研究吸引了越來越多的人。在 中國,許多大學(xué)(如北京郵電大學(xué)、清華大學(xué)等)也對數(shù)字水印技術(shù)進(jìn)行了比較深入的研 究。此外,湖南大學(xué)也在該領(lǐng)域組建了有規(guī)模的研究團(tuán)隊(duì),開展了一些具有特色的研究工 作,并承擔(dān)了很多相關(guān)的科研項(xiàng)目,如國家自然科學(xué)基金等。近年來,美國的普渡大學(xué)以及 韓國的Chonbuk國立大學(xué)在文本數(shù)字水印技術(shù)上進(jìn)行了一些獨(dú)特的研究,并取得相應(yīng)的 石開究成果(Atallah M J,Raskin V,Hempelmann C. Natural Language Watermarking and Tamper proofing [C]. In 5th information Hiding Workshop (IHW) 2002, USA, 2002, 196-212 ? Atallah M J,McDonough C J,Raskin V. Natural Language Processing for Information Assurance and Security,An Overview and Implementations[C]. NSPWj 2000, 51-65. Young-Won Kim, Kyung-Ae Moon,II-Seok Oh. Watermarking Algorithm based on Word Classification and Inter-word space statistics [C]. Proceedings of the Seventh International Conference on Document Analysis and Recognition, Edinburgh:IEEE Computer Society,2003, 775-779.)。已有的文本水印研究提出了不少文本數(shù)字水印系統(tǒng), 但是還存在一些問題,如隱蔽性較差、容量較小、魯棒性不強(qiáng)等問題。目前提出的文本數(shù)字 水印方法多是停留在文本的版面布局上,如調(diào)整一下文檔中文檔格式或內(nèi)容,包括:垂直移 動行距、水平調(diào)整字距、調(diào)整文本特性(如字體),拆分漢語文字結(jié)構(gòu),這些方法的魯棒性較 差,只需隨機(jī)化調(diào)整字間距、行間距即可破壞水印。除此,還有如分詞、句法分析、改寫技術(shù) 等語言處理技術(shù)的水印算法,但都還不是很完善。
[0005] Brassil等人提出的經(jīng)典的行間距編碼和字間距編碼算法,以及此后研究者以此 為基礎(chǔ)對基于格式編碼的文本水印算法進(jìn)行的各種優(yōu)化或者創(chuàng)新,仍然存在同一個(gè)明顯的 缺點(diǎn),即算法中圍繞各種字符屬性進(jìn)行相關(guān)操作所設(shè)置的參數(shù)數(shù)值與二進(jìn)制流水印信息 存在著一一映射關(guān)系(即某個(gè)固定參數(shù)數(shù)值標(biāo)識字符"〇",另一個(gè)固定參數(shù)數(shù)值標(biāo)識字符 "1"),而字符屬性的參數(shù)值非法用戶可以利用應(yīng)用程序輕而易舉地提取得到。隨著計(jì)算機(jī) 處理能力的快速提升,破解提取到的二進(jìn)制流水印信息也變得越來越容易,這在很大程度 上限制了基于格式編碼的文本水印算法的應(yīng)用和發(fā)展。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的旨在提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印算法,以克服上述 現(xiàn)有技術(shù)的存在缺陷。
[0007] 本發(fā)明提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,包括以下步驟:
[0008] 步驟Al :輸入載體文檔T,水印信息W,密鑰信息K ;將水印信息W和密鑰信息K分 別轉(zhuǎn)化成二進(jìn)制流水印信息Wb和二進(jìn)制流密鑰信息Kb ;
[0009] 步驟A2 :將二進(jìn)制流水印信息Wb和二進(jìn)制流密鑰信息Kb進(jìn)行加密處理得到加密 后的二進(jìn)制流水印信息Wkb ;
[0010] 步驟A3 :將加密后的二進(jìn)制流水印信息Wkb進(jìn)行糾錯(cuò)編碼處理得到編碼后的二進(jìn) 制流水印信息Wkcb ;
[0011] 步驟A4 :用N種標(biāo)識屬性來構(gòu)建子方案,每種子方案包含一個(gè)標(biāo)識屬性和N-I個(gè) 偽裝屬性,為每組子方案設(shè)置一個(gè)索引號并按升序排列得到一個(gè)初始方案序列;
[0012] 步驟A5 :根據(jù)密鑰信息K和初始方案序列計(jì)算其BKDR哈希值h并進(jìn)行排列運(yùn)算 得到自適應(yīng)方案序列表T ;
[0013] 步驟A6 :嵌入同步頭信息S,并設(shè)初值n = 0, i = 0 ;
[0014] 步驟A7 :依次從自適應(yīng)方案序列表T中取出一種方案Ti ;
[0015] 步驟A8 :依次選定載體文檔T中的每一個(gè)字符c并從二進(jìn)制流水印信息Wkcb取 出Ibit編碼,計(jì)數(shù)n++ ;若n等于二進(jìn)制流水印信息Wkcb的長度,進(jìn)入步驟A5且設(shè)置n = 0;否者進(jìn)入步驟A9;
[0016] 步驟A9 :將方案Ti作用于字符c,若方案Ti作用的時(shí)間長度等于該方案設(shè)定的作 用時(shí)間長度li,進(jìn)入步驟A6且i= (i++%N);否則進(jìn)入步驟A7;直至完成所有自適應(yīng)方案 序列表T的所有Ti ;
[0017] 步驟AlO :載體文檔T嵌入完畢,保存嵌入水印信息后的文檔Tw。
[0018] 進(jìn)一步,本發(fā)明提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,還可以具 有這樣的特征:步驟A3中糾錯(cuò)編碼處理為(7, 4)漢明碼編碼處理。
[0019] 進(jìn)一步,本發(fā)明提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,還可以具 有這樣的特征:步驟A4中,將N種透明屬性分別作為N組子方案中的標(biāo)識屬性并加入其對 應(yīng)的操作來構(gòu)建N組初始子方案,在N組初始子方案中分別加入與本組中標(biāo)識屬性相對的 其余N-I種作為偽裝屬性的透明屬性的相關(guān)操作來構(gòu)建N組最終子方案。根據(jù)密鑰信息K 計(jì)算其BKDR哈希值h并進(jìn)行相關(guān)運(yùn)算得到自適應(yīng)方案序列表T。
[0020] 進(jìn)一步,本發(fā)明提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,還可以具 有這樣的特征:步驟A4中,構(gòu)建子方案的標(biāo)識屬性必須確保標(biāo)識屬性相關(guān)操作的參數(shù)數(shù)值 與二進(jìn)制流水印信息中編碼"1"和"〇"之間是一一映射的關(guān)系;而偽裝屬性的相關(guān)操作的 參數(shù)數(shù)值與二進(jìn)制流水印信息中編碼" 1"和"〇"之間的關(guān)系是任意的。
[0021] 進(jìn)一步,本發(fā)明提供一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,還可以具 有這樣的特征:步驟5中,按下列公式計(jì)算密鑰信息K的BKDR哈希值h :
[0022]
【權(quán)利要求】
1. 一種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟Al :輸入載體文檔T,水印信息W,密鑰信息K ;將水印信息W和密鑰信息K分別轉(zhuǎn) 化成二進(jìn)制流水印信息Wb和二進(jìn)制流密鑰信息Kb ; 步驟A2 :將二進(jìn)制流水印信息Wb和二進(jìn)制流密鑰信息Kb進(jìn)行加密處理得到加密后的 二進(jìn)制流水印信息Wkb ; 步驟A3 :將加密后的二進(jìn)制流水印信息Wkb進(jìn)行糾錯(cuò)編碼處理得到編碼后的二進(jìn)制流 水印信息Wkcb ; 步驟A4 :用N種標(biāo)識屬性來構(gòu)建子方案,每種子方案包含一個(gè)標(biāo)識屬性和N-I個(gè)偽裝 屬性,為每組子方案設(shè)置一個(gè)索引號并按升序排列得到一個(gè)初始方案序列; 步驟A5 :根據(jù)密鑰信息K和初始方案序列計(jì)算其BKDR哈希值h并進(jìn)行排列運(yùn)算得到 自適應(yīng)方案序列表T ; 步驟A6 :嵌入同步頭信息S,并設(shè)初值η = 0, i = O ; 步驟A7 :依次從自適應(yīng)方案序列表T中取出一種方案Ti ; 步驟A8 :依次選定載體文檔T中的每一個(gè)字符c并從二進(jìn)制流水印信息Wkcb取出Ibit 編碼,計(jì)數(shù)η++ ;若η等于二進(jìn)制流水印信息Wkcb的長度,進(jìn)入步驟A5且設(shè)置η = 0 ;否者 進(jìn)入步驟Α9 ; 步驟Α9:將方案Ti作用于字符c,若方案Ti作用的時(shí)間長度等于該方案設(shè)定的作用時(shí) 間長度li,進(jìn)入步驟A6且i= (i++%N);否則進(jìn)入步驟A7;直至完成所有自適應(yīng)方案序列 表T的所有Ti ; 步驟AlO :載體文檔T嵌入完畢,保存嵌入水印信息后的文檔Tw。
2. 根據(jù)權(quán)利要求1所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟A3中糾錯(cuò)編碼處理為(7,4)漢明碼編碼處理。
3. 根據(jù)權(quán)利要求1所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟A4中,將N種透明屬性分別作為N組子方案中的標(biāo)識屬性并加入其對應(yīng)的操作來 構(gòu)建N組初始子方案,在N組初始子方案中分別加入與本組中標(biāo)識屬性相對的其余N-I種 作為偽裝屬性的透明屬性的相關(guān)操作來構(gòu)建N組最終子方案;根據(jù)密鑰信息K計(jì)算其BKDR 哈希值h并進(jìn)行相關(guān)運(yùn)算得到自適應(yīng)方案序列表T。
4. 根據(jù)權(quán)利要求3所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟A4中,構(gòu)建子方案的標(biāo)識屬性必須確保標(biāo)識屬性相關(guān)操作的參數(shù)數(shù)值與二進(jìn)制 流水印信息中編碼"1"和"〇"之間是一一映射的關(guān)系;而偽裝屬性的相關(guān)操作的參數(shù)數(shù)值 與二進(jìn)制流水印信息中編碼" 1"和"〇 "之間的關(guān)系是任意的。
5. 根據(jù)權(quán)利要求1所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟5中,按下列公式計(jì)算密鑰信息K的BKDR哈希值h :
6. 根據(jù)權(quán)利要求1所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟A7-步驟A9中,順序從自適應(yīng)方案序列T中選擇各個(gè)Tl,T2,... Tj. .. TN子方案, 對應(yīng)于選中的第j種子方案,修改文本的第j個(gè)字符屬性,嵌入nj比特水印信息,直到所有 的水印信息按此方式嵌入完成;接著對水印信息進(jìn)行循環(huán)嵌入,直到達(dá)到載體文檔字符數(shù) Μ。
7. -種基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印提取方法,其特征在于包括以下步驟: 步驟Bl :輸入待檢測文檔Tw,密鑰信息K ; 步驟B2 :將密鑰信息K轉(zhuǎn)化成二進(jìn)制流密鑰信息Kb ;二進(jìn)制流密鑰信息Kb進(jìn)行解密處 理; 步驟B3 :用N種標(biāo)識屬性來構(gòu)建子方案,每種子方案包含一個(gè)標(biāo)識屬性和N-I個(gè)偽裝 屬性,為每組子方案設(shè)置一個(gè)索引號并按升序排列得到一個(gè)初始方案序列; 步驟B4 :根據(jù)密鑰信息K初始方案序列計(jì)算其BKDR哈希值h并進(jìn)行排列運(yùn)算得到自 適應(yīng)方案序列表T ; 步驟B5 :依次選定待檢測文檔Tw中的每一個(gè)字符c,若字符c為同步頭位,重復(fù)步驟 B5 ;否則,進(jìn)入步驟B6 ; 步驟B6 :提取同步頭信息S,定義i = 0 ;若同步頭被破壞,光標(biāo)跳至下一同步頭位置, 重復(fù)步驟B5 ; 步驟B7 :依次從自適應(yīng)方案序列表T中取出一種方案Ti ; 步驟B8 :將方案Ti作用于字符c提取并保存Ibit編碼,若方案Ti作用的時(shí)間長度等 于該方案設(shè)定的作用時(shí)間長度li,進(jìn)入步驟B6且i= (i++%N);否則進(jìn)入步驟M;直至完 成所有自適應(yīng)方案序列表T的所有Ti ; 步驟B9 :利用大數(shù)定理,對每一個(gè)水印的長度進(jìn)行統(tǒng)計(jì),確認(rèn)概率最大的長度為水印 最終長度,并提取長度匹配的水印信息內(nèi)容,得出一組正確的二進(jìn)制流水印信息Wkcb ; 步驟BlO :將得到的二進(jìn)制流水印信息Wkcb進(jìn)行解碼處理,得到解碼后的二進(jìn)制流水 印信息Wkb ; 步驟Bll :將解碼后的二進(jìn)制流水印信息Wkb與二進(jìn)制流密鑰信息Kb進(jìn)行解密處理得 到解密后的二進(jìn)制流水印信息Wb并其轉(zhuǎn)化成字符形式W',即提取到的水印信息,輸出W'。
8. 根據(jù)權(quán)利要求7所述的基于偽裝學(xué)的方案自適應(yīng)數(shù)字水印嵌入方法,其特征在于: 步驟B2中,解密處理為為(7,4)漢明碼編碼處理。
【文檔編號】G06F21/16GK104376236SQ201410720402
【公開日】2015年2月25日 申請日期:2014年12月2日 優(yōu)先權(quán)日:2014年12月2日
【發(fā)明者】陳青, 黃鵬波, 盧宇鵬, 周廣州, 王飛, 熊蒙, 柯婷婷 申請人:上海出版印刷高等??茖W(xué)校