專利名稱:一種針對htm/html信息隱藏系統的制作方法
技術領域:
本發明應用于信息安全,信息數字化,信息傳輸和移動存儲。
背景技術:
隱寫術是關于信息隱藏,即不讓計劃的接收者之外的任何人知道信息的傳遞事件 (而不只是信息的內容)的一門技巧與科學。隱寫術英文作“steganography”,來源于約翰尼斯·特里特米烏斯的一本看上去是有關黑魔法,實際上是講密碼學與隱寫術的一本書 《Steganographia》中。此書書名來源于希臘語,意為“隱秘書寫”。信息隱藏是指在設計和確定模塊時,使得一個模塊內包含的特定信息(過程或數據),對于不需要這些信息的其他模塊來說是透明的。HTML (Hyper Text Mark-up Language)即超文本標記語言或超文本鏈接標示語言,是目前網絡上應用最為廣泛的語言,也是構成網頁文檔的主要語言。HTML文本是由 HTML命令組成的描述性文本,HTML命令可以說明文字、圖形、動畫、聲音、表格、鏈接等。 HTML的結構包括頭部(Head)和主體(Body)兩大部分,其中頭部描述瀏覽器所需的信息,而主體則包含所要說明的具體內容。針對三者特色,我們將其綜合到一塊。針對htm/html的信息隱藏,即針對htm/ html的信息隱寫,就是將敏感信息通過打包編碼后使其作為一個整體,主要解決不同類型信息,比如多個文件。將信息打包后,我們將其放大到原來的八倍,并按照特定的算法將信息嵌入到原始的html載體中,新形成的信息巧妙的利用html自解析,偽裝后的html和普通html外觀上無任何區別,通過偽裝自己,迷惑攻擊者,使得傳輸原有信息的基礎上,為敏感信息的傳遞開啟了一條綠色通道。敏感信息還可以通過加密算法使得即使信息不幸泄漏,仍留有最后一道屏障,為信息的安全傳輸提供了一道新的防護墻。
發明內容
1、本發明是一種針對htm/html文本格式的信息隱藏系統,此系統由htm/html超文本識別模塊、信息收集模塊、信息處理模塊和提取模塊組成。2、發明內容1所述的二維條碼信息索引生成模塊包含以下實現步驟(1) htm/html文本被序列化后,我們將其看做一個bitstream,對于bitstream按照官方對htm/html的解釋,將其信息分為<HTML><HEAD><title>, <base>, <link>, <isindex>, <meta></HEAD><B0DY>HTML文件的正文寫在這里......</B0DY>
</HTML>(2)在1的基礎上計算出正文的內容(3)計算失敗則整個隱藏過程宣告失敗3、發明內容1所述的信息收集模塊包含以下實現步驟(1)將需要被隱藏的信息通過標準的算法進行打包;(2)將打包后的文件序列化為特定符號供信息處理模塊進行進一步加工;4、發明內容1所述的信息處理模塊包含以下實現步驟(1)在2(1)所提取出的文本信息中找到合適的位置并將該位置作為隱藏信息的入口,入口的選定上按照特定的算法生成。(2)信息隱藏的入口和信息提取的入口作為共享點,首先判斷原文是否已經被處理過,如果被處理過,則先將曾經藏匿在此的信息剔除。(3)按照1 8的比例放大被3所序列化的信息,將其直接寫入html中,放大后的序列根據html的解析規則,這些信息肉眼是不可見的。(4)信息提取,提取過程和隱藏過程類似,得到入口點后,檢測是否有信息,如果沒有,則提取失敗;否則按照8 1的比例對信息進行縮小,縮小后所得即為打包后的信息,將信息拆包即得到原始信息。
具體實施例方式本發明的目的、優點和特色由以下數個實施例之詳細說明及圖式當可更加明白, 這些實施例作為實施方式之舉例說明,其目的是為方便詳加說明本發明,而非用以限定本發明。實施案例-編碼任給一段htm網頁文檔,我們以mm. baidu. com網頁為例,生成一張含有隱寫信息的htm網頁文件。假設要隱藏的信息為’ china’ .通過查詢ascii碼表得知 china = 63H,68H,69H,6EH,61H = 0110 0011(B),0110 1000 (B),0110 1001(B),0110 1110 (B) 01100001 (B),將此信息通過算法三序列化后得到09 20 20 09 09 09 20 20 09 20 20 09 20 09 09 09 09 20 20 09 20 09 09 20 09 20 20 0920 20 20 09 09 20 20 09 09 09 09 20這樣信息就被放大了 8倍,并且由于這些數字在網頁或者記事本中都是不可見的,可以直接被寫到網頁的內容中。假設我們以body之前為此信息的潛入口,則直接將此序列插入到原始文本中即可。實施案例-解碼由于事先我們知道在<body>之前是隱寫信息之所在,在<body>之前檢測是否存在隱寫標記,如果存在,則去尋找信息頭,找到后的信息是09和20組成的偽二進制流,只需要做一個8 1的解碼即可得到原始數據流,通過對這個流進行運算最終得到隱藏前的信息。通過掃描將得到 09 20 20 09 09 09 20 20 09 20 20 09 2009 09 09 09 20 20 09 20 09 09 20 09 20 20 09 20 20 20 09 09 20 20 09 09 09 09 20 序列,按照 09 為 0, 20 為 1 的原則,得到 0110 001101101000011010010110111001100001,轉化為 16 進制后得 6368696E61,查詢ASCII表得china.與隱藏前信息剛好一致。
權利要求
1.本發明是一種針對htm/html超文本協議的信息隱藏系統,其特征是包含如下模塊 htm/html超文本識別模塊、信息收集模塊、信息處理模塊和信息提取模塊。
2.根據權利要求1所述的信息收集模塊,其特征是原始信息通過標準的zlib算法將原有信息進行壓縮和打包處理,處理后的文件使用高級加密標準(Advanced Encryption Standard, AES)Rijndael 算法進行加密。
3.根據權利要求1所述的信息處理模塊,其特征是數據處理部分將2過程所得到的信息按照1 8的比例放大,放大后的信息類似于原文中一個bit現在用一個byte來表示, 新形成的信息按照html自解釋的規則進行嵌入,嵌入的方法是直接嵌入到原有htm/html 主干中。嵌入的信息由于有特殊標記,所以能夠被提取模塊準確無誤的提取出。
4.根據權利1所述的信息提取模塊,在3的基礎上被標記后能夠被輕易的識別出,提取算法即為嵌入算法的逆算法。
全文摘要
本發明是一種針對htm/html的信息隱藏系統,屬于信息安全領域。本發明的目的在于解決用戶隱私,用戶敏感信息不被他人所窺視,使得htm在傳輸網頁的同時傳輸了私有信息,存儲的文件中看似一個普通的文檔,里面其實包含用戶隱私。此系統是通過對htm/html標簽的解讀和運用,實現了信息的藏匿,得到了一個針對htm/html的信息隱藏系統。
文檔編號G06F21/00GK102226906SQ201110148640
公開日2011年10月26日 申請日期2011年6月3日 優先權日2011年6月3日
發明者張無忌, 王秋池, 董新宇 申請人:張無忌, 王秋池, 董新宇