專利名稱:基于視覺注意模型的壓縮域敏感圖像識別方法
基于視覺注意模型的壓縮域敏感圖像識別方法技術領域
本發明以網絡中JPEG壓縮格式的敏感圖像為研究對象(本發明特指色情圖像), 運用壓縮域圖像處理技術,根據人眼注意視覺機制建立針對敏感圖像的視覺注意模型,重點分析圖像中的敏感(色情)區域,提取敏感區域內的顏色、紋理、亮度和膚色特征,構建描述敏感圖像內容的視覺單詞庫,然后根據這些敏感視覺單詞在圖像中的分布情況,采用支持向量機的圖像識別方法進行敏感圖像的識別與過濾,為網絡信息監管領域提供基于人眼視覺注意的敏感圖像識別與過濾方法。
背景技術:
隨著互聯網技術的飛速發展,網絡成為了人們傳播和分享信息的重要媒介,但至今缺乏一個有效的機構對這些信息進行監管,導致色情圖像不良信息大量傳播。受此影響, 互聯網色情信息服務產業得以快速發展,并已形成了一個巨大的產業鏈,其年利潤遠超過以下著名企業的總和微軟、谷歌、雅虎、蘋果和EarthLink。網絡中色情信息的大量傳播、 蔓延,極大地危害了社會穩定和人們的身心健康,尤其影響了青少年的健康成長。此外,許多色情網站在提供色情信息的同時還傳播病毒、木馬以及流氓軟件,從而竊取重要的私人信息,嚴重妨礙了人們的正常上網。因此,采取相關技術手段,遏制互聯網色情產業發展,嚴厲打擊從事非法色情服務的網站是一個需要重視的社會問題。
為了讓青少年遠離敏感信息的侵擾,方便家長對子女網上沖浪進行監控,從上個世紀開始,陸續出現了很多家用反黃軟件,這些敏感信息過濾軟件的實現主要采用兩種技術一種是網址過濾和文本信息分析技術;另一種則結合了基于圖像內容分析的過濾技術。前一種技術不能適用于圖像識別,無法準確地自動過濾包含敏感信息的圖像。而后一種技術則利用圖像處理技術和模式識別的方法,提取描述圖像信息的視覺特征,檢測圖像中是否含有敏感信息,并取得了較好的效果。但是,這類方法也面臨著巨大的挑戰,圖像是否包含色情信息是一種高層語義概念,具有不同教育程度、背景、經歷的用戶有著不同的解釋,因而從它的定義上來說就不具有統一的標準。由于在不同的背景、光照條件下,色情圖像會表現出各種各樣的形式,因此很難找到一些穩定的特征來準確、完整地表征這類圖像, 這給敏感圖像的準確識別帶來了很大的難度。另外,對于網絡環境來說,處理的實時性也是必須考慮的一個重要因素,識別算法自身的復雜程度過高所帶來的延時往往會造成網絡鏈接的中斷。
基于視覺單詞的敏感圖像識別與過濾技術是通過尋找圖像中局部突出的興趣點, 并對這些興趣點建立旋轉、尺度、仿射不變的局部描述,從而建立視覺單詞庫,描述圖像的語義內容,然后引入模式識別技術完成類別的判定。它為缺乏準確描述圖像敏感信息的特征描述算子這一問題,提供了一種重要的解決思路。壓縮域圖像處理技術是充分利用圖像壓縮算法及其所形成壓縮數據的特點,直接在盡量少解碼的壓縮數據上進行圖像處理。與傳統的圖像壓縮與處理相互分離的方式不同,它省略了解壓縮和再壓縮的附加環節,減少了圖像處理的數據量,有效地提高了圖像處理的速度。將上述兩種技術有機地結合在一起,并引入視覺注意模型在壓縮域檢測敏感區域,然后提取區域內顏色、紋理、亮度和膚色特征作為視覺單詞,完成敏感圖像的識別與過濾,不但能提高系統的識別準確率,而且可以滿足敏感圖像實時處理的要求,對網絡信息的監管具有重要的研究意義發明內容
本發明與已有的基于視覺單詞的敏感圖像識別方法不同,針對網絡上大部分以 JPEG壓縮格式存在的敏感圖像,引入壓縮域圖像處理技術,并根據人眼視覺注意機制,建立視覺注意模型檢測符合人主觀感受的敏感區域,通過提取區域內的顏色、紋理、亮度和膚色特征建立視覺單詞庫,完成敏感圖像的識別。這個方法主要分為兩大步驟視覺單詞庫構建和敏感圖像識別。其中,視覺單詞庫構建又可細分為四個步驟視覺注意模型建立,敏感區域檢測,特征提取和聚類分析,整個流程如附圖
I所示。敏感圖像的識別則可細分為訓練和測試兩個階段,其中訓練階段分為五個步驟,視覺注意模型建立,敏感區域檢測,特征提取,視覺單詞直方圖建立和支持向量機分類器建立。而測試階段也分為五個步驟,前四步與訓練階段相同,最后一步則是利用訓練階段建立的分類器對圖像進行識別,敏感圖像識別流程如附圖2所示。
當用戶輸入圖像進行識別時,首先檢測圖像的敏感區域,然后提取顏色、紋理、亮度和膚色特征,并根據視覺單詞庫構建描述圖像內容的視覺單詞直方圖,最后通過支持向量機分類器對圖像類別進行判決,得到圖像識別結果。
本發明以網絡中JPEG壓縮格式的敏感圖像為研究對象(本發明特指色情圖像), 運用壓縮域圖像處理技術,根據人眼視覺注意機制建立針對敏感圖像的視覺注意模型,重點分析圖像中的敏感區域,分別提取區域內顏色、紋理、亮度和膚色特征,構建描述圖像內容的視覺單詞庫,然后根據這些單詞在圖像中的分布情況,采用支持向量機的圖像識別方法進行敏感圖像的識別與過濾,為網絡信息監管領域提供基于人眼視覺注意的敏感圖像識別與過濾方法。
I.視覺單詞庫構建
本發明從敏感圖像特點出發,運用壓縮域圖像處理技術,根據人眼視覺注意機制, 建立視覺注意模型,檢測出敏感區域,然后提取敏感區域的顏色、紋理、亮度和膚色壓縮域特征,構建視覺單詞庫。
I)視覺注意模型建立本發明首先尋找圖像中最容易引起注意的顯著部分,并用一幅灰度圖像表示顯著度,圖中越亮的地方即灰度值越大的區域越能引起人的注意。與大部分正常圖像相比,網絡中的敏感圖像往往包含大量裸露的膚色區域,通過分析這些區域, 能夠比較容易地得到暴露的人體性器官所在的位置,而這些圖像內容恰恰是人們最為關注的。因此,對圖像進行膚色檢測,計算圖像的視覺顯著度,建立視覺注意模型。實際中,主要是利用壓縮域圖像處理技術進行膚色檢測。利用從大量標記的膚色和非膚色圖像塊中提取的顏色和紋理特征,建立決策樹模型,通過分析找到與膚色相關度最大的一組特征對應的規則作為最終膚色模型。隨后,根據膚色判決規則計算膚色似然圖,該圖反映了原始圖像的膚色概率分布信息,圖中各點像素值越高膚色的可能性越大。接著,本發明采用公式(I)對膚色似然圖進行閾值分割,將大于閾值的圖像像素點判定為膚色,反之為非膚色。然后,將膚色似然圖作為顏色關注圖,并從JPEG圖像的壓縮碼流中得到圖像的亮度信息計算亮度關注圖,然后分別進行多尺度高斯濾波,計算中央周邊差,最后進行歸一化合并和線性組合得到視覺顯著圖,整個計算過程如附圖3所示。視覺顯著圖是一幅灰度圖,圖中各點像素值反映了顯著度的大小,即人眼關注度的大小。
權利要求
1.基于視覺注意模型的壓縮域敏感圖像識別方法,其特征在于分為兩個步驟視覺單詞庫構建和敏感圖像識別,其中,視覺單詞庫構建又可細分為四個步驟視覺注意模型建立,敏感區域檢測,特征提取和聚類分析;敏感圖像的識別則可細分為訓練和測試兩個階段,其中訓練階段分為五個步驟視覺注意模型建立,敏感區域檢測,特征提取,視覺單詞直方圖建立和支持向量機分類器建立;而測試階段也分為五個步驟,前四步與訓練階段相同, 最后一步則是利用訓練階段建立的分類器對圖像進行識別;當用戶輸入圖像進行識別時,首先檢測圖像的敏感區域,然后提取顏色、紋理、亮度和膚色特征構建視覺單詞庫,并根據視覺單詞庫構建描述圖像內容的視覺單詞直方圖,最后通過支持向量機分類器對圖像類別進行判決,得到圖像識別結果;I).視覺單詞庫構架從敏感圖像特點出發,運用壓縮域圖像處理技術,根據人眼視覺注意機制,建立視覺注意模型,檢測出敏感區域,提取敏感區域的顏色、紋理、亮度和膚色壓縮域特征,構建視覺單詞庫,具體步驟如下I. I視覺注意模型建立利用壓縮域圖像處理技術進行膚色檢測,利用從大量標記的膚色和非膚色圖像塊中提取的顏色和紋理特征,建立決策樹模型,通過分析找到與膚色相關度最大的一組特征對應的規則作為最終膚色模型;隨后,根據膚色判決規則計算膚色似然圖,該圖反映了原始圖像的膚色概率分布信息,圖中各點像素值越高膚色的可能性越大;接著,采用公式(I)對膚色似然圖進行閾值分割,將大于閾值的圖像像素點判定為膚色,反之為非膚色;然后,將膚色似然圖作為顏色關注圖,并從JPEG圖像的壓縮碼流中得到圖像的亮度信息計算亮度關注圖,然后分別進行多尺度高斯濾波,計算中央周邊差,最后進行歸一化合并和線性組合得到視覺顯著圖,視覺顯著圖是一幅灰度圖,圖中各點像素值反映了顯著度的大小,即人眼關注度的大小;
全文摘要
基于視覺注意模型的壓縮域敏感圖像識別方法屬于圖像識別領域。本發明對現有的基于視覺單詞的敏感圖像識別方法進行改進,根據人眼視覺注意機制,建立視覺注意模型,檢測出符合人主觀感受的敏感區域,然后提取相關特征,生成視覺單詞庫,從而有效地提高了視覺單詞的表征性,得到了能夠準確描述圖像敏感信息的特征,進而達到提高敏感圖像識別準確率的目的。此外,本發明還引入了壓縮域圖像處理技術,利用JPEG圖像壓縮數據的特點,快速檢測圖像的敏感區域并提取其特征,有效地提高了視覺單詞庫構建和圖像識別的速度。
文檔編號G06K9/66GK102938054SQ20121032883
公開日2013年2月20日 申請日期2012年9月6日 優先權日2012年9月6日
發明者張菁, 隋磊, 卓力, 李振偉 申請人:北京工業大學