一種基于內容改進型均值哈希的圖像檢索方法
【專利摘要】本發明公開了一種基于內容改進型均值哈希的圖像檢索方法,該方法對圖像進行縮小尺寸和灰度圖處理,通過反復離散余弦變換,并進行哈希計算處理,得到目標圖像的特征;將該特征與圖像特征庫中的特征通過相似度檢測進行匹配運算,得到檢索的結果。采用本發明方法能夠對一般圖像庫進行有效的檢索,并且有很好的檢測效果;同時可以很好地容忍有一定變形的圖像。
【專利說明】
一種基于內容改進型均值哈希的圖像檢索方法
技術領域
[0001] 本發明屬于圖像檢索技術領域,具體涉及一種基于內容改進型均值哈希的圖像檢 索方法。
【背景技術】
[0002] 近年來,隨著網絡和計算機技術的飛速發展,社會進入了以大數據為標志的網絡 數據時代,近年來,不少國際頂級刊物相繼出版專刊來探討對大數據的研究。對網絡數據的 研究對維護社會穩定、推動社會發展、提升行業競爭能力、促生新興戰略性產業及對科學研 究的方法論有著重要的作用。而網絡數據的重要組成部分一一圖像,作為包含豐富信息內 容的多媒體信息,隨著Internet的日益普及和網絡技術的不斷發展,越來越成為網絡數據 的主流。再加上各種多媒體設備,如數碼相機、拍照手機、DV等數碼產品迅速發展起來,廣泛 的應用推動了大量的圖片產生。面對如此高速產生出來的數字圖片,如果你想準確、快速的 獲取圖像信息就變得更加困難。如何挖掘蘊含在圖像中的巨大信息,如何實現對這些圖像 數據的有效組織、分析、管理,已成為網絡數據時代信息處理領域的一個重要的發展方向和 研究熱點。網絡圖像數據具有:數據量巨大、維度和信息分辨率較高、非結構化的數據形態、 解釋的多樣性、模糊性和不確定性。這些特點使得相關領域的研究成果難以被直接借鑒于 對網絡圖像數據的研究。如何合理的組織、表達、存儲、查詢和檢索這些海量的圖像數據是 目前我們面臨的亟待研究和解決的問題,也是一個重大的挑戰。建立高效的圖像檢索模型 和方法,能夠交叉多學科,綜合運用數字圖像處理、模式識別、統計學習、機器視覺等理論與 方法并與傳統數據庫技術結合起來,能夠根據圖像的底層視覺屬性特征建立起與高層語義 信息的有效關聯,給出性能良好的圖像檢索模型與方法,檢索出用戶所需的、滿意的圖像具 有重要的理論意義和現實的價值。如何準確、迅速的找到所需要的圖像,成為研究開發高效 率、高性能的圖像檢索系統的最大動力。隨著大型圖像庫的增長,基于文本的圖像檢索暴露 出來的缺陷也越來越多。為了使查詢系統更加人性化,使管理者從人工標注的繁重勞動中 解脫出來,使查詢結果更加準確和方便,促進了研究者對檢索技術的改革和研究,使圖像檢 索技術邁進了一個全新的時代。于是,基于內容的圖像檢索(Content Based Image Retrieval,CBIR)技術便成為解決這一問題的研究重點和趨勢。
[0003] 目前基于內容的圖像檢索技術主要有以下兩種方式:
[0004] (1)傳統底層特征的圖像檢索。顏色特征是圖像的基本特征之一,同時也是所有視 覺特征中表達力最強的。顏色對圖像中的對象大小和方向變化都不具有敏感性,具有很好 的魯棒性。研究圖像的顏色特征,一般先要了解幾種主要的顏色空間,主要有RGB、HSV、 CIELAB這三種空間。然后通過顏色直方圖和顏色矩來提取特征,最后對提取的特征進行相 似度匹配,從而得到結果。紋理特征也是圖像的重要特征之一,其本質是刻畫像素的鄰域灰 度空間的分布規律,主要有方向性、粒度和重復性。與顏色特征不同,紋理特征不再是基于 像素點的特征,它需要在包含多個像素點的區域中進行統計計算。因此,紋理特征具有旋轉 不變性和區域性,并且具有較強的抗噪性,廣泛應用于圖像檢索領域。但其受圖像分辨率影 響很大,當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。
[0005] (2)將用戶對圖像的理解、邏輯、情感等圖像對象的語義特征作為圖像特征進行圖 像檢索,可以稱作基于高層特征的圖像檢索或基于語義的圖像檢索。例如相關反饋、神經網 絡、哈希算法等。這些檢索方法結合了圖像處理、模式識別、人工智能、機器學習、數據庫等 模型與方法。由于圖像內容的復雜性和人類的認知主觀性,建立高效、通用的圖像索引是一 項很富有挑戰性的工作。CBIR系統可以是介于用戶和圖像數據庫間的信息交互、查詢、服務 系統。
【發明內容】
[0006] 針對現有技術所存在的上述技術問題,本發明提供了一種基于內容改進型均值哈 希的圖像檢索方法,根據對目標圖片的計算得到其具有的特殊"指紋",然后與圖片庫里面 的圖片進行匹配,最后得出較為準確的檢索結果。
[0007] 一種基于內容改進型均值哈希的圖像檢索方法,包括如下步驟:
[0008] (1)對于圖像庫中的任一圖片,將其縮小至N*N的尺寸,N為大于1的自然數;
[0009] (2)將縮小后的圖片轉換為灰度圖,得到N*N維的圖像灰度矩陣;
[0010] (3)對所述的圖像灰度矩陣進行DCT變換(離散余弦變換),得到M*M維的頻率灰度 矩陣,M為大于N的自然數;
[0011] (4)提取頻率灰度矩陣左上角N*N大小的區塊,計算該區塊N2個元素的平均值;進 而使該區塊的每個元素值與平均值進行比較,以得到該區塊每個元素的哈希值;
[0012] (5)將該區塊每行或每列元素的哈希值按次序疊合成N2位長整型的哈希值序列, 該哈希值序列即為圖片的"指紋",依此遍歷圖像庫中的所有圖片;
[0013] (6)根據步驟(1)~(5)計算得到目標圖片的哈希值序列,根據哈希值序列計算目 標圖片與圖像庫中每一圖片的相似度,進而將相似度符合閾值條件的圖片作為目標圖片的 檢索結果。
[0014] 優選地,所述的步驟(1)中將圖片縮小至8*8的尺寸;作用是能夠去除圖片的細節, 只保留結構、明暗等基本信息,摒棄不同尺寸和不同比例帶來的圖片差異。
[0015] 進一步地,所述步驟(2)的具體過程如下:
[0016] 首先,對于縮小后的圖片中的任一像素點,根據以下公式計算該像素點的灰度值 Gray :
[0017] Gray = R*0.299+G*0.587+B*0.114
[0018]其中:R、G、B分別為該像素點對應紅綠藍三色通道上的顏色值;
[0019]然后,將該像素點的灰度值Gray量化成1~64級灰度;
[0020] 最后,依此遍歷所有像素點,得到N*N維的圖像灰度矩陣,即圖像灰度矩陣中每一 元素值為對應像素點的灰度級別。
[0021] 進一步地,所述的步驟(3)中根據以下公式對圖像灰度矩陣進行DCT變換:
[0023]其中:f(x,y)為頻率灰度矩陣中第x行第y列元素值,F(0,0)為圖像灰度矩陣中第0 行第0列元素值,F(u,0)為圖像灰度矩陣中第u行第0列元素值,F(0,v)為圖像灰度矩陣中第 〇行第v列元素值,F(u,v)為圖像灰度矩陣中第u行第v列元素值,x和y均為自然數且 M,0^y^M〇
[0024]優選地,所述的步驟(3)對圖像灰度矩陣進行DCT變換過程中使M設定為32;DCT是 把圖片分解頻率聚集和梯狀形,通過計算DCT能夠把圖片分離成頻率的集合。
[0025] 進一步地,所述的步驟(4)中使該區塊的每個元素值與平均值進行比較:若元素值 大于等于平均值,則將該元素的哈希值記為1;若元素值小于平均值,則將該元素的哈希值 記為0。
[0026] 進一步地,所述的步驟(6)中根據哈希值序列通過計算目標圖片與圖像庫中每一 圖片的漢明距離來表示圖片之間的相似度。
[0027] 本發明在基于內容的均值哈希算法的基礎上,通過離散變換的相關計算,求出圖 片的哈希值,然后再離散變換計算得出"指紋"作為特征進行匹配檢索。故相對于現有技術, 本發明具有以下有益技術效果:
[0028] (1) -般的基于內容均值哈希算法雖然簡單快速,不受圖片大小縮放的影響,但它 有一個缺點就是受均值的影響很大,如果對圖片進行伽馬校正或直方圖均衡,就會影響到 均值,從而影響最終的識別效果。而本發明基于內容的改進均值哈希算法只要圖片變形程 度不過高,它都可以匹配原圖,它采用的是DCT(離散余弦變換)來降低頻率。
[0029] (2)本發明根據數字圖像處理的有關知識,其應用的公式和步驟相對于一般的哈 希算法而言更加減少計算時間。
【附圖說明】
[0030] 圖1為本發明圖像檢索方法的流程示意圖。
【具體實施方式】
[0031] 為了更為具體地描述本發明,下面結合附圖及【具體實施方式】對本發明的技術方案 進行詳細說明。
[0032] 基于內容的圖像檢索的特點:(1)基于內容檢索改變了傳統的依靠文本標注的狀 態,依靠圖像的特征值進行檢索,使檢索更加方便、快捷,更加有效的滿足了人們的需求。 (2)由于采用的匹配技術不是精確的,而是近似的,對內容相同但大小和方向不同的圖像有 很好的檢索效果,使圖像之間具有較好的相互關聯性。(3)在實際應用的大型圖片庫中,圖 片的數量巨大,種類繁多,這就要求檢索系統要有迅速準確的進行大批量檢索的能力。(4) 具有有效的反饋能力。在圖像檢索過程中,使用者的檢索目的和首次采用的相似性度量可 能存在一定的誤差,需要通過使用者的反饋,掌握用戶的目的,調整檢索過程,有效地提高 檢索效率和精度。
[0033] 本發明方法針對圖像檢索技術的研究,在均值哈希算法中對圖像檢索做了進一步 的處理。首先對圖像做縮小處理,去彩色后進行灰度運算,計算離散變換率,取出哈希值,得 出目標圖片的"指紋"。然后和圖片庫通過相似度檢索進行匹配運算,通過用戶的反饋得到 想要的檢索結果。
[0034] 如圖1所示,本發明提出的基于內容的改進均值哈希的圖像檢索方法,包括以下步 驟:
[0035] 步驟一:創建圖像庫,收集具有研究價值的圖片。進行歸類處理,每一類的圖片數 量統一,構建一個完整系統的圖像庫。
[0036] 步驟二:對圖像庫中的圖片進行處理,構建一個圖像特征庫,具體操作如下,縮小 圖片的尺寸,去除高頻和細節的最快方法就是縮小圖片,將圖片縮小到8*8的尺寸,總共64 個像素。不需要保持縱橫比,只需要將其變為8*8的正方形。這樣就可以比較任意大小的圖 片。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸和不同 比例帶來的圖片差異。
[0037] 步驟三:簡化色彩,利用灰度公式Gray = R*0.299+G*0.587+B*0.114將彩色圖轉化 為灰度圖:將縮小后的圖片,轉為64級灰度。也就是說,所有像素點總共只有64種灰度級別。 [0038]步驟四:對圖片庫中每個圖片進行DCT(離散余弦變換),DCT是把圖片分解頻率聚 集和梯狀形,雖然JPEG使用8*8的DCT變換,本實施方式在這里使用32*32的DCT變換。通過計 算DCT把圖片分離成頻率的集合。其計算公式如下:
[0039] 正變換:
[0044] 正變換公式中f (x,y)是空間域二維向量之元素,x,y = 0,1,2,......N_1 ;F(u,v) 是變換系數陣列之元素,式中表示的陣列為N*N。
[0045] 反變換:
[0047]反變換公式中的符號意義同正變換式一樣。正變換和反變換公式是離散余弦變換 的解析式定義。二維離散余弦變換也可以寫成矩陣式: _] [F(u,v)] = [A][f(x,y)][A]T _] [f(x,y)] = [A]T[F(u,v)][A]
[0050]其中:[f(x,y)]是空間數據陣列,A是變換系數陣列,[F(u,v)]是變換矩陣,[A]T是 [A]的轉置。
[00511步驟五:縮小DCT:雖然DCT結果是32*32大小的矩陣,但只要保留左上角的8*8的矩 陣,這部分呈現了圖片中的最低頻率。
[0052]步驟六:計算平均值:計算縮小DCT后的所有64個像素點的平均值。
[0053]步驟七:進一步縮小DCT:根據8*8的DCT矩陣,設置0或1的64位的哈希值,大于等于 DCT均值的記為1;小于平均值,記為0。結果并不能告訴我們真實性的低頻率,只能粗略地告 訴我們相對于平均值頻率的相對比例。只要圖片的整體結構保持不變,哈希結果值就不變。 這樣能夠避免伽馬校正或調整顏色直方圖被調整帶來的影響。
[0054]步驟八:計算哈希值:將64bit設置成64位的長整型,組合的次序并不重要,只要保 證圖片庫中所有圖片都采用同樣次序就行了。將32*32的DCT轉換成32*32的圖像。
[0055]步驟九:將上一步的比較結果,組合在一起,就構成了一個64位的整數,即為圖片 的"指紋"。重復上面步驟二到步驟九,構建圖片庫中所有圖片的"指紋"組成一個圖像特征 庫,然后建立一個索引表。
[0056] 步驟十:用戶上傳目標圖像過來,進行搜索后,重復步驟二到步驟九,得到目標圖 像的"指紋"。
[0057] 步驟十一:將目標圖像的"指紋"特征和圖像特征庫里面的指紋特征進行匹配,通 過查看64位指紋中有多少位不同來確定圖片的相似度。理論上,這一步等同于計算漢明距 離。漢明距離是以理查德?衛斯里?漢明的名字命名的。在信息論中,兩個等長字符串之間 的漢明距離是兩個字符串對應位置的不同字符的個數,即它就是將一個字符串變換成另外 一個字符串所需要替換的字符個數。
[0058] 如果不相同的數據不超過5,就說明兩幅圖片很相似;如果不相同的數據位超過 10,就說明兩幅圖片完全不同。將匹配出來的相似圖片從特征數據庫中顯示出來。
[0059] 本實施方式在基于內容的改進的均值哈希算法的基礎上,通過離散變換的相關運 算,求出圖片的哈希值,然后再離散變換計算得出"指紋"作為特征進行匹配檢索,期間建立 了圖像特征庫與目標特征進行匹配。
[0060] 上述的對實施例的描述是為便于本技術領域的普通技術人員能理解和應用本發 明。熟悉本領域技術的人員顯然可以容易地對上述實施例做出各種修改,并把在此說明的 一般原理應用到其他實施例中而不必經過創造性的勞動。因此,本發明不限于上述實施例, 本領域技術人員根據本發明的揭示,對于本發明做出的改進和修改都應該在本發明的保護 范圍之內。
【主權項】
1. 一種基于內容改進型均值哈希的圖像檢索方法,包括如下步驟: (1) 對于圖像庫中的任一圖片,將其縮小至N*N的尺寸,N為大于1的自然數; (2) 將縮小后的圖片轉換為灰度圖,得到N*N維的圖像灰度矩陣; (3) 對所述的圖像灰度矩陣進行DCT變換,得到M*M維的頻率灰度矩陣,M為大于N的自然 數; (4) 提取頻率灰度矩陣左上角N*N大小的區塊,計算該區塊N2個元素的平均值;進而使該 區塊的每個元素值與平均值進行比較,W得到該區塊每個元素的哈希值; (5) 將該區塊每行或每列元素的哈希值按次序疊合成妒位長整型的哈希值序列,該哈希 值序列即為圖片的"指紋",依此遍歷圖像庫中的所有圖片; (6) 根據步驟(1)~(5)計算得到目標圖片的哈希值序列,根據哈希值序列計算目標圖 片與圖像庫中每一圖片的相似度,進而將相似度符合闊值條件的圖片作為目標圖片的檢索 結果。2. 根據權利要求1所述的圖像檢索方法,其特征在于:所述的步驟(1)中將圖片縮小至 8*8的尺寸。3. 根據權利要求1所述的圖像檢索方法,其特征在于:所述步驟(2)的具體過程如下: 首先,對于縮小后的圖片中的任一像素點,根據W下公式計算該像素點的灰度值Gray: Gray = R*0.299+G*0.587+B*0.114 其中:R、G、B分別為該像素點對應紅綠藍=色通道上的顏色值; 然后,將該像素點的灰度值Gray量化成1~64級灰度; 最后,依此遍歷所有像素點,得到N*N維的圖像灰度矩陣,即圖像灰度矩陣中每一元素 值為對應像素點的灰度級別。4. 根據權利要求1所述的圖像檢索方法,其特征在于:所述的步驟(3)中根據W下公式 對圖像灰度矩陣進行DCT變換:其中:f(x,y)為頻率灰度矩陣中第X行第y列元素值,F(0,0)為圖像灰度矩陣中第O行第 O列元素值,F(u,0)為圖像灰度矩陣中第U行第O列元素值,F(0,v)為圖像灰度矩陣中第O行 第V列元素值,F(u,v)為圖像灰度矩陣中第U行第V列元素值,X和y均為自然數且0《x《M,O5. 根據權利要求1所述的圖像檢索方法,其特征在于:所述的步驟(3)對圖像灰度矩陣 進行DCT變換過程中使M設定為32。6. 根據權利要求1所述的圖像檢索方法,其特征在于:所述的步驟(4)中使該區塊的每 個元素值與平均值進行比較:若元素值大于等于平均值,則將該元素的哈希值記為1;若元 素值小于平均值,則將該元素的哈希值記為0。7.根據權利要求1所述的圖像檢索方法,其特征在于:所述的步驟(6)中根據哈希值序 列通過計算目標圖片與圖像庫中每一圖片的漢明距離來表示圖片之間的相似度。
【文檔編號】G06F17/30GK105912643SQ201610217779
【公開日】2016年8月31日
【申請日】2016年4月8日
【發明人】黃文清, 吳強, 戴佳哲, 尤輝, 梅力
【申請人】浙江理工大學