商標圖像檢索方法
【專利摘要】本發明的商標圖像檢索方法包括:對樣本商標圖像進行顏色和局部特征提取;根據灰度頻率對樣本商標圖像分類;進行前景和背景分割;根據前景和背景的像素灰度統計值確定邊緣判據;根據邊緣判據提取邊緣特征;根據邊緣特征判斷樣本商標圖像的復雜度以將樣本商標圖像分為一個以上群組;按照相同提取步驟提取待測商標圖像的顏色特征、邊緣特征和局部特征;根據邊緣特征判斷待測商標圖像的復雜度以確定其所屬群組;綜合待測商標圖像的顏色和邊緣特征在其所屬群組中進行相似度檢索;在確定待測商標圖像與其所屬群組中的每一樣本商標圖像均不相似的情況下在之外的群組中進行相似度檢索;在確定重新檢索的情況下根據待測商標圖像的局部特征進行相似度檢索。
【專利說明】商標圖像檢索方法
【技術領域】
[0001] 本發明涉及圖像檢索技術,具體地,涉及一種商標圖像檢索方法。
【背景技術】
[0002] 商標是公司、產品或服務的標志,與企業的商品質量、服務質量、經營管理融為一 體,在工商業社會中起著非常重要的作用,是公司及其產品的一個重要屬性,具有唯一性。 為使商標得到合法的保護,必須向商標局正式注冊。隨著我國經濟的發展和全球化進程的 加快,商標數量逐年遞增。防止重復注冊或相似商標注冊是商標管理的核心問題。為了保護 注冊商標的合法權益,打擊仿冒盜用注冊商標的違法行為,需要對待注冊的商標進行檢索, 與已注冊的商標進行比較,確定二者不相同或者不相近似,才具有注冊資格。
[0003] 商標圖像的識別檢索是多媒體信息檢索領域的熱點問題,圖像識別檢索方法盡管 多種多樣,但其核心問題都是圍繞特征提取。目前的商標識別檢索方法主要針對背景較簡 單的高品質商標圖像,對于圖像背景較為復雜的商標圖像的識別具有一定的局限性,識別 率較低。特別是在圖像邊緣提取過程中,往往無法保證準確地提取圖像邊緣。
【發明內容】
[0004] 本發明的目的是針對現有的商標圖像識別檢索技術在特征提取方面的局限性,提 供一種能夠針對不同類型的圖像準確提取圖像邊緣,保證邊緣檢測效果,提高商標圖像識 別準確率的商標圖像檢索方法。
[0005] 根據本發明的技術方案,提供一種商標圖像檢索方法,該方法包括以下步驟:獲取 樣本商標圖像;對樣本商標圖像進行灰度化、歸一化和濾波處理后,進行顏色特征提取和局 部特征提取;計算樣本商標圖像中的灰度頻率,并根據計算出的灰度頻率對樣本商標圖像 進行分類;根據分類的結果來確定分割閾值,以對樣本商標圖像中的前景和背景進行分割; 計算樣本商標圖像的前景和背景的像素灰度統計值,并根據所述灰度統計值確定邊緣判 據;根據確定的邊緣判據提取樣本商標圖像的邊緣特征;根據樣本商標圖像的顏色特征、 邊緣特征和局部特征建立商標特征數據庫,其中根據樣本商標圖像的邊緣特征判斷該樣本 商標圖像的復雜度,并按照樣本商標圖像的復雜度將所建立的商標特征數據庫中的樣本商 標圖像分為一個以上的群組;獲取待測商標圖像;對待測商標圖像進行灰度化、歸一化和 濾波處理后,按照與樣本商標圖像相同的提取步驟,提取待測商標圖像的顏色特征、邊緣特 征和局部特征;根據待測商標圖像的邊緣特征判斷該待測商標圖像的復雜度,以確定該待 測商標圖像所屬的群組;綜合待測商標圖像的顏色特征和邊緣特征,在該待測商標圖像所 屬的群組中進行相似度檢索;在確定待測商標圖像與該待測商標圖像所屬的群組中的每一 樣本商標圖像均不相似的情況下,根據該待測商標圖像的顏色特征和邊緣特征,在該待測 商標圖像所屬的群組之外的群組中進行相似度檢索,獲得相似度檢索結果;根據用戶對所 述相似度檢索結果的反饋,判斷是否進行重新檢索;以及在確定進行重新檢索的情況下,根 據所述待測商標圖像的局部特征,在商標特征數據庫中進行相似度檢索。
[0006] 根據本發明的技術方案,在樣本商標圖像的特征提取過程中,能夠針對不同類型 的樣本圖像,按照樣本圖像的灰度分布而動態地改變分割樣本圖像為前景和背景的分割閾 值,從而動態地確定邊緣判據,進而更準確地提取樣本商標圖像的邊緣特征,同樣地,在待 測商標圖像的特征提取過程中,也按照與樣本商標圖像相同的方式進行準確的邊緣特征提 取,由此可以更好地保證圖像的邊緣檢測效果,在后續的圖像檢索過程中能夠提高商標圖 像識別準確率。
[0007] 此外,現有的商標圖像檢索針對待測商標圖像,均在由樣本商標圖像建立的商標 特征數據庫中進行相似度檢索,由于樣本商標圖像數量巨大,內容繁復,在保證準確率的前 提下往往難以兼顧檢索效率。根據本發明的技術方案,在商標特征數據庫的建立過程中,根 據樣本商標圖像的邊緣特征判斷該樣本商標圖像的復雜度,并按照樣本商標圖像的復雜度 將所建立的商標特征數據庫中的樣本商標圖像分為一個以上的群組,由此在后續的相似度 檢索中,根據待測商標圖像的邊緣特征判斷該待測商標圖像的復雜度以確定該待測商標圖 像所屬的群組,在該待測商標圖像所屬的群組中進行相似度檢索,而無需在整個商標特征 數據庫中進行檢索,縮短了檢索時間,由此,本發明的商標圖像檢索方法在保證檢索準確率 的同時大大提1? 了圖像檢索效率。
[0008] 更進一步地,根據本發明的技術方案,在未檢索到近似商標圖像的情況下,在該待 測商標圖像所屬的群組之外的群組中進行相似度檢索,并且在以待測商標圖像的全局特征 進行的檢索仍無法獲得滿意的檢測結果的情況下,根據待測商標圖像的局部特征,在商標 特征數據庫中再次進行相似度檢索,由此能夠更好地保證相似度檢索的準確性。
[0009] 本發明提供的商標圖像檢索方法能夠針對不同類型的圖像準確提取圖像邊緣,保 證邊緣檢測效果,提高商標圖像識別準確率,同時還能夠提高圖像檢索效率,保證相似度檢 索的準確性。
[0010] 本發明的其他特征和優點將在隨后的【具體實施方式】部分予以詳細說明。
【專利附圖】
【附圖說明】
[0011] 附圖是用來提供對本發明的進一步理解,并且構成說明書的一部分,與下面的具 體實施方式一起用于解釋本發明,但并不構成對本發明的限制。在附圖中:
[0012] 圖1是本發明提供的商標圖像檢索方法的流程示意圖;
[0013] 圖2是調整前景不清楚的圖像類型I的分割閾值的流程示意圖;以及
[0014] 圖3是調整背景不清楚的圖像類型II的分割閾值的流程示意圖。
【具體實施方式】
[0015] 以下結合附圖對本發明的【具體實施方式】進行詳細說明。應當理解的是,此處所描 述的【具體實施方式】僅用于說明和解釋本發明,并不用于限制本發明。
[0016] 本發明提供了一種商標圖像檢索方法,如圖1所示,該方法包括以下步驟:獲取樣 本商標圖像;對樣本商標圖像進行灰度化、歸一化和濾波處理后,進行顏色特征提取和局部 特征提取;計算樣本商標圖像中的灰度頻率,并根據計算出的灰度頻率對樣本商標圖像進 行分類;根據分類的結果來確定分割閾值,以對樣本商標圖像中的前景和背景進行分割; 計算樣本商標圖像的前景和背景的像素灰度統計值,并根據所述灰度統計值確定邊緣判 據;根據確定的邊緣判據提取樣本商標圖像的邊緣特征;根據樣本商標圖像的顏色特征、 邊緣特征和局部特征建立商標特征數據庫,其中根據樣本商標圖像的邊緣特征判斷該樣本 商標圖像的復雜度,并按照樣本商標圖像的復雜度將所建立的商標特征數據庫中的樣本商 標圖像分為一個以上的群組;獲取待測商標圖像;對待測商標圖像進行灰度化、歸一化和 濾波處理后,按照與樣本商標圖像相同的提取步驟,提取待測商標圖像的顏色特征、邊緣特 征和局部特征;根據待測商標圖像的邊緣特征判斷該待測商標圖像的復雜度,以確定該待 測商標圖像所屬的群組;綜合待測商標圖像的顏色特征和邊緣特征,在該待測商標圖像所 屬的群組中進行相似度檢索;在確定待測商標圖像與該待測商標圖像所屬的群組中的每一 樣本商標圖像均不相似的情況下,根據該待測商標圖像的顏色特征和邊緣特征,在該待測 商標圖像所屬的群組之外的群組中進行相似度檢索,獲得相似度檢索結果;根據用戶對所 述相似度檢索結果的反饋,判斷是否進行重新檢索;以及在確定進行重新檢索的情況下,根 據所述待測商標圖像的局部特征,在商標特征數據庫中進行相似度檢索。
[0017] 根據本發明的技術方案,為了方便圖像特征提取,首先需要對樣本商標為圖像商 標還是文字圖像組合商標進行判斷。由此,本發明提供的商標圖像檢索方法包括以下步驟: 判斷樣本商標和待測商標是否為文字圖像組合商標,并在確定樣本商標為文字圖像組合商 標時,對樣本商標進行文字和圖像的分割,以獲取樣本商標圖像。
[0018] 其中,所述文字和圖像的分割可以根據實際情況的需要采用基于連通域投影法、 基于連通域面積法、以及基于結構的子圖抽取法中的一種來實現,本發明不對其進行限定。
[0019] 基于連通域投影法:對于文字圖像組合商標來說,雖然商標中的文字部分可能由 漢字、拼音和英文組成且字體、大小、形狀不規則,但是文字通常以行的形式出現,同一行中 的文字個數多于一個且文字的高度相差不大,而商標中的圖形部分通常單獨位于一行且與 文本行間存在間隔。這是文字圖像組合商標中最常見的情況。基于連通域投影的文字消除 方法是將連通域分解所得到的子圖像沿水平方向投影,然后按照投影的結果分層為文本層 和圖形層,確定圖形所在的層且保留該層。
[0020] 基于連通域面積法:圖形是商標的關鍵部分,在大部分文字圖像組合商標中,圖形 在面積上占主導地位。商標中的文字無論出現在圖形的內部或者外部,與圖形相比所占的 面積都較小,定義一個面積閾值可以達到去掉噪聲面積較小的文字的目的,而對面積較大 的子圖形來說,在消除文字噪聲前需要做一些判斷,防止誤消除一些有用的子圖形。基于連 通域面積法主要利用圖形的外圍特征和筆劃穿刺特征把文字和圖形區分開來,因為文字通 常是由很多筆劃組成的不封閉圖形,而圖形的外輪廓比較平滑,通過該方法可以消除圖形 內部的文字,也可以消除和圖形的投影相重疊的文字。
[0021] 基于結構的子圖抽取法:在部分文字圖像組合商標中,與文字部分相比,圖形部分 并不占據明顯的優勢,且圖形部分通常和文字部分完全重疊。通常在商標圖案的寬高差別 較大時,會出現圖形在面積上不占優勢的情況,另外,與其它的圖像相比,這些圖像的結構 比較規則,即具有確定的結構。基于結構的子圖抽取法對圖像的處理過程如下:對于橫向商 標圖像,首先計算圖像的寬高比并判斷是否大于給定的閾值,對寬高比較大的圖像(大于 閾值),確定該圖像的結構,如果滿足事先給定的結構,則保留相應的圖像部分。對于縱向商 標圖像,可將商標圖像逆時針旋轉90度,然后按照橫向商標圖像的方法處理。
[0022] 根據本發明的技術方案,在獲取樣本商標圖像之后,為了方便特征比較,保證圖像 尺寸和格式的統一性以及清晰度,對樣本商標圖像進行特征提取之前,需要對樣本商標圖 像進行灰度化、歸一化和濾波處理。
[0023] 將彩色圖像轉化成灰度圖像的過程稱為圖像的灰度化處理。彩色圖像中每個像素 的顏色由R、G、B三個分量決定,而每個分量有255中值可取,這樣一個像素點可以有1600 多萬(255*255*255)的顏色的變化范圍。而灰度圖像是R、G、B三個分量相同的一種特殊的 彩色圖像,其一個像素點的變化范圍為255種,在數字圖像處理中,通常先將各種格式的圖 像轉變成灰度圖像,以使后續圖像的計算量變得少一些。灰度圖像的描述與彩色圖像一樣, 仍然反映了整幅圖像的整體和局部的色度和亮度等級的分布和特征。圖像灰度化處理的常 用方法有分量法、最大值法及加權平均法等,其原理及計算過程為本領域技術人員所公知。
[0024] 圖像的歸一化是通過一系列變換(即利用圖像的不變矩尋找一組參數使其能夠 消除其他變換函數對圖像變換的影響),將待處理的原始圖像轉換成相應的唯一標準形式 (該標準形式圖像對平移、旋轉、縮放等仿射變換具有不變特性)。由于樣本商標圖像通常 具有不同的格式和尺寸,為了方便特征比較,需要對其中的樣本商標圖像進行歸一化處理。 樣本商標圖像的格式轉換可以采用格式化軟件提前進行處理,并通過尺寸歸一化將樣本商 標圖像縮放為同一尺寸。根據本發明的技術方案,可以將樣本商標圖像的高度和寬度設為 256個像素點。
[0025] 為了保證圖像的清晰度,還需要對樣本商標圖像進行濾波處理。根據本發明的技 術方案,可以采用中值濾波(一種非線性平滑技術,其基本原理是將數字圖像或數字序列 中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍的像素值接近真實值,從而消 除孤立的噪聲點)對圖像進行濾波處理。
[0026] 根據本發明的技術方案,在對樣本商標圖像進行灰度化、歸一化和濾波處理后,首 先對處理后的樣本商標圖像進行顏色特征提取和局部特征提取。
[0027] 對樣本商標圖像進行顏色特征提取可以包括:A)對樣本商標圖像進行顏色特征 量化;以及B)提取顏色直方圖。
[0028] 常用的顏色特征量化方法有非間隔量化法和階層聚類法。本發明采用的方法為對 HSV(H為色調,S為飽和度,V為亮度)顏色空間進行48維非間隔量化,具體步驟如下:
[0029] 將色調H分成8份,飽和度S分成3份,亮度V分成2份;對色調H、飽和度S、亮度 V進行量化:
【權利要求】
1. 一種商標圖像檢索方法,其特征在于,該方法包括以下步驟: 獲取樣本商標圖像; 對樣本商標圖像進行灰度化、歸一化和濾波處理后,進行顏色特征提取和局部特征提 取; 計算樣本商標圖像中的灰度頻率,并根據計算出的灰度頻率對樣本商標圖像進行分 類; 根據分類的結果來確定分割閾值,以對樣本商標圖像中的前景和背景進行分割; 計算樣本商標圖像的前景和背景的像素灰度統計值,并根據所述灰度統計值確定邊緣 判據; 根據確定的邊緣判據提取樣本商標圖像的邊緣特征; 根據樣本商標圖像的顏色特征、邊緣特征和局部特征建立商標特征數據庫,其中根據 樣本商標圖像的邊緣特征判斷該樣本商標圖像的復雜度,并按照樣本商標圖像的復雜度將 所建立的商標特征數據庫中的樣本商標圖像分為一個以上的群組; 獲取待測商標圖像; 對待測商標圖像進行灰度化、歸一化和濾波處理后,按照與樣本商標圖像相同的提取 步驟,提取待測商標圖像的顏色特征、邊緣特征和局部特征; 根據待測商標圖像的邊緣特征判斷該待測商標圖像的復雜度,以確定該待測商標圖像 所屬的群組; 綜合待測商標圖像的顏色特征和邊緣特征,在該待測商標圖像所屬的群組中進行相似 度檢索; 在確定待測商標圖像與該待測商標圖像所屬的群組中的每一樣本商標圖像均不相似 的情況下,根據該待測商標圖像的顏色特征和邊緣特征,在該待測商標圖像所屬的群組之 外的群組中進行相似度檢索,獲得相似度檢索結果; 根據用戶對所述相似度檢索結果的反饋,判斷是否進行重新檢索;以及 在確定進行重新檢索的情況下,根據所述待測商標圖像的局部特征,在商標特征數據 庫中進行相似度檢索。
2. 根據權利要求1所述的方法,其特征在于,該方法還包括以下步驟: 判斷樣本商標和待測商標是否為文字圖像組合商標,并在確定樣本商標和/或待測商 標為文字圖像組合商標時,對樣本商標和/或待測商標進行文字和圖像的分割,以獲取樣 本商標圖像和/或待測商標圖像。
3. 根據權利要求2所述的方法,其特征在于,所述文字和圖像的分割采用基于連通域 投影法、基于連通域面積法、以及基于結構的子圖抽取法中的一種來實現。
4. 根據權利要求1所述的方法,其特征在于,所述對樣本商標圖像進行顏色特征提取 包括:A)對樣本商標圖像進行顏色特征量化;以及B)提取顏色直方圖。
5. 根據權利要求4所述的方法,其特征在于,步驟A)對樣本商標圖像進行顏色特征量 化包括: 將色調H分成8份,飽和度S分成3份,亮度V分成2份; 對色調H、飽和度S、亮度V進行量化:
9 量化完成后,HSV顏色空間被劃分成LHXLSXLV個區間,其中LH、LS、LV分別為H、S、V的量化級數; 把量化后的三個顏色分量合成一維顏色特征向量G: G=H*LH+S·LS+V·LV; 根據量化的數目,LH= 8,LS= 3,LV= 2得出: G= 8H+3S+2V; H,S,V三個分量在一維矢量上分布開來,G的取值范圍為[0,1,· 47]。
6. 根據權利要求1所述的方法,其特征在于,所述對樣本商標圖像進行分類包括:將 樣本商標圖像分為正常圖像類型〇、前景不清楚的圖像類型I、以及背景不清楚的圖像類型 II。
7. 根據權利要求6所述的方法,其特征在于,所述確定分割閾值包括:確定所述正常圖 像類型〇的分割閾值為初始分割閾值,確定所述前景不清楚的圖像類型I和背景不清楚的 圖像類型II的分割閾值為經過調節的分割閾值。
8. 根據權利要求1所述的方法,其特征在于,所述確定邊緣判據包括:根據像素灰度統 計值小于分割閾值的象素的灰度統計均值和像素灰度統計值大于分割閾值的象素的灰度 統計均值之差來確定邊緣判據。
9. 根據權利要求8所述的方法,其特征在于,所述前景不清楚的圖像類型I和背景不清 楚的圖像類型II的分割閾值還根據從初始分割閾值到灰度統計均值的象素數來確定。
10. 根據權利要求1所述的方法,其特征在于,所述局部特征為尺度不變特征轉換特征 或加速魯棒性特征。
11. 根據權利要求1所述的方法,其特征在于,所述綜合待測商標圖像的顏色特征和邊 緣特征在商標特征數據庫中進行檢索包括:對待測商標圖像的顏色特征和形狀特征賦予權 重值,按照顏色特征和形狀特征的權重值進行檢索。
【文檔編號】G06F17/30GK104462381SQ201410752382
【公開日】2015年3月25日 申請日期:2014年12月11日 優先權日:2014年12月11日
【發明者】孔軍民 申請人:北京中細軟移動互聯科技有限公司