基于多特征融合的簡單背景下的葉片識別方法
【技術領域】
[0001] 本發明屬于計算機圖像處理領域,涉及一種基于多特征融合的簡單背景下的葉片 識別方法。
【背景技術】
[0002] 隨著圖像獲取設備及互聯網的迅速發展,海量的圖像數據正在生成,而這些圖像 所包含的信息也變得越來越重要。如何利用計算機視覺、機器學習等技術方便、快速地檢索 圖像,也逐漸變成了研宄熱點。
[0003] 從上世紀70年代開始,圖像檢索這個領域已經十分活躍。首先主要是基于文本的 圖像檢索技術,將圖像與對其的文本描述存儲至數據庫中,而查詢時是根據對圖像的文本 描述進行檢索。但是慢慢的基于文本的圖像檢索技術的問題就越來越多了。由于當時的技 術受限必須由人工來對圖像進行進行關鍵字的標注工作,非但十分耗時耗力,而且人工的 標注往往存在一些偏差,最終導致錯誤的檢索結果。同時,圖像中包含的視覺特征在該技術 下也被完全忽略了。
[0004] 到了上世紀90年代,為了克服基于文本的圖像檢索技術產生的一系列問題,基于 內容的圖像檢索技術誕生了。基于內容的圖像檢索技術不需要對圖像進行人工標注,而是 利用計算機視覺技術對越圖像提取其視覺特征,例如顏色、形狀和紋理等,然后再對特征進 行匹配,最后返回用戶相似的圖像。現在,該技術已經得到了廣泛應用,包括公安部門指紋 圖像的分析、衛星云圖的分析等。
[0005] 現在,基于內容的細粒度的圖像檢索正在興起。傳統的基于內容的圖像檢索旨在 對不同大類的物體圖像進行分類,而人們越來越希望能對于同一大類物體的圖像進行檢 索,例如鳥類、真菌等,于是基于內容的細粒度圖像的檢索應運而生。
[0006] 植物作為人類賴以生存的元素,自然是人類關注的焦點,人類對于通過計算機而 非人工來自動完成對植物圖像的鑒別、分類以及檢索工作的需求也越來越迫切。
【發明內容】
[0007] 本發明的目的在于克服現有技術的不足,提供一種基于多特征融合的簡單背景下 的葉片識別方法。
[0008] 本發明的目的是通過以下技術方案來實現的:一種基于多特征融合的簡單背景下 的葉片識別方法,包括以下步驟:
[0009] (1)經過大津閾值法將葉片圖像中的葉片與背景分割開來獲得葉片;
[0010] (2)對分割得到的葉片圖像提取多個葉片特征,包括多尺度三角特征、定向片段直 方圖、基于輪廓關鍵點的特征以及葉片的幾何特征;
[0011] (3)在進行葉片識別時,將多個葉片特征通過基于位置敏感哈希(LSH)方法映射 到哈希表,每個葉片特征都通過K近鄰得出與它最匹配的候選特征列表;使用加權置信評 分得到最后的識別結果;
[0012] (4)對步驟3得到的識別結果通過潛在語義分析算法進行進一步重排序,提高識 別效果。
[0013] 進一步地,所述步驟1中,大津閾值法使用某一個閾值將灰度圖像根據灰度大小, 分成目標部分和背景部分兩類,在這兩類的類內方差最小和類間方差最大的時候,得到的 閾值是最優的二值化閾值;具體包括以下子步驟:
[0014] (1. 1)將簡單背景下的葉片圖像轉換為灰度圖;
[0015] (1. 2)計算灰度圖的平均灰度:對于一張大小為MXN的圖像,統計獲得灰度為i 對應的像素個數為rV則平均灰度值u可由下式得出:
【主權項】
1. 一種基于多特征融合的簡單背景下的葉片識別方法,其特征在于,包括w下步驟: (1) 經過大津闊值法將葉片圖像中的葉片與背景分割開來獲得葉片; (2) 對分割得到的葉片圖像提取多個葉片特征,包括多尺度=角特征、定向片段直方 圖、基于輪廓關鍵點的特征W及葉片的幾何特征; (3) 在進行葉片識別時,將多個葉片特征通過基于位置敏感哈希(LSH)方法映射到哈 希表,每個葉片特征都通過K近鄰得出與它最匹配的候選特征列表;使用加權置信評分得 到最后的識別結果; (4) 對步驟3得到的識別結果通過潛在語義分析算法進行進一步重排序,提高識別效 果。
2. 根據權利要求1所述的一種基于多特征融合的簡單背景下的葉片識別方法,其特征 在于,所述步驟1具體包括W下子步驟: (1. 1)將簡單背景下的葉片圖像轉換為灰度圖; (1. 2)計算灰度圖的平均灰度:對于一張大小為MXN的圖像,統計獲得灰度為i對應 的像素個數為ni,則平均灰度值U可由下式得出:
(1. 3)計算求解最佳閥值t的相關變量;記t為目標與背景的分割閥值,目標像素占的 比例為Wi,目標像素的平均灰度為Ui,則
其中Wi是灰度值大于t的統計值;
同理可得到背景像素占的比例W2及平均灰度U2; (1. 4)求解最佳閥值t;遍歷步驟1. 3中得到的t,使得下式最大: G=Wi* (Ui-U) 2+"2* (U2-U) 2 (1. 5)將根據閥值t獲得的背景像素賦予白色。
3. 根據權利要求1所述的一種基于多特征融合的簡單背景下的葉片識別方法,其特征 在于,所述步驟2中,所述多尺度=角特征具體為:形狀邊界由N個均勻地分布在葉片輪廓 上的采樣點Pi,...,Pw的序列表示,然后將該些采樣點按照順時針的順序進行排列;每個采 樣點Pi由在不同尺度下的Ns個S角形進行表示;引入d(k)用于表示在尺度k中的S角形 點之間的距離,由邊界點的數量進行表述,其中1《k《化;選擇在Pi兩側的化個點組成的 兩個集合來描述Pi,化的選擇取決于是否尋求捕獲本地或全局信息;距離d(k)為均勻的或 對數的海一個邊界點Pi與化個立角形相關聯,該些立角形由邊界點Pwoo、P山及Pwoo組 成;使用S角形邊長和角度特征(TSLA) ; A)=(巧1作7;),...,巧心/(7,八'、)); 假設Lik,L2K和L3k是由邊界點Pi-doo、P山及Pwoo組成的;角形於;條邊,且長度從小到大 排列,設Mk=Lik/Lsk、Nk=L2k/L3k,假設0為S角形7l的頂點Pi的角度的絕對值,則於的TSLA特征可表述為S元組(Mk,Nk,0 )。
4. 根據權利要求1所述的一種基于多特征融合的簡單背景下的葉片識別方法,其特征 在于,所述步驟2中,所述定向片段直方圖具體為;任何輪廓都是一連串連續的元素成分組 成的,一個元素成分可W是一個像素;對于輪廓上的每個像素,通過計算兩個變量的均值來 關聯方向信息,該兩個變量為從原始圖像計算出的梯度的角度0W及0的導數0';變量 0的值是絕對的,它對應于原始圖像的梯度角度;該些角度被投影到一個量化的[〇,2n