植物自動識別方法和系統的制作方法
【專利摘要】本發明涉及一種植物自動識別方法和系統,通過獲取不同類別和個體的植物點云數據構建植物識別的訓練集,再計算所述植物的形狀特征向量,基于所述形狀特征向量計算計算植物識別算法的參數以及待識別植物個體屬于各植物類別的可能性大小,并選取可能性最大的類別作為該植物的類別。本發明的過程簡單,且方便實用,提高了植物自動識別的工作效率,減小了工作量,適用于大規模植物分類識別工作。
【專利說明】植物自動識別方法和系統
【技術領域】
[0001]本發明涉及植物分類技術,尤其涉及一種植物自動識別方法和系統。
【背景技術】
[0002]據估計,地球上大約有22萬到42萬種不同類別的植物。對于植物的分類識別是一項龐大復雜的工作,傳統的植物識別方法主要依靠相應的植物學家,利用他們自身的專業知識,對植物外形、表皮、葉子等進行研究分析,確認植物類別,但是,這種人工分類方式效率低下,需要耗費大量的人力、物力和財力,而且極度依賴植物學家的專業知識。
[0003]目前也有少量基于植物葉片圖像采用自動分類方法對植物進行識別。在國外,Guyer等在1993年提取了 17種用于描述葉片形狀的特征對植物進行分類研究;Abbasi等人使用多重尺度曲率空間來描述葉子的邊界和形狀及其它特征來對菊花進行分類研究;Saitoh和Kaneko通過提取形狀和顏色等特征,使用神經網絡來識別野花,對16種不同類別的野花進行分類識別實驗,其準確率超過了 95% ;Rui等人利用改進的傅立葉描述子對植物葉片進行了分類研究。在國內,傅星、盧漢清在1994年進行了使用計算機技術進行植物自動分類的初步探討和研究;祁亨年等通過提取基于葉片大小、葉形、圓形度參數及葉緣等葉片外觀形狀特征,建立植物分類識別模型對植物分類進行研究;傅弘等提出使用邊緣梯度、局部對比度和領域統計特征等10個參數來描述像素的鄰域特征,結合神經網絡方法提取葉脈圖像,用于葉片識別。
[0004]雖然,上述的這些方法都需要采集植物葉片,相對于人工識別提高了效率,但是,其采集數據的工作量任然較大、效率較低。
【發明內容】
[0005]基于此,有必要針對上述植物自動識別方法存在工作量大、效率低的缺陷,提供一種高效的植物自動識別方法。
[0006]一種植物自動識別方法,包括下述步驟:
[0007]獲取不同類別和個體的植物點云數據;
[0008]構建植物識別的訓練集;
[0009]計算植物訓練集植物的形狀特征向量;
[0010]基于所述形狀特征向量計算植物識別算法的參數;及
[0011]基于所述識別算法及參數計算待識別植物個體屬于各植物類別的可能性大小,選取可能性最大的類別作為該植物的類別。
[0012]在本實施例中,其中,獲取不同類別和個體的植物云數據,具體為采用車載移動數據采集平臺,獲取不同類別和個體的植物云數據,所述數據采集平臺為StreetMapper系統或Lynx系統。
[0013]在本實施例中,同一類別的植物個體數目至少為10個。
[0014]在本實施例中,其中,計算植物訓練集植物的形狀特征向量,包括下述步驟:[0015]對所述植物點云數據的任一點P,查找其最近的k個點N (p,k),其中,k分別選取為 10,20,30,40,50 ;
[0016]利用主成分分析方法計算所述點p及所述點N (p,k)的特征值和所述特征值對應的特征向量,所述特征值為(l_lk,l_2k,_3k),所述特征向量為(v_lk,v_2k, v_k3),其中l_lk〈l_2k〈l_3k ;
[0017]計算每個特征向量與Z軸的夾角,并選取最小的夾角,記為a_ik,其中,i=l,2,3;k=10,20,30,40,50 ;
[0018]計算每個特征向量在XOY平面投影與X軸的夾角,并選取最小的夾角,記為b_ik,其中,i=l,2,3 ;k=10,20,30,40,50 ;
[0019]基于所及所述b_ik,構建所述點P的形狀特征,記為F (p),其中,F (p)=(l_ik, l_ik/sqrt (k), l_ik/ (l_lk+l_2k+l_3k), (l_ik+l_jk) / (l_lk+l_2k+l_3k), 1_ik/l_jk, l_lk/l_2k+l_lk/l_3k, l_lk/l_2k+l_2k/l_3k, l_lk/l_3k+l_2k/l_3k, a_ik, b_ik)其中,i, j=l,2,3 ;l<=i<j<=3 ;k=10,20,30,40,50 ;
[0020]采用上述同樣的方法得到所述植物點云數據中每一點對應的形狀特征,并記為F ;
[0021]將所述F每一維構造均勻分成若干直方圖,得到所述植物個體的形狀特征向量,所述形狀特征向量表征了所述植物個體的形狀信息及類別信息。
[0022]在本實施例中,所述形狀特征F (p)為一個120維的形狀特征向量。
[0023]在本實施例中,所述F每一維構造均勻分成10個直方圖,所述植物個體的形狀特征向量為1200維的形狀特征向量。
[0024]在本實施例中,基于所述形狀特征向量計算植物識別算法的的參數,具體為:
[0025]將所述特征向量及所述特征向量對應的類別信息輸入Joint Boost算法進行訓練得到算法參數。
[0026]另外,本發明還提供了一種植物自動識別系統,包括數據獲取模塊,用于獲取不同類別和個體的植物點云數據;
[0027]構建模塊,用于構建植物識別的訓練集;
[0028]第一計算模塊,用于計算所述植物的形狀特征向量;
[0029]第二計算模塊,用于基于所述形狀特征向量計算植物識別算法的參數;和
[0030]識別模塊,用于計算待識別植物個體屬于各類別的可能性,選取可能性最大的類別作為識別結果。
[0031 ] 在本實施例中,所述數據獲取模塊包括車載移動數據采集平臺,所述車載移動數據采集平臺用于獲取不同類別和個體的植物云數據,所述數據采集平臺為StreetMapper系統或Lynx系統。
[0032]本發明提供的植物自動識別方法和系統,通過獲取不同類別和個體的植物點云數據構建植物識別的訓練集,再計算所述植物的形狀特征向量,基于所述形狀特征向量計算計算植物識別算法的參數以及待識別植物個體屬于各植物類別的可能性大小,并選取可能性最大的類別作為該植物的類別,過程簡單、方便實用,提高了植物自動識別的工作效率,減小了工作量,適用于大規模植物分類識別工作。【專利附圖】
【附圖說明】
[0033]圖1為本發明提供的植物自動識別方法的步驟流程圖;
[0034]圖2為本發明一較佳實施例提供的計算植物的形狀特征向量的步驟流程圖;
[0035]圖3為本發明提供的植物自動識別系統;
[0036]圖4為本發明實施例1提供的樹木識別結果的示意圖。
【具體實施方式】
[0037]為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及具體實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
[0038]請參閱圖1圖1為本發明提供的植物自動識別方法100的步驟流程圖,包括下述步驟:
[0039]步驟SllO:獲取不同類別和個體的植物點云數據;
[0040]其中,獲取不同類別和個體的植物云數據,具體為采用車載移動數據采集平臺,獲取不同類別和個體的植物云數據。
[0041]優選地,上述數據采集平臺為加拿大Optech公司的三維激光測量車Lynx系統和英國 3D Laser Mapping 公司的 StreetMappe 系統。
[0042]優選地,同一類別的植物個體數目至少為10個。可以理解,上述植物個體且盡可能具有不同的形狀和代表性。
[0043]步驟S120:構建植物識別的訓練集;
[0044]可以理解,采用上述車載移動數據采集平臺,可以快速準確獲取植物外在的形狀信息,獲取各種類別、不同個體的植物高精度點云數據,構建植物識別的訓練數據集,訓練集中植物類別和各類別植物數目可隨實際需要增加。
[0045]步驟S130:計算植物訓練集植物的形狀特征向量;
[0046]請參閱圖2,圖2為本發明一較佳實施例提供的計算所述植物的形狀特征向量的步驟流程圖,包括下述步驟:
[0047]步驟S131:對植物點云數據的任一點P,查找其最近的k個點N化,10,其中,1^分別選取為 10,20,30,40,50 ;
[0048]步驟S132:利用主成分分析方法計算點p及點N (p, k)的特征值和特征值對應的特征向量,特征值為(l_lk,l_2k, _3k),特征向量為(v_lk,v_2k, v_k3),其中l_lk〈l_2k〈l_3k ;
[0049]步驟S133:計算每個特征向量與Z軸的夾角,并選取最小的夾角,記為a_ik,其中,i=l,2,3 ;k=10,20,30,40,50 ;
[0050]步驟S134:計算每個特征向量在XOY平面投影與X軸的夾角,并選取最小的夾角,記為 b_ik,其中,i=l,2,3 ;k=10,20,30,40,50 ;
[0051]步驟S135:基于a_ik&b_ik,構建所述點P的形狀特征,記為F (p),其中,F (p)=(l_ik,l_ik/sqrt (k), l_ik/ (l_lk+l_2k+l_3k),(l_ik+l_jk) / (l_lk+l_2k+l_3k), 1_ik/l_jk, l_lk/l_2k+l_lk/l_3k, l_lk/l_2k+l_2k/l_3k, l_lk/l_3k+l_2k/l_3k, a_ik, b_ik)其中,i, j=l,2,3 ;l<=i<j<=3 ;k=10,20,30,40,50 ;[0052]優選地,形狀特征F (p)為一個120維的形狀特征向量。
[0053]步驟S136:采用上述同樣的方法得到植物點云數據中每一點對應的形狀特征,并記為F ;
[0054]優選地,F每一維構造均勻分成10個直方圖,植物個體的形狀特征向量為1200維的形狀特征向量。
[0055]步驟S137:將所述F每一維構造均勻分成若干直方圖,得到所述植物個體的形狀特征向量,該形狀特征向量表征了植物個體的形狀信息及類別信息。
[0056]可以理解,對植物數據中每一點依據上述方法都可以計算得到其對應的形狀特征F,然后對F每一維構造均勻分成10個區間的直方圖,得到該植物個體1200維的形狀特征向量,該特征向量在很大程度上描述了該植物個體的形狀信息及類別信息。
[0057]步驟S140:基于所述形狀特征向量計算植物識別算法的參數;
[0058]優選地,將特征向量及特征向量對應的類別信息輸入Joint Boost算法進行訓練得到算法參數。
[0059]步驟S150:基于所述識別算法及參數計算待識別植物個體屬于各植物類別的可能性大小,選取可能性最大的類別作為該植物的類別。
[0060]具體地將帶識別植物的特征向量輸入步驟S140訓練好的識別算法,得到該植物屬于各植物類別的可能性大小,實際中選取可能性最大的類別作為該植物的類別。
[0061]請參閱圖3,圖3為本發明提供的植物自動識別系統200,包括數據獲取模塊210、構建模塊220、第一計算模塊230、第二計算模塊240及識別模塊250。
[0062]數據獲取模塊210用于獲取不同類別和個體的植物點云數據。具體地,數據獲取模塊210包括車載移動數據采集平臺211。車載移動數據采集平臺211用于獲取不同類別和個體的植物云數據,車載移動數據采集平臺211為StreetMapper系統或Lynx系統。可以理解,采用上述車載移動數據采集平臺211,可以快速準確獲取植物外在的形狀信息,獲取各種類別、不同個體的植物高精度點云數據。
[0063]構建模塊220用于構建植物識別的訓練集。可以理解,通過構建模塊220構建植物識別的訓練數據集,訓練集中植物類別和各類別植物數目可隨實際需要增力口。優選地,同一類別的植物個體數目至少為10個,且選取的植物個體且盡可能具有不同的形狀和代表性。
[0064]第一計算模塊230用于計算植物的形狀特征向量。具體地,第一計算模塊230能夠執行下述功能,以實現計算植物的形狀特征向量。
[0065]對植物點云數據的任一點P,查找其最近的k個點N (p,k),其中,k分別選取為
10,20,30,40,50;
[0066]利用主成分分析方法計算所述點p及所述點N (p,k)的特征值和特征值對應的特征向量,特征值為(l_lk,l_2k, _3k),特征向量為(v_lk,v_2k, v_k3),其中l_lk〈l_2k〈l_3k ;
[0067]計算每個特征向量與Z軸的夾角,并選取最小的夾角,記為a_ik,其中,i=l,2,3;k=10,20,30,40,50 ;
[0068]計算每個特征向量在XOY平面投影與X軸的夾角,并選取最小的夾角,記為b_ik,其中,i=l,2,3 ;k=10,20,30,40,50 ;
[0069]基于a_ik及所述b_ik,構建點P的形狀特征,記為F (P),其中,F (p)=(l」k,l_ik/sqrt (k), l_ik/ (l_lk+l_2k+l_3k),(l_ik+l_jk) / (l_lk+l_2k+l_3k), l_ik/l_jk,l_lk/l_2k+l_lk/l_3k,l_lk/l_2k+l_2k/l_3k,l_lk/l_3k+l_2k/l_3k,a_ik,b_ik)其中,
i,j=l,2,3 ;l<=i<j<=3 ;k=10,20,30,40,50 ;
[0070]采用上述同樣的方法得到所述植物點云數據中每一點對應的形狀特征,并記為F ;
[0071]將F每一維構造均勻分成若干直方圖,得到植物個體的形狀特征向量,形狀特征向量表征了所述植物個體的形狀信息及類別信息。
[0072]第二計算模塊240用于基于形狀特征向量計算植物識別算法的參數。具體地,將第一計算模塊230計算植物的形狀特征向量及特征向量對應的類別信息輸入Joint Boost算法進行訓練得到算法參數。
[0073]識別模塊250用于計算待識別植物個體屬于各類別的可能性,選取可能性最大的類別作為識別結果。可以理解,識別算法的輸出結果在一定程度上表述了該植物屬于何種個體類別,最大的值表明了該植物最可能屬于的個體類別,
[0074]實際中選取識別結果最大的類別作為該植物的類別。
[0075]本發明提供的植物自動識別方法和系統,通過獲取不同類別和個體的植物點云數據構建植物識別的訓練集,再計算所述植物的形狀特征向量,基于所述形狀特征向量計算計算植物識別算法的參數以及待識別植物個體屬于各植物類別的可能性大小,并選取可能性最大的類別作為該植物的類別,過程簡單、方便實用,提高了植物自動識別的工作效率,減小了工作量,適用于大規模植物分類識別工作。
[0076]以下通過具體實施例進一步闡述本發明,這些實施例僅用于舉例說明的目的,并沒有限制本發明的范圍。
[0077]實施例1
[0078]在本實施中我們采用車載移動激光掃描車獲取了 12種樹的點云數據,每種樹的數目見表1。對每種樹隨機選一半的樹木作為訓練樣本,另一半作測試樣本。
[0079]表1樹木名稱及數量
[0080]
【權利要求】
1.一種植物自動識別方法,其特征在于,包括下述步驟: 獲取不同類別和個體的植物點云數據; 構建植物識別的訓練集; 計算植物訓練集植物的形狀特征向量; 基于所述形狀特征向量計算植物識別算法的參數;及 基于所述識別算法及參數計算待識別植物個體屬于各植物類別的可能性大小,選取可能性最大的類別作為該植物的類別。
2.根據權利要求1所述的植物自動識別方法,其特征在于,其中,獲取不同類別和個體的植物云數據,具體為采用車載移動數據采集平臺,獲取不同類別和個體的植物云數據,所述數據采集平臺為StreetMapper系統或Lynx系統。
3.根據權利要求1所述的植物自動識別方法,其特征在于,同一類別的植物個體數目至少為10個。
4.根據權利要求1所述的植物自動識別方法,其特征在于,其中,計算植物訓練集植物的形狀特征向量,包括下述步驟: 對所述植物點云數據的任一點P,查找其最近的k個點N (p,k),其中,k分別選取為.10.20.30.40.50; 利用主成分分析方法計算所述點P及所述點N (p,k)的特征值和所述特征值對應的特征向量,所述特征值為(l_lk, l_2k, _3k),所述特征向量為(v_lk, v_2k, v_k3),其中.l_lk〈l_2k〈l_3k ; 計算每個特征向量與Z軸的夾角,并選取最小的夾角,記為a_ik,其中,i=l, 2, 3 ;k=10,.20.30.40.50; 計算每個特征向量在XOY平面投影與X軸的夾角,并選取最小的夾角,記為b_ik,其中,i=l,2,3 ;k=10,20,30,40,50 ; 基于所及所述b_ik,構建所述點P的形狀特征,記為F (p),其中,F (p)=(l_ik,l_ik/sqrt (k),l_ik/ (l_lk+l_2k+l_3k),(l_ik+l_jk)/ (l_lk+l_2k+l_3k), l_ik/l_jk, l_lk/l_2k+l_lk/l_3k,l_lk/l_2k+l_2k/l_3k,l_lk/l_3k+l_2k/l_3k,a_ik,b_ik)其中,i, j=l,2,3 ;l<=i<j<=3 ;k=10,20,30,40,50 ; 采用上述同樣的方法得到所述植物點云數據中每一點對應的形狀特征,并記為F ;將所述F每一維構造均勻分成若干直方圖,得到所述植物個體的形狀特征向量,所述形狀特征向量表征了所述植物個體的形狀信息及類別信息。
5.根據權利要求4所述的植物自動識別方法,其特征在于,所述形狀特征F(P)為一個120維的形狀特征向量。
6.根據權利要求4所述的植物自動識別方法,其特征在于,所述F每一維構造均勻分成10個直方圖,所述植物個體的形狀特征向量為1200維的形狀特征向量。
7.根據權利要求1所述的植物自動識別方法,其特征在于,基于所述形狀特征向量計算植物識別算法的的參數,具體為: 將所述特征向量及所述特征向量對應的類別信息輸入Joint Boost算法進行訓練得到算法參數。
8.一種植物自動識別系統,其特征在于,包括:數據獲取模塊,用于獲取不同類別和個體的植物點云數據; 構建模塊,用于構建植物識別的訓練集; 第一計算模塊,用于計算所述植物的形狀特征向量; 第二計算模塊,用于基于所述形狀特征向量計算植物識別算法的參數;和識別模塊,用于計算待識別植物個體屬于各類別的可能性,選取可能性最大的類別作為識別結果。
9.根據權利要求8所述的植物自動識別系統,其特征在于,所述數據獲取模塊包括車載移動數據采集平臺,所述車載移動數據采集平臺用于獲取不同類別和個體的植物云數據,所述數據采集平臺為StreetMapper系統或Lynx系統。
【文檔編號】G06K9/46GK103617417SQ201310603406
【公開日】2014年3月5日 申請日期:2013年11月25日 優先權日:2013年11月25日
【發明者】程章林, 黃惠, 丹尼爾·科恩 申請人:中國科學院深圳先進技術研究院