專利名稱:一種基于云模型和topsis法的植物鑒別方法
技術領域:
本發明屬于植物鑒別技術領域,具體地說是涉及一種基于云模型和TOPSIS 法的植物鑒別方法。
背景技術:
農業數據庫在農業信息資源的開發利用中發揮著重要作用,目前國內外農業組織已建設了一大批農業數據庫,其中,國際上最著名的農業數據庫系統就有AGRIS、IFIS、 AGRI-COLA、CABI四大農業數據庫,即聯合國糧農組織的農業系統數據庫(AGRIS),國際食物信息數據庫(IFIS),美國農業部農業聯機存取數據庫(AGRI - COLA)和國際農業生物中心數據庫(CAB1)。我國有代表性的植物數據庫就有中國國家農業科學數據共享中心 (www. agridata. cn)、中國數字植物標本館(http//www. cvh. org. cn)、中國植物數據庫 (www. plant, csdb. cn)、中國植物科學網(www. chinaplant. org)、中國生物多樣性信息系統 (bd. brim. ac. cn)、中國植物圖像庫(www. plantphoto. cn)等。這些數據庫包含了豐富的專業知識,存儲了大量的農業相關科技信息,由于這些數據庫專業性強,并且只能采用關鍵詞檢索方式進行查詢,增加了操作者對數據庫的操作難度,降低了數據庫的使用效率,造成了資源浪費。其主要表現為(1)對操作者要求高。 使用這些數據庫的操作者必須能熟練地運用計算機,了解數據庫檢索界面,掌握檢索策略。 同時,必須對主題、關鍵詞、機構、全文、題名等-般的檢索概念和檢索途徑要有所了解和掌握。但是,植物數據庫的使用者不僅包括有著較強專業知識的領域專家和農技人員,還包括農民和非農業科技工作者,這些大部分人員很難根據要求準確的輸入檢索詞;(2)關鍵詞檢索方式要求檢索提問必須嚴格按照規定的格式輸入,只有當組配完全匹配時才可得到搜索結果,這種在字面上與檢索提問標識保持一致的檢索方式,很難實現在內容上和概念上檢索到滿足用戶需求的檢索結果,將導致檢索結果的查全率和查準率較低。針對上面的問題,一些研究者利用數字圖像處理技術實現植物鑒別,再根據鑒別結果對數據庫進行查詢,從而獲得相關的專業知識。但是,目前該技術還存在以下問題(1)目前的圖像采集基本通過掃描儀,背景簡單,圖像分割和描述相對簡單,難以處理復雜背景;(2)不同研究者使用的圖像數據庫各不相同,很難比較識別效果的性能優劣,且難以用于實踐;(3)當前已有的圖像分類系統通常只能處理幾種至百種植物,范圍較小,難以實現大規模、多類別的植物鑒別。然而,已有一些研究者提出
有文獻報道,其題目為“知識表示中的不確定性”(該文作者是李德毅,發表于2000 年出版的《中國工程科學》第2卷第10期第73 79頁)。該文公開了云模型是用自然語言值表示的某個定性概念與其定量表示之間的不確定性轉換模型,其包括 (1)云的定義
設U是一個用精確數值表示的定量論域,C是U上的定性概念,若定量值 χ e U,且χ是定性概念C的一次隨機實現,1對C的確定度e
是有穩定傾向的隨機數私
, Vxet/ ,叉—姻。貝U在論域上的分布稱為云模型,簡稱為云, 每一個κ稱為一個云滴。(2)云的數字特征
云模型的數字特征用期望、熵£和超熵P來表征,反映了定性概念c的整體特性。是云滴在論域空間分布的期望,就是最能夠代表定性概念的點,反映了這個
概念的云滴群的云重心。E是定性概念的不確定性度量,由概念的隨機性和模糊性共
η
同決定,揭示了模糊性和隨機性的關聯性。熵E 一方面是定性概念隨機性的度量,反映
K
了能夠代表這個定性概念的云滴的離散程度;另一方面又是定性概念模糊性的度量,反映
了論域空間中可被概念接受的云滴的取值范圍。用E這一個數字特征來同時反映模糊
性和隨機性,也體現了二者之間的關聯性。H是熵的不確定性的度量,反映了在數域空
間代表該概念的所有點的不確定度的凝聚性,即云滴的凝聚度。其大小間接地表示了云的離散程度和厚度,由熵的隨機性和模糊性共同決定。云的數字特征在于用三個數值就勾畫出由成千上萬的云滴構成的整個云來,把定性表示的語言值中的模糊性和隨機性完全集成到一起。由于具體實現方法不同,構成不同類型的云,如正態云模型、梯形云模型、半云模型等。其中,正態云模型和梯形云模型。還有書籍報道,其書名為“Multiple Attribute Decision Making =Methods and Application”(該書作者是C. L. Hwang 和 Yoon K.,柏林 Springe 出版社 1981 年出版)。 該書中公開了一種根據有限個評價對象與理想化目標的接近程度進行排序的方法——離散型逼近理想解排序法(^Technique for Order Preference by Similarity to Ideal Solution,縮寫T0PSIS)。其原理基于歸一化后的原始數據矩陣,找出有限方案中的最優方案和最劣方案構成一個空間,待評價的某對象可視為該空間上的一個點,據此可獲得該點與最優方案和最劣方案間的距離(常用Euclidean距離,又稱歐氏距離),從而得出該對象與最優方案的相對接近程度,籍此可進行方案優劣的評價。
發明內容
鑒于以上所述現有技術存在的問題和不足,本發明要解決的技術問題是提供一種基于云模型和T0PSIS法的植物鑒別方法,該方法能夠方便、快捷地從同類群多種植物或者從保存大量植物標本的數據庫中檢索出被測植物,實現對植物的鑒別。為了解決上述問題,本發明采用下述技術方案一種基于云模型和T0PSIS法的植物鑒別方法,其特征在于該方法首先構建了植物的外形特征標本數據庫;然后利用梯形云模型將被測植物的外觀特征與植物的外觀特征標本數據庫進行比對,得到被測植物與外形特征標本數據庫相比的隸屬度,實現了被測植物的初步鑒別;當鑒別結果為多個時,再利用正態云模型對檢索結果進行精確匹配計算,得到被測植物與外形特征標本數據庫相比的精確隸屬度;最后利用T0PSIS法對隸屬度進行綜合評價,鑒別出植物,具體步驟如下
(1)、構建植物的外形特征標本數據庫;
(2)、利用梯形云模型,計算被測植物的隸屬度,初步鑒別被測植物;
(3)、判斷被測植物的隸屬度是否小于或等于1,若被測植物的隸屬度是小于或等于1, 則轉步驟(5),若被測植物的隸屬度是小于或等于1等于1,則轉步驟(4);
(4)、利用正態云模型,對隸屬度為1的標本與被測植物進行正態云模型計算,得到被測植物的精確隸屬度;
(5)、利用TOPSIS法,對隸屬度進行綜合評價鑒別出被測植物。上述步驟(1)中所述的構建植物的外形特征標本數據庫,該標本數據庫存放為可用以辨別植物種類的植物的外形特征,其外形特征值為數值型數據。上述步驟(2)中所述的利用梯形云模型,計算被測植物的隸屬度,初步鑒別被測植物,其操作步驟如下
(21)、確定梯形云模型的期望區間[Irii根據植物的外形特征標本庫中
的外形特征取值范圍,確定梯形云模型的期望區間[^rri 的下限值,^2為該外形特征值的上限值;
Ex2飛,其中為該外形特征
(22)、計算梯形云模型熵H 利用梯形云模型的上升云和下降云,對植物的外
η
形特征的取值范圍進行擴展,擴展區間設定為[_3 ,+3 ];
ηη
(23)、利用梯形云模型的數字特征對被測植物的外形特征進行描述通過梯形云期望和熵確定梯形云期望曲線方程
權利要求
1.一種基于云模型和TOPSIS法的植物鑒別方法,其特征在于該方法首先構建了植物的外形特征標本數據庫;然后利用梯形云模型將被測植物的外觀特征與植物的外觀特征標本數據庫進行比對,得到被測植物與外形特征標本數據庫相比的隸屬度,實現了被測植物的初步鑒別;當鑒別結果為多個時,再利用正態云模型對檢索結果進行精確匹配計算,得到被測植物與外形特征標本數據庫相比的精確隸屬度;最后利用T0PSIS法對隸屬度進行綜合評價,鑒別出植物,具體步驟如下(1)、構建植物的外形特征標本數據庫;(2)、利用梯形云模型,計算被測植物的隸屬度,初步鑒別被測植物;(3)、判斷被測植物的隸屬度是否小于或等于1,若被測植物的隸屬度是小于或等于1, 則轉步驟(5),若被測植物的隸屬度是小于或等于1等于1,則轉步驟(4);(4)、利用正態云模型,對隸屬度為1的標本與被測植物進行正態云模型計算,得到被測植物的精確隸屬度;(5)、利用TOPSIS法,對隸屬度進行綜合評價鑒別出被測植物。
2.根據權利要求1所述的一種基于云模型和T0PSIS法的植物鑒別方法,其特征在于, 上述步驟(1)中所述的構建植物的外形特征標本數據庫,該標本數據庫存放為可用以辨別植物種類的植物的外形特征,其外形特征值為數值型數據。
3.根據權利要求1所述的一種基于云模型和T0PSIS法的植物鑒別方法,其特征在于, 上述步驟(2)中所述的利用梯形云模型,計算被測植物的隸屬度,初步鑒別被測植物,其操作步驟如下(21)、 確定梯形云模型的期望區間 Ex2根據植物的外形特征標本庫中的外形特征取值范圍,確定梯形云模型的期tUKHiEx^ Ex2],其中◎為該外形特征的下限值,為該外形特征值的上限值;ri^M^j^lJirnd 器,(22)、計算梯形云模型熵E 利用梯形云模型的上升云和下降云,對植物的外 形特征的取值范圍進行擴展,擴展區間設定為[-3 ii ,+3 E ]; (23)、利用梯形云模型的數字特征對被測植物的外形特征進行描述通過梯形云期望和熵確定梯形云期望曲線方程
4.根據權利要求1所述的一種基于云模型和T0PSIS法的植物鑒別方法,其特征在于上述步驟(4)中所述的利用正態云模型,對隸屬度為1的標本與被測植物進行正態云模型計算,得到被測植物的精確隸屬度,其操作步驟如下(41)、確定正態云模型的期望值根據植物的外形特征標本庫中外形特征值,確定正態云模型的期望值磯,I1f為外形特征區間值的中間值;(42)、計算正態云模型的熵En,熵En的計算式為
5.根據權利要求1所述的一種基于云模型和T0PSIS法的植物鑒別方法,其特征在于上述步驟(5)中所述的利用T0PSIS法,對隸屬度進行綜合評價鑒別出被測植物,其操作步驟如下(51)、確立隸屬度綜合評價的評價矩陣F:如果步驟( 計算的隸屬度值只有一項或者沒有一項等于1時,評價矩陣F為步驟(2)所得的隸屬度矩陣;否則,評價矩陣F為步驟(3)計算所得結果;(52)、確定評價矩陣F的理想點,其理想點的計算式為
6.根據權利要求5所述的一種基于云模型和TOPSIS法的植物鑒別方法,其特征在于上述步驟(22)所述的計算梯形云模型熵E其擴展范圍為外形特征下限值的20%,則梯形η云模型熵E計算式為熵E =( E χ0· 2)/3。 KH jtjXl
全文摘要
本發明涉及一種基于云模型和TOPSIS法的植物鑒別方法。本發明方法首先構建了植物的外形特征標本數據庫;然后利用梯形云模型將被測植物的外觀特征與植物的外觀特征標本數據庫進行比對,得到被測植物與外形特征標本數據庫相比的隸屬度,實現了被測植物的初步鑒別;當鑒別結果為多個時,再利用正態云模型對檢索結果進行精確匹配計算,得到被測植物與外形特征標本數據庫相比的精確隸屬度;最后利用TOPSIS法對隸屬度進行綜合評價,鑒別出植物。該方法采用TOPSIS對最后鑒別結果進行綜合評價,能夠全面、合理、準確地對某幾個評價指標進行優劣排序,評價過程清晰、評價結果客觀。
文檔編號G06K9/64GK102156710SQ20111004898
公開日2011年8月17日 申請日期2011年3月2日 優先權日2011年3月2日
發明者劉宗田, 彭琳, 楊林楠, 鐘飛 申請人:上海大學