專利名稱::基于多光譜散射圖像的蘋果硬度預測方法
技術領域:
:本發明屬于農產品無損檢測領域,特別涉及一種基于多光譜散射圖像的蘋果硬度預測方法。技術背景硬度是蘋果內部屬性的一項重要指標,該指標會隨著諸如氣候狀況、文化差異、收獲時間或成熟度,以及收后處理方法和實際儲藏方式等的不同具有很大的差異。標準的儀器式硬度測量方法在測試過程中會損壞水果樣本,因此,不能采用該方法對水果分選和分級。新的無損檢測技術的研究能夠克服傳統方法的缺點,有較大的應用價值。在水果硬度無損檢測技術方面已有了大量的研究。多光譜散射圖像技術是非破壞性水果硬度測量技術之一。研究表明在水果硬度檢測方面,多光譜散射技術是有用的,并優于近紅外光譜分析技術。
發明內容本發明的目的是提出一種基于多光譜散射圖像的蘋果硬度預測方法。其特征在于,采用不同的回歸方法用于預測一組樣本。即開發了一種通過增加新樣本來更新現有的最小二乘法預測模型;并提出一種能夠獲得較好的水果硬度預測結果的樣本增加方法,使新模型可以有效的預測水果硬度。最后用同一時間采集但具有不同收后儲存時間的兩組不同的蘋果樣本集來測試該模型對蘋果的硬度預測效果,并與采用以往預測方法的水果硬度預測結果進行比較。具體步驟如下(1)蘋果樣本材料的選取試驗開始前,需要選取合適蘋果樣本,并將其放置在室溫下至少15小時,試驗時將蘋果樣本分成兩組組i和組n。(2)數據采集與處理數據采集是使用袖珍型、裝有液晶可調諧濾波器(LCTF)的多光譜圖像系統分別采集組I和組II的蘋果樣本獲得其光譜散射圖像,獲得每個蘋果樣本在8個波長(650,680,700,740,820,880,910,和9卯nm)下的8幅散射圖像。數據處理,使用修正的洛倫茲分布函數(MLD)來計算每一個散射圖像的輪廓參數<formula>formulaseeoriginaldocumentpage6</formula>上式中,R是以CCD灰度數表示的光密度;Z是散射距離;^為光密度不對稱值,"2為散射輪廓峰值;"3為半最大峰值對應的滿散射寬度(FWHM);a4為FWHM周圍的散射斜坡。采集完光譜散射圖像后,使用標準的MT硬度測試儀測量每個水果的硬度值,在與采集圖像相同的環繞每個水果赤道的區域,以2mm/s的落下速度將直徑為llmm的探針刺入去皮水果9.0mm測量其硬度值。(3)回歸預測模型的步驟水果硬度回歸預測模型共包含以下5步1)按組I和組II分為兩個獨立的樣本集,樣本按硬度值大小降序排列。每四個蘋果中的前三個用于校準,第四個用于驗證。該過程最終使從組I和組II分別提取出兩個驗證集和兩個校準集。2)在不同的波長下對每一個樣本采用非線性回歸分析擬合圖像散射輪廓,從而確定方程一中它們的MLD參數。從每個樣本可獲得一套共32個MLD參數(4參數*8波長)。進一步,將水果樣本的MLD參數除以與Teflon參考標準對應的參數,以校正從蘋果樣本獲取散射圖像的試驗過程中光源波動帶來的影響。3)采用多元線性回歸(MLR)計算組I校準集和組II校準集中樣本MT硬度和MLD硬度兩者間的r值和校準標準差(SEC),采用MLR方法分別建立起組I和組II的8波長預測模型,接著分別用它們各自的驗證集對其進行驗證。驗證結果用作與后續所述新的模型更新方法所獲模型的驗證結果進行比較。組I的水果硬度預測模型可用方程2來表示i7=c0十Ct。,+c2a2H-----hc"a"二Z。a^.(2)其中,F為以N表示的MT預測硬度;》(/=1,2,...,";"=32)為MLD參數;下標/表示每一個參數;C/為每個波長下與4個MLD參數中的每個參數相聯系的回歸系數;co為以N為單位的截距。4)用從組II校準集選取的樣本校正由組I校準集所建預測模型,接著用組II驗證集驗證該更新模型,更新算法由下列過程導出。加入新樣本后預測模型(方程l)的回歸系數c將變為。+A。.,可表示為F+AF=(c0十Ac。)+(c,+Ac、)a+(c2+Ac2)a2十…+(c"0"=S。(3)戶o戶o其中AF為預測硬度的校正值,假定新樣本的MLD參數和MT硬度為"11"12^21"2222w,、(4)其中,為新加入樣本的MT硬度;(/=l,2,...,m)代表每個樣本;m為新加入樣本的數量。更新的模型必須確保新加入樣本的預測值(F,+AF,)和參考值乂之間的最小差異,即利用方程(5)的最小二乘求取更新預測模型的Acy值。J(《+a^-/;)(5)根據最小二乘方法,通過求取對Ag'的一階微分可導出下面的方程:<formula>formulaseeoriginaldocumentpage8</formula>1=1d加入新樣本后回歸系數c^的校正值A(^可由方程6導出。將Aq插入方程3可導出更新預測模型。5)從組II校準集選擇樣本有以下四種方法a)隨機選擇,b)僅從'軟'水果組選取;C)僅從'硬'水果組選取;d)同時從'軟'水果組和'硬'水果組選取.組II中所有的樣本均根據MT硬度值按降序排列。'軟'水果樣本從l開始按向前順序選取;'硬'水果樣本從最后一個樣本按向后順序選取;將按以上四種選擇方法選取的樣本分別加入到由組I校準集所得預測模型,以更新該預測模型。最后,用組II驗證集驗證所更新模型。本發明的有益效果是采用不同的回歸方法更新現有模型以用于預測新一組樣本。即開發了一種通過增加新樣本來更新現有預測模型的回歸最小二乘方法;并提出一種能夠獲得較好的水果硬度預測結果的樣本增加方法,使更新后的模型可以有效的預測水果的硬度。最后用同一時間采集但具有不同收后儲存時間的兩組不同的蘋果樣本集來測試該模型對蘋果的硬度預測效果,并與采用以往預測方法的水果硬度預測結果進行比較,本文的模型更新方法連同多光譜散射技術可以用來對來自不同收獲季節和不同地方的蘋果的硬度進行實時預測。圖l為蘋果原始徑向散射圖像輪廓圖,圖l(a)為一個有代表性的蘋果原始散射圖像。圖l(b)為從圖l(a)所示散射圖像提取的一個一維散射輪廓圖。圖2組I的MT硬度和估計硬度的關系(a)組I的校準集;(b)組I的驗證集。圖3II的MT硬度和估計硬度的關系(a)組II的校準集(b)組II的驗證集。圖4由組I所建預測模型用于組II的驗證集。圖5使用四種不同的樣本加入方法將新樣本加入組I水果校正集所建模型預測組II蘋果硬度的相關系數。具體實施方式本發明提出一種基于多光譜散射圖像的蘋果硬度預測模型更新方法。采用不同的回歸方法更新現有模型以用于預測新一組樣本。即開發了一秒通過增加新樣本來更新現有預測模型的回歸最小二乘方法;并提出一種能夠獲得較好的水果硬度預測結果的樣本增加方法,使更新后的模型可以有效的預測水果硬度。首先使用袖珍型、裝有液晶可調諧濾波器(LCTF)的多光譜圖像系統分別采集組I和組II的蘋果樣本獲得其光譜散射圖像,獲得每個蘋果樣本在8個波長(650,680,700:740,820,880,910,和990nm)下的針對每個波長的8幅散射圖像(如圖l所示),圖l(a)為一個有代表性的蘋果原始散射圖像。圖l(b)為從圖l(a)所示散射圖像提取的一個一維散射輪廓圖。另外,對應于每100個蘋果,都有一個白色聚四氟乙烯圓盤,其散射圖像被用作校正光源波動影響的參考圖像。對上述采集的光譜散射圖像數據進行處理,使用修正的洛倫茲分布函數(MLD)來計算每一個散射圖像的輪廓參數其中,R是以CCD灰度數表示的光密度;z是散射距離;^為光密度不對稱值,化為散射輪廓峰值;"3為半最大峰值對應的滿散射寬度(FWHM);^為FWHM周圍的散射斜坡.采集完光譜散射圖像后,使用標準的MT硬度測試儀測量每個水果的硬度值,在與采集圖像相同的環繞每個水果赤道的區域,以2mm/s的落下速度將直徑為llmm的探針刺入去皮水果9.0mm測量其硬度值。水果硬度回歸預測模型共包含以下5步1)按組I和組II每組450個蘋果樣本,各自均被分為兩個獨立的樣本集,樣本按硬度值大小降序排列。每四個蘋果中的前三個用于校準,第四個用于驗證。該過程最終使從組I和組II分別提取出兩個驗證集和兩個校準集。2)在不同的波長下對每一個樣本采用非線性回歸分析擬合圖像散射輪廓,從而確定方程一中它們的MLD參數。從每個樣本可獲得一套共32個MLD參數(4參數*8波長)。進一步,將水果樣本的MLD參數除以與Teflon參考標準對應的參數,以校正從蘋果樣本獲取散射圖像的試驗過程中光源波動帶來的影響。3)采用多元線性回歸(MLR)計算組I校準集和組II校準集中樣本MT硬度和MLD硬度兩者間的r值和校準標準差(SEC),采用MLR方法分別建立起組I和組II的8波長預測模型,接著分別用它們各自的驗證集對其進行驗證。驗證結果用作與后續所述新的模型更新方法所獲模型的驗證結果進行比較。組I的水果硬度預測模型可用方程2來表示<formula>formulaseeoriginaldocumentpage10</formula>其中,F為以N表示的MT預測硬度;aj(/=l,2,...,";"=32)為MLD參數;下標7'表示每一個參數;&為每個波長下與4個MLD參數中的每個參數相聯系的回歸系數;co為以N為單位的截距。4)用從組II校準集選取的樣本校正由組I校準集所建預測模型,接著用組II驗證集驗證該更新模型,更新算法由下列過程導出。加入新樣本后預測模型(方程l)的回歸系數c將變為^+A。,可表示為<formula>formulaseeoriginaldocumentpage10</formula>其中AF為預測硬度的校正值,假定新樣本的MLD參數和MT硬度為<formula>formulaseeoriginaldocumentpage11</formula>其中乂為新加入樣本的MT硬度;(/=l,2,...,m)代表每個樣本;m為新加入樣本的數量。更新的模型必須確保新加入樣本的預測值(^+AF,)和參考值,之間的最小差異,即利用方程(5)的最小二乘求取更新預測模型的A。值。<formula>formulaseeoriginaldocumentpage11</formula>根據最小二乘方法,通過求取對Aq/的一階微分可導出下面的方程<formula>formulaseeoriginaldocumentpage11</formula>加入新樣本后回歸系數Cy的校正值Acv可由方程6導出。將Acy插入方程(3)可導出更新預測模型。5)從組II校準集選擇樣本有以下四種方法a)隨機選擇,b)僅從'軟,水果組選取;c)僅從'硬'水果組選取;d)同時從'軟'水果組和'硬'水果組選取.組II中所有的樣本均根據MT硬度值按降序排列。'軟'水果樣本從l開始按向前順序選取;'硬,水果樣本從最后一個樣本按向后順序選取;將按以上四種選擇方法選取的樣本分別加入到由組I校準集所得預測模型,以更新該預測模型。最后,用組II驗證集驗證所更新模型。上述步驟以列舉應用實例予以說明。1組內預測圖2(a)表明,組I的校準樣本的MT硬度值和估計硬度值之間的!^0.89,SEC=5.74N。對于驗證樣本集,模型預測蘋果硬度值具有r=0.89,SEP=6.04N(圖2(b))。這些結果表明基于散射圖像MLD參數的MLR預測模型可以很方便的被用于預測當年的蘋果樣本。類似的,組II校準集用于建立校準模型,組II驗證集用作驗證模型。MT硬度值和在8個波長下的并利用校正集樣本回歸得出MLD參數。圖3(a)和(b)分別為校準和驗證的結果。結果表明該模型對于校準樣本i^0.87和SEC:5.91N,對于驗證樣本r-0.87,SEP=6.07N,是-一個好的預測模型。圖2(a)和圖3(a)看起來好像相似,但是,由組I組建的預測模型不能夠直接用于預測組II中的樣本(圖4),這是因為兩個樣本集具有不同的水果條件,因此這兩組的特性差異將會有很大不同。這樣,基于某一組中校正樣本所建立的蘋果硬度預測模型對本組的驗證樣本可取得良好的預測結果,但針對另一組的預測性能不佳。因此為確保所建模型對新組的預測性能,必須通過加入新族中的樣本對該模型予以更新。2跨年度預測表l所示為采用不同方式從組n校準集取樣本并將其加入到組I校準集用于預測水果硬度的比較結果。表l第一列表示加入的新樣本數。表1中從第二列到第17列每四列分別表示選取增加樣本的每種方式的預測結果,即隨機選取、僅從'軟'水果組選取;僅從'硬'水果組選取;同時從'軟'水果組和'硬'水果組選取。表l給出了針對每一種樣本選擇方法的校正和驗證結果。比較表l中第2,4,6,8,10th,12,14和th列的相關系數(r)值,或者比較第3,5,7,9,11,13,15和17列的標準差數值,可以看到,交替的從'軟'水果組和'硬'水果組選取樣本的方式具有最好的模型效果。表i從組n校準集中選擇樣本加入組i校準集的四種樣本選擇方法對預測組n水果硬度的比較<table>tableseeoriginaldocumentpage13</column></row><table>圖5所示為隨所加樣本數目的變化蘋果硬度的預測r值相應于四種不同樣本選擇方式下的變化曲線。隨著樣本數目的增多r值表現出增長趨勢,但在隨機選擇樣本用于更新校正模型這種方式下,曲線的增長趨勢并不穩定;僅從'軟'水果組或僅從'硬'水果組選取樣本的方式具有較好和更為穩定模型預測結果,隨著所加樣本數目的增多r值穩定、持續增大。而交替的從'軟'水果組和'硬'水果組選取樣本的方式下可獲得最好的模型預測結果。隨著所加樣本數目的增多r值穩定增長,當所加樣本數為148時r值到達穩定值0.86,預測標準差SEP=6.11N(表1和圖5)。對組II預測結果與針對當年樣本的預測結果r=0.87,SEP=6.07N相近,后者所用預測模型建立在由組II組的338個校正樣本基礎上。使用四種不同的樣本加入方法將新樣本加入組I水果校正集所建模型預測組II蘋果硬度的相關系數(r)研究結果表明,若要取得相近的預測結果,該模型更新方法相比依托新組大量樣本重新建立模型的方法,所需新樣本數少得多。進一步,本研究對更新預測模型的四種樣本懸著方式進行了比較,研究結果表明,這四種方式在蘋果硬度預測結果方面具有很大的差異,在這四種方式中,交替的從'軟'水果組和'硬'水果組選取樣本的方式具有最好的模型更新效果。采用本文的模型更新方法,使得為組I所建預測模型可以用來預測組II組蘋果樣本的硬度,2005年的測試結果是相關系數r-0.86,預測標準差為6.11N,這一結果已與依靠組II組內大量校正樣本所建模型的預測結果相近。因此,本文的模型更新方法連同多光譜散射技術可以用來對來自不同收獲季節和不同地方的蘋果的硬度進行實時預測。權利要求1.一種基于多光譜散射圖像的蘋果硬度預測模型新方法,其特征在于,采用不同的回歸方法更新現有模型以用于預測新一組樣本,即開發了一種通過增加新樣本來更新現有預測模型的回歸最小二乘方法;并提出一種能夠獲得較好的水果硬度預測結果的樣本增加方法,使更新后的模型可以有效的預測水果的硬度,最后用同一時間采集但具有不同收后儲存時間的兩組不同的蘋果樣本集來測試該模型對蘋果的硬度預測效果,并與采用以往預測方法的水果硬度預測結果進行比較。2.根據權利要求l所述基于多光譜散射圖像的蘋果硬度預測模型更新方法,其特征在于,所述蘋果硬度預測模型更新方法具體步驟如下(1)蘋果樣本材料的選取試驗開始前,需要選取合適蘋果樣本,并將其放置在室溫下至少15小時,試驗時選取了兩組蘋果樣本;(2)數據采集與處理數據采集是使用袖珍型、裝有液晶可調諧濾波器(LCTF)的多光譜圖像系統分別采集組I和組II的蘋果樣本獲得其光譜散射圖像,獲得每個蘋果樣本在8個波長下的8幅散射圖像;數據處理,使用修正的洛倫茲分布函數(MLD)來計算每一個散射圖像的輪廓參<formula>formulaseeoriginaldocumentpage2</formula>上式中,R是以CCD灰度數表示的光密度;Z是散射距離;A為光密度不對稱值,^為散射輪廓峰值;"3為半最大峰值對應的滿散射寬度(FWHM);^為FWHM周圍的散射斜坡;采集完光譜散射圖像后,使用標準的MT硬度測試儀測量每個水果的硬度值,在與采集圖像相同的環繞每個水果赤道的區域,以2mm/s的落下速度將直徑為llmm的探針刺入去皮水果9.0mm測量其硬度值;(3)回歸預測模型的步驟,水果硬度回歸預測模型共包含以下5步1)按組I和組II每組450個蘋果樣本,各自均被分為兩個獨立的樣本集,樣本按硬度值大小降序排列,每四個蘋果中的前三個用于校準,第四個用于驗證,該過程最終使從組i和組n分別提取出兩個驗證集和兩個校準集;2)在不同的波長下對每一個樣本采用非線性回歸分析擬合圖像散射輪廓,從而確定方程一中它們的MLD參數,從每個樣本可獲得一套共32個MLD參數^4參數*8波長;進一步將水果樣本的MLD參數除以與Teflon參考標準對應的參數,以校正從蘋果樣本獲取散射圖像的試驗過程中光源波動帶來的影響;3)采用多元線性回歸(MLR)計算組I校準集和組II校準集中樣本MT硬度和MLD硬度兩者間的r值和校準標準差(SEC),采用MLR方法分別建立起組I和組II的8波長預測模型,接著分別用它們各自的驗證集對其進行驗證,驗證結果用作與后續所述新的模型更新方法所獲模型的驗證結果進行比較,組I的水果硬度預測模型可用方程(2)來表示<formula>formulaseeoriginaldocumentpage3</formula>(2)其中,F為以N表示的MT預測硬度;a,(/=l,2,…,";"=32)為MLD參數;下標y表示每一個參數;C/為每個波長下與4個MLD參數中的每個參數相聯系的回歸系數;CO為以N為單位的截距;4)用從組II校準集選取的樣本校正由組I校準集所建預測模型,接著用組II驗證集驗證該更新模型,更新算法由下列過程導出,加入新樣本后預測模型(方程1)的回歸系數C將變為。+AC/,可表示為<formula>formulaseeoriginaldocumentpage3</formula>其中AF為預測硬度的校正值,假定新樣本的MLD參數和MT硬度為2"、(4)其中乂為新加入樣本的MT硬度;(/=l,2,...,m)代表每個樣本;AW為新加入樣本的數量。更新的模型必須確保新加入樣本的預測值(^+A^)和參考值,之間的最小差異,即利用方程(5)的最小二乘求取更新預測模型的As值,+(5)'=1根據最小二乘方法,通過求取對Ag'的一階微分可導出下面的方程a2la,2w/2V(6)加入新樣本后回歸系數(V的校正值Ac^可由方程6導出。將Ac,插入方程3可導出更新預測模型;5)從組II校準集選擇樣本有以下四種方法a)隨機選擇,b)僅從'軟,水果組選取;c)僅從'硬'水果組選取;d)同時從'軟'水果組和'硬,水果組選取.組II中所有的樣本均根據MT硬度值按降序排列。'軟'水果樣本從l開始按向前順序選取;'硬,水果樣本從最后一個樣本按向后順序選取;將按以上四種選擇方法選取的樣本分別加入到由組I校準集所得預測模型,以更新該預測模型,最后,用組II驗證集驗證所更新模型。3.根據權利要求l所述基于多光譜散射圖像的蘋果硬度預測模型更新方法,其特征在于,所述8個波長為650,680,700,740,820,880,910,和990nm。全文摘要本發明屬于農產品無損檢測的一種基于多光譜散射圖像的蘋果硬度預測模型更新方法。采用不同的回歸方法更新現有模型以用于預測新一組樣本。即開發了一種通過增加新樣本來更新現有預測模型的回歸最小二乘方法;并提出一種能夠獲得較好的水果硬度預測結果的樣本增加方法,使更新后的模型可以有效的預測水果的硬度。最后用同一時間采集但具有不同收后儲存時間的兩組不同的蘋果樣本集來測試該模型對蘋果的硬度預測效果,所需新樣本數少得多。進一步,本研究對更新預測模型的四種樣本懸著方式進行了比較,研究結果表明本文的模型更新方法連同多光譜散射技術可以用來對來自不同收獲季節和不同地方的蘋果的硬度進行實時預測。文檔編號G06F19/00GK101226146SQ20081005685公開日2008年7月23日申請日期2008年1月25日優先權日2008年1月25日發明者彭彥昆申請人:中國農業大學