本發明涉機器學習領域,特別涉及一種基于卷積神經的農作物害蟲圖像識別方法。
背景技術:
傳統的病蟲害診斷采用人工觀測的方式,這一方式存在主觀性、局限性、模糊性等不足。隨著計算機圖像處理以及人工智能技術的發展,人們開始利用計算機代替人來進行農作物的病蟲害診斷,提出了在計算機上實現病蟲害的識別。
目前有基于傳統的圖像識別技術對病蟲害圖像進行識別,該技術采用灰度變換、中值濾波、閥值分割、輪廓檢測、病斑提取作為與處理數據,從預處理數據顯式提取紋理特征、顏色特征和形狀特征。傳統的圖像識別方法是基于圖像的“點特征”或“線特征”進行的。對于一般圖像的識別匹配效果較好,但是當光照條件較復雜、拍照角度變化大時,魯棒性不好。基于卷積神經的圖像識別方法克服了傳統算法中對光照條件改變和拍照角度改變適應性不強的問題。
而且,上述傳統的圖像識別方法只提取圖像的部分具有代表性的特征,比如sift和surf,具有一定的局限性,某些過程還需要人工選取;人工神經網絡容易過擬合,參數很難調整,訓練比較慢,并且在層數較少時效果并不比其他方法更優。
20世紀60年代,hubel和wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經元時發現其獨特的網絡結構可以有效地降低反饋神經網絡的復雜性,繼而提出了卷積神經網(convolutionalneuralnetworks-簡稱cnn)。現在,cnn已經成為眾多科學領域的研究熱點之一,特別是在模式分類領域,由于該網絡避免了對圖像的復雜前期預處理,可以直接輸入原始圖像,因而得到了更為廣泛的應用。
技術實現要素:
為解決現有技術中的缺點和不足,本發明提出一種基于卷積神經的農作物害蟲圖像識別方法,將卷積神經與農作物害蟲圖像識別相結合,采用逐層初始化的訓練方式,充分發揮深度學習自我學習的優勢可以有效解決特征提取困難、訓練難度大、參數很難調整的問題。
本發明的技術方案時這樣實現的:
一種基于卷積神經的農作物害蟲圖像的方法,包括:農作物害蟲圖像數據庫、圖像預處理、卷積神經網絡和模型;農作物害蟲圖像數據庫的圖像經過預處理輸入到卷積神經網絡,經過帶標簽圖像訓練后得到逐層計算后能夠提取具有代表性的特征的模型,將要分類的圖像經過預處理輸入到訓練好模型的卷積神經網絡得到該圖像屬于各種類型的概率。
可選地,所述輸入層,隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經過預處理的三通道圖像像素值。
步驟b,隱含層包括:卷積層、池化層、dropout層和全連接層,隱藏層首先使用前向傳播,再食用反向傳播進行訓練;
步驟c,輸出層即進行分類的層,分類器softmax接收全連接層輸入,輸出該圖像所屬各類別的概率。
可選地,隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個樣本x,yp,將x輸入網絡;
步驟b,計算相應的實際輸出op。
在此階段,信息從輸入層經過逐級的變換,傳送到輸出層。這個過程也是網絡在完成訓練后正常運行時執行的過程。在此過程中,網絡執行的計算是(實際上就是輸入與每層的權值矩陣相點乘,得到最后的輸出結果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)。
可選地,隱藏層使用反向傳播,具體過程為:
步驟a,計算實際輸出op與相應的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調整權矩陣。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量)。
本發明的有益效果是:
1、充分發揮深度學習的自我學習優勢,經過前向傳播和反向傳播訓練得到能提取具有代表性特征的模型,當輸入一副圖像時,能夠快速準確的提取特征,進行逐層抽象知道形成某一事物的概念,并用分類器進行分類;
2、利用深度學習網絡的結構特征,采取逐層初始化的訓練機制,大大降低訓練難度;
3、由于深度學習網絡將圖像分割后提取每一部分的特征,然后再將特征進行組合,而非直接比較整幅圖,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度的問題;而且可以識別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問題。
4、卷積神經與農民關注的農作害蟲防治結合,更方便農民治理害蟲,易于被認可和傳播,提高研究價值。
附圖說明
圖1是本發明所述卷積神經網絡結構示意圖;
圖2是本發明所述卷積示意圖;
圖3是本發明所述dropout層示意圖。
具體實施方式
下面將結合本發明實例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實例僅僅是本發明一部分實例,而不是全部的實例。基于本發明中的實例,本領域普通技術人員在沒有做出創造性勞動前提下所獲的的所有其他實例,都屬于本發明保護的范圍。
如圖1-3所示,本發明的基于卷積神經的農作物害蟲圖像識別方法,包括:農作物害蟲圖像數據庫、圖像預處理、卷積神經網絡和模型;農作物害蟲圖像數據庫的圖像經過預處理輸入到卷積神經網絡,經過帶標簽圖像訓練后得到逐層計算后能夠提取具有代表性的特征的模型,將要分類的圖像經過預處理輸入到訓練好模型的卷積神經網絡得到該圖像屬于各種類型的概率,即分類結果。
其中,深度學習網絡分為:輸入層、隱藏層和輸出層,包括以下步驟:
步驟a,輸入層輸入經過預處理的三通道圖像像素值。
步驟b,隱藏層設置為7層,首先使用前向傳播,再使用反向傳播修改模型參數來進行訓練。
步驟c,輸出層進行分類的層,分類器softmax接收全連接層輸入,輸出該圖像所屬各類別的概率。
隱藏層使用前向傳播的步驟,具體包括:
步驟a,從樣本集中取一個樣本x,yp,將x輸入網絡;
步驟b,計算相應的實際輸出op。
在此階段,信息從輸入層經過逐級的變換,傳送到輸出層。這個過程也是網絡在完成訓練后正常運行時執行的過程。在此過程中,網絡執行的計算是(實際上就是輸入與每層的權值矩陣相點乘,得到最后的輸出結果):
op=fn(…(f2(f1(x*w1+b1)w2+b2)…)wn+bn)
隱藏層使用反向傳播,具體過程為:
步驟a,計算前向傳播輸出op與相應的理想輸出yp的差;
步驟b,按極小化誤差的方法反向傳播調整權矩陣。
其中,上述步驟b中,調整權矩陣過程為:通過梯度下降法修改權值w和偏移值b使前向傳播輸出值op收斂。
算法如下的:
卷積層的輸出=sigmoid(sum(卷積值)+偏移量);
圖2為本發明中部分卷積神經網絡的解析圖,由圖2可以看出,輸入層為顯層,輸入經過預處理的圖像像素值。
本發明充分發揮深度學習的自我學習優勢,經過前向傳播和反向傳播訓練得到能提取具有代表性特征的模型,當輸入一副圖像時,能夠快速準確的提取特征,進行逐層抽象知道形成某一事物的概念,并用分類器進行分類;而且可以識別位移、縮放及其他形式扭曲不變性的二維圖形,這就解決了拍攝角度限制的問題。
而且,由于深度學習網絡將圖像分割后提取每一部分的特征,然后再將特征進行組合,而非直接比較整幅圖像,從任何角度拍攝獲取的圖像,得到的局部特征都幾乎相同,這就解決了拍攝角度限制的問題。
并且,農作物害蟲圖像的識別更關注農作物的產量和質量,利于普遍推廣,將兩者結合具有很高的研究價值與應用前景。
以上所述僅為本發明的較佳實例而已,并不用以限制本發明,凡在本發明精神和原則之內,所作出的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。