本發明涉及一種基于卷積神經網絡的電網設備分類方法,屬于神經網絡領域。
背景技術:
電網設備識別在電網設備分類、狀態監測和異常預警等領域有著非常重要的應用,是一項具有很高實用價值的技術。
近年來基于深度卷積神經網絡的圖像識別方法有了很多突破。但是,由于圖像數據數量限制和CPU運算能力的限制,神經網絡的精度一直難以突破,且訓練效率很低。隨著數據增強技術和使用GPU計算的實現,利用基于較少數據的深層卷積網絡實現圖像準確分類成為可能。
目前,主流的圖像識別的方法分為兩大類,第一類是基于邊緣識別和特征提取的算法。這種方法根據灰度圖像分割、彩色圖像分割和紋理圖像分割等分割方法得到圖像的特征,然后通過特征匹配進行圖像的分類。這種方法缺點在于計算量大,對噪聲敏感,且不具有泛化能力。
第二類是基于深度卷積神經網絡的算法。卷積神經網絡主要用來識別位移、縮放及扭曲不變性的二維圖像,其基本結構包括兩層,其一為特征提取層,每個神經元輸入與前一層的局部接受域相連,并提取該局部特征;其二是特征映射層,網絡的每個計算層由多個特征映射組成,每個特征映射是一個平面,平面上所有神經元的權值相等。
Alexnet是常用的卷積神經網絡。Alexnet的結構在“Alex Krizhevsky,ImageNet classification with Deep Convolutional Neural Networks”中提出。應用在電網設備的分類中,其結構可以用圖1說明,InputLayer就是輸入圖片層,每個輸入圖片都將被縮放成227×227大小,分rgb三個顏色維度輸入。Layer1~Layer5是卷積層,用于提取特征。在卷積濾波后,還接有ReLUs操作和max‐pooling操作。Layer6~Layer8是全連接層,相當于在五層卷積層的基礎上再加上一個三層的全連接神經網絡分類器。
由于Alexnet的特征檢測層通過訓練數據進行學習,所以在使用時,避免了顯式的特征提取,而是隱式從訓練數據學習;由于其特征映射層中單獨神經元在約束下共享相同的突觸權值集,具有位移不變性的優點。
缺點在于對于較少的訓練數據,Alexnet中過多的卷積層和卷積核非常容易出現數據的過擬合,使得訓練完成的網絡對于測試數據分類結果很不準確,沒有實用性。
技術實現要素:
為了解決上述技術問題,本發明提供了一種基于卷積神經網絡的電網設備分類方法。
為了達到上述目的,本發明所采用的技術方案是:
一種基于卷積神經網絡的電網設備分類方法,包括以下步驟,
步驟1,根據已有的電網設備圖像訓練集和測試集,訓練卷積神經網絡模型;
卷積神經網絡模型包括輸入層、卷積層、全連接層和Softmax層;所述輸入層對輸入的圖像數據進行預處理,用以增大數據量;所述卷積層的數量不大于N,N+1為常用卷積神經網絡卷積層的層數;
步驟2,利用訓練完成的卷積神經網絡模型對需分類的電網設備圖像進行分類。
輸入層利用數據增強技術將輸入的圖像數據進行預處理,用以增大數據量。
輸入輸入層的圖像數據包括圖像均值和lmdb文件,lmdb文件中包括電網設備圖像以及對應的電網設備分類標簽文檔,每張電網設備圖像都對應有一個電網設備分類標簽文檔。
采用權值共享方法,建立卷積層。
卷積層對輸入的電網設備圖像依次進行卷積、非線性激活、平滑和最大值池化處理。
采用采用ReLU型的激勵函數進行非線性激活。
N=4。
本發明所達到的有益效果:本發明利用數據增強技術將輸入圖像數據進行預處理,通過剪切、隨機反轉,增大數據量,解決了數據量不足會導致網絡過擬合,精度下降的問題;鑒于訓練數據的數量較少,削減了卷積層數量和卷積核數目,同時增大卷積核的尺寸,減小了每層卷積層所提取出的特征圖的大小,從而減少了卷積層提取出的特征數量,同樣起到了防止過擬合的作用,提高了精度。
附圖說明
圖1為常用卷積神經網絡結構;
圖2為本發明的流程圖。
具體實施方式
下面結合附圖對本發明作進一步描述。以下實施例僅用于更加清楚地說明本發明的技術方案,而不能以此來限制本發明的保護范圍。
一種基于卷積神經網絡的電網設備分類方法,包括以下步驟:
步驟1,構建訓練集和測試集。
通過實地拍照,采集六大電網設備圖像,每類采集24張,并按照3:1的比例分為訓練圖片和測試圖片。
步驟2,構建與電網設備圖像對應的電網設備分類標簽文檔。
每張電網設備圖像都對應有一個電網設備分類標簽文檔,電網設備分類標簽文檔中存儲有對應電網設備圖像的讀取路徑和文件名,其中,文件名=名稱+數字標簽,例如:0代表變壓器、1代表避雷器、2代表電流互感器、3代表電壓互感器、4代表斷路器、5代表整流器。
步驟3,將電網設備圖像以及對應的電網設備分類標簽文檔打包成lmdb文件。
步驟4,分別計算訓練集和測試集中各電網設備圖像的圖像均值。
步驟5,構建并訓練卷積神經網絡模型。
卷積神經網絡模型包括輸入層、卷積層、全連接層和Softmax層,其中,輸入層利用數據增強技術將輸入的圖像數據進行預處理,用以增大數據量;卷積層采用權值共享方法建立,卷積層的數量不大于N,N+1為常用卷積神經網絡卷積層的層數。常用卷積神經網絡卷積層的層數為5,這里的卷積層的數量區4。
用訓練集和測試集進行訓練過程為:
S51,將訓練用的圖像數據輸入輸入層進行預處理;
訓練用的圖像數據包括訓練集中的電網設備圖像以及對應的電網設備分類標簽文檔打包成lmdb文件、訓練集中的電網設備圖像的圖像均值。
對圖像數據預處理主要處理的是電網設備圖像,這里依次通過剪切和隨機反轉的方法,增大數據量。例如:對于256×256的圖像進行隨機剪切到227×227,然后允許水平翻轉,那么相當與將樣本倍增到(256-227)2×2=1682,測試時候,對左上、右上、左下、右下、中間做了5次剪切,然后翻轉,共10個剪切,之后對結果求平均。
S52,定義t=1,將預處理后的訓練用的圖像數據輸出到第t層卷積層;
S53,依次對其進行卷積、非線性激活、平滑和最大值池化處理;
這里的采用ReLU型的激勵函數進行非線性激活,具體數學表達式為:f(x)=max(0,x),其中,f(x)為輸出,x為輸入,當輸入小于0時,輸出都是0,當輸入大于0時,輸出等于輸入;
平滑處理的具體公式如下:
其中,n為同一個位置上臨近的平滑核的數目,N是平滑核的總數目,k,α,β為預設的參數,是對位于(x′,y)的像素運用核i計算得到的激活值,是對位于(x′,y)的像素運用核j計算得到的激活值,是對進行平滑操作后的激活值。最大值池化選擇池化窗口中的最大值作為采樣值;
S54,判斷t是否等于N,如果是,則轉至S55;如果不是,則t=t+1,將t層卷積層的輸出傳遞至t+1層卷積層,轉至S53;
S55,將N層卷積層的輸出依次經過兩層全連接層輸出至Softmax層。
第一層全連接層是N層卷積層進行池化后的全連接,第二層全連接層是第一層全連接層進行非線性激活后,然后進行Dropout后再進行全連接的結果;
Dropout的具體做法是對于每一個隱層,以50%的概率將他們設置為0,不再對于前向運算或者后向反饋的過程起任何作用,對于每一個輸入來說,使用的不同的網絡結構,但是權重是共享的,這樣求得的參數能夠適應不同的情況下的網絡結構,也就是提高了系統的泛化能力;
Softmax層輸出的每一維電網設備圖像屬于該類別的概率;
S56,將Softmax層輸出的結果與對應的電網設備分類標簽文檔中的數字標簽進行對比;
S57,根據兩者的的殘差采用隨機梯度下降法調整卷積神經網絡的權重參數,重復S52~S57的步驟,直到殘差小于閾值完成訓練,最后輸出訓練完成的卷積神經網絡模型;
S58,調用卷積神經網絡模型,輸入測試用的圖像數據,將判斷結果與已知正確結果相比較,建立精度層、損失層,實時輸出這一判斷的正確率以及損失。
測試用的圖像數據包括測試集中的電網設備圖像以及對應的電網設備分類標簽文檔打包成lmdb文件、測試中的電網設備圖像的圖像均值。
步驟6,利用訓練完成的卷積神經網絡模型對需分類的電網設備圖像進行分類。
上述方法利用數據增強技術將輸入圖像數據進行預處理,通過剪切、隨機反轉,增大數據量,解決了數據量不足會導致網絡過擬合,精度下降的問題;鑒于訓練數據的數量較少,削減了卷積層數量和卷積核數目,同時增大卷積核的尺寸,減小了每層卷積層所提取出的特征圖的大小,從而減少了卷積層提取出的特征數量,同樣起到了防止過擬合的作用,提高了精度。
以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發明技術原理的前提下,還可以做出若干改進和變形,這些改進和變形也應視為本發明的保護范圍。