本發明涉及信息系統運行維護領域,特別涉及一種基于卷積神經網絡的信息系統故障診斷方法及裝置。
背景技術:
:隨著云計算、大數據的發展和應用,信息服務無處不在,已經完全融入到人們生產和生活之中,因此要求信息系統能夠可靠地提供各類服務。信息系統運行時積累了大量數據,可以很好地反映信息系統的運行狀態,為故障時的智能診斷提供了重要的基礎。智能故障診斷是一個傳統的研究領域,在各行各業都有著一定的研究和實踐。在信息系統故障診斷方面,也開展了這方面的研究和探索。目前,現有技術支持向量機、BP神經網絡(BP,BackPropagation,反向傳播)和決策樹等機器學習方法在信息通信故障診斷中已經得到了一定的研究和應用。但這些方法存在預測精度低,且需要人工選取特征從而導致主觀性強等問題。技術實現要素:有鑒于此,本發明的目的在于提供一種基于卷積神經網絡的信息系統故障診斷方法,以避免因人為因素而產生的誤差,提高故障診斷精準度。其具體方案如下:一種基于卷積神經網絡的信息系統故障診斷方法,包括:獲取運行監控數據;利用所述運行監控數據,創建運行監控數據矩陣;將所述運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,所述故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到所述故障診斷模型。優選的,所述利用所述運行監控數據,創建運行監控數據矩陣的過程包括:將所述運行監控數據按照信息的類型進行排列,創建所述運行監控數據矩陣。優選的,所述獲取運行監控數據的過程包括:獲取所述信息系統的運行數據;將所述運行數據進行歸一化處理,得到所述運行監控數據。優選的,所述故障診斷模型的獲得過程包括:預先創建所述卷積神經網絡;利用反向傳播算法、所述歷史運行監控數據矩陣和所述運行狀態標簽對所述卷積神經網絡進行訓練,得到所述故障診斷模型。優選的,所述卷積神經網絡包括:依次連接的輸入層、第一特征提取層、第一特征映射層、第二特征提取層、第二特征映射層、卷積層和輸出層。優選的,所述第一特征提取層和所述第二特征提取層中的卷積核均為5×5的卷積核,所述卷積層中的卷積核為3×3的卷積核,所述輸出層為全連接層。本發明還公開了一種基于卷積神經網絡的信息系統故障診斷裝置,包括:數據獲取模塊,用于獲取運行監控數據;矩陣創建模塊,用于利用所述運行監控數據,得到運行監控數據矩陣;故障診斷模塊,用于將所述運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,所述故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到所述故障診斷模型,所述運行狀態標簽為通過用戶對信息系統運行故障的狀態進行記錄得到的。優選的,所述運行監控數據矩陣獲取模塊具體用于將所述運行監控數據按照信息的類型進行排列,組成所述運行監控數據矩陣。優選的,所述運行監控數據獲取模塊包括:數據獲取單元,用于獲取所述信息系統的運行數據;歸一化處理單元,用于將所述運行數據進行歸一化處理,得到所述運行監控數據。優選的,所述故障診斷模塊包括:網絡創建單元,用于預先創建所述卷積神經網絡;模型訓練單元,用于利用反向傳播算法、所述歷史運行監控數據矩陣和所述運行狀態標簽對所述卷積神經網絡進行訓練,得到所述故障診斷模型。本發明中,基于卷積神經網絡的信息系統故障診斷方法,包括:獲取運行監控數據;利用運行監控數據,創建運行監控數據矩陣;將運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到故障診斷模型。可見,本發明中利用卷積神經網絡創建故障診斷模型,對運行監控數據進行故障診斷,得出診斷結果,使得用戶利用診斷結果可以對信息系統進行維護,使用卷積神經網絡提升了對于特征的抽取能力和分類能力,能夠更有效的診斷出系統的故障,避免了人為因素的干擾,提升了診斷的準確度,且對故障診斷模型的復用提升診斷效率,為信息系統的安全運行提供了支持。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據提供的附圖獲得其他的附圖。圖1為本發明實施例提供的一種基于卷積神經網絡的信息系統故障診斷方法的流程圖;圖2為本發明實施例提供的另一種基于卷積神經網絡的信息系統故障診斷方法的流程圖;圖3為本發明實施例提供的一種卷積神經網絡應用結構示意圖;圖4為本發明實施例提供的一種基于卷積神經網絡的信息系統故障診斷裝置結構示意圖。具體實施方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。本發明實施例公開了一種基于卷積神經網絡的信息系統故障診斷方法,參見圖1所示,該方法包括:步驟S11:獲取運行監控數據。具體的,采集信息系統各組成部分的運行狀態信息,例如,主機、存儲、數據庫、中間件、應用軟件等信息類型。采集的具體指標包括CPU利用率、內存使用率、磁盤空間使用率、數據庫連接數、數據庫表空間使用率、數據庫運行狀態、Java虛擬機使用率、日志報錯信息、系統日訪問量和在線用戶數等指標,得到運行監控數據。步驟S12:利用運行監控數據,創建運行監控數據矩陣。具體的,診斷系統得到運行監控數據后,將運行監控數據按照信息的類型進行排列,創建運行監控數據矩陣。例如,參見表1運行監控數據矩陣組織示意表所示,按照存儲、主機、數據庫、中間件、應用系統等自上而下排列,當同一類信息類型中有多個設備或軟件,則按照設備或軟件的編號從左向右依次排列,即,矩陣的行數由信息的類型數量決定,矩陣的列數由包括設備或軟件的最多的信息類型決定,最后創建出運行監控數據矩陣。表1存儲S11S12S13...主機1M11M12M13...主機2M21M22M23...數據庫1D11D12D13...數據庫2D21D22D23...中間件1M11M12M13...中間件2M21M22M23...應用系統1A11A120...應用系統2A21A220...其中,由于每個信息類型的設備或軟件數量不一樣,而矩陣的列數以設備或軟件數量最大值為標準,因此,在矩陣中未定義數據項的空白處用數字0補充。步驟S13:將運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到故障診斷模型。在實際應用中,由于卷積神經網絡其優異的特征抽取能力和分類能力,在圖像、語音、文本識別與分類應用中取得了非常好的效果,將人工智能技術向前推進了一大步,得到了科研領域和工業界的普遍關注,且卷積神經網絡能夠進行深度學習,深度學習算法是借鑒腦神經工作機理,在傳統的人工神經網絡技術上的延伸和發展,增加人工神經網絡的隱層數量,并提出了有效訓練方法,解決了神經網絡訓練的局部收斂問題,從而提升了神經網絡的特征抽取能力和分類能力,因此本發明實施例中,故障診斷模型是基于卷積神經網絡搭建的。具體的,診斷系統將得到的運行監控數據矩陣輸入到預先訓練好的故障診斷模型,通過故障診斷模型采用卷積神經網絡對運行監控數據進行計算,分析出系統運行正常或故障的原因,得到診斷結果。其中,首次創建故障診斷模型需要預先創建卷積神經網絡,卷積神經網絡可以包括依次連接的輸入層、特征提取層、特征映射層、卷積層和輸出層;再利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到故障診斷模型,當下次再進行故障診斷時,可以復用訓練好的故障診斷模型,以得到診斷結果。可見,本發明實施例中利用卷積神經網絡創建故障診斷模型,對運行監控數據進行故障診斷,得出診斷結果,使得用戶利用診斷結果可以對信息系統進行維護,使用卷積神經網絡提升了對于特征的抽取能力和分類能力,能夠更有效的診斷出系統的故障,避免了人為因素的干擾,提升了診斷的準確度,且對故障診斷模型的復用提升診斷效率,為信息系統的安全運行提供了支持。本發明實施例公開了一種具體的基于卷積神經網絡的信息系統故障診斷方法,相對于上一實施例,本實施例對技術方案作了進一步的說明和優化。參考圖2所示,具體的:步驟S21:獲取信息系統的運行數據。診斷系統獲取信息系統的各組成部分的各項運行數據。步驟S22:將運行數據進行歸一化處理,得到運行監控數據。將獲取到的運行數據進行歸一化處理,使各項數據歸一化到[0,1]范圍,以便于統一各項數據的單位,便于后續的計算和分析,是結果更加準確。例如,當前cpu占用率為50%,磁盤空間使用量為6G,總空間為10G,數據庫連接數為12,允許最大連接數為100,對cpu占用率、磁盤空間使用量和數據庫連接數進行歸一化,分別得到cpu占用率0.5、磁盤空間使用量0.6和數據庫連接數0.12。步驟S23:利用運行監控數據,創建運行監控數據矩陣。步驟S23:將運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到故障診斷模型。具體的,使用故障診斷模型前,需要預先搭建故障診斷模型,首先預先創建卷積神經網絡的初始模型,可以使用基于LeNet—5網絡改進的卷積神經網絡,搭建出依次連接的輸入層、第一特征提取層、第一特征映射層、第二特征提取層、第二特征映射層、卷積層和輸出層。其中,每層由多個二維平面組成,而每個平面由多個獨立神經元組成;特征提取層中的每個神經元的輸入與前一成的局部區域相連,并提取該局部的特征,因為下一層與上一層的局部點或局部位置上的元素有關,所以體現了不同二維特征之間的位置關系,一旦該局部特征被提取后,該局部特征與其他特征間的位置關系也隨之確定下來,例如,在信息系統中,提取cpu的特征會確定出與內存之間的關聯關系;神經網絡中的每個計算層有多個特征映射組成,每個特征映射為一個平面,平面上所有神經元的權值相等,該平面集便是特征映射層。為使特征映射具有位移不變性,特征映射結構可以采用sigmod函數作為卷積網絡的激活函數。具體的,得到卷積神經網絡的初始模型后,逐層訓練卷積神經網絡,利用歷史運行監控數據矩陣和運行狀態標簽,使歷史運行監控數據矩陣作為輸入層,經過逐級的變換,直到輸出,例如,設置初始網絡參數包括卷積核、運行幾次卷積運算和權值矩陣等參數,將歷史運行監控數據矩陣作為輸入層,第一特征提取層利用相應的卷積核對輸入層進行卷積運算,得到第一特征提取層的特征圖;第一特征映射層對第一特征提取層進行采樣,生成第一特征映射層的特征圖;第二特征提取層利用相應的卷積核對第一特征映射層進行卷積運算,得到第二特征提取層的特征圖;第二特征映射層對第二特征提取層進行采樣,得到第二特征映射層的特征圖;卷積層利用相應的卷積核對第二特征映射層進行卷積運算,得到特征集;輸出層再對卷積層中的特征集進行運算,得到輸出層的特征集,作為初始結果。其中,運行狀態標簽為用戶對信息系統運行故障的狀態進行標注和記錄,形成運行監控數據和運行狀態標簽的對應關系。進一步,得到初始結果后,利用反向傳播算法,計算初始結果與理想輸出的差,按最小化誤差的方法調整權值矩陣,得到優化后的網絡參數,例如,參見圖4所示,上述訓練卷積神經網絡的例子中,輸入層采用24×24的結構,第一特征提取層C1利用5×5的卷積核對輸入層進行卷積計算,得到20×20的特征圖;第一特征映射層S2對第一特征提取層C1進行1/2的采樣生成10×10的特征圖;第二特征提取層C3利用5×5的卷積核對第一特征映射層S2進行卷積計算,得到6×6的特征圖;第二特征映射層S4對第二特征提取層C3進行1/2的采樣生成3×3的特征圖;卷積層C5利用3×3的卷積核對第二特征映射層S4進行卷積運算,得到100個特征;輸出層采用全連接,即全連接層,對100個特征進行運算,得到60個對應信息系統故障的分類的特征。可以理解的是,在圖像中以ai,j為左上角,ai+4,j+4為右下角元素的矩陣與5×5卷積核的卷積值為:其中,ai,j是二位矩陣中的元素,bn,m是卷積核中的元素,n和m的取值范圍為[1,2,3,4,5],i和j為圖像中的坐標。需要說明的是,得到優化后的網絡參數后,將其輸入到卷積神經網絡中,得到訓練好的故障診斷模型,當再次使用診斷系統時,不再需要重新創建故障診斷模型,可以直接使用先前訓練好的故障診斷模型,得到診斷結果。當然,根據實際需要也可以調整故障診斷模型中的各項參數,而不局限于上述例子中的具體參數,在此不做限定。另外,本發明實施例還提供了一種基于卷積神經網絡的信息系統故障診斷裝置,參見圖4所示,該裝置包括:數據獲取模塊11,用于獲取運行監控數據;矩陣創建模塊12,用于利用運行監控數據,得到運行監控數據矩陣;故障診斷模塊13,用于將運行監控數據矩陣輸入到故障診斷模型,得到診斷結果,其中,故障診斷模型為利用歷史運行監控數據矩陣和運行狀態標簽,對卷積神經網絡進行訓練,得到故障診斷模型,運行狀態標簽為通過用戶對信息系統運行故障的狀態進行記錄得到的。具體的,運行監控數據矩陣獲取模塊具體用于將運行監控數據按照信息的類型進行排列,組成運行監控數據矩陣。上述運行監控數據獲取模塊11包括數據獲取單元和歸一化處理單元;其中,數據獲取單元,用于獲取信息系統的運行數據;歸一化處理單元,用于將運行數據進行歸一化處理,得到運行監控數據。上述故障診斷模塊13包括網絡創建單元和模型訓練單元;其中,網絡創建單元,用于預先創建卷積神經網絡。其中,卷積神經網絡包括:依次連接的輸入層、第一特征提取層、第一特征映射層、第二特征提取層、第二特征映射層、卷積層和輸出層;第一特征提取層和第二特征提取層中的卷積核均為5×5的卷積核,卷積層中的卷積核為3×3的卷積核,輸出層為全連接層。模型訓練單元,用于利用反向傳播算法、歷史運行監控數據矩陣和運行狀態標簽對卷積神經網絡進行訓練,得到故障診斷模型。可見,本發明實施例中利用卷積神經網絡創建故障診斷模型,對運行監控數據進行故障診斷,得出診斷結果,使得用戶利用診斷結果可以對信息系統進行維護,使用卷積神經網絡提升了對于特征的抽取能力和分類能力,能夠更有效的診斷出系統的故障,避免了人為因素的干擾,提升了診斷的準確度,且對故障診斷模型的復用提升診斷效率,為信息系統的安全運行提供了支持。最后,還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。以上對本發明所提供的一種基于卷積神經網絡的信息系統故障診斷方法及裝置進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發明的方法及其核心思想;同時,對于本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。當前第1頁1 2 3