一種處理告警事件的方法及系統的制作方法
【技術領域】
[0001]本發明涉及計算機程序管理領域,特別涉及一種處理告警事件的方法及系統。
【背景技術】
[0002]—般的集群管理系統的告警模塊包括告警級別、問題描述、時間提示和解決方案。通過告警模塊來收集、反饋和推送系統運行時遇到的各種問題和操作,讓系統管理員及時了解系統運行時所遇到的各種問題,由于系統的復雜性和邏輯上的關聯性,單一的設備故障可能引發大量的告警,形成告警風暴,但是告警模塊不能直接判定出錯原因,而是根據出錯的問題一一給出解決方案,不能找到問題關鍵所在,主要是靠系統管理者個人的維護經驗對其進行人工分類判斷和分析,并最終得出發生告警事件的根源所在。
[0003]因此,現有技術中的告警問題都比較單一,只是針對當前的問題故障提供一些解決方法。維護起來費時費力,不能精確找到處理問題的關鍵。
【發明內容】
[0004]本發明的目的是提供一種處理告警事件的方法,該方法能夠在有效處理告警信息的同時,節省了因試用不同的處理方案所產生的人力物力的浪費,提高解決集群告警問題的效率;此外,本發明的另一目的是提供一種處理告警事件的系統。
[0005]為解決上述技術問題,本發明提供一種處理告警事件的方法,應用于集群管理系統,利用關聯規則對告警數據庫中的數據進行分析,形成告警關聯規則庫,還包括:
[0006]獲取故障告警信息;
[0007]將所述故障告警信息進行處理,得到索引信息;
[0008]將所述索引信息與所述告警關聯規則庫中的數據進行對比,確定與所述索引信息相對應的處理方案。
[0009]其中,將所述故障告警信息進行處理,得到索引信息包括:
[0010]將所述故障告警信息進行語義分析,將提取的關鍵詞作為索引信息。
[0011]其中,將所述索引信息與所述告警關聯規則庫中的數據進行對比,確定與所述索引信息相對應的處理方案包括:
[0012]將所述索引信息與所述告警關聯規則庫中的關聯規則列表數據進行對比,確定關聯規則;
[0013]根據所述關聯規則,確定與所述關聯規則相對應的處理方案。
[0014]其中,還包括:
[0015]將所述故障告警信息上報至所述告警數據庫。
[0016]其中,還包括:
[0017]定期對所述告警關聯規則庫進行更新。
[0018]本發明還提供一種處理告警事件的系統,應用于集群管理系統,包括告警關聯規則庫,用于利用關聯規則對告警數據庫中的數據進行分析,形成告警關聯規則庫,還包括:
[0019]獲取模塊,用于獲取故障告警信息;
[0020]處理模塊,用于將所述故障告警信息進行處理,得到索引信息;
[0021]對比模塊,用于將所述索引信息與所述告警關聯規則庫中的數據進行對比,確定與所述索引信息相對應的處理方案。
[0022]其中,所述處理模塊包括:
[0023]將所述故障告警信息進行語義分析,將提取的關鍵詞作為索引信息。
[0024]其中,所述對比模塊包括:
[0025]對比單元,用于將所述索引信息與所述告警關聯規則庫中的關聯規則列表數據進行對比,確定關聯規則;
[0026]確定單元,用于根據所述關聯規則,確定與所述關聯規則相對應的處理方案。
[0027]其中,還包括:
[0028]上報模塊,用于將所述故障告警信息上報至所述告警數據庫。
[0029]其中,還包括:
[0030]更新模塊,用于定期對所述告警關聯規則庫進行更新。
[0031]本發明所提供的處理告警事件的方法,應用于集群管理系統,利用關聯規則對告警數據庫中的數據進行分析,形成告警關聯規則庫,還包括:獲取故障告警信息;將所述故障告警信息進行處理,得到索引信息;將所述索引信息與所述告警關聯規則庫中的數據進行對比,確定與所述索引信息相對應的處理方案;
[0032]該方法改變現有技術中告警級別、問題描述、時間提示和解決方法單一,只是針對當前的問題故障提供一些固定解決方法;該方法通過將告警數據庫中的數據進行分析,找到各個數據之間的關聯關系,形成告警關聯規則庫;告警關聯規則庫可以排除一些不必要的解決方案,增加靈活度,協助管理人員分析故障信息,提高了處理告警信息的準確性和實效性。即該方法利用告警關聯規則庫能夠在有效處理告警信息的同時,節省了因試用不同的處理方案所產生的人力物力的浪費,提高解決集群告警問題的效率。
【附圖說明】
[0033]為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據提供的附圖獲得其他的附圖。
[0034]圖1為本發明實施例所提供的處理告警事件的方法的流程圖;
[0035]圖2為本發明實施例所提供的處理告警事件的系統的結構框圖;
[0036]圖3為本發明實施例所提供的另一處理告警事件的系統的結構框圖;
[0037]圖4為本發明實施例所提供的又一處理告警事件的系統的結構框圖。
【具體實施方式】
[0038]本發明的核心是提供一種處理告警事件的方法,該方法能夠在有效處理告警信息的同時,節省了因試用不同的處理方案所產生的人力物力的浪費,提高解決集群告警問題的效率。
[0039]為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0040]請參考圖1,圖1為本發明實施例所提供的處理告警事件的方法的流程圖;該方法應用于集群管理系統,首先利用關聯規則對告警數據庫中的數據進行分析,形成告警關聯規則庫;形成告警關聯規則庫;其中,通過對一個大型的告警數據庫進行分析處理,最終形成一個告警關聯規則庫。
[0041]基于該告警關聯規則庫,該方法可以包括:
[0042]SlOO、獲取故障告警信息;
[0043]其中,當發生故障發生后,集群告警模塊會上報告警信息,集群收集故障告警信息。告警信息可以包括:告警級別、問題描述、時間提示等描述該故障的信息。
[0044]SllO、將所述故障告警信息進行處理,得到索引信息;
[0045]其中,對該故障告警信息進行處理,可以得到關鍵的索引信息;例如故障設備的名稱,故障種類,故障級別等。將這些信息作為索引信息。
[0046]sl20、將所述索引信息與所述告警關聯規則庫中的數據進行對比,確定與所述索引信息相對應的處理方案。
[0047]其中,將索引信息與告警關聯規則庫中的數據進行對比;例如通過索引信息中的設備名稱映射到告警關聯規則庫中的設備進行比較,確定與該設備有關的存儲空間,再根據其他索引信息進行對比,并最終確定與所述索引信息相對應的處理方案。
[0048]由于告警關聯規則庫中的解決方案并不是針對單一問題進行的,而是根據對大量的數據分析,確定的高效的解決方案。例如A設備出現某個故障,根據實際設備的運行,可以知道該故障可能會影響到另一問題,因此,在解決該問題時,不僅僅是克服該故障,而是從根源解決由此來帶的問題。達到使系統管理員能夠快速準確找到問題,并提供最有效的解決方案。
[0049]即本發明的集群管理系統的環境是搭建在集群環境中,因此,在集群環境搭建完成后,集群管理系統的告警數據庫里會存儲大量的告警信息,其中蘊含了許多規律性的有用信息,因此可通過數據分析,找到告警的關聯規則。通過這些關聯規則推測出事件發生的根源,產生一條新的解決方案。
[0050]基于上述技術方案,本發明實施例提供的處理告警事件的方法,該方法改變現有技術中告警級別、問題描述、時間提示和解決方法單一,只是針對當前的問題故障提供一些固定解決方法;該方法通過將告警數據庫中的數據進行分析,找到各個數據之間的關聯關系,形成告警關聯規則庫;告警關聯規則庫可以排除一些不必要的解決方案,增加靈活度,協助管理人員分析故障信息,提高了處理告警信息的準確性和實效性。即該方法利用告警關聯規則庫能夠在有效處理告警信息的同時,節省了因試用不同的處理方案所產生的人力物力的浪費,提高解決集群告警問題的效率。
[0051]基于上述技術方案,可選的,上述方法中將所述故障告警信息進行處理,得到索引信息可以包括:
[0052]將所述故障告警信息進行語義分析,將提取的關鍵詞作為索引信息。
[0053]其中,這里可以利用語義分析技術,提取故障告警信息中的