專利名稱:告警信息配制系統及其配制方法
技術領域:
本發明涉及一種面向IT(信息)系統管理的告警信息配制系統, 同時也涉及該告警信息配制系統配制告警信息的方法,屬于IT系統管理 技術領域。
背景技術:
隨著計算機在各個行業的廣泛使用,基于計算機技術的IT系統在數 量和規模上都得到很大擴展,相應的管理工作也日益重要。特別是對于 現有的大規模復雜異構分布式IT系統而言,其運行狀況的監控和性能的 管理具有特殊的重要性。因此,為了確保IT系統的性能和可用性,保障 數據和其他信息資源的完整性,人們發展出"IT系統管理"這一技術領 域。
一個健壯的IT系統管理體系至少包括三個方面第一.系統監控、 系統配置和系統操作管理工具,用于實現對基本組件(如CPU、內存、硬 盤、文件系統、打印機和網絡等)運行情況的監控;對于交易系統、數據 庫、應用中間件和WEB服務等系統的監控;對于軟硬件系統的資源登記 和軟件升級分發;對于作業排序和應用程序作業調度等。第二.事件根源 追蹤、關聯規則和自動化處理機制,用于整體地分析和鑒別形成/導致某 個事件的各種原因,確立問題的根源并進行相應的處置,如告警或啟動 某個引擎程序等。第三.業務影響分析管理機制,用于保障業務系統的服 務水平,并且將業務系統的性能映射到各個可能的影響因素上,幫助用 戶及時發現性能的變化并識別導致變化的原因。
在IT系統管理體系中,告警環節發揮著重要的作用。告警環節需要 達到的要求是在獲取到某一監控數據后,查找針對此數據的告警配制, 如果數據符合某種告警條件,則做出符合要求的記錄、報警或干預等動 作。在現有技術中,往往是直接在程序編寫中加入告警的條件判斷和動 作執行的語句,因此存在擴展性不強等缺陷。
在申請號為200510131864.8的中國發明專利申請中,公開了 一種對 網絡告警信息的處理方法,其中執行以下步驟網管系統采集GSM網絡資源數據,建立一個數據管理平臺系統網管從資源類和資源關系兩個 維度來抽象和描述GSM網絡資源的內部屬性,通過描述GSM網絡資源 相互之間的關聯關系,建立資源模型,根據資源模型中對象之間的關系, 為資源數據管理平臺系統中的數據建立資源對象庫;網管系統采集和分 析多個原始告警事件,并將多個原始告警事件進行統一歸類整理,形成 歸整告警信息;網管系統根據告警相關性分析規則及資源模型,對相關 聯的歸整告警信息進行歸并,產生結果告警信息。該技術方案的缺陷在 于針對特定的平臺一網絡,因此通用性不強。
另外,在申請號為200710123385.0的中國發明專利申請中,公開了 一種實現告警位置條件選擇的方法,首先確定各告警分類及告警分類的 告警位置信息的組織形式,設置運行時告警分類集,然后對告警分類進 行差別化,生成告警分類關系描述文件,并對告警分類關系進行加載, 實現告警位置條件選擇處理。該技術方案的優點在于對告警位置信息的 組成進行公共性/可變性的分析后,抽取出告警位置信息的公共概念(包括 拓撲標識、拓撲位移以及特定位置信息的統一形式),并且根據這樣一種 統一形式統一地刻畫出告警位置信息的組織方式。通過告警分類差別化 將告警分類之間的差別局部化和自治化,并在此基礎上提供了告警査詢 和告警統計中告警位置條件選擇的統一方法。但是,該技術方案關注的 是告警位置條件選擇的方法,是從對告警分類的角度,研究告警分類和 告警位置的關系,得到選擇告警位置的方法,因此適用范圍也受到一定 限制。
發明內容
本發明的首要目的是提供一種面向IT系統管理的告警信息配制系 統。該告警信息配制系統針對IT系統管理中的告警環節提出,可以通過 對監控數據、告警條件、告警動作的靈活配制,實現對告警條件的全面 和完備的描述,從而確保了告警動作的可擴展性。
本發明的另外一個目的是提供上述告警信息配制系統配制告警信息 的具體方法。
為實現上述的發明目的,本發明采用下述的技術方案 一種告警信息配制系統,包括告警管理單元和告警配制庫,其特征 在于-
所述告警管理單元包括配制記錄管理及告警模塊、條件管理模塊、動作管理模塊和動作類型管理模塊,所述告警配制庫包括配制記錄庫、條件庫、動作庫和動作類型庫;其中,
所述配制記錄管理及告警模塊分別連接所述配制記錄庫、條件庫和動作庫,所述條件管理模塊與所述條件庫相連接,所述動作管理模塊連接所述動作庫,所述動作類型管理模塊連接所述動作類型庫。
其中,所述配制記錄管理及告警模塊分別與外部的用戶界面和輪詢監控單元相連接。
所述配制記錄庫、條件庫、動作庫和動作類型庫之間通過標識符實現相互引用。
一種告警信息配制方法,基于上述的告警信息配制系統實現,其特征在于
(1) 利用條件描述符組成的條件表達式對告警條件進行描述;
(2) 配制記錄管理及告警模塊在輪詢監控單元控制下定期獲取針對告警監控對象的監控數據;
(3) 所述配制記錄管理及告警模塊査找該監控數據涉及的配制記錄,判斷是否符合所述告警條件;
(4) 如果符合所述告警條件則執行告警動作,否則繼續獲取所述監控數據。
其中,所述條件描述符至少包括如下內容〉大于;《小于;等于;!=:不等于;〉=:大于或等于;<=:小于或等于;
!:否,用于一個條件表達式之前,表示要求不達到此條件;&:且,用于連接兩個條件表達式,表示要求兩個條件同時達到;i-或,用于連接兩個條件表達式,表示要求兩個條件至少一個達到;():確定表達中&和l運算的優先級別。
所述配制記錄包含所述監控數據、告警條件信息和告警動作信息,所述告警條件信息為條件庫中記錄的標識符,所述告警動作信息為動作庫中記錄的標識符。
6所述告警動作包括用戶自行擴展的動作;用戶需要自行擴展動作時,首先定義動作類型并在動作類型庫中注冊,然后在動作類型庫中選擇這個動作類型,并設定參數得到一個擴展的動作,所述擴展的動作存入動作庫中。
所述動作類型通過面向對象語言的類予以實現。
在執行所述告警動作時,首先在動作庫中査詢是否有合適的動作,如果有則直接選用,如果沒有則在條件庫中通過選取動作類型并編寫動作參數的方式添加一個動作后再選用。
獲取所述監控數據后,在配制記錄庫中查找所述監控數據涉及的配制記錄,然后對于所述配制記錄中包含的告警條件信息和告警動作信息,分別在條件庫和動作庫中査詢出條件和動作,在符合所述告警條件的情況下根據動作包含的動作類型和動作參數進行行動。
本發明所提供的告警信息配制系統及其配制方法具有如下的特點-
1. 告警功能完備對告警條件和告警動作的表達提供了完備的方案,提供的條件表達式可以表達復雜的告警條件,告警類型和告警參數也使告警行動能夠靈活設置和方便擴展,可以適用多種需要告警的平臺;
2. 具有合理的結構本發明通過四個庫對告警配制記錄所涉及的條
件信息和動作信息進行存儲,不同庫之間是引用標識符的關系。對于不同的監控數據,可以共用某個條件,避免重復編寫有關參數的麻煩;
3. 支持多人角色式的管理不同的管理角色可以分別關注告警涉及的條件、動作類型、動作等信息,具體配制記錄的管理人員只需要在比較完善的條件庫、動作庫中選取和切換即可。
下面結合附圖和具體實施方式
對本發明作進一步的說明。圖1為一個進行IT系統運行性能監控及告警的原型系統的整體框架示意圖2為本發明所提供的告警信息配制系統的組成框架示意圖。
具體實施例方式
在對本發明所提供的告警信息配制系統進行詳細說明之前,首先解釋一下本發明中用到的一些概念。
條件判斷是否需要告警的一個定義,根據獲得的監控數據和條件,可以計算是否需要告警。
7條件描述符為了表達復雜的條件而定義的一套符號,包括進行大小判斷的符號和進行邏輯計算的符號等。
動作類型需要告警時,可供選擇的方案,例如輸出錯誤信息到控制臺。
動作參數動作類型可以接受的配制信息,例如如果動作類型是輸出錯誤信息到控制臺,動作參數就可以是輸出的格式。
動作選定動作類型并按要求設定了參數得到的具體可以實施的行動。
配制記錄包含了監控數據、告警條件和告警動作的信息。獲得監控數據后,可以査找該監控數據涉及的配制記錄,判斷是否符合條件,如果符合條件,則執行動作。
圖1顯示了一個進行IT系統運行性能監控及告警的原型系統。該原型系統包括告警信息配制系統和監控任務管理系統兩部分。其中,告警信息配制系統包括告警管理單元和告警配制庫兩部分,告警管理單元和告警配制庫相互連接。監控任務管理系統包括監控任務管理單元和監控任務庫兩部分,這兩部分也相互連接。告警管理單元和監控任務管理單元分別連接用戶界面,以便向用戶提供告警信息。監控任務庫連接輪詢監控單元,輪詢監控單元連接告警管理單元。這樣,監控任務管理系統中的監控任務通過輪詢監控單元傳送給告警管理單元,以便讓告警管理單元完成預定的告警任務。另外,輪詢監控單元也定時從監控對象處獲取信息,以使告警管理單元及時獲取監控對象的情況,準確及時地發出告警信息。
圖2顯示了本發明所提供的告警信息配制系統的基本組成框架。前已述及,該告警信息配制系統包括告警管理單元和告警配制庫兩部分。其中,告警管理單元包括配制記錄管理及告警模塊、條件管理模塊、動作管理模塊和動作類型管理模塊,而告警配制庫包括配制記錄庫、條件庫、動作庫和動作類型庫。配制記錄管理及告警模塊一方面連接外部的用戶界面和輪詢監控單元,另一方面分別連接告警配制庫中的配制記錄庫、條件庫和動作庫。條件管理模塊一方面連接用戶界面,另一方面與條件庫相連接。動作管理模塊分別連接用戶界面和動作庫,動作類型管理模塊也分別連接用戶界面和動作類型庫。
在上述的告警配制庫中,四個庫之間通過標識符實現相互引用,以便讓不同的監控數據可以共用某個條件或者某個動作。這種設計方式的好處在于對于條件或動作相同的配制記錄而言,不必重復編寫條件表達式或動作參數,如果條件或動作需要調整也不必對配制記錄逐個修改,只需要在條件庫中修改條件的表達式或在動作庫中修改動作的類型或參數即可。
本發明所提供的告警信息配制系統及其配制方法可以提供一種有效的告警配制機制。利用該機制,使用者可以靈活配置監控數據、告警條件、告警動作,從而確保實現了告警動作的可擴展性。下面對此展開詳細的說明。
1.條件管理
條件管理主要通過條件管理模塊實現,其作用在于表達、存儲和維護各種告警所涉及的條件,其中存儲和維護告警條件時需要對條件進行唯一的標識,然后借助關系型數據庫的支持實現條件的添加、修改、刪除和査詢操作。
對于各種條件的表達,現有的技術方案多采用設置某一監控數據超過和低于某一閥值,這種情況下條件只需要一個比較符和一個數值就可以表達。但是在實際情況中往往還有更加復雜的告警條件,為此,本發明考慮了更復雜一些的情況,定義了下面這些條件描述符來表達這些復雜的條件。
>:大于
〈小于
=:等于
!=:不等于
> =:大于或等于
<=:小于或等于
!:否,用于一個條件表達式之前,表示要求不達到此條件&:且,用于連接兩個條件表達式,表示要求兩個條件同時達到I:或,用于連接兩個條件表達式,表示要求兩個條件至少一個達到():確定表達中&和l運算的優先級別例如下面這個例子v!:15 & (v〉二12 i v〈3)
表示v大于或等于12,或v小于3,但v不等于15
9利用上述的條件描述符可以提供一種具有良好可擴展性的條件表達 式機制。該機制并不包含對告警條件的全面和完備的描述,但通過有關 條件描述符的有效組合,基本上能夠表達任何的復雜告警條件。通過對 條件表達式進行解析,可以判斷出使用者描述的條件是否已經達到。因 此,在面對復雜的告警條件的情況下,使用者完全可以利用該機制來滿 足描述各種情況下的復雜條件的需要。
2. 動作類型管理
前面已經提到,動作類型指的是需要告警時可供選擇的方案,例如 輸出錯誤信息到控制臺、日志記錄、郵件通知或手機短信通知等等。動 作類型在結構上分成兩塊 一是參數載入部分,二是動作執行部分。參 數載入部分要求給用戶提供編寫參數的說明,以使得用戶可以根據自己 的需要并按照規范編寫參數。動作執行的效果根據參數的不同而不同。
在具體實施本發明時,動作類型是通過面向對象語言的類實現的。 這些類都繼承于上層接口,包含載入參數的方法,例如config(String arg); 包含動作執行的部分,例如 execute (ActionContext actionContext)。
用戶只需要提供參數的載入部分和動作執行部分,就可以自己定義 相關的動作類型。對于自己定義的動作類型,要把實現的代碼部署在合 適的位置,進行唯一的標識并在動作類型庫中注冊,借助關系型數據庫 的支持可以實現動作類型的添加、修改、刪除和查詢操作。
3. 動作管理
動作管理所針對的動作是動作類型和動作參數構成的成對記錄。用 戶在一個需要具體的告警動作的場合,需要在動作類型庫中選取合適的 記錄,再提供參數信息得到動作類型和動作參數的成對記錄,通過動作 管理模塊把這一成對記錄進行唯一標識后存儲在動作庫中,借助關系型 數據庫的支持可以實現動作的添加、修改、刪除和查詢操作。
上述的動作類型管理模塊和動作管理模塊相互配合,可以讓用戶按 照需求對發生告警的動作進行擴展。具體的擴展過程是這樣的用戶首 先自己定義動作類型并在動作類型庫中注冊,然后在動作類型庫中選擇 這個動作類型,并設定參數得到一個動作。用戶所提供的擴展動作也存 入動作庫中,和已有的動作一樣進行管理,這樣就實現了動作的可擴展性。
104.配制記錄管理及告警
在配制記錄中包含了監控數據、告警條件和告警動作的信息,是監 控程序運行過程中實現按條件和要求進行告警行為的依據。在本發明中, 告警條件和告警動作的信息并不是條件表達式本身及動作類型和動作參 數本身,而分別是條件庫中記錄的標識符和動作庫中記錄的標識符。利 用標識符可以在相應的條件庫和動作庫中査詢有關信息的完整內容。
由于告警條件和告警動作單獨維護,配置記錄只是引用這些單獨維 護的信息實現了監控數據、告警條件、告警動作的靈活配制。因此可以 讓使用者分出專門負責維護告警條件的角色,專門維護告警動作的角色, 專門給監控數據指定條件和動作的角色。其中專門給監控數據指定條件 和動作的角色的工作內容就是在已經有的告警條件和告警動作中做選 擇,并可以方便地進行切換。
上述單獨維護的設計方式可以實現告警條件的靈活配置。對于某個 告警條件,用條件表達式表達完畢之后,可以被使用到多個配置記錄中。 如果要調整條件,在條件庫中修改就可以了。配置記錄只是引用條件庫 中記錄的標識符,因此會按照修改后的條件表達式運行。這一性質在一 個條件具有潛在的改動的需求并需要被多個配置記錄引用的情況下十分 有用,只需要做一處修改,多處的改動都得到體現。
對于告警動作也是類似,可以被使用到多個配置記錄中。如果要調 整告警動作,在動作庫中修改就可以了。同樣可以做到一處修改,多處 得到體現。
配制記錄管理及告警模塊在輪詢監控單元控制下定期獲取針對告警 監控對象的監控數據。在獲得監控數據后,可以查找該監控數據涉及的 配制記錄,判斷是否符合告警條件。如果符合告警條件,則執行告警動 作。
對于某一監控數據,如果有某一條件需要告警,則在條件庫里査詢 是否有這個條件,如果有則直接選用,如果沒有則在條件庫中添加這個 條件后再選用。對于配制所采取的動作,則在動作庫中查詢是否有合適 的動作,如果有則直接選用,如果沒有則在條件庫中添加這個動作(選 取動作類型并編寫動作參數)后再選用。需要注意的是添加動作只能 是在動作類型庫中現有的類型中選取,如果需要擴展,則需要像前述動 作類型管理中說明的那樣實現新的動作類型并部署和注冊。對于監控數據,每次獲取后都要在配制記錄庫中査詢該數據涉及的 配制記錄,對于有多個配制記錄的數據說明它有多個要報警的時機,要 按照順序判斷一遍。對于一條配制記錄,它包含條件的標識符和動作的 標識符,分別在條件庫和動作庫中查詢出條件和動作,解析條件表達式 判斷條件是否達到。如果條件達到,根據動作包含的動作類型和動作參 數進行行動。
本發明所提供的告警信息配制系統及其配制方法是實現IT系統管理 中告警功能的基礎。該系統及其方法的實現思路同樣可以應用于下面這 些場合日歷行程管理工具、操作系統中的計劃任務模塊、通知提醒工 具等等。相關的移植工作都是計算機領域一般技術人員能夠勝任的常規 操作,在此就不詳細贅述了。
以上對本發明所述的告警信息配制系統及其配制方法進行了詳細的 說明。對本領域的一般技術人員而言,在不背離本發明實質精神的前提 下對它所做的任何顯而易見的改動,都將構成對本發明專利權的侵犯, 將承擔相應的法律責任。
權利要求
1.一種告警信息配制系統,包括告警管理單元和告警配制庫,其特征在于所述告警管理單元包括配制記錄管理及告警模塊、條件管理模塊、動作管理模塊和動作類型管理模塊,所述告警配制庫包括配制記錄庫、條件庫、動作庫和動作類型庫;其中,所述配制記錄管理及告警模塊分別連接所述配制記錄庫、條件庫和動作庫,所述條件管理模塊與所述條件庫相連接,所述動作管理模塊連接所述動作庫,所述動作類型管理模塊連接所述動作類型庫。
2. 如權利要求1所述的告警信息配制系統,其特征在于 所述配制記錄管理及告警模塊分別與外部的用戶界面和輪詢監控單元相連接。
3. 如權利要求1所述的告警信息配制系統,其特征在于 所述配制記錄庫、條件庫、動作庫和動作類型庫之間通過標識符實現相互引用。
4. 一種告警信息配制方法,基于如權利要求1所述的告警信息配制 系統實現,其特征在于-(1) 利用條件描述符組成的條件表達式對告警條件進行描述;(2) 配制記錄管理及告警模塊在輪詢監控單元控制下定期獲取針對 告警監控對象的監控數據;(3) 所述配制記錄管理及告警模塊查找該監控數據涉及的配制記錄, 判斷是否符合所述告警條件;(4) 如果符合所述告警條件則執行告警動作,否則繼續獲取所述監控 數據。
5. 如權利要求4所述的告警信息配制方法,其特征在于 所述條件描述符至少包括如下內容>:大于; 〈小于; 等于; !二不等于;> =:大于或等于; < =:小于或等于;!:否,用于一個條件表達式之前,表示要求不達到此條件; &:且,用于連接兩個條件表達式,表示要求兩個條件同時達到; I:或,用于連接兩個條件表達式,表示要求兩個條件至少一個達到; ():確定表達中&和l運算的優先級別。
6. 如權利要求4所述的告警信息配制方法,其特征在于 所述配制記錄包含所述監控數據、告警條件信息和告警動作信息,所述告警條件信息為條件庫中記錄的標識符,所述告警動作信息為動作 庫中記錄的標識符。
7. 如權利要求4所述的告警信息配制方法,其特征在于 所述告警動作包括用戶自行擴展的動作;用戶需要自行擴展動作時,首先定義動作類型并在動作類型庫中注冊,然后在動作類型庫中選擇這 個動作類型,并設定參數得到一個擴展的動作,所述擴展的動作存入動 作庫中。
8. 如權利要求7所述的告警信息配制方法,其特征在于 所述動作類型通過面向對象語言的類予以實現。
9. 如權利要求4所述的告警信息配制方法,其特征在于-在執行所述告警動作時,首先在動作庫中査詢是否有合適的動作,如果有則直接選用,如果沒有則在條件庫中通過選取動作類型并編寫動 作參數的方式添加一個動作后再選用。
10. 如權利要求4所述的告警信息配制方法,其特征在于 獲取所述監控數據后,在配制記錄庫中査找所述監控數據涉及的配制記錄,然后對于所述配制記錄中包含的告警條件信息和告警動作信息, 分別在條件庫和動作庫中查詢出條件和動作,在符合所述告警條件的情 況下根據動作包含的動作類型和動作參數進行行動。
全文摘要
本發明公開了一種告警信息配制系統及其配制方法。該告警信息配制系統包括告警管理單元和告警配制庫,其中告警管理單元包括配制記錄管理及告警模塊、條件管理模塊、動作管理模塊和動作類型管理模塊,告警配制庫包括配制記錄庫、條件庫、動作庫和動作類型庫;配制記錄管理及告警模塊分別連接配制記錄庫、條件庫和動作庫,條件管理模塊與條件庫相連接,動作管理模塊連接動作庫,動作類型管理模塊連接動作類型庫。本發明提供一種有效的告警配制機制。利用該機制,使用者可以靈活配置監控數據、告警條件、告警動作,從而確保實現了告警動作的可擴展性。
文檔編號H04L12/24GK101515864SQ20081010418
公開日2009年8月26日 申請日期2008年4月16日 優先權日2008年4月16日
發明者蔣洪迅, 斌 郭 申請人:蔣洪迅