專利名稱:告警系統和告警方法
技術領域:
本發明涉及一種告警系統和告警方法,尤其是一種可以實現同步告警的告警系統和告警方法。
背景技術:
在電信設備管理領域,對于告警的監控,設備和網絡管理系統(NetworkManager System,NMS)之間普遍采用了簡單網絡管理協議(Simple NetworkManagement Protocol,SNMP)和基于字符的命令行接口(Command LineInterface,CLI)。
在采用SNMP協議的管理系統中,當告警設備發生故障時,設備采用SNMPTrap方式通過告警上報通道上報告警到NMS。NMS對收到的告警進行過濾、相關性分析等處理后,保存到告警庫中。即該告警上報通道工作方式為異步有故障發生時,告警設備主動向NMS上報告警。
NMS對告警設備的管理請求通過“配置通道”完成,配置通道的工作方式是“請求/響應”式。NMS下發管理請求(SNMP的GET或SET等操作),告警設備完成相應的功能并返回響應給NMS。即該配置通道工作方式為同步方式NMS下發管理命令,告警設備返回相應的響應。其中Get和Set為SNMP協議標準操作,Get用于獲取指定OID(Object Identifier對象標識符)對應的管理變量的值;Set為設置指定OID對應的管理變量的值。
在采用CLI接口的管理系統中,當告警設備發生故障時,告警設備的告警通過“告警上報通道”上報告警。告警上報格式基于字符串方式,具體格式由告警設備和NMS約定。即該告警上報通道的工作方式為異步方式有故障發生時,告警設備主動上報告警。
NMS對告警設備的管理請求通過“配置通道”完成。NMS通過該配置通道向告警設備下發管理請求命令,告警設備完成相應的功能并返回響應給NMS。即該配置通道工作方式為同步方式NMS下發管理命令,告警設備返回相應的響應。
在上述兩種告警系統和告警方法中,通過NMS上的告警監控臺對設備進行告警監控和故障管理。NMS告警監控臺上展示的告警設備未恢復告警是否與告警設備故障的真實情況一致,對設備維護來說,有重要意義。如果NMS上顯示的未恢復告警比告警設備真實故障情況少,就不能及時處理設備故障;反之,則會浪費時間成本處理一些已經恢復的故障。NMS和告警設備之間的網絡可能是跨地域的廣域網,使得NMS和告警設備兩者之間告警信息的同步變得更加困難了。因此,需要一個完備的告警同步系統和方法,保證NMS上的告警信息與告警設備真實故障情況一致。
現有的告警系統和告警方法是采用告警緩存機制,來解決NMS和告警設備上的告警同步問題。
當告警設備檢測到NMS接收告警異常時(可能原因有網絡斷連,NMS故障等),緩存告警信息。當告警設備檢測到NMS可以正常接收告警時,通過告警上報通道把緩存的告警信息上報給NMS。
對于采用SNMP協議的管理系統,上述方法存在以下問題。SNMP協議基于的傳輸層協議為UDP,而UDP提供的是不可靠的傳輸服務,因此NMS是否成功接收到告警設備上報的告警Trap,UDP層不提供保證,這樣可能存在告警報文丟失情況。另外,UDP層也不提供機制檢查目的端是否還正常。如果要解決這些問題,則需要告警設備和NMS額外增加機制檢查,增加了管理系統的成本。
對基于SNMP協議和CLI接口的管理系統,上述方法存在以下共同問題。當告警設備向多個NMS系統上報告警時,告警設備需要為每個NMS系統進行告警緩存處理,增加了管理系統開發復雜性。當NMS崩潰或升級時,可能導致NMS丟失設備告警信息。通過設備告警緩存機制,NMS無法恢復丟失的告警信息。
發明內容
本發明的目的是針對上述現有的告警系統和告警方法的缺陷,提供一種可靠的告警系統和告警方法,可以實現告警的同步,而且使得NMS上的告警設備未恢復的告警與告警設備的故障真實一致。
為實現上述目的,本發明提供了一種告警系統,包括告警設備,用于上報告警列表;網絡管理系統,與所述告警設備相連接,用于接收告警設備上報的告警列表,并根據該告警列表進行處理,該網絡管理系統包括告警處理模塊,與所述告警設備相連接,用于根據告警設備發送的告警列表進行處理,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做操作。
所述網絡管理系統還包括協議適配器,分別與所述告警處理模塊和所述告警設備相連接,用于對告警設備和網絡管理系統之間不同協議的適配,將告警設備上報的告警列表解析為相同格式。所述協議適配器為簡單網絡管理協議協議適配器或者命令行接口協議適配器;所述告警設備為簡單網絡管理協議告警設備或者命令行接口告警設備。
本發明還提供了一種告警方法,包括以下步驟步驟1,當網絡管理系統與告警設備連接成功后,網絡管理系統的告警處理模塊向告警設備模塊下發同步告警操作,告警設備上報未恢復告警列表;步驟2,告警處理模塊接收告警列表,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做操作。
上述技術方案中的步驟1具體為步驟11,當網絡管理系統與告警設備連接成功后,網絡管理系統的告警處理模塊向協議適配器下發同步告警操作;步驟12,協議適配器從告警設備獲得告警設備未恢復告警列表;步驟13,協議適配器將告警列表解析為相同格式,并設置同步告警標志,然后將解析后的告警列表返回給告警處理模塊。
其中的步驟12可以具體為簡單網絡管理協議協議適配器通過Get或者Getnext操作,獲得簡單網絡管理協議告警設備上的未恢復告警列表。也可以具體為命令行接口協議適配器通過配置通道向命令行接口告警設備下發告警同步命令,命令行接口告警設備返回命令行接口告警設備上的未恢復告警列表。
因此,本發明的告警系統和告警方法實現了告警的同步,而且使得NMS上的告警設備未恢復的告警與告警設備的故障真實一致。對于基于SNMP的管理系統,告警設備無需檢測NMS是否可以正常接收告警;告警同步機制與告警設備連接多少個NMS無關;當NMS由于某種原因丟失設備告警信息時,也可以獲取設備當前所有告警。
下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。
圖1為本發明告警系統的結構示意圖;圖2為本發明告警方法的流程圖。
具體實施例方式
本發明是通過改造設備網管Agent,維護一張未恢復的告警列表。當有新告警產生,把新告警增加到告警列表中。當有告警恢復時,把該告警從未恢復告警列表中刪除。
如圖1所示,為本發明告警系統的結構示意圖,包括SNMP告警設備21和CLI告警設備22,均用于上報告警列表,還包括網絡管理系統(NetworkManager System,NMS)1,用于接收告警設備上報的告警列表,并根據該告警列表進行處理。該網絡管理系統1包括與SNMP告警設備21相連接的SNMP協議適配器121,與CLI告警設備22相連接的CLI協議適配器122,兩個協議適配器121、121均用于對告警設備21、22和網絡管理系統1之間不同協議的適配,將告警設備21、22上報的告警列表解析為相同格式。對于提供SNMP協議的SNMP告警設備21,增加“未恢復告警”管理信息庫(ManagementInformation Base,MIB)表,以便NMS可以查詢未恢復告警,具體MIB定義如表1所示,支持SNMP的Get/GetNext操作,與告警Trap定義的告警內容一致。
表1,具體MIB定義對于提供CLI接口的CLI告警設備22,增加“查詢未恢復告警”命令接口。
命令描述lst alarmnetid=[,sd=,ed=];
輸入和輸出參數如表2和表3所示
表2,輸入參數
表3,輸出參數再如圖1所示,網絡管理系統1還包括告警處理模塊11,與SNMP協議適配器121和CLI協議適配器122相連接,用于根據從協議適配器131、122接發送的告警列表進行處理,對于告警設備21、22有而網絡管理系統1上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備21、22上沒有而網絡管理系統1上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備21、22和網絡管理系統1都有的告警,對該告警不做操作。
圖中虛線表示同步告警上報流,點劃線表示告警同步命令下發流。告警設備21、22和NMS1之間增加“告警同步命令”接口。
如圖2所示,為本發明告警方法的流程圖,具體步驟如下步驟101,當NMS與告警設備連接成功后(也可用戶手工或定時觸發告警同步操作),NMS的告警處理模塊向協議適配器下發同步告警操作;步驟102,協議適配器從告警設備獲得告警設備未恢復告警列表;對于SNMP協議適配器,SNMP協議適配器通過Get或者Getnext操作,獲得SNMP告警設備上的未恢復告警列表,再如表1所示,對于提供SNMP協議的SNMP告警設備,增加MIB表;對于CLI協議適配器,CLI協議適配器通過配置通道向CLI告警設備下發告警同步命令,CLI告警設備返回CLI告警設備上的未恢復告警列表,對于提供CLI接口的CLI告警設備22,增加“查詢未恢復告警”命令接口,其命令及輸入和輸出的參數如表2和表3所示;其中Get和GetNext操作為SNMP協議標準操作,Get用于獲取指定OID(ObjectIdentifier對象標識符)對應的管理變量的值;Getnext用于獲取指定OID的下一個管理變量的值;步驟103,協議適配器將告警列表解析為相同格式,并設置同步告警標志,然后將解析后的告警列表返回給告警處理模塊;步驟104,告警處理模塊接收解析后的告警列表,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做任何操作。
對于NMS來說,同步的告警與正常上報的告警處理方式不一樣,需要區分。本發明是通過不同的上報通道來區分的,具體描述如下對于SNMP告警設備,正常的告警上報是以Trap方式完成的;同步告警通過配置通道獲取。
對于CLI告警設備,正常的告警上報是通過專有的告警通道完成的;同步告警通過配置通道獲取。
并且本發明也可以使用現有的方法告警設備檢測到NMS不能正常接收告警時,緩存告警信息;當檢測到NMS正常時,通過告警上報通道向NMS上報緩存的告警信息。
因此本發明的告警設備上的網管Agent不需要檢測NMS是否可以正常接收告警,因此不需要增加因為檢測對端是否正常會增加設備Agent的開發成本,并且告警同步機制與告警設備連接多少個NMS無關,當NMS由于某種原因丟失告警設備告警信息時,也可以通過這種方法獲取設備當前所有未恢復告警。
最后所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,盡管參照較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或者等同替換,而不脫離本發明技術方案的精神和范圍。
權利要求
1.一種告警系統,其特征在于包括告警設備,用于上報告警列表;網絡管理系統,與所述告警設備相連接,用于接收告警設備上報的告警列表,并根據該告警列表進行處理,該網絡管理系統包括告警處理模塊,與所述告警設備相連接,用于根據告警設備發送的告警列表進行處理,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做操作。
2.根據權利要求1所述的告警系統,其特征在于所述網絡管理系統還包括協議適配器,分別與所述告警處理模塊和所述告警設備相連接,用于對告警設備和網絡管理系統之間不同協議的適配,將告警設備上報的告警列表解析為相同格式。
3.根據權利要求2所述的告警系統,其特征在于所述協議適配器為簡單網絡管理協議協議適配器或者命令行接口協議適配器。
4.根據權利要求3所述的告警系統,其特征在于所述告警設備為簡單網絡管理協議告警設備或者命令行接口告警設備。
5.一種告警方法,其特征在于包括以下步驟步驟1,當網絡管理系統與告警設備連接成功后,網絡管理系統的告警處理模塊向告警設備模塊下發同步告警操作,告警設備上報未恢復告警列表;步驟2,告警處理模塊接收告警列表,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做操作。
6.根據權利要求5所述的告警方法,其特征在于所述步驟1具體為步驟11,當網絡管理系統與告警設備連接成功后,網絡管理系統的告警處理模塊向協議適配器下發同步告警操作;步驟12,協議適配器從告警設備獲得告警設備未恢復告警列表;步驟13,協議適配器將告警列表解析為相同格式,并設置同步告警標志,然后將解析后的告警列表返回給告警處理模塊。
7.根據權利要求6所述的告警方法,其特征在于所述步驟12具體為簡單網絡管理協議協議適配器通過Get或者Getnext操作,獲得簡單網絡管理協議告警設備上的未恢復告警列表。
8.根據權利要求6所述的告警方法,其特征在于所述步驟12具體為命令行接口協議適配器通過配置通道向命令行接口告警設備下發告警同步命令,命令行接口告警設備返回命令行接口告警設備上的未恢復告警列表。
全文摘要
本發明涉及一種告警系統,包括互相連接的網絡管理系統和告警設備,該網絡管理系統包括告警處理模塊,與告警設備相連接,用于對告警的處理。本發明還涉及一種告警方法,包括當網絡管理系統與告警設備連接成功后,網絡管理系統的告警處理模塊向告警設備模塊下發同步告警操作,告警設備上報未恢復告警列表;告警處理模塊接收告警列表,對于告警設備有而網絡管理系統上沒有的告警,則增加到網絡管理系統側的未恢復告警列表中;對于告警設備上沒有而網絡管理系統上有的告警,對網絡管理系統側的該告警進行恢復操作;對于告警設備和網絡管理系統都有的告警,對該告警不做操作。因此本發明實現了告警的同步,使得未恢復告警與告警設備的故障真實一致。
文檔編號H04L29/06GK1925427SQ20061012865
公開日2007年3月7日 申請日期2006年9月4日 優先權日2006年9月4日
發明者李高峰 申請人:華為技術有限公司