一種獲取移動網絡故障定位和故障預警的方法
【技術領域】
[0001] 本發明涉及網絡通信領域,具體地說是一種實用性強、獲取移動網絡故障定位和 故障預警的方法。
【背景技術】
[0002] 在移動通信中,交換設備眾多、指標復雜,每天的數據日以萬記的積累,若采用傳 統的監控方式,就會非常被動,出現的問題往往不能及時發現,只有設備出現故障報了告警 才能知道,即使發現了又不能迅速獲知問題根源,更別提對未來數據的預測了,或者只有通 過維護人員定期檢查設備或者網絡才能發現,使得網管系統的運營維護工作非常繁重。
[0003] 實際上,有時候多種故障可能是同一個故障引起的,如果不能進行解決,還可以引 起其他的故障,這就需要根據網絡設備的運行數據,盡可能的分析出各告警之間的潛在聯 系,快速進行故障定位和故障預警,這樣才能減輕維護人員的工作,并能做到防患于未然, 為預警、優化、規劃工作提供有力支撐。基于此,現提供一種獲取移動網絡故障定位和故障 預警的方法。
【發明內容】
[0004] 本發明的技術任務是針對以上不足之處,提供一種實用性強、獲取移動網絡故障 定位和故障預警的方法。
[0005] -種獲取移動網絡故障定位和故障預警的方法,其具體實現過程為: 在網管系統中將相關的告警進行分析,找出其中的潛在關系,將所有的關系拆分成可 以配置的數據,維護這些數據相關的配置表; 獲取每一個標題的告警數據相應的資源或者故障信息; 將當前告警和其他已經獲取相關信息的告警進行關聯比較,然后將告警進行關聯分 析,獲取告警產生的原因; 根據不同的告警進行故障判斷,將判斷過程和結論根據配置好的數據進行派單和短信 發送,使相關人員能快速定位問題,預測隱患。
[0006] 所述拆分數據相關的配置表包括規則表、衍生關系表、主次關系表、告警定位表、 關聯表、結論表、派單規則表、短信設置表,在一個完整的規則里面,主次和衍生關系表只能 用到一個,衍生是根據當前現有的告警在生成一條新的告警;主次是一條告警是主告警,另 一條是次告警,都是采集上來的告警,進行關聯就是增加它們之間的關系。
[0007] 所述配置表中,各規則表的具體內容為: 規則表,包括規則名字、規則類型清除方式、衍生時的衍生門限、以及廠家、設備類型、 關聯資源說明、是否啟用信息,所述規則類型清楚方式中的規則類型是指主次或衍生; 衍生關系表,配置衍生告警標題和次告警標題的衍生規則關系,哪些類型的次告警,限 時內發生η條時則衍生一條新的告警; 主次關系表,是指哪些主告警標題和哪些次告警標題可以進行關聯的關系表,限時內 進行關聯;主次關聯有優先級,當優先級高的存在時,則優先級低的不處理,相對應的結論 表針對不同的優先級,也有不同的故障結論; 告警定位表,根據梳理好的規則,查找到告警相關的信息,其中包括機房、電路、局站、 歸屬的告警相關信息是告警之間關聯的依據; 定位關系表,在定位函數中,將需要關聯的字段寫到定位結果表中的相關字段中 RELATION_LOCATION和SYNTHE_RELATED_ACT_ALARM,兩個表中的數據是一樣的,字段名字 不同,關聯關系表中將字段之間的關系標注,把多條具有相關關系的告警關聯到一起,當衍 生超過一定數量時衍生出一條告警,當主次關聯時則掛接到一起; 結論表,根據告警相關信息,分析告警產生的可能原因,記錄下判斷過程,以及判斷結 論; 派單規則表和短信配置表,將故障結論和故障判斷過程等信息進行工單派發和短信通 知給設備相關人員。
[0008] 所述告警的具體預警過程為: 當活動告警發出后,首先進行標準化入庫,然后再判斷是否需要進行告警定位; 如果不需要到此結束,如果需要,則進行告警定位并將定位結果入庫,然后再獲取此條 告警相關的關聯規則; 如果是衍生,則判斷是否符合衍生條件,不符合則去定位庫中查找其他符合此規則的 告警,再判斷是否符合衍生條件,如果不符合則結束,符合就衍生,判斷故障過程并獲得結 論,然后再判斷是否需要派單和短信,不符合就結束,符合就派單和短信通知; 如果是主次,判斷是否符合主次關聯規則,如果符合就關聯,判斷故障原因和故障結 論,然后判斷是否需要派單和短信通知,然后結束。
[0009] 還包括新規則加入的步驟,該新規則的具體增加過程為: 首先獲取活動告警,增加規則信息; 根據告警標題添加定位函數; 確定告警為主次告警還是衍生告警:當為主次告警時,增加主次告警標題的關聯規則; 當為衍生告警時,增加衍生標題和次告警的關聯規則; 增加定位關系表、結論表結論; 確定是否需要拍單或短信:需要時則設置短信或工單規則并結束;不需要時則直接結 束。
[0010] 本發明的一種獲取移動網絡故障定位和故障預警的方法,與現有技術相比,具有 以下優點: 本發明提出的一種獲取移動網絡故障定位和故障預警的方法,可以避免維護人員的大 工作量告警數據分析,降低了工作的復雜度,更好的優化網絡質量;可以自動實現告警故障 的快速定位,以及隱患預警,快速定位是指通過單個告警很難發現故障產生的原因,綜合有 關系的多條件就可以快速定位,減少了維護人員的工作量,提高了工作效率;隱患預警是指 可以通過此次告警,找出故障點,可以預防其他相關設備產生同樣的問題,例如有四個交換 機產生了掛接在了同一個CE上,產生了相關告警,這個CE上工掛接了六個交換機,那么就 可以預測其他的兩個交換機是不是也會有問題,這樣就可以進行故障預警,提高網絡質量; 自動化是指需要將相關的規則進行拆分,配置相關數據就可以自動根據需要進行判斷,遠 比維護人員去分析來得快,來得準確,還可以隨時添加新的規則來進行更多方面的預警,而 且可以節省開發時間,降低了開發的復雜度,提高了開發效率,實用性強,易于推廣。
【附圖說明】
[0011] 附圖1是本發明的實現流程圖。
[0012] 附圖2是本發明中增加新規則步驟的實現流程圖。
【具體實施方式】
[0013] 下面結合附圖和具體實施例對本發明作進一步說明。
[0014] 現結合某移動網絡運營維護的實踐經驗和現實需求,提供一種獲取移動網絡故障 定位和故障預警的方法, 如附圖1所示,其具體實現過程為: 在網管系統中將相關的告警進行分析,找出其中的潛在關系,將所有的關系拆分成可 以配置的數據,維護這些數據相關的配置表; 獲取每一個標題的告警數據相應的資源或者故障信息; 將當前告警和其他已經獲取相關信息的告警進行關聯比較,然后將告警進行關聯分 析,獲取告警產生的原因; 根據不同的告警進行故障判斷,將判斷過程和結論根據配置好的數據進行派單和短信 發送,使相關人員能快速定位問題,預測隱患。
[0015] 所述拆分數據相關的配置表包括規則表、衍生關系表、主次關系表、告警定位表、 關聯表、結論表、派單規則表、短信設置表,在一個完整的規則里面,主次和衍生關系表只能 用到一個,衍生是根據當前現有的告警在生成一條新的告警;主次是一條告警是主告警,另 一條是次告警,都是采集上來的告警,進行關聯就是增加它們之間的關系。
[0016] 所述配置表中,各規則表的具體內容為: 規則表,包括規則名字、規則類型清除方式、衍生時的衍生門限、以及廠家、設備類型、 關聯資源說明、是否啟用信息,所述規則類型清楚方式中的規則類型是指主次或衍生; 衍生關系表,配置衍生告警標題和次告警標題的衍生規則關系,哪些類型的次告警,限 時內發生η條時則衍生一條新的告警; 主次關系表,是指哪些主告警標題和哪些次告警標題可以進行關聯的關系表,限時內 進行關聯;主次關聯有優先級,當優先級高的存在時,則優先級低的不處理,相對應的結論 表針對不同的優先級,也有不同的故障結論; 告警定位表,根據梳理好的規則,查找到告警相關的信息,其中包括機房、電路、局站、 歸屬的告警相關信息是告警之間關聯的依據; 定位關系表,在定位函數中,將需要關聯的字段寫到定位結果表中的相關字段中 RELATI0N_L0CATI0N和SYNTHE_RELATED_ACT_ALARM,兩個表中的數據是一樣的,字段名字 不同,關聯關系表中將字段之間的關系標注,把多條具有相關關系的告警關聯到一起,當衍 生超過一定數量時衍生出一條告警,當主次關聯時則掛接到一起; 結論表,根據告警相關信息,分析告警產生的可能原因,記錄下判斷過程,以及判斷結 論; 派單規則表和短信配置表,將故障結論和故障判斷過程等信息進行工單派發和短信通 知給設備相關人員。
[0017] 所述告警的具體預警過程為: 當活動告警發出后,首先進行標準化入庫,然后再判斷是否需要進行告警定位; 如果不需要到此結束,如果需要,則進行告警定位并將定位結果入庫,然后再獲取此條 告警相關的關聯規則; 如果是衍生,則判斷是否符合衍生條件,不符合則去定位庫中查找其他符合此規則的 告警,再判斷是否符合衍生條件,如果不符合則結束,符合就衍生,判斷故障過程并獲得結 論,然后再判斷是否需要派單和短信,不符合就結束,符合就派單和短信通知; 如果是主次,判斷是否符合主次關聯規則,如果符合就關聯,判斷故障原因和故障結 論,然后判斷是否需要派單和短信通知,然后結束。
[0018] 還包括新規則加入的步驟,該新規則的具體增加過程為: 首先獲取活動告警,增加規則信息; 根據告警標題添加定位函數; 確定告警為主次告警還是衍生告警:當為主次告警時,增加主次告警標題的關聯規則; 當為衍生告警時,增加衍生標題和次告警的關聯規則; 增加定位關系表、結論表結論; 確定是否需要拍單或短信:需要時則設置短信或工單規則并結束;不需要時則直接結 束。
[0019] 衍生實例:監控平臺在同一時段(5分鐘之內)發現大于等于2個交換網元 (SERVER/MGW)出現告警(見下表),獲取這些設備的歸屬CE,如果這些交換網元連接在同一 CE上,則衍生出一條CE的IP承載網H. 248斷連的告警。
[0020] 配置數據: 關聯規則配置:
衍生規則配置:
定位函數配置:
告警定位結果表RELATION_LOCATION表內容:
關聯關系配置: 因為歸屬CE是多個,所以需要將CE拆分,關聯關系就不需要配置,程序中拆分獲取。 [0021] 故障結論表:
生成的告警相關信息: 告警[衍生預警]交換H. 248故障衍生CE設備預警。
[0022] 告警級別:一級告警。
[0023] 設備類型:CE。
[0024] 設備名稱:UN