專利名稱::移動通信網管系統中告警自定位和自處理的方法及系統的制作方法
技術領域:
:本發明涉及移動通信網中網管系統,尤其涉及移動通信網管監控系統中的告警自定位及自處理。技術背景運營支撐系統(OperationSupportSystem,縮寫成0SS)是移動運營管理的重要組成部分。OSS是移動運營商快速開通業務、及時保障業務、優化管理網絡資源的重要手段,是網絡運營管理不可分割的一部分。故障管理是OSS系統核心的管理領域。目前各移動運營商已經基本實現了主要網絡設備故障信息的集中化統一監控,圍繞故障的采集/發現、分析、展現、處理建立了較完善的故障管理系統。在目前的移動通信網管監控系統中,當有告警發生時,告警采集程序會將告警信息保存至數據庫,經過采集過濾、告警壓縮等處理之后的告警,在監控終端顯示出來,維護人員看到告警后,根據自己的告警處理經驗及文檔、設備資料等,對某些種類的告警進行處理,這種處理是通過向產生告警的設備發送若干條指令并分析執行結果、獲取設備狀態,根據設備的狀態定位故障根源或發送指令清除故障。這種手工的告警定位和處理方法是一種簡單的、重復的勞動,特別是在設備數量較多的網絡中,可能會有大量的告警信息產生,監控維護人員的工作量可想而知,而且故障處理的時間過長,有時得不到及時處理,從而影響網絡運營質量。整個監控工作的效率不高,缺點顯而易見。隨著網絡規模的不斷擴大,網絡設備不斷增加,網絡監控、維護人員忙于處理不斷發生的大量的告警,手工向OSS等發送指令收集信息或消除告警,耗用大量時間,且容易遺漏重大網絡事件。此外,由于處理告警已消耗了大量時間,用在告警深層次分析以確定告警根本原因從而減少甚至杜絕相關故障發生的時間就相應減少。設備的維護管理工作,通過把各種經驗IT化、自動化、智能化,在告警發生以后能夠快速響應、自動分析、自動定位、自動收集信息,在保證網絡安全運營的基礎上,更要優質快速地保證端到端的業務質量、網絡投訴問題的快速響應并解決,大大提高客戶對移動優質網絡服務的感知程度。這些工作的落實需要更加優質高效的智能化告警處理系統。
發明內容本發明的目的是提供一種代替手工的移動通信網管系統中告警自定位和自處理的方法。本發明所要解決的問題是提供一種告警自定位及自處理的方法,即通過把各種經驗IT化、自動化、智能化,采取自動向網元發送操作、查詢指令的方式,在告警發生以后能夠快速響應、自動分析、自動定位、自動收集信息,實現非硬件故障的自動處理以及故障發生時刻的信息收集、信息分析的智能化。本發明技術方案如下一種移動通信網管系統中告警自定位和自處理的方法,涉及移動通信網管監控系統中的告警自定位及自處理。監控系統維護三個表,分別存放自動執行指令所得結果、告警自定位及自處理規則、延時處理對象。如果告警網元不是工程網元且不處于繁忙等不自處理狀態,并且該告警符合自處理規則時,判斷告警是否為需延時處理,若是,則由外部輪詢進程處理,否則查看其是否在自處理后設定時間內又重復出現的告警,若是,則派單,否則調用告警自處理服務。經過歸一化處理的告警,在經過告警關聯分析之后,對于需要進行自定位及自處理的告警,判斷發生告警的網元是否處于工程狀態,對于非工程網元所發生的告警,接下來統計此網元是否處于告警風暴期間,若不是則根據每種告警的處理規則,進入智能化處理過程。在進行自動定位及自處理時,為避免給本已繁忙的網元帶來更大的負擔,自定位及自處理方法中設計了一個驗證網元本身狀態的步驟,通過驗證后,自定位及自處理繼續執行,否則自動調用派單過程。同一故障點反復出現的告警以及經自處理之后又重復出現的告警,方法中均做了判斷,當這些情況出現的時候,自動調用派單過程。對于那種經常在發生后的很短時間內自動清除的告警,使用延時處理方式,達到延遲時間后仍然處于活動狀態的告警,方進行自動定位及自處理。告警的自處理和自定位,是對每種告警的處理經驗,經IT化后形成智能化的、自動的、程序化的處理規則,隨著處理經驗的不斷豐富,這些規則也將不斷的完善或添加更多種類的告警自處理規則,為了適應這種變化,自處理和自定位方法中設計了易于擴展的整體架構。每種告警的處理規則,可以很容易的掛載在此架構下,對其他告警不產生任何影響,使得規則的擴充及豐富十分方便。移動通信網管系統中告警自定位和自處理的方法,其特征是包括以下步驟1、判斷告警是否為工程網元所發出的步驟是,則智能化過程結束,否,則進入網元目前狀態分析步驟;2、網元目前狀態分析步驟網元負荷正常,引入告警自處理規則,進入自處理步驟;3、判斷是否為頻發告警或者為告警自處理規則指定需延時自處理是,保存數據進入延時計時進入外部處理系統,否,進入自處理設定時間判斷步驟;4、自處理設定時間內又重復出現告警的判斷步驟是,轉為智能化派單步驟,否,進入自處理步驟;5、告警自動定位及自處理、智能化分析步驟存儲自動定位及自處理、智能化分析的數據,發工單;6、結束本次告警處理。該監控系統包括依次連接的警告歸一化模塊、自處理一預處理模塊、處理結果存儲及后續處理模塊、自動派單模塊及前臺呈現、查詢統計模塊。該監控系統可自動動作,自動消除告警或者使得操作維護人員能夠越過故障定位過程快速進入故障處理階段,以達到快速定位故障點或自動處理告警,縮短故障歷時,提高告警處理效率的目的。減輕了網絡監控角色和工程/維護角色中理解告警本身、人工處理告警以及收集告警信息等工作量,使維護人員把更多精力放在網絡分析方面。而實時收集的設備信息,也將會對網絡分析人員大有幫助。使監控人員從簡單、重復的手工勞動中解放出來,提高了整個監控工作的效率,將更大的精力投入到故障分析及故障預防當中,故障定位的平均時長從十幾分鐘縮短到幾分鐘,影響網絡運營質量的故障的平均歷時顯著降低,提升了網絡運營質量。例如,在山東移動通信有限公司,智能化自處理目前設定對各專業5大類共40余種告警進行自動定位及自處理,收集了2007年6月移動網管數據進行分析,6月份全省入庫告警數據約600萬條,其中需要人工干預才可清除的告警140萬條,可以進行智能化處理的告警為112萬條,智能化處理的比率約為80%,經過智能化處理之后,告警可以自動消除的有87萬條,處理成功率為78%。附圖1是本發明的告警自定位及自處理模塊圖及主框架處理流程圖,附圖2是本發明實施例的一個告警的處理過程的流程圖,附圖3是本發明實施例自處理的通用內部流程圖,附圖4是本發明實施例頻發或延時外部輪循程序流程圖,圖5是本發明告警自處理及相關模塊的整體模塊圖。具體實施方式經過歸一化處理的告警,在經過告警關聯分析之后,根據自處理配置表的數據,做進一步判斷。自處理配置表,配置了需要自處理、自定位的告警以及這些告警的處理參數。自處理配置表的結構如下<table>tableseeoriginaldocumentpage6</column></row><table>>根據所傳入的告警數據以及fmin—config的配置數據,判斷此告警是否需要進行智能處理。若否則返回。對于配置數據的匹配,遵循以下原則今規則必須是啟用狀態,且介于啟用時間段之內。今匹配至最明確的設定(標題+網元),標題是必選項,例如有一條規則R1是針對A標題告警所有(ALL)網元進行自處理,同時有另外一條規則R2同樣針對A標題但只對B網元有效,則匹配規則R2.今規則是否啟用和是否進行自動處理兩個選項的關系是否進行自動處理選項僅在輸入特定網元時可選。當規則啟用且進行自動處理時對該網元進行自動處理當規則啟用且不進行自動處理時不對該網元進行自動處理今若規則不啟用時此規則失效>判斷相關網元是否為工程網元,若是則返回>接下來根據統計數據判斷此網元是否處于告警風暴期間,是則中止處理。>判斷網元當前狀態是否適合自處理(例如愛立信網元CP〉60。/。則不適合自處理),若不適合自處理,則將此告警的智能化處理狀態設置為'轉活動'并不再繼續處理。>進行頻發告警處理頻發告警不同于普通頻次告警,判斷時需先提取定位信息(每個告警都不同)。當freq_time_window>0時有效,若在freq_time—window時間內某告警連續出現達到frecLoccur—limit次,則為頻發告警,不做自處理。>是否為N秒前已處理過的告警重復出現,是則轉活動,中止自處理。>對于需要延時處理或者需要進行頻發判斷的告警,先保存至延遲處理表中,延遲處理表的結構如下:<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>下面結合附圖舉例說明。其中的幾個的判斷過程的意圖首先判斷網元是否為工程網元,處于工程狀態的網元所發生的告警不進行自動定位及自處理。然后,進入網元當前狀態判斷分支當網元過于繁忙或處于其他不適于進行自處理狀態時,將跳過自處理流程,此判斷分支的作用在于提高自處理的安全性。如果此種告警為頻發告警或已設定為延時處理,此告警將被保存到延時處理列表中,待延時結束后進行處理。對于經自定位及自處理后重復出現的告警,將自動轉派單。以上的判斷分支,由告警自處理整體框架ALR—IN—MAIN完成,具體各個告警的處理步驟由外部組件處理,可方便的掛接于主框架下。該監控系統包括依次連接的警告歸一化模塊、自處理一預處理模塊、處理結果存儲及后續處理模塊、自動派單模塊及前臺呈現、查詢統計模塊。其整體結構見附圖5。一種移動通信網管系統中告警自定位和自處理系統,其特征是包括以下裝置-將警告信息歸一化處理的警告歸一化模塊;將警告信息自處理一預處理模塊;將警告信息處理結果存儲及后續處理模塊;生成自動派單模塊及前臺呈現、査詢統計模塊。實施例以下以某一CCITT7SIGNALLINGLINKFAILURE告警的自定位及自處理,舉例說明告警處理步驟告警內容如下WOBZG2/A33I/0/0/10/09NVT-682TIME0703082308PAGE1***ALARM825A1/APT"BZG2/A33I/0/0/l"A0703090001CCITT7SIGNALLINGLINKFAILURELSSPIDSLCST2-10-255-18JNLSTP27C7ST2C-69SDLJNLl,UPD-3587FCODEINFOREASON104H'OSIN,SIE,SIOORSIOSRECEIVEDEND2-10-255-18:信令點JNLSTP2:信令點名稱7:link號碼C7ST2C-69:信令終端對該告警的處理流程如下1、出現告警時等待3—5分鐘(時間可以設置),如果告警消失則不進行任何處理。2、如果在3—5分鐘內消失后又重新出現(針對同一信令點、同SLC的信令中斷告警),認為是頻次告警或臨時閃斷,也不進行任何處理;等待到1小時內如果出現次數超過6次,達到頻次告警的門限,自動派發工單。3、對非頻次告警,則按照如下流程處理1)C7LTP:LS=2-10-255-18;<c71tp:ls=2-10-255-18;CCITT7LINKSETSTATELSSPIDSLC.STATE腿IBSTFCODEINFO2-10-255-18JNLSTP200ACTIVE01ACTIVE02ACTIVE03ACTIVE04ACTIVE05ACTIVE06ACTIVE07RESTORING104H'O如果SLC二7的link為ACTIVE,表示信令恢復中止處理;否則繼續將故障SLC進行閉解>C7LAE:LS=2-10-255-18,SLC=7;EXECUTED表示執行成功,繼續執行下一條指令其他響應中止處理。>C7LAI:LS=2-10-255-18,SLC=7;EXECUTED表示執行成功,繼續執行下一條指令其他響應中止處理。>C7LTP:LS=2-10-255-18;EXECUTED表示執行成功,繼續執行下一條指令其他中止處理檢査SLC對應的LINK是否ACTIVE,表示信令恢復中止處理;否則繼續2)檢査ST對應的RP和EM狀態>〈c7tsp:st=c7st2c_69:CCITT7SIGNALLINGTERMINALSTATESTSTATEADMBLSRPEMC7ST2C-69ISERVCCC530><exemP:em=all,rp=53;EMDATARPTYPEEMEQM53RPD1A0C7ST2C-68M-71TWINCNTRLPPSTATEPRIMWO><exrpp:rp=53;RPDATARPSTATETYPETWINSTATEDSMAINT.STATE53WORPD1AIDLE如果RP、EM狀態不是WO狀態,則按照EMFAULT或RPFAULT的處理流程進行處理如果為WO狀態則繼續按照以下步驟處理。3)檢査半永久連接狀態和對應的傳輸時隙DEV<exscp:dev=c7st2c-69;SEMIPERMANENTCONNECTIONDATANAMECSTATEDISTCLSTP23ACT57SIDE1SSTATEATTESDEV-C7BTC4-3S88ACTSIDE2SSTATEATTESDEV-C7ST2C-69ACT4)檢査DEV對應的SNT及其狀態〈exd印dev=c7btc4-3588;DEVICEDATADEVRHNBSNT/DEVPC7BTC4-3588JNL2S0C7ETC4—112JNL2SIDEVMISC1MISC2MISC3MISC4C7BTC4-3588通過以上指令得到C7BTC4-3588_〉C7ETC4-112MISCNUMCHMISCSMISCS證ADMSTATERSNTSCCCEMCUANC<ntcoP:snt=c7etc4_l12;SWITCHINGNETWORKTERMINALCONNECTIONDATASNTSNTVSNTPDIPDEVC7ETC4-1121TSM-5-5112C7B4C7BTC4-3584&&-3615END通過以上指令得到C7ETC4-112—〉112C7B4〈ntstp:snt=c7etc4-112;SWITCHINGNETWORKTERMINALSTATESNTSTATEBLSLSTFCODEC7ETC4-112WO如果SNT狀態不是WO,則按照SwitchingNetworkTerminal,Repair中的流程進行處理。5)檢査DIP質量及對應的狀態〈dtstp:dip=112c7b4:DIGITALPATHSTATEDIPTYPESTATELOOPTSLO;TLDIPENDFAULTSECTION112C7B4IEXWO如果傳輸狀態不是WO則派發工單核査原因;如果為WO則按照以下規則進行處理。<DTQUP:DIP=112C7B4;DIGITALPATHQUALITYINCOMINGANDOUTGOINGDIRECTIONDIPTlT2SLIPSLIP2UASUASR證lUASB1UAV2UASB2112C7B421700000000SECTIONESVSESV隱ESVRSESVRDMVRSFVSFTI0000024SECTIONES2VSES2VDM2VES2VRSES2VRDM2VRSMI000027如果傳輸質量存在加多的滑碼或誤碼則復位傳輸<DTQSR:DIP=dip,SF,DEGR,UNACC;EXECUTED表示執行成功,繼續執行下一條指令其他中止處理6)檢査鏈路狀態<c71tp:ls=2-10-255-18;CCITT7LINKSETSTATELSSPID2-10-255-18JNLSTP2SLCSTATE00ACTIVE01ACTIVE02ACTIVE03ACTIVE04ACTIVE05ACTIVE06ACTIVE07ACTIVE如果為wo則結束處理,否則發工單。INHIBSTFCODEINFO權利要求1、移動通信網管系統中告警自定位和自處理的方法,其特征是包括以下步驟A、判斷告警是否為工程網元所發出的步驟,是,則智能化過程結束;否,則進入網元目前狀態分析步驟;B、網元目前狀態分析步驟,網元負荷正常,引入告警自處理規則,進入自處理步驟;C、判斷是否為頻發告警或者為告警自處理規則指定需延時自處理,是,保存數據進入延時計時進入外部處理系統,否,進入自處理設定時間判斷步驟;D、自處理設定時間內又重復出現告警的判斷步驟,是,轉為智能化派單步驟,否,進入自處理步驟;E、告警自動定位及自處理、智能化分析步驟,向網元發送指令,獲取分析指令執行結果,存儲自動定位及自處理、智能化分析的數據,根據返回狀態判斷是否發送工單;F、結束本次告警處理。2、一種移動通信網管系統中告警自定位和自處理系統,其特征是包括以下裝置將警告信息歸一化處理的警告歸一化模塊;將警告信息自處理一預處理模塊;將警告信息處理結果存儲及后續處理模塊;生成自動派單模塊及前臺呈現、查詢統計模塊。全文摘要一種移動通信網管系統中告警自定位和自處理的方法,涉及移動通信網管監控系統中的告警自定位及自處理。監控系統維護三個表,分別存放自動執行指令所得結果、告警自定位及自處理規則、延時處理對象。如果告警網元不是工程網元且不處于繁忙等不自處理狀態,并且該告警符合自處理規則時,判斷告警是否為需延時處理,若是,則由外部輪詢進程處理,否則查看其是否在自處理后設定時間內又重復出現的告警,若是,則派單,否則調用告警自處理服務。采用本發明所述方法,使監控人員從簡單、重復的手工勞動中解放出來,提高了整個監控工作的效率。文檔編號H04Q7/34GK101222742SQ200810009119公開日2008年7月16日申請日期2008年1月24日優先權日2007年11月22日發明者姜良軍,欽宮,琳林,王奉軍,剛陳申請人:中國移動通信集團山東有限公司