r>[0040] 將獲得的每一種比例分別結合所述一個節點的累加系數,獲得所述一個節點在對 應故障鏈路中的分權重,將獲得的所有分權重進行累加,獲得累加結果,所述累加結果即為 所述故障權重,所述累加系數用于表征所述一個節點在所有故障鏈路中的重要程度。
[0041] 較佳地,進一步包括呈現單元,所述呈現單元具體用于:
[0042] 在故障定位的過程中,通過承載網資源數據庫獲取網絡拓撲,將全網鏈路拓撲結 構可視化呈現;以及,
[0043] 將故障定位結果在所述全網鏈路拓撲結構中進行呈現;以及,
[0044] 在故障定位后,將故障相關信息在所述全網鏈路拓撲結構中進行呈現。
[0045] 這樣,可以實時將全網鏈路質量進行可視化呈現,能夠直觀呈現鏈路故障點。
[0046] 較佳地,在故障定位后,將故障相關信息在所述全網鏈路拓撲結構中進行呈現,所 述呈現單元具體用于:
[0047] 根據預設的故障經驗庫,將定位后的故障與所述故障經驗庫進行關聯,分析故障 相關信息,將獲得的故障相關信息在全網絡拓撲結構視圖中進行呈現,所述故障相關信息 至少包括故障產生原因、故障引發的后果以及故障處理建議。
[0048] 這樣,能夠在全網鏈路質量可視化呈現的基礎上,有效的進行全網故障的診斷,通 過可視化視圖快速處理故障。
【附圖說明】
[0049] 圖1為現有技術中網絡拓撲圖;
[0050] 圖2為本發明實施例中故障定位流程圖;
[0051] 圖3為本發明實施例中服務器結構圖。
【具體實施方式】
[0052] 本發明實施例中,通過時間輪詢統計遠端測量點出現丟包變化的一條或多條鏈路 進行加權累加算法后,統計丟包權重最高的節點,定位鏈路故障節點,并在監控系統上可視 化呈現,綜合展現全網鏈路質量。
[0053] 下面參閱附圖對本發明實施例優選的方案進行詳細說明。
[0054] 本發明實施例以數據鏈路層的應用為例進行介紹,如附圖1所示,為節點眾多,通 過匯聚交換機和核心路由器組成的兩層或三層結構的網絡。
[0055] 在預處理階段,對測量參數進行配置。具體地,對物理層網絡鏈路網元、數據鏈路 層和網絡層數通設備進行遠端測量參數統計配置,例如,配置統計節點、網絡質量、丟包計 數器參數、SNMP服務器地址等。并且,統計接口通信信道上的基本數據包質量信息。
[0056] 針對服務器設置對網元和數通設備的接口 IP地址后,服務器采集承載網內各 網元節點數據信息和網絡鏈路質量信息,具體地,網元和數通設備通過遠端測量點(即 Remotesite)測量統計項及SNMP協議上報的節點信息將設備信息傳給服務器。
[0057] 參閱圖2所示,本發明實施例中,在進行網絡鏈路質量監控過程中,服務器具體執 行以下操作:
[0058] 步驟200 :監控系統中各個設備運行狀態信息,并對各個設備的信道質量關聯參 數進行統計,將經過信道質量關聯參數符合預設故障條件的設備的鏈路判定為故障鏈路, 并記錄故障鏈路經過的各個節點。
[0059] 服務器對系統中各個設備的信道質量關聯參數進行統計,其中,信道質量關聯參 數包括丟包、時延、抖動等,本發明實施例采用丟包判斷各個設備的信道質量。具體判斷方 式可以采用但不局限于時間輪詢方式,具體過程為:
[0060] 1)根據預設的時間輪詢值和預設的丟包次數門限,對各個設備進行丟包統計,每 當確定一個設備在預設的時間輪詢值內的丟包次數高于所述丟包次數門限時,記錄所述一 個設備的丟包次數信息,其中,時間輪詢值用于指示進行丟包統計的時間間隔。
[0061] 例如,預設時間輪詢值為5分鐘,預設丟包次數門限為400次,也就是,每隔5分鐘 觸發對每個設備的統計,若確定一個設備在5分鐘內的丟包次數高于400次,則記錄該設備 的丟包次數信息;若確定一個設備在每5分鐘內的丟包次數不高于400次,則不記錄該設備 的丟包次數信息,即丟棄該設備的丟包次數信息。在統計完畢后,對計數器進行清零,以便 于下一次的統計。
[0062] 2)針對記錄丟包次數信息的每一個設備,采用預設的跟蹤方式,將經過該每一個 設備的每一條鏈路均為故障鏈路,并記錄故障鏈路經過的各個節點。
[0063] 在步驟1)中獲得的記錄結果中,每一個設備的信道質量關聯參數都符合預設故 障條件,即每一個設備的丟包次數在預設時間輪詢值內都高于預設的丟包次數門限,因此, 將每一個設備都記錄為故障設備。
[0064] 針對每一個故障設備,采用預設的跟蹤方式,將經過該每一個設備的每一條鏈路 均判定為故障鏈路。當然,故障鏈路的判定是根據鏈路質量規則和遠端測量點即設備的信 道質量關聯參數共同決定,為了方便測定,將經過該每一個故障設備的每一條鏈路均判定 為故障鏈路。
[0065] 預設的跟蹤方式可以但不限于采用跟蹤路由(即Traceroute)和IP地址對應的 方式,其中,Traceroute是一種網絡技術,可顯示數據包經過的路由器或交換機的IP地址。
[0066] 首先,在利用Traceroute工具獲得各節點的IP地址后,根據IP地址與節點名稱 的對應關系編輯網絡拓撲,配置網絡內各設備間的端到端的鏈路。
[0067] 接著,由每一個故障設備出發,發出路徑跟蹤,記錄所有經過故障設備的路徑,每 一條路徑即為一條故障鏈路。
[0068] 然后,統計每一條故障鏈路經過的各個節點并進行記錄。
[0069] 步驟210:分別計算每一條故障鏈路經過的各個節點的故障權重,該故障權重用 于指示節點在所有故障鏈路中作為故障原因的可信程度。
[0070] 具體地,針對每一條故障鏈路,確定故障鏈路經過的各個節點的故障權重,具體計 算過程如下:
[0071 ] 1、遍歷各個節點,每選定一個節點,統計經過這一個節點的所有故障鏈路,基于經 過這一個節點的每一條故障鏈路中包含的節點數目,分別計算這一個節點在每一條經過這 一個節點的故障鏈路的節點總數目中所占的比例。
[0072] 當同一時間多個設備出現故障進行告警時,會引起多條鏈路同時發生故障,服務 器通過預設的跟蹤方式確定出現故障的鏈路路徑,假設經過服務器分析后,確認同一時間 有關聯的三條鏈路出現故障,第一條故障鏈路共經過4個節點,第二條故障鏈路共經過5個 節點,第三條故障鏈路共經過6個節點,然而,這三條故障鏈路中可能會包含共同經過的節 點,因此,服務器對三條故障鏈路中包含的所有節點進行遍歷,每選定一個節點時,判定該 節點在每一條經過該節點的故障鏈路中所占的個數比例。
[0073] 例如,選定一個節點(記為節點1),若上述3條故障鏈路都經過這個節點,由于第 一條故障鏈路共經過4個節點,第二條故障鏈路共經過5個節點,第三條故障鏈路共經過6 個節點,因此,節點1在第一條故障鏈路中所占的比例為1/4,在第二條故障鏈路中所占的 比例為1/5,在第三條鏈路中所占的比例為1/6 ;
[0074] 又例如,選定節點2,若上述第二條故障鏈路和第三條故障鏈路都經過這個節點, 則節點2在第二條故障鏈路中所占的比例為1/5,在第三條鏈路中所占的比例為1/6,由于 第一條故障鏈路不經過節點2,所以節點2在第一條故障鏈路中所占的比例為0 ;
[0075] 用同樣的方法確定這三條故障鏈路中所有節點在每一條經過它的故障鏈路中所 占的個數比例。
[0076] 2、將獲得的每一種比例分別結合這一個節點的累加系數,獲得這一個節點在對應 鏈路中的分權重,將獲得的所有分權重進行累加,獲得累加結果,該累加結果即為故障權 重,該累加系數用于表征這一個節點在所有鏈路中的重要程度。
[0077] 故障權重用W表示,累加系數用X表示,其