專利名稱:一種系統故障的檢測方法和裝置的制作方法
技術領域:
本發明涉及通訊領域控制、傳送站點及子系統各功能單元的自動檢測及故 障發現的方法和裝置,尤其在光通信領域中對于傳輸節點系統設備及單元的狀 態檢測方法和裝置。
背景技術:
隨著現代通信領域的技術不斷進步和發展,超長距離、超大容量的傳輸系 統越來越得到廣泛的應用。由于長途骨干傳輸往往需要穿過人煙稀少的區域, 其中繼站點往往屬于無人或者少人值守的狀態。系統設備發生故障時,由相應 的管理人員進行人工的故障定位及故障排除,其工作效率比較低下。
隨著通信系統業務領域的不斷擴展,對通信設備可靠性及可管理性等方面 性能的要求越來越高,采用人工事后干預的方式已經不能夠滿足當前通信系統 的要求。為了有效地自動發現定位故障,并力爭在系統性能進一步惡化前實現 故障的預警,需要一種自動實現系統故障檢測及預警的裝置和方法。
目前已經采用的一些方法和手段包括在無人值守站點增加錄像監控系統、 實現更加智能化的網絡管理等等。這些方法是基于站點各功能單元正常工作時 的外在表現來實現對系統單元功能是否正常的識別與劃分,不能夠準確判定復 雜的故障類型及產生原因,需要用戶后期干預的工作量較大,在實際使用中將 造成不便,需要的改進方面包括
1. 根據用戶配置對系統實施監控;
2. 自動檢測系統故障類型及故障原因;
3. 可配置的簡單故障自動處理功能;
4. 事前故障預警,通過對故障的分級,當系統性能進一步惡化前,執行 告警動作。
發明內容
為解決上述問題,本發明的目的在于提出一種系統故障的檢測方法和裝置, 解決系統故障的檢測及定位問題,根據用戶配置,自動解決低風險故障或者產 生故障警告,降低事故處理的人工干預程度。
為實現上述目的,本發明提出了一種系統故障自動檢測的裝置,與被監控 系統連接,用于自動檢測包括光通信傳輸節點系統設備及單元的被監控系統的 工作狀態,進行上報或告警,其中,包括
配置單元,用于通過通信信道接收用戶的配置信息,并將所述配置信息傳 送給控制單元;
控制單元,與所述配置單元連接,用于將所述配置信息下發至檢測單元,
并接收檢測單元反饋的檢測結果;
檢測單元,與所述控制單元連接并通過檢測接口與所述被監控系統連接,
用于根據所述配置信息檢測所述被監控系統的硬件狀態、配置信息、功能指標 和/或性能指標,生成檢測結果反饋回所述控制單元;
輸出單元,與所述控制單元連接,用于輸出所述控制單元發送的檢測結果。
上述的系統故障自動檢測的裝置,其特征在于,所述被監控系統包括多個 目標單元,所述目標單元分別與所述檢測單元通過檢測接口連接;或者,所述 目標單元分別與所述檢測單元設置于目標單板,所述目標單板通過檢測接口與 所述控制單元連接,所述控制單元可以與多個目標單板分別連接。 上述的系統故障自動檢測的裝置,其中,所述配置單元還包括-串口或以太網接口,與通信信道連接,用于通過人機界面、鍵盤和/或鼠 標完成所述配置信息的更新和上傳/下載服務。
上述的系統故障自動檢測的裝置,其中,所述控制單元包括控制芯片或現 場可編程門陣列。
上述的系統故障自動檢測的裝置,其中,還包括 非易失性存儲器,用于保存配置單元接收的配置信息。 上述的系統故障自動檢測的裝置,其中,所述輸出單元包括-視頻信號輸出設備,包括液晶顯示器或陰極射線管顯示器,用于顯示檢測 檢測結果和/或控制信息;和/或
以太網接口,與互聯網或局域網連接,用于將所述檢測結果輸出。
為實現上述目的,本發明還提出了一種根據權利要求1所述的系統故障自 動檢測的方法,其中,包括以下步驟
步驟一,配置單元從通信信道讀取用戶設定的配置信息,并將所述配置信 息發送至控制單元;
步驟二,所述控制單元處理所述配置信息,將所述配置信息下發至檢測單
元;
步驟三,所述檢測單元根據所述配置信息檢測所述被監控系統的硬件狀 態、配置信息、功能指標和/或性能指標,生成檢測結果反饋回所述控制單元;
歩驟四,所述控制單元發送檢測結果至所述輸出單元,所述輸出單元輸出 所述檢測結果。
上述的系統故障自動檢測的方法,其中,所述步驟一之前還包括 上電自檢,若自檢異常,直接產生告警消息,終止監控;若自檢正常,進
入步驟一的步驟。
上述的系統故障自動檢測的方法,其中,所述步驟三具體包括
步驟91,檢測單元檢測與目標單元的檢測接口是否正常,若正常則進入
步驟92,若不正常,則產生異常告警信息,終止檢測;
步驟92,所述檢測單元分別檢測所述目標單元的硬件狀態,用戶配置是
否在合理范圍,執行異常處理的次數和類型,和/或功能、性能指標是否處于
合理范圍;
步驟93,所述檢測單元判斷是否對全部目標單元都進行了檢測,若未完 成全部檢測,則繼續對下一個目標單元進行檢測,返回步驟91。 上述的系統故障自動檢測的方法,其中,還包括
所述定時檢測步驟,用于所述控制單元根據設定的檢測周期,當定時到達 時,對被監控系統開始檢測。
本發明在系統中增加專用的監控接口 ,能夠通過FPGA模塊或專用的附加 監測模塊電路實現對現有監控設備無法發現的底層硬件狀態、配置信息等直接 關系產品是否可靠運行參數的監控及告警處理。基于更底層的設備狀態獲取將 能夠在設備性能進一步惡化前發出故障預警。
本發明采用配置靈活的獨立式監控或者嵌入式方式監控,能夠實現靈活的 配置,可以操用全部嵌入式的方式實現,也可以采用檢測部分嵌入目標系統,
控制預警單元獨立設計的方式,或者目標系統預留部分測試接口,其余檢測、 控制及輸出部分集中處理的方式,在實際應用中具有很強的靈活性。
另外,由于本發明所述的檢測方法具有智能化的用戶配置策略,因此在用 戶根據自己的監控策略設定控制后,剩下工作將全部由檢測控制器自動完成, 系統故障提前預警功能能夠為設備可靠運行提供保障,同時其記錄上報的故障 定位及診斷信息能夠大幅度提高設備的可靠性和可維護性,并減少了人工干預 的環節,減少了產品的故障平均維護時間。
本發明的裝置及方法,于目前現有的一般監控軟件及設備相比,由于通過 在系統中增加專用的嵌入式監控接口技術,通過對底層硬件狀態、配置信息、 程序執行異常處理的頻率進行監控,解決了現場快速故障定位及提前故障預警 的功能,從而從整體上增強了系統的可維護性并大幅度縮短了產品的故障平均 修復時間,為提前預防設備故障及提升系統的可維護性方面做出了有益的改 進。
圖1為本發明系統故障檢測裝置示意圖2為本發明系統故障檢測方法流程圖3為本發明系統故障檢測裝置在系統級應用實例;
圖4為系統故障檢測裝置在單板級的嵌入式應用實例。
具體實施例方式
下面結合附圖,基本按照附圖的順序對技術方案的實施作進一步的詳細描
述
本發明所述系統故障的檢測裝置100主要由4個功能單元組成,包括配置 單元IIO、檢測單元120、輸出單元130和控制單元140。
圖1為系統故障檢測裝置示意圖。如圖1所示,該檢測裝置100內部可分 為4個功能單元,各功能單元之間通過內部的總線連接在一起,構成完整的系 統。配置單元110從人機界面接收用戶配置信息,并保存在檢測裝置內部的非 易失性存儲器150中,該非易失性存儲器150可以是EEPROM (Electrically Erasable Programmable Read-Only Memory,電可擦可編程只讀存儲器)、FALSH
存儲器或者微型硬盤等,該配置信息通過內部總線接口可以到達控制單元
140,控制單元140通過從配置單元110獲取的信息下發給檢測單元120,檢 測單元120執行檢測動作,并將檢測結果反饋給控制單元140,控制單元140 將相關信息顯示在輸出單元130上。
配置單元110可以通過串口 、以太網接口等方式通過人機界面或鍵盤等方 式完成控制信息的配置更新及上下載服務。
控制單元140主要由控制芯片及相應軟件或者FPGA(Field Programmable Gate Array ,可編程門陣列)構成。主要完成對配置信息的處理,以及檢測指 令的生成及下發,并作為配置單元110及檢測單元120的信息顯示控制,將信 息發送到輸出單元130,該單元亦可以作為獨立的控制單元或者作為系統功能 而嵌入到其他設備中。
檢測單元120通過對應的硬件檢測接口 ,完成與被監控系統的底層通信過 程,并能夠從檢測接口中獲取到關系系統可靠性、穩定性方面的數據,以作為 后續控制單元140的控制條件,該單元可以是具有專用測試接口的獨立硬件設 備或者是具有對外接口的嵌入式設備。
專用檢測接口可以是用戶自行定義的硬件或者軟件接口。
輸出單元130可以包括CRT、 LCD等可視信號輸出,也可以是通過對應
的接口的格式數據流輸出。
圖2為系統故障檢測方法流程圖。如圖2所示,包括以下步驟 步驟S210,上電自檢,如果自檢異常,轉入步驟S270;否則,轉入步驟
S220。
步驟S220,配置單元讀取用戶設定的監控配置信息,并將參數傳遞給檢 測單元;
步驟S230,檢測單元根據配置檢測目標單元的檢測口是否正常,正常則 進入步驟S240,否則直接產生告警后,轉入步驟S250。
步驟S240,檢測單元分別檢測目標單元的硬件狀態、配置信息、功能指 標及性能指標,根據檢測結果,上報檢測結論,轉入步驟S250;
步驟S250,檢測控制器判定是否本次檢測完成,如果完成轉入步驟S260,
否則繼續下一格目標單元的檢測;
步驟S260,系統控制單元根據用戶設定的默認掃描周期實施下--輪檢測,
如果定時到達,開始轉入步驟S220,否則繼續循環計時;
步驟S270,檢測控制器產生自身異常告警,終止監控任務。 在上述方法中,步驟S240又可包括如下步驟
步驟S241,檢測目標單元的硬件狀態,包括關鍵器件的溫度、速率、誤 碼率等;
步驟S242,檢測目標單元的的配置信息,用戶配置是否在正常合理的范
圍;
步驟S243,檢測目標單元的應用程序執行異常處理的次數及類型; 步驟S244,檢測目標單元的支持的主要性能,檢査是否處于合理范圍; 步驟S245,根據檢測結果,生成檢測報告。
圖3為系統故障檢測裝置在系統級應用實例。如圖3所示,被監控單元 200包括n個目標單元210 (21、 22……2n),該裝置100內部可分為4個功 能單元,各單元之間通過內部的總線連接在一起,構成完整的系統。配置單元 110從人機界面接收用戶配置信息,并保存在檢測裝置內部的非易失性存儲器 150中,該配置信息通過內部總線接口可以到達控制單元140,控制單元140 通過從配置單元110獲取的信息下發給檢測單元120,檢測單元20執行檢測 動作,并將檢測結果反饋給控制單元140,控制單元140將相關信息顯示在輸 出單元130上。
配置單元IIO通過串口連接PC或其它終端,通過上位機人機界面完成控 制信息的配置更新及上下載服務。
控制單元140主要由控制芯片及FPGA構成。主要完成對配置信息的處理, 以及檢測指令的生成及下發,并作為配置單元110及檢測單元120的信息顯示 控制,將信息發送到輸出單元130,該單元亦作為獨立的控制單元。
檢測單元120通過自定義的硬件檢測接口,完成與被監控系統200的底層 通信過程,并能夠從檢測接口中獲取到關系系統可靠性、穩定性方面的數據, 以作為后續控制單元14的控制條件,該單元可以是具有專用測試接口的獨立 硬件設備或者是具有對外接口的嵌入式設備。
輸出單元為LCD顯示屏,通過相應接口也可輸出到其他顯示設備上 下面以配置為被監控系統目標單元21為例,說明系統工作過程 步驟S301,正常工作的目標單元21能夠正常的完成其擔負的任務流程;
步驟S302,目標單元21能夠根據目前的工作狀況,給出檢測控制板需要 檢測的控制信號;
步驟S303,檢測裝置上電自檢,如果自檢異常,轉入步驟S309;否則, 轉入步驟S304;
步驟S304,配置單元讀取用戶設定的監控配置信息,并將參數傳遞給檢 測單元;
步驟S305,檢測單元根據配置檢測目標單元的檢測口是否正常,正常則 進入步驟S306,否則直接產生告警后轉入步驟S307。
步驟S306,檢測單元分別檢測目標單元的硬件狀態、配置信息、功能指 標及性能指標,根據檢測結果,上報檢測結論,轉入步驟S307;
步驟S307,檢測控制器判定是否本次檢測完成,如果完成轉入步驟S308, 否則繼續下一個目標單元的檢測;
步驟S308,系統控制單元根據用戶設定的默認掃描周期實施下一輪檢測, 如果定時到達,幵始轉入步驟S304,否則繼續循環計時;
步驟S309,檢測控制器產生自身異常告警,終止監控任務。
上述控制過程的持續定時執行將能夠保證在目標單元品質下降后及時給 出警告信息,并在故障發生后能夠記錄并顯示故障的類型及原因。
圖4為本發明系統故障檢測裝置在單板級的嵌入式應用實例。如圖4所示, 本應用實例應用于嵌入式檢測,集中控制的方式。本實現方式包括目標單板 400,集中檢測控制板300以及連接他們的檢測接口和通信信道,集中檢測控 制板300上的控制單元140可以通過自定義接口與多個目標單板400連接,與 目標單板400上的檢測單元120連接,而檢測單元再通過硬件或軟件檢測接口 與目標單元210連接。
其中檢測裝置100內部可分為3個功能單元,各單元之間通過內部的總線 連接在一起,構成完整的系統。配置單元IIO通過以太網接口獲取用戶配置信 息,并保存在檢測裝置內部的非易失性存儲器150中,該配置信息通過內部總 線接口可以到達控制單元140,控制單元140通過從配置單元110獲取的信息 通過自定義接口下發給多個目標單板400中嵌入的檢測模塊120,嵌入式檢測 單元120執行檢測動作,并將檢測結果通過自定義接口反饋給控制單元140, 控制單元140將相關信息輸出到配置有以太網接口的輸出單元130上。
所述的配置單元110通過以太網與LAN或者其他網絡相連,終端用戶通 過網絡登錄到檢測裝置上,完成配置工作。
控制單元140主要由控制芯片及FFGA構成。主要完成對配置信息的處理, 以及檢測指令的生成及下發,并作為配置單元110及檢測單元120的信息顯示 控制,將信息發送到輸出單元130,該單元亦作為獨立的控制單元。
檢測單元120被嵌入到目標系統中,通過自定義的硬件檢測接口總線與檢 測板300連接,完成本單元的各種監控參量的數據采集/測試工作。
本裝置中,所述的輸出單元為以太網接口,與配置單元110在物理上可以 為同一個接口,將監控信息可以直接傳輸到終端或者專用服務器上。
下面以配置被監控系統目標單元210為例,說明系統工作過程-
步驟S401,正常工作的目標單元210能夠正常的完成其擔負的任務流程;
步驟S402,目標單元210能夠根據目前的工作狀況,給出檢測控制板需 要檢測的控制信號;
步驟S403,檢測裝置上電自檢,如果自檢異常,轉入步驟S409;否則, 轉入步驟S404;
步驟S404,配置單元讀取用戶設定的監控配置信息,并將參數傳遞給檢 測單元;
步驟S405,檢測單元根據配置檢測目標單元的檢測口是否正常,正常則 進入步驟S406,否則直接產生告警后轉入步驟S407;
歩驟S406,檢測單元分別檢測目標單元的硬件狀態、配置信息、功能指 標及性能指標,根據檢測結果,上報檢測結論,轉入步驟S407;
步驟S407,檢測控制器判定是否本次檢測完成,如果完成轉入步驟S408, 否則繼續下一個目標單元的檢測;
步驟S408,系統控制單元根據用戶設定的默認掃描周期實施下一輪檢測, 如果定時到達,開始轉入步驟S404,否則繼續循環計時;
步驟S409,檢測控制器產生自身異常告警,終止監控任務。
上述控制過程的單次執行即可完成目標單板群的狀態檢測及故障定位功 能,適宜于大批量執行品質檢驗以及快速故障排除分類等操作。
當然,本發明還可有其它多種實施例,在不背離本發明精神及其實質的情 況下,熟悉本領域的普通技術人員當可根據本發明做出各種相應的改變和變 形,但這些相應的改變和變形都應屬于本發明所附的權利要求的保護范圍。
權利要求
1.一種系統故障自動檢測的裝置,與被監控系統連接,用于自動檢測包括光通信傳輸節點系統設備及單元的被監控系統的工作狀態,進行上報或告警,其特征在于,包括配置單元,用于通過通信信道接收用戶的配置信息,并將所述配置信息傳送給控制單元;控制單元,與所述配置單元連接,用于將所述配置信息下發至檢測單元,并接收檢測單元反饋的檢測結果;檢測單元,與所述控制單元連接并通過檢測接口與所述被監控系統連接,用于根據所述配置信息檢測所述被監控系統的硬件狀態、配置信息、功能指標和/或性能指標,生成檢測結果反饋回所述控制單元;輸出單元,與所述控制單元連接,用于輸出所述控制單元發送的檢測結果。
2. 根據權利要求l所述的系統故障自動檢測的裝置,其特征在于,所述 被監控系統包括多個目標單元,所述目標單元分別與所述檢測單元通過檢測接 口連接;或者,所述目標單元分別與所述檢測單元設置于目標單板,所述目標 單板通過檢測接口與所述控制單元連接,所述控制單元可以與多個目標單板分 別連接。
3. 根據權利要求l所述的系統故障自動檢測的裝置,其特征在于,所述 配置單元還包括串口或以太網接口,與通信信道連接,用于通過人機界面、鍵盤和/或鼠 標完成所述配置信息的更新和上傳/下載服務。
4. 根據權利要求l所述的系統故障自動檢測的裝置,其特征在于,所述 控制單元包括控制芯片或現場可編程門陣列。
5. 根據權利要求l所述的系統故障自動檢測的裝置,其特征在于,還包括非易失性存儲器,用于保存配置單元接收的配置信息。
6. 根據權利要求l所述的系統故障自動檢測的裝置,其特征在于,所述輸出單元包括視頻信號輸出設備,包括液晶顯示器或陰極射線管顯示器,用于顯示檢測 檢測結果和/或控制信息;和/或以太網接口,與互聯網或局域網連接,用于將所述檢測結果輸出。
7. —種根據權利要求l所述的系統故障自動檢測的方法,其特征在于,包括以下步驟步驟一,配置單元從通信信道讀取用戶設定的配置信息,并將所述配置信 息發送至控制單元;步驟二,所述控制單元處理所述配置信息,將所述配置信息下發至檢測單元;步驟三,所述檢測單元根據所述配置信息檢測所述被監控系統的硬件狀 態、配置信息、功能指標和/或性能指標,生成檢測結果反饋回所述控制單元;步驟四,所述控制單元發送檢測結果至所述輸出單元,所述輸出單元輸出 所述檢測結果。
8. 根據權利要求7所述的系統故障自動檢測的方法,其特征在于,所述 步驟一之前還包括-上電自檢,若自檢異常,直接產生告警消息,終止監控;若自檢正常,進 入步驟一的步驟。
9. 根據權利要求7所述的系統故障自動檢測的方法,其特征在于,所述 步驟三具體包括步驟91,檢測單元檢測與目標單元的檢測接口是否正常,若正常則進入 步驟92,若不正常,則產生異常告警信息,終止檢測;步驟92,所述檢測單元分別檢測所述目標單元的硬件狀態,用戶配置是 否在合理范圍,執行異常處理的次數和類型,和/或功能、性能指標是否處于 合理范圍;步驟93,所述檢測單元判斷是否對全部目標單元都進行了檢測,若未完 成全部檢測,則繼續對下一個目標單元進行檢測,返回步驟91。
10. 根據權利要求7或9所述的系統故障自動檢測的方法,其特征在于, 還包括所述定時檢測步驟,用于所述控制單元根據設定的檢測周期,當定時到達 時,對被監控系統開始檢測。
全文摘要
本發明提出了一種系統故障自動檢測的裝置,與被監控系統連接,用于自動檢測包括光通信傳輸節點系統設備及單元的被監控系統的工作狀態,進行上報或告警,其中,包括配置單元,用于通過通信信道接收用戶的配置信息,并將配置信息傳送給控制單元;控制單元,與配置單元連接,用于將配置信息下發至檢測單元,并接收檢測單元反饋的檢測結果;檢測單元,與控制單元連接并通過檢測接口與被監控系統連接,用于根據配置信息檢測被監控系統的硬件狀態、配置信息、功能指標和/或性能指標,生成檢測結果反饋回控制單元;輸出單元,與控制單元連接,用于輸出控制單元發送的檢測結果。并提出了上述裝置進行系統故障自動檢測的方法。
文檔編號H04B10/08GK101110642SQ200610088830
公開日2008年1月23日 申請日期2006年7月19日 優先權日2006年7月19日
發明者鄒紅兵 申請人:中興通訊股份有限公司