專利名稱:一種單板信息采集的方法
技術領域:
本發明涉及一種通信系統設備的維護技術,尤其涉及移動通信系統中單板信息采集的方法。
背景技術:
正常工作的單板在某些情況下可能會出現異常情況甚至發生故障,此時如何及時的對問題進行定位并迅速響應所發生的問題,對于系統的運行維護具有重要意義。在移動通信系統中,現有通信設備中的基站(NodeB)設備包括射頻框和基帶框,射頻框和基帶框分別插有多塊射頻單板和基帶單板。其中,射頻單板中射頻部分的問題定位的常用方法是通過主控告警日志和射頻單板告警日志來確認發生的問題。而對于其中一些有關射頻上下行的問題,需要通過告警發生時的具體現象來進一步定位。如果能夠采集到更為詳盡的信息,對于故障或異常情況的解決至關重要。
針對如何采集單板運行時的信息,現有技術的一種方法是在單板運行時,當出現重要的操作失敗或者軟件進入異常處理分支后,調用單板運行日志,將相關信息記錄到消息隊列中;當隊列到達一定長度時將隊列中的信息記錄到相應的文件中,或者由系統定時將信息記錄到文件中;定位問題時,遠端維護臺打包上傳運行日志文件,局端使用專用的解析工具打開單板運行日志進行分析。這種方法的主要缺點是它依賴軟件判斷異常情況并進行記錄,而實際情況中有些問題的發生具有突然性,軟件根本無法得知,更無法進行記錄;它只對某一點的異常情況做記錄,而通常情況下,出現的問題具有相關性,所以很難通過一點的記錄得知單板的整個運行情況并對問題做全面的分析和定位。
對于上述問題,現有技術的另一種方法是在單板運行時,記錄告警日志,并將告警日志通過告警消息發送到局端;局端通過分析告警消息中的信息判斷告警發生時單板的運行狀態。這種方法的缺點在于由于告警消息中可攜帶的告警參數最多只有幾個字節,本方法的可擴展性差;同時由于軟件較難將告警發生時刻的有用參數記錄下來,所以這種方法定位問題較為困難。例如告警是硬件檢測到的,軟件得到該告警信息時告警早已發生,此時軟件所記錄的參數已失去實時性。軟件得到告警信息前的一段時間單板的運行參數對于問題定位具有重要意義,但本方法卻無法得到該參數。
發明內容
有鑒于此,本發明提供一種單板信息采集的方法,實時記錄單板長期健康性參數,以及告警前后一段時間的重要參數,從而為單板問題定位提供全面的信息。
基于上述目的,本發明的一種單板信息采集的方法,設置數據緩存隊列和告警信息緩存隊列,定時將單板運行時的長期健康性參數循環記錄到數據緩存隊列的各個數據存儲單元;當單板出現告警時,在延時一段時間后,將當前用于區分告警類型的告警標識以及數據緩存隊列中數據記錄到告警信息緩存隊列,其中,延時時間不超過數據緩存隊列最長可記錄的單板運行參數的時長。
本發明的一種單板信息采集的方法,進一步設置告警記錄,在所述的延時一段時間后,將當前告警標識以及告警產生時間記錄在告警記錄中;當單板出現告警時進一步搜索告警記錄,根據告警標識判斷該告警在預先設定的一段時間內是否產生過如果產生過,則不執行延時和記錄告警信息緩存隊列的操作;如果沒有產生過,則在延時后執行記錄告警信息緩存隊列的操作。
本發明的一種單板信息采集的方法,在所述記錄告警標識之前進一步包括,根據單板產生告警時的告警參數確定該告警的告警標識。
本發明的一種單板信息采集的方法,進一步設置告警日志文件,該告警日志文件保存在閃速存儲器中,在執行記錄告警信息緩存隊列后,進一步將告警信息緩存隊列中的告警信息寫入閃速存儲器中的告警日志文件。
本發明的一種單板信息采集的方法,在記錄告警信息緩存隊列之前,進一步判斷告警緩存隊列是否已滿如果已滿,則在刪除隊列中最先記錄的告警信息后執行記錄告警信息緩存隊列的操作;否則直接執行記錄告警信息緩存隊列操作。
本發明的一種單板信息采集的方法,按照預先設定的周期,定時將數據緩存隊列中的數據寫入閃速存儲器文件。
本發明的一種單板信息采集的方法,所述的數據緩存隊列為多級數據緩存隊列,當記錄到低一級數據緩存隊列的最后一個數據存儲單元時,將低一級數據緩存隊列的部分或者全部數據存儲單元中的數據記錄到高一級數據緩存隊列。
本發明的一種單板信息采集的方法,所述的多級數據緩存隊列為4級數據緩存隊列,當執行記錄第一級數據緩存隊列最后一個數據存儲單元時,同時將記錄到第一級數據緩存隊列最后一個數據存儲單元的數據記錄到第二級數據緩存隊列;當執行到第二級數據緩存隊列的最后一個數據存儲單元時,同時將記錄到第二級數據緩存隊列最后一個數據存儲單元的數據記錄到第三級數據緩存隊列;當第3次執行到第三級數據緩存隊列最后一個數據存儲單元時,同時將當前第三級數據緩存隊列中全部數據記錄到第四級數據緩存隊列。
本發明的一種單板信息采集的方法,所述的定時記錄是每秒鐘記錄一次,將每次的單板長期健康性參數記錄到數據緩存隊列的一個數據存儲單元中;所述的第一級數據緩存隊列有60個數據存儲單元,第二級數據緩存隊列有60個數據存儲單元,第三級數據緩存隊列有24個數據存儲單元,第四級數據緩存隊列有122×24個數據存儲單元。
本發明的一種單板信息采集的方法,所述的單板運行時的長期健康性參數是和單板運行相關的中頻、射頻、溫度參數之一或兩個以上的組合。
從以上所述可以看出,本發明一種單板信息采集的方法,采集單板長期健康性參數以及告警前后一段時間內的信息,為單板運行維護和故障問題定位提供了重要信息;本發明所述方法具有通用性和可擴展性,用戶可以根據具體情況配置定時采集周期、緩存隊列的長度以及緩存隊列的個數;另外,本發明提供了一種數據存儲方法,用來合理有效的對單板長期健康性參數進行存儲。
圖1為本發明的一種數據存儲方式示意圖;
圖2為本發明中單板長期健康性參數采集的流程示意圖;圖3為本發明中單板異常信息采集的流程示意圖。
具體實施例方式
本發明提供一種單板信息采集的方法,在各個參數采集點實時采集單板運行過程中的重要數據。本發明采用長期、短期相結合的數據采集策略長期數據采集是指單板運行時始終定時采集當前單板運行狀態的參數,并記錄到數據緩存隊列中;短期數據采集是指單板出現告警情況時采集告警前后一段時間內單板運行狀態的參數,并記錄到告警信息緩存隊列中。在具體實施中,用戶可以根據具體情況靈活設置定時采集的周期、數據緩存隊列的個數和各緩存隊列的長度。以下以用戶設置4個數據緩存隊列為例,結合附圖通過具體實施例對本發明做詳細的說明。
本發明首先提供了一種數據存儲方法,用于在單板信息采集的過程中對單板長期健康性參數進行存儲。下面以4個緩存隊列為例說明本發明的數據存儲方法。圖1為本發明的數據存儲方法示意圖。如圖1所示,用戶配置了4個數據緩存隊列,分別為1分鐘緩存,1小時緩存,1天緩存,一年緩存,每個數據緩存隊列分別有60、60、24和122×24個數據存儲單元,定時采集周期是1秒。每個數據存儲單元用來存儲每1秒終止時刻的單板運行參數。單板運行參數根據具體的單板類型設定,可以是有助于告警問題定位的各種參數的集合,比如,對于基站的射頻單板,該參數可以是重要的中頻、射頻、溫度等參數集合。“1分鐘緩存”有60個數據存儲單元,由于定時采集周期是1秒,所以每個數據存儲單元存儲每1秒的快照,即在每秒的終止時刻采集數據,并依次將采集到的數據存儲到數據存儲單元中。60個數據存儲單元都存滿后,下一個數據將循環存儲到“1分鐘緩存”第1個數據存儲單元,如此循環。當執行到“1分鐘緩存”的第60個數據存儲單元時,同時將存儲到第60個數據存儲單元的數據存儲到“1小時緩存”,即“1小時緩存”的每個數據存儲單元依次存儲每分鐘的最后一秒單板的運行參數,即前1分鐘的最后一秒的快照。類似的,當“1小時緩存”的60個數據存儲單元都存滿時,下一個數據將循環存儲到其第1個數據存儲單元。并且當執行到“1小時緩存”的第60個數據存儲單元時,同時將存儲到第60個數據存儲單元的數據存儲到“1天緩存”,即“1天緩存”的每個數據存儲單元依次存儲每小時的最后一秒當前單板運行參數,即前1小時的最后一秒的快照。“1天緩存”和“1年緩存”也按上述方式存儲數據,所不同的是“1天緩存”是每小時存入“1小時緩存”當前第60個數據存儲單元的數據,而“1年緩存”是每3天存入“1天緩存”當前全部的24個數據存儲單元的數據。
以上說明了如何存儲采集到的數據,下面結合圖2說明如何采集單板長期健康性參數。圖2為本發明中單板長期健康性參數采集的流程示意圖,具體包括以下步驟步驟20,設置一個高層定時器,超時時間設置為1秒;根據參數定義的內容,每秒定時器超時后,在各個單板運行參數采集點采集當前1秒的數據;步驟21,定義一個參數記錄接口,將采集到的數據通過該接口傳至單板長期健康性參數的緩存隊列;該參數記錄接口作為軟件定義的函數接口,具有通用性。它定義了傳入的數據類型、數據長度、數據內容、指針等接口內容,該接口封裝了隊列的具體創建和存儲等操作,高層使用時候無需考慮具體的隊列操作和循環方式。該接口將傳入的參數信息自動保存到相應的隊列中。
步驟22,參數記錄接口傳入的數據按照圖1所述的數據存儲方法分別存儲到1分鐘緩存隊列,1小時緩存隊列,1天緩存隊列和1年緩沖隊列;步驟23,系統定時將各個隊列中的數據寫入到閃速存儲器(FLASH)文件中。
為了避免在步驟23中由于頻繁寫FLASH文件導致硬件損壞,在確定定時間隔時需要考慮FLASH可寫次數以及寫周期,以保證定時寫入的操作不過于頻繁。
通過上述流程,本發明每秒鐘定時采集單板運行參數,并將相關數據記錄在FLASH文件中。通過查看該文件即可獲知單板運行中的長期的健康狀況,而異常情況發生前后的單板運行參數對單板問題定位尤其重要,下面結合圖3說明當單板運行中出現異常時,如何采集單板異常信息。圖3為本發明中單板異常信息采集的流程示意圖,在該流程中設置一個告警信息緩存隊列和一個告警記錄。其中,告警信息緩存隊列用于記錄24小時內新產生的告警信息,告警信息的內容包括告警標識(ID)以及告警產生前后30秒內的單板的長期健康性參數。該告警信息緩存隊列的長度設置為10個告警信息的長度。告警記錄用于記錄24小時內新產生的告警的ID以及產生時間,以便在流程中根據當前告警ID搜索告警記錄,判斷當前告警是否在24小時內曾經出現過。圖3所示流程包括以下步驟步驟300,當單板出現告警時,上報網管;步驟301,記錄當前的告警時間和告警參數,根據告警參數確定告警ID,其中,告警ID用于區分不同的告警類型;實際中,告警參數主要用于確認告警,主要包括三類參數第一告警參數用于區分不同的告警類型,例如單板內部硬件故障,單板操作系統異常等;第二告警參數用于確定單板中產生告警的告警器件的類型,例如中央處理器、射頻器件等;第三告警參數用于進一步區分告警器件的告警種類,例如中央處理器的工作溫度過高等。在步驟301中,提取告警參數中的第一告警參數即可獲得當前告警的告警ID。
步驟302,搜索告警記錄,將當前告警ID同告警記錄中的告警ID進行比較,判斷當前告警是否在24小時內產生過如果出現過,則退出該流程;如果沒有出現過,則進入步驟303;步驟303,延時30秒鐘;步驟304,調用參數記錄接口;步驟305,將當前告警ID以及告警產生時間寫入告警記錄,告警記錄中保存當前24小時內新產生的告警ID及告警產生時間,用于判斷下次告警是否在24小時內曾經出現過;步驟306,將當前告警ID寫入告警信息緩存隊列;步驟307,從單板長期健康性記錄的“1分鐘緩存”隊列中提取全部60個數據存儲單元的數據,因為延時了30秒,所以當前該緩存中的數據為當前告警產生前后30秒內的單板的長期健康性參數;步驟308,判斷告警信息緩存隊列中的告警個數是否已經滿10個,如果小于10個,則進入步驟310;如果是10個,則進入步驟309;步驟309,按照先入先出的原則,刪除告警信息緩存隊列中最先保存那個告警信息后進入步驟310;步驟310,將“1分鐘緩存”隊列中的全部數據,即告警產生前后30秒內的單板的長期健康性參數寫入告警信息緩存隊列中,并將當前告警ID以及告警產生前后30秒內的單板長期健康性參數寫入告警日志文件,告警日志文件保存在FLASH文件中。
由于1分鐘緩存隊列的存儲單元是60個,數據采集周期為1秒,可記錄60秒時間段內的單板運行參數。為了保證1分鐘緩存隊列中的數據是告警產生前后的單板運行參數,步驟303中延時的長度不能超過1分鐘緩存隊列最長可記錄的單板運行參數的時長,即不能超過60秒,否則1分鐘緩存隊列中的數據只是告警發生后的單板運行參數。
通過以上所述的單板信息采集方法,系統將單板運行過程中的長期性能參數和告警發生前后的信息記錄在相關文件中。通過軟件工具查看這些文件,即可了解單板的運行中的參考信息,從而為問題定位提供幫助。本發明具有通用性,可以運用在基站單板以及其它單板,如RNC單板。單板長期健康性參數和告警發生時記錄的異常信息,根據不同的單板的具體情況制定。同時,本發明的定時采集周期和緩存隊列長度可以通過軟件具體配置,具有較好的通用性和可擴展性。
權利要求
1.一種單板信息采集的方法,其特征在于,設置數據緩存隊列和告警信息緩存隊列,定時將單板運行時的長期健康性參數循環記錄到數據緩存隊列的各個數據存儲單元;當單板出現告警時,在延時一段時間后,將當前用于區分告警類型的告警標識以及數據緩存隊列中數據記錄到告警信息緩存隊列,其中,延時時間不超過數據緩存隊列最長可記錄的單板運行參數的時長。
2.根據權利要求1所述的方法,其特征在于,設置告警記錄,在所述的延時一段時間后,將當前告警標識以及告警產生時間記錄在告警記錄中;當單板出現告警時進一步搜索告警記錄,根據告警標識判斷該告警在預先設定的一段時間內是否產生過如果產生過,則不執行延時和記錄告警信息緩存隊列的操作;如果沒有產生過,則在延時后執行記錄告警信息緩存隊列的操作。
3.根據權利要求1或2所述的方法,其特征在于,在所述記錄告警標識之前進一步包括,根據單板產生告警時的告警參數確定該告警的告警標識。
4.根據權利要求2所述的方法,其特征在于,設置告警日志文件,該告警日志文件保存在閃速存儲器中,在執行記錄告警信息緩存隊列后,進一步將告警信息緩存隊列中的告警信息寫入閃速存儲器中的告警日志文件。
5.根據權利要求1所述的方法,其特征在于,在記錄告警信息緩存隊列之前,進一步判斷告警緩存隊列是否已滿如果已滿,則在刪除隊列中最先記錄的告警信息后執行記錄告警信息緩存隊列的操作;否則直接執行記錄告警信息緩存隊列操作。
6.根據權利要求1所述的方法,其特征在于,按照預先設定的周期,定時將數據緩存隊列中的數據寫入閃速存儲器文件。
7.根據權利要求1所述的方法,其特征在于,所述的數據緩存隊列為多級數據緩存隊列,當記錄到低一級數據緩存隊列的最后一個數據存儲單元時,將低一級數據緩存隊列的部分或者全部數據存儲單元中的數據記錄到高一級數據緩存隊列。
8.根據權利要求7所述的方法,其特征在于,所述的多級數據緩存隊列為4級數據緩存隊列,當執行記錄第一級數據緩存隊列最后一個數據存儲單元時,同時將記錄到第一級數據緩存隊列最后一個數據存儲單元的數據記錄到第二級數據緩存隊列;當執行到第二級數據緩存隊列的最后一個數據存儲單元時,同時將記錄到第二級數據緩存隊列最后一個數據存儲單元的數據記錄到第三級數據緩存隊列;當第3次執行到第三級數據緩存隊列最后一個數據存儲單元時,同時將當前第三級數據緩存隊列中全部數據記錄到第四級數據緩存隊列。
9.根據權利要求8所述的方法,其特征在于,所述的定時記錄是每秒鐘記錄一次,將每次的單板長期健康性參數記錄到數據緩存隊列的一個數據存儲單元中;所述的第一級數據緩存隊列有60個數據存儲單元,第二級數據緩存隊列有60個數據存儲單元,第三級數據緩存隊列有24個數據存儲單元,第四級數據緩存隊列有122×24個數據存儲單元。
10.根據權利要求1所述的方法,其特征在于,所述的單板運行時的長期健康性參數是和單板運行相關的中頻、射頻、溫度參數之一或兩個以上的組合。
全文摘要
本發明公開了一種單板信息采集的方法。本發明方法通過定時將單板運行時的長期健康性參數循環記錄到第一緩存隊列的各個數據存儲單元,并當單板出現告警時,在等待一段時間后將當前告警標識以及第一緩存隊列中數據記錄到告警信息緩存隊列。本發明方法采集單板運行時的相關數據,為單板運行狀況分析以及故障問題定位提供信息,從而提高單板運行的穩定性和可維護性。
文檔編號H04B17/00GK1905590SQ20061011576
公開日2007年1月31日 申請日期2006年8月16日 優先權日2006年8月16日
發明者范欽槐 申請人:華為技術有限公司