專利名稱:一種通訊鏈路故障的檢測及恢復(fù)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信系統(tǒng)中的鏈路故障的檢測及恢復(fù)方法。
技術(shù)背景在通訊系統(tǒng)設(shè)備中,穩(wěn)定可靠的板間通訊是通信設(shè)備正常工作的基礎(chǔ)之一。板間通訊異常的故障檢測, 一般有以下兩種方法①硬件電路檢測法。 通過硬件預(yù)先設(shè)計(jì)的維護(hù)電路,進(jìn)入調(diào)試狀態(tài),檢測故障。這種檢測方法, 需要硬件電路支持,增加了額外的硬件成本開銷。同時(shí)該方法適用于實(shí)驗(yàn)室 研究,對于工程中通訊故障的檢測,無能為力,整個(gè)檢測過程需要人工干預(yù)。 ②協(xié)議軟件或者應(yīng)用軟件診斷法。協(xié)議軟件或者應(yīng)用軟件定期發(fā)送鏈路探測 報(bào)文,在收到對等設(shè)備的協(xié)議或者應(yīng)用軟件回復(fù)的確認(rèn)報(bào)文后,即認(rèn)為通訊 鏈路是處于連通狀態(tài)。否則,則認(rèn)為通訊鏈路斷開。如專利號為CN1863094 的專利描述了一種鏈路故障診斷的技術(shù),該技術(shù)的缺點(diǎn)在于,它屬于實(shí)驗(yàn)室 診斷故障的方法,在工程應(yīng)用中需要定期發(fā)送檢測數(shù)據(jù)需要占用一定的總線 帶寬。該方法的缺點(diǎn)是速度慢,額外占用了通訊鏈路帶寬,增加了開銷。 同時(shí)還需要通訊對端設(shè)備軟件支持相應(yīng)的檢測功能。在鏈路故障恢復(fù)中,工 程中最常用的恢復(fù)方法是人工干預(yù)。通過設(shè)備維護(hù)人員來復(fù)位設(shè)備或者執(zhí) 行特定的操作,使通訊鏈路恢復(fù)正常工作。以上的4連路故障檢測方法中,具有一定的缺點(diǎn)。分析如下方法①對于 故障的檢測是被動的,它只對于定位故障有一定的積極意義,同時(shí)需要較高 成本來設(shè)計(jì)檢測電路。在工程應(yīng)用中,從成本角度考慮,這種維護(hù)電路一般 也是沒有的。方法②,對故障的檢測具有一定的主動性。但是它增加了數(shù)據(jù) 流量。為了盡可能少的增加流量,通常1秒或者若干時(shí)間才發(fā)送一個(gè)探測報(bào) 文,但是這樣導(dǎo)致有一定的延遲,效率低,還可能導(dǎo)致丟失數(shù)據(jù)。通過人工 干預(yù)的故障解決方法,在實(shí)際工程應(yīng)用中,不具有積極的意義。特別是對于
某些要求極其可靠的設(shè)備來說,這種方法是不能接受的。 發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問題是提供一種通信鏈路故障的檢測及恢復(fù)的方 法,能主動、快速地檢測出通信鏈路故障。本發(fā)明提供了一種通信鏈路故障的檢測及恢復(fù)的方法,包括 設(shè)置允許異常次數(shù)為大于或等于0的整數(shù);記錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù)與當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù),比較兩 者的差值,如該差值大于所述允許異常次數(shù),則判斷為出現(xiàn)故障;當(dāng)出現(xiàn)故障時(shí)進(jìn)行故障恢復(fù)處理。進(jìn)一步地,故障檢測前先定義發(fā)送幀數(shù)寄存器、發(fā)送幀數(shù)成功寄存器; 所述發(fā)送幀數(shù)寄存器用于紀(jì)錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù); 所述發(fā)送幀數(shù)成功寄存器用于紀(jì)錄當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù)。 進(jìn)一步地,故障檢測在每次發(fā)送數(shù)據(jù)幀前進(jìn)行。進(jìn)一步地,所述故障檢測是指計(jì)算發(fā)送幀數(shù)寄存器與發(fā)送幀數(shù)成功寄 存器的差值的絕對值,當(dāng)所述絕對值大于允許異常次數(shù)時(shí)認(rèn)為硬件設(shè)備出現(xiàn) 故障,并記錄連續(xù)異常次數(shù);否則,繼續(xù)進(jìn)行正常的數(shù)據(jù)發(fā)送流程,發(fā)送幀 數(shù)寄存器的值加一,如發(fā)送成功,發(fā)送幀數(shù)成功寄存器的值加一,連續(xù)異常 次數(shù)置0,并進(jìn)行下一次數(shù)據(jù)幀發(fā)送,否則,保存發(fā)送幀數(shù)成功寄存器的值 及連續(xù)異常次數(shù),進(jìn)行下一次數(shù)據(jù)幀發(fā)送。進(jìn)一步地,設(shè)置最大連續(xù)異常次數(shù);所述故障恢復(fù)具體是指,讀取連續(xù)異常次數(shù),若所述連續(xù)異常次lt小于 最大連續(xù)異常次數(shù)則執(zhí)行如下操作(a) 連續(xù)異常次數(shù)加一并關(guān)閉異常通信設(shè)備;(b) 打開異常通信設(shè)備,將發(fā)送幀數(shù)寄存器及發(fā)送幀數(shù)成功寄存器的值 置O,保存當(dāng)前連續(xù)異常次數(shù),并進(jìn)行下一次數(shù)據(jù)幀發(fā)送;若連續(xù)異常次數(shù)等于最大連續(xù)異常次數(shù)則上報(bào)告警信息,等待人工干預(yù)。進(jìn)一步地,設(shè)置異常次數(shù)寄存器用于記錄連續(xù)異常次數(shù)的值。綜上所述,本發(fā)明提供的一種通信鏈路故障的檢測及恢復(fù)的方法,能夠 主動、快速檢測到設(shè)備內(nèi)部通訊鏈路的工作狀態(tài)。當(dāng)設(shè)備工作狀態(tài)異常的時(shí) 候,通過通訊設(shè)備自復(fù)位的方法來使設(shè)備恢復(fù)正常的通訊工作狀態(tài);當(dāng)設(shè)備 不能自我修復(fù)故障的時(shí)候,通過告警的方式,請求人工干預(yù)。
圖1是本發(fā)明通訊鏈路故障檢測及恢復(fù)的操作流程圖。
具體實(shí)施方式
下面將結(jié)合附圖及實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行更詳細(xì)的說明。本實(shí)施例涉及一種通信鏈路故障的檢測及恢復(fù)的方法,首先定義以下的寄存器和變量發(fā)送幀數(shù)寄存器Rl:用于紀(jì)錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù),每發(fā)送一個(gè) 數(shù)據(jù)幀,計(jì)數(shù)器加一;Rl的計(jì)數(shù)用rl表示,其初始值設(shè)為0。發(fā)送幀數(shù)成功寄存器R2:用于紀(jì)錄當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù),每 次硬件成功發(fā)送一幀數(shù)據(jù)后,計(jì)數(shù)器加一;R2的計(jì)數(shù)用r2表示,其初始值 設(shè)為0。異常次數(shù)寄存器R3:用于紀(jì)錄前系統(tǒng)中連續(xù)異常次數(shù),R3的計(jì)數(shù)用r3 表示,其初始值設(shè)為0。允許異常次數(shù)N0: N0為大于或等于0的整數(shù),用來判斷硬件設(shè)備是否 出現(xiàn)異常,當(dāng)lrl-r2l小于或等于N0時(shí)認(rèn)為硬件設(shè)備未出現(xiàn)異常,當(dāng)M-r2l大 于NO時(shí)認(rèn)為硬件設(shè)備出現(xiàn)異常,進(jìn)行故障恢復(fù)處理。最大連續(xù)異常次數(shù)Nl:當(dāng)連續(xù)異常次數(shù)r3等于N1的時(shí)候,認(rèn)為故障 無法完成自我恢復(fù),上報(bào)告警信息,等待人工千預(yù)。
如圖1所示,本實(shí)施例的通訊鏈路故障的檢測及恢復(fù)方法包括以下步驟步驟110,發(fā)送數(shù)據(jù)。每次發(fā)送數(shù)據(jù)幀前先進(jìn)行故障檢測,判斷l(xiāng)rl-r21 是否小于或等于NO,如果是,執(zhí)行120,否則,執(zhí)行160;以上在進(jìn)行故障檢測時(shí),是對發(fā)送幀數(shù)寄存器R1中的計(jì)數(shù)rl和發(fā)送幀 數(shù)成功寄存器R2中的計(jì)數(shù)r2進(jìn)行作差計(jì)算。由于當(dāng)前硬件計(jì)算速度遠(yuǎn)遠(yuǎn)高 于軟件的運(yùn)算速度,所以在作差之后,理論上應(yīng)該是rl-r2的值為0。但是 為了避免偶然的錯(cuò)誤,我們可以定義允許異常次數(shù)NO,本實(shí)施例中設(shè)NO 為6,當(dāng)lrl-r2l小于或等于6時(shí)認(rèn)為硬件設(shè)備未出現(xiàn)異常。步驟120,更新發(fā)送幀數(shù)寄存器R1,即rl加一,繼續(xù)進(jìn)行正常的數(shù)據(jù) 發(fā)送流程;步驟130,判斷是否發(fā)送成功,是則執(zhí)行步驟140,否則執(zhí)行步驟150;步驟140,更新發(fā)送幀數(shù)成功寄存器R2,即r2加一,并將r3置0,返 回步驟110;步驟150,保存當(dāng)前r2及r3的值,返回步驟110;步驟160,將待發(fā)數(shù)據(jù)加入到發(fā)送數(shù)據(jù)緩沖隊(duì)列,并查詢連續(xù)異常次數(shù) 寄存器R3的值r3,若r3<Nl則執(zhí)行步驟170,否則執(zhí)行190;步驟170, r3加一,并關(guān)閉異常通信設(shè)備,執(zhí)行步驟180;步驟180,重新打開異常通信設(shè)備,將rl及r2的值均置0,保存當(dāng)前 r3的值,并檢查發(fā)送緩沖隊(duì)列,如果存在待發(fā)送數(shù)據(jù),則依次發(fā)送緩沖隊(duì)列 中的數(shù)據(jù),執(zhí)行步驟110。步驟l卯,上報(bào)告警信息,通知網(wǎng)管,等待人工干預(yù),結(jié)束。
權(quán)利要求
1、 一種通信鏈路故障的檢測及恢復(fù)的方法,包括 設(shè)置允許異常次數(shù)為大于或等于0的整數(shù);記錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù)與當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù),比較兩 者的差值,如該差值大于所述允許異常次數(shù),則判斷為出現(xiàn)故障;當(dāng)出現(xiàn)故障時(shí)進(jìn)行故障恢復(fù)處理。
2、 如權(quán)利要求l所述的方法,其特征在于 故障檢測前先定義發(fā)送幀數(shù)寄存器、發(fā)送幀數(shù)成功寄存器; 所述發(fā)送幀數(shù)寄存器用于紀(jì)錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù); 所述發(fā)送幀數(shù)成功寄存器用于紀(jì)錄當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù)。
3、 如權(quán)利要求1所述的方法,其特征在于故障檢測在每次發(fā)送數(shù)據(jù) 幀前進(jìn)行。
4、 如權(quán)利要求2所述的方法,其特征在于所述故障檢測是指計(jì)算發(fā)送幀數(shù)寄存器與發(fā)送幀數(shù)成功寄存器的差值 的絕對值,當(dāng)所述絕對值大于允許異常次數(shù)時(shí)認(rèn)為硬件設(shè)備出現(xiàn)故障,并記 錄連續(xù)異常次數(shù);否則,繼續(xù)進(jìn)行正常的數(shù)據(jù)發(fā)送流程,發(fā)送幀數(shù)寄存器的 值加一,如發(fā)送成功,發(fā)送幀數(shù)成功寄存器的值加一,連續(xù)異常次數(shù)置O, 并進(jìn)行下一次數(shù)據(jù)幀發(fā)送,否則,保存發(fā)送幀數(shù)成功寄存器的值及連續(xù)異常 次數(shù),進(jìn)行下一次數(shù)據(jù)幀發(fā)送。
5、 如權(quán)利要求4所述的方法,其特征在于設(shè)置最大連續(xù)異常次數(shù);所述故障恢復(fù)具體是指,讀取連續(xù)異常次數(shù),若所述連續(xù)異常次數(shù)小于 最大連續(xù)異常次數(shù)則執(zhí)行如下操作(a) 連續(xù)異常次數(shù)加一并關(guān)閉異常通信設(shè)備;(b) 打開異常通信設(shè)備,將發(fā)送幀數(shù)寄存器及發(fā)送幀數(shù)成功寄存器的值 置0,保存當(dāng)前連續(xù)異常次數(shù),并進(jìn)行下一次數(shù)據(jù)幀發(fā)送;若連續(xù)異常次數(shù)等于最大連續(xù)異常次數(shù)則上報(bào)告警信息,等待人工干
6、如權(quán)利要求5所述的方法,其特征在于設(shè)置異常次數(shù)寄存器用于 記錄連續(xù)異常次數(shù)的值。
全文摘要
本發(fā)明提供了一種通信鏈路故障的檢測及恢復(fù)的方法,包括設(shè)置允許異常次數(shù)為大于或等于0的整數(shù);記錄當(dāng)前已經(jīng)發(fā)送的數(shù)據(jù)幀數(shù)與當(dāng)前已經(jīng)成功發(fā)送的數(shù)據(jù)幀數(shù),比較兩者的差值,如該差值大于所述允許異常次數(shù),則判斷為出現(xiàn)故障;當(dāng)出現(xiàn)故障時(shí)進(jìn)行故障恢復(fù)處理。采用本發(fā)明的技術(shù)方案能夠主動、快速檢測到設(shè)備內(nèi)部通訊鏈路的工作狀態(tài)。當(dāng)設(shè)備工作狀態(tài)異常的時(shí)候,通過通訊設(shè)備自復(fù)位的方法來使設(shè)備恢復(fù)正常的通訊工作狀態(tài);當(dāng)設(shè)備不能自我修復(fù)故障的時(shí)候,通過告警的方式,請求人工干預(yù)。
文檔編號H04L12/26GK101145988SQ200710129488
公開日2008年3月19日 申請日期2007年7月19日 優(yōu)先權(quán)日2007年7月19日
發(fā)明者鄧華利, 魏小強(qiáng) 申請人:中興通訊股份有限公司