基于數據流的確定性網絡完整性故障檢測方法
【技術領域】
[0001] 本發明屬于網絡可靠性和網絡故障診斷技術領域,具體涉及確定性網絡故障檢測 方法,采用基于數據傳輸流的故障定位方法。
【背景技術】
[0002] 確定性網絡被用于工業控制、航空機載網絡和軍事通信等具有特定應用的領域, 通過確定的網絡拓撲和協議配置完成確定流向的數據傳輸,達到數據和資源互聯互通的目 的。然而,隨著所使用網絡技術的日漸成熟和網絡數據的規模化,隨著確定性網絡綜合程度 的不斷提高,信息傳輸需求進一步寬帶化和多樣化。比如目前大型飛機新的應用功能(例 如大屏幕顯示、數字地圖、空地數據鏈等)對網絡數據傳輸的能力提出了更高的要求。因 此,確定性網絡的完整性問題也越來越受到關注。
[0003] 傳統上,"網絡"通常不被認為是一個專用系統,其故障檢測分析通常是將軟、硬件 分離開來,而將整個網絡當作一個整體檢測對象從數據、尋址、次序和時間等四類完整性故 障的研究尚欠缺。從故障檢測方法的角度來講,一方面,目前雖然有對組成網絡設備的完整 性管理技術,缺乏把"網絡"作為一個產品、一個整體系統單獨進行完整性管理的有效技術 手段,另一方面,目前傳統的基于圖論的可靠性分析方法主要包括:可靠性框圖、故障樹分 析法和狀態轉移鏈法,這些方法對于單個設備的完整性分析有一定效果,可是對于整網的 完整性分析無法有效進行,而且用傳統圖論的分析方法進行故障檢測時,需要假設各設備 間相互獨立,但網絡中這一假設顯然不能成立,比如某個交換機發生故障而選擇其他路徑, 那么可能導致相鄰設備的數據量突發而引發故障;另一方面,由于確定性網絡對互聯互通 的高可靠性和完整性需求,使得網絡互連的運行需硬件、軟件和邏輯的緊密協調與配合,兩 者的故障機理又全然不同,這使得當前流行的網絡演算方法等可靠性定量解析計算方法不 能解決整網完整性的問題;
[0004] 因此,針對確定性網絡的完整性問題的故障檢測的問題,現有方法無法對確定性 網絡完整性進行有效地故障檢測,急需一種具有工程操作性的故障檢測方法。
[0005] 經檢索,沒有發現與本發明構思完全相同的方法報道。
【發明內容】
[0006] 針對現有技術概況,本發明的目的在于:提出一種基于數據流的確定性網絡完整 性的故障檢測方法。該方法工程實踐性強,易于操作。
[0007] 現將本發明構思及技術解決方案敘述如下:
[0008] 本發明的構思是,針對確定性網絡的四類完整性中的隨機性和不確定性問題,以 數據流為分析對象,提取出故障模式、故障原因與故障影響的關系,并通過故障樹進行定性 和定量分析系統的薄弱環節。
[0009] 本發明的技術解決方案如下:
[0010] 完整性是考察網絡服務質量的一個重要指標,相關概念來源于國際電信聯盟遠程 通信標準化組織關于服務質量的ITU-TE. 8002008標準和ARINC(航空無線電通信公司AeronauticalRadio,Inc)制定的664系列標準。對于確定性網絡,應考慮以下四類完整 性:
[0011] 定義一數據完整性:指網絡中端到端的比特完整性。
[0012] 定義二源完整性:指數據從源端口發送到正確的目的端口。網絡必須通過保證數 據傳送至正確的目的端口以防止高完整性應用接收低完整性應用的數據。
[0013] 定義三次序完整性:指網絡中通過給數據添加階段時間戳或序列號標志數據信息 的順序,并按次序傳輸數據流,數據幀到達接收端后,按照序列號次序進行接收,以此機制 來保證網絡的次序完整性。
[0014] 定義四時間完整性:指數據幀的第一個位從源端開始發出到整個報文完全到達目 的端所經歷的時間小于給定傳輸時間閾值。如果大于閾值則為時間完整性錯誤,即時延過 大。
[0015] 針對以上四類完整性問題和確定性網絡的故障特點,針對軟硬件故障高度耦合的 故障特點,本發明提出了一種新型的基于數據流的故障檢測方法。
[0016] 本發明提供的一種新型的基于數據流的確定性網絡完整性故障檢測的方法,流程 參見圖1。本方法包括如下步驟:
[0017] 步驟1 :建立基于數據流的確定性網絡傳輸模型,并進行模型簡化;從網絡拓撲結 構和特定確定性協議的角度,深入分析網絡特征,建立數據流結構模型,并簡化為三元組 Net(t) = {S(t),T(t),R(t)},Net(t)為確定性網絡的某次傳輸的模型,S(t)為某數據傳送 時隙內的發送元組,T(t)為某數據傳送時隙內的交換元組,R(t)為某數據傳送時隙內的接 收元組;
[0018] 步驟2:確定數據、源、次序和時間四類完整性的內涵,并明確根據它們的故障特 征分析優先級關系;
[0019] 步驟3:根據用戶要求的粒度,針對確定性網絡整網完整性進行故障模式影響分 析。明確故障模式、故障原因和故障影響的對應關系,其中故障影響對應于局部影響、高一 層次影響和最終影響,填寫故障模式分析(FailureModelandEffectsAnalysis,簡稱為 FMEA)表;
[0020] 步驟4 :基于數據流的確定性網絡整網完整性故障樹分析。
[0021] 步驟4. 1基于數據流的故障模式分析建立基于四類完整性的故障樹;
[0022] 步驟4. 2分析硬件故障和軟件故障(包括邏輯故障和配置信息故障)等底層事件 發生概率的求解方法;
[0023] 步驟4. 3定性分析,求出最小割集,所述最小割集是指頂事件發生的原因組合;
[0024] 步驟4. 4按照軟、硬件故障概率數值,進行定量分析,即求出頂事件的發生概率和 底事件重要度等關鍵數據;
[0025] 步驟4. 4. 1頂事件發生概率:設故障樹由k個最小割集& (1 <i<k)
[0026]
[0027] 其中,Fs是系統不可靠度,P(T)為頂事件發生概率,P〇g最小割集的發生概率;
[0028] 步驟4. 4. 2底事件重要度: Cr
[0029] 第i個事件的概率重要度:g( &ι即概率重要度是底事件發生概率變化 引起頂事件發生概率的變化程度,Fi為i個事件的概率;
[0030] 第i個事件的關鍵重要度即關鍵重要度是底事件i故障概率的變化率與 它引起頂事件發生概率變化率之比,Fi為i個事件的概率;
[0031] 步驟5:查找系統的薄弱環節,并提出故障檢測意見。
[0032] 本發明的優點與積極效果在于:
[0033] (1)首次使用四個"完整性"概念對確定性網絡進行了詳細分析。對四類完整性進 行了明確的定義,并對定義的實際內涵進一步深入挖掘,提供了一種對于確定性網絡產品 的設計、評估和故障檢測的方法。
[0034] (2)采用了依據整網數據傳輸過程進行分析方法。在傳統的故障模式分析和故障 樹分析中,系統一般被簡化為各網絡元素的簡單串并聯模型,并且假設系統只有故障與工 作兩種狀態。然而,實際中由于涉及到數據的傳輸與交換,并且傳輸與交換要滿足實時、正 確、完整等一系列性能方面的要求,因此本發明采用基于數據傳輸過程的整網故障檢測方 法。
[0035] (3)綜合考慮硬件故障、邏輯故障與配置信息故障。確定性網絡中由于部分硬件相 應功能的實現需要軟件支持,交換機、端系統存在大量的配置信息需要輸入,比如緩沖區大 小設置,且用戶對網絡服務性能方面要求較高,因此本方法除了對硬件故障進行了詳細分 析,還綜合考慮軟件故障、配置不合理對整網數據傳輸造成的影響。
【附圖說明】
[0036] 圖1是本發明基于數據流的確定性網絡完整性故障檢測方法流程示意圖;
[0037] 圖2是本發明示例網絡的結構圖;
[0038] 圖3是本發明示例協議保障的數據傳輸圖;
[0039] 圖4是本發明示例的整網端到端傳輸模型圖;
[0040] 圖5是本發明示例的整網的完整性功能結構圖;
[0041] 圖6是本發明示例中的總故障樹;
[0042] 圖7是本發明示例中的終端系統失效故障樹;
[0043] 圖8是本發明示例中的終端系統工作異常故障樹;
[0044] 圖9是本發明示例中的終端系統傳輸數據異常故障樹。
【具體實施方式】
[0045] 下面將結合附圖和實施例對本發明作進一步的詳細說明。
[0046]航空電子全雙工交換式以太網(AvionicsFullDuplexSwitchedEthernet,以下 簡稱為AFDX)是一種確定性的機載數據網絡,同時具有通道冗余、可擴展性、次序完整性、 容錯性等特點。其組成部分主要包括AFDX端系統(EndSystem,以下簡稱為ES),AFDX交 換機以及傳輸信道。圖2所示為AFDX網絡結構圖。AFDX交換機的主要功能包含:過濾、管 制、監視、交換,這些功能均由靜態配置表中的配置數據控制。以AFDX網絡的數據完整性為 例,實施整個故障檢測示例:
[0047] 步驟1根據AFDX網絡的數據流建立傳輸模型,并進行模型簡化
[0048] 根據協議分析AFDX網絡整網的數據傳輸過程,如圖3所示,按照Arinc664協議, 從發送端到接收端的數據傳送具體的協議層為:AFDX發送端口-傳輸層-鏈路層-物理 層-鏈路層-傳輸層-AFDX接收端口,在圖3中對每一層次的基本功能和故障進行了分析。 以為了便于對AFDX整網的故障進行檢測,提取出傳輸路徑的數據流,通過每條數據流的虛 擬鏈路來簡化模型,建立端端傳輸模型,發送端是發送ES,中轉設備為交換機Switch,接收 端為接收ES,如圖4所示。
[0049] 步驟2確定AFDX網絡四類完整性的優先次序
[0050] 步驟2. 1分析AFDX網絡的完整性功能結構
[0051] 圖5所7K為AFDX網絡的完整性功能結構圖,梳理出每一種完整性所對應的設備的 功能。
[0052] 步驟2. 2確定四類完整性的優先次序為源完整性、時間完整性、次序完整性、數據 完整性。分析方法如下:
[0053] 步驟2. 2. 1如果數據發送到錯誤端口,即源完整性錯誤,則數據對于此接收端口 失去意義,所以源完整性優先判斷;
[0054] 步驟2. 2. 2時延是一個動態累計過程,時延過大影響時間完整性的數據,按照網 絡冗余管理算法會影響接收端對數據幀的按次序接收,所以次序完整性優先于時間完整 性;
[0055] 步驟2. 2. 1對于符合三個完整性的數據幀,最后進行數據完整性的判斷;
[0056] 步驟3根據用戶要求的粒度,針對確定性網絡整網完整性故障模式影響分析
[0057] 以終端系統為例,按照如下步驟進AFDX整網的故障模式分析:
[0058] 步驟3. 1明確分析對象類型和每一類器件所對應的故障模式
[0059] 基于功能結構圖,分析終端系統的器件類型為:
[0060] 類型一、具備數據存儲功能的存儲器件,包括Flash、可編程存儲器(Programmab