專利名稱:一種快速通道互連鏈路監控方法和設備及系統的制作方法
技術領域:
本發明實施例涉及計算機技術領域,尤其涉及一種快速通道互連鏈路監控方法和設備及系統。
背景技術:
在容錯計算機的小型機項目中,小型機核心技術就是中央處理器(CPU,Central Processing Unit)之間的互連架構,而互連架構的穩定性重點取決于快速通道互連(QPI, Quick Path Interconnect)信號的完整性。為了測試QPI信號的完整性,現有技術中采用定量測試QPI信號完整性(Si, Signal Integrality)的方法,通過英特爾 Gntel)QPI 負載檢測板 0)LB,QPI Load Board) 配合示波器以及英特爾快速通道監測工具套件(QTK,QuickPath Tool Kit)和sigtest等軟件來測試QPI信號的信號完整性,首先由QLB檢測出QPI信號傳輸到示波器,然后示波器輸出波形文件到計算機中運行的sigtest軟件,最后由sigtest軟件將測試結果輸出。但是,現有的測試方案需要單獨的測試設備(如負載檢測板和示波器)和單獨的測試軟件(如QTK和sigtest)才能進行測試,所需的測試成本較高,且操作起來也較復雜。
發明內容
本發明實施例提供了一種快速通道互連鏈路監控方法和設備及系統,能夠以較低的測試成本實現對QPI鏈路的監控,操作簡單。本發明實施例提供的一種快速通道互連鏈路監控方法,包括快速通道互連鏈路監控設備獲取待測系統SUT的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;所述快速通道互連鏈路監控設備判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,所述快速通道互連鏈路監控設備將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過所述預置的循環冗余碼校驗誤碼閾值,所述快速通道互連鏈路監控設備判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;所述快速通道互連鏈路監控設備將所述第二判斷結果和所述路由表信息映射為第二圖形化界面,所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。本發明實施例提供的一種快速通道互連鏈路監控設備,包括
7
獲取單元,用于獲取待測系統SUT的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;第一判斷單元,用于判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;第一映射單元,用于當所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值時,將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;第二判斷單元,用于當所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值時,判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;第二映射單元,用于將所述第二判斷結果和所述路由表信息映射為第二圖形化界面,所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。本發明實施例提供的一種快速通道互連鏈路監控系統,包括待測系統SUT、能夠顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態的快速通道互連鏈路監控設備,其中,所述快速通道互連鏈路監控設備,用于獲取所述待測系統的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過所述預置的循環冗余碼校驗誤碼閾值,判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;將所述第二判斷結果和所述路由表信息映射為第二圖形化界面,所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。從以上技術方案可以看出,本發明實施例具有以下優點在本發明實施例中,快速通道互連鏈路監控設備獲取到待測系統的循環冗余碼校驗誤碼信息和路由表信息之后,快速通道互連鏈路監控設備在循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值的情況下將第一判斷結果和路由表信息映射為第一圖形化界面,在循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值的情況下,通過判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值得到第二判斷結果,將第二判斷結果和路由表信息映射為第二圖形化界面。通過第一圖形化界面或者第二圖形化界面用戶能夠直觀的查看到整個待測系統的QPI鏈路連接狀態。本發明實施例中獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息可以由一個軟件裝置(即本發明實施例中的快速通道互連鏈路監控設備)即可獲取得到,不需要增加單獨的測試設備(例如不需要增加負載檢測板)去實現,另外該快速通道互連鏈路監控設備由第一判斷結果或第二判斷結果結合路由表信息就能映射得到圖形化界面,也不需要單獨的測試設備(即不需要增加示波器)轉化為波形文件輸出到一個測試軟件sigtest。本發明實施例可以通過圖形化界面就能夠實時的顯示QPI鏈路連接狀態,從而能夠降低測試成本,且操作過程簡單容易實現。
圖1為本發明實施例提供的快速通道互連鏈路監控方法一個實施例的示意圖;圖2為本發明實施例提供的快速通道互連鏈路監控方法的系統組網圖;圖3為本發明實施例提供的快速通道互連鏈路監控方法另一個實施例的示意圖;圖4為本發明實施例提供的快速通道互連鏈路實現實時監控的示意圖;圖5為本發明實施例提供的快速通道互連鏈路監控設備一個實施例示意圖。
具體實施例方式本發明實施例提供了一種快速通道互連鏈路監控方法和設備及系統,能夠以較低的測試成本實現對QPI鏈路的監控,操作簡單。為使得本發明的發明目的、特征、優點能夠更加的明顯和易懂,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,下面所描述的實施例僅僅是本發明一部分實施例,而非全部實施例。基于本發明中的實施例,本領域的技術人員所獲得的所有其他實施例,都屬于本發明保護的范圍。本發明實施例中,實現該快速通道互連鏈路監控方法的動作主體是快速通道互連鏈路監控設備,在實際應用中,快速通道互連鏈路監控設備具體可以是集成在一種單板管理者(OA,OnBoard Administrator)管理軟件上實現,用戶可以使用普通個人電腦(PC, Personal Computer)控制機通過網絡訪問單板管理者管理軟件實現對快速通道互連鏈路的實時監控。快速通道互連鏈路監控設備也可以是一種獨立的設備按照軟件控制硬件的方式安裝在單板管理者服務器上,用戶可以使用普通PC控制機通過快速通道互連鏈路監控設備實現對快速通道互連鏈路的實時監控。快速通道互連鏈路監控設備也可以是一種獨立的設備按照軟件控制硬件的方式安裝在普通PC控制機上實現。具體實現方式此處不作限定。需要說明的是,本發明實施例提供的快速通道互連鏈路監控設備在一個快速通道互連鏈路監控系統內執行。該監控系統的系具體可以包括快速通道互連鏈路監控設備、普通PC控制機、單板管理者服務器、待測系統、交換機。其中,普通PC控制機通過交換機以網絡連接的方式訪問OA服務器。請參閱圖1,本發明實施例提供的快速通道互連鏈路監控方法一個實施例包括101、快速通道互連鏈路監控設備獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息。其中,循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數。在本發明實施例中,為了能夠實現對待測系統(SUT,System Under Test)的監控,快速通道互連鏈路監控設備(以下將快速通道互連鏈路監控設備簡稱為QPI鏈路監控設備)獲取SUT的循環冗余碼校驗(CRC,Cyclic Redundancy Check)誤碼信息和路由表信
肩、ο在本發明實施例中,待測系統是QPI鏈路監控設備需要監控的節點的集合。其中, 待測系統包括一個主節點和多個節點,在監控系統上電時,待測系統中的主節點和每一個節點的中央處理器(CPU,Central Processing Unit)都會主動的和本地鏈路中的其它節點建立連接,在握手成功后,它們之間會交換鏈路層參數,主節點和每一個節點都會得到其它節點的插槽(socket)信息和端口信息以及傳輸速率等。此時,主節點和每一個節點的CPU 進入等待狀態。待測系統中的主節點的CPU將建立一路由表然后存儲該路由表信息,路由表用于記錄待測系統中的所有節點(其中所有節點包括主節點和每一個節點)的路由信息。在實際應用中,主節點的CPU具體可以通過廣度優先搜索算法發現所有在網的插槽來實現建立路由表。需要說明的是,本發明實施例中的CRC誤碼信息包括CRC誤碼次數和QPI鏈路重傳次數。其中,在QPI鏈路傳輸數據時,若鏈路層發現CRC誤碼之后,待測系統中的CPU誤碼次數寄存器會記錄下CRC誤碼次數。當鏈路層發現CRC誤碼之后QPI鏈路會嘗試自愈, 對數據進行重傳,待測系統中的QPI鏈路重傳次數寄存器會記錄下QPI鏈路重傳次數。在本發明實施例中,QPI鏈路監控設備能夠獲取SUT的CRC誤碼信息和路由表信息存在多種實現方式。其中一種實現方式為QPI鏈路監控設備通過與自身連接的OA服務器獲取待測系統的CRC誤碼信息和路由表信息。其中,OA服務器能夠獲取到待測系統的CRC誤碼信息和路由表信息具體可以通過如下方式實現0A服務器通過智能平臺管理接口(IPMI,Intelligent Platform Management Interface)從待測系統的單板管理控制器 (BMC,Boardbase Management Controller)獲取到CRC誤碼信息和路由表信息。待測系統的BMC和OA服務器之間信息傳遞通過IPMI來實現,待測系統的BMC通過IMPI向OA服務器傳遞CRC誤碼信息和路由表信息。需要說明的是,在本發明實施例中,待測系統的BMC獲取路由表信息具體可以采用如下方式首先由待測系統的主節點在待測系統的所有節點之間交換鏈路層參數之后建立待測系統的路由表信息。然后,待測系統的BMC從該主節點處獲取到路由表信息。其中, 待測系統的BMC從該主節點處獲取到路由表信息具體可以采用多種實現方式,一種可實現的方式是主節點的基本輸入輸出系統(BI0S,Basic Input Output System)通過鍵盤控制器規格接口(KCS,Keyboard Controller Style Interface)向待測系統的BMC發送路由表信息,則待測系統的BMC可以通過該KCS接收到主節點的BIOS發送的路由表信息。另一種可實現的方式是待測系統的BMC通過系統管理總線(SMBUS,System Management Bus)讀取主節點的CPU相關寄存器并解析出路由表信息。其中,CPU相關寄存器指的是主節點的 CPU所包括的12個QPI端口中每個QPI端口所包括的3個寄存器,3個寄存器分別是路由表配置寄存器(Router Table Configuration Register)、路由讀取寄存器(Router Read Register)、路由寫入寄存器(Router Write Register)。需要說明的是,在本發明實施例中,待測系統的BMC獲取CRC誤碼信息具體可以采用如下方式待測系統的BMC通過系統管理總線讀取待測系統的節點的CRC誤碼信息。本發明實施例中的CRC誤碼信息包括CRC誤碼次數和QPI鏈路重傳次數。
102、快速通道互連鏈路監控設備判斷循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果。若第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值,觸發操作103執行,若第一判斷結果為循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值,觸發操作104執行。在本發明實施例中,當QPI鏈路監控設備獲取到待測系統的CRC誤碼信息和路由表信息之后,QPI鏈路監控設備判斷CRC誤碼次數是否超過預置的CRC誤碼閾值,得到第一判斷結果。其中,第一判斷結果表示的是QPI鏈路監控設備獲取到的CRC誤碼次數與預置的CRC誤碼閾值的數值關系。當第一判斷結果為CRC誤碼次數超過了 CRC誤碼閾值時表示 QPI鏈路存在異常,QPI鏈路監控設備觸發操作103執行,當第一判斷結果為CRC誤碼次數沒有超過CRC誤碼閾值時,QPI鏈路監控設備觸發操作104執行。需要說明的是,CRC誤碼閾值的設定可以根據具體的應用場景而預先設定,例如可以根據用戶的實際需要將CRC誤碼閾值設定的小一些,當然也可以將CRC誤碼閾值設定的大一些,但不能超過CPU誤碼次數寄存器的溢出值。103、快速通道互連鏈路監控設備將第一判斷結果和路由表信息映射為第一圖形化界面。其中,第一圖形化界面用于根據第一判斷結果和路由表信息顯示待測系統的節點之間的快速通道互連鏈路連接狀態。在實際應用中,一種可實現的實現方式是,快速通道互連鏈路監控設備將第一判斷結果和路由表信息映射為第一圖形化界面具體可以包括如下操作Al、快速通道互連鏈路監控設備從路由表信息中解析出待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系。快速通道互連鏈路監控設備通過路由表信息,可以得出待測系統中的所有節點之間的拓撲結構關系,如每一個節點都與哪些節點相連,進而可以得到全部節點之間的拓撲結構關系。A2、快速通道互連鏈路監控設備根據第一判斷結果獲取到待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障。快速通道互連鏈路監控設備從第一判斷結果中可以得到循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,若超過,則認為存在鏈路故障,若沒有超過, 則認為不存在鏈路故障。A3、快速通道互連鏈路監控設備將節點之間存在鏈路故障的鏈路顯示在該拓撲結構關系上,得到第一圖形化界面。快速通道互連鏈路監控設備在每一個節點和待測系統中其它節點之間的拓撲結構關系上顯示節點之間存在鏈路故障的鏈路,就可以得到第一圖形化界面。例如,快速通道互連鏈路監控設備可以通過分析函數將各節點之間的拓撲結構關系和CRC誤碼信息通過數據分析并形成標準的可擴展標記語言(XML,Extensible Markup Language)數據,然后通過Jav必cript函數繪制成動態矢量圖,得到第一圖形化界面。普通 PC控制機可以瀏覽器訪問該第一圖形化界面,在瀏覽器端可以實現定時刷新頁面以獲取最新的QPI鏈路連接狀態,也可以通過按鈕手動刷新來獲取最新的QPI鏈路連接狀況。需要說明的是,在本發明實施例中的操作103中,一種實現方式是,QPI鏈路監控設備通過該第一圖形化界面顯示異常的快速通道互連鏈路。
當QPI鏈路監控設備通過該第一圖形化界面顯示異常的QPI鏈路時,本發明實施例還可以包括如下可選實現方式QPI鏈路監控設備對異常的QPI鏈路上的異常節點進行隔離,并跳回操作102開始執行102及其后續的操作步驟。若第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值,本發明實施例還可以包括如下實現方式快速通道互連鏈路監控設備觸發第一報警。在本發明實施例中,QPI鏈路監控設備觸發第一報警方式可以有多種,例如,向用戶發送郵件、 向用戶發送手機短信、在QPI鏈路監控設備上顯示某種特殊文件(如彈出警告框、播放某種音頻文件、播放某種視頻文件)等。只要是用于向用戶顯示QPI鏈路異常的報警方式都可以作為第一報警的方式由快速通道互連鏈路監控設備觸發。在本發明實施例中,QPI鏈路監控設備在101中獲取到CRC誤碼信息和路由表信息、在102得到第一判斷結果、在103中QPI鏈路監控設備可以將第一判斷結果和路由表信息映射為第一圖形化界面。在該圖形化界面上,可以實時的顯示QPI鏈路的連接狀態,QPI 鏈路監控設備可以隨時通過第一圖形化界面得到QPI鏈路的連接狀態,用戶可以使用普通 PC控制機訪問QPI鏈路監控設備實時查看QPI鏈路的連接狀態。104、快速通道互連鏈路監控設備判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果,然后觸發105執行。在本發明實施例中,QPI鏈路監控設備可以判斷QPI鏈路重傳次數是否超過預置的QPI鏈路重傳閾值,得到第二判斷結果。其中,第二判斷結果表示的是QPI鏈路監控設備獲取到的QPI鏈路重傳次數與預置的QPI鏈路重傳閾值的數值關系。當第二判斷結果為 QPI鏈路重傳次數超過了預置的QPI鏈路重傳閾值時表示QPI鏈路存在異常。當第二判斷結果為QPI鏈路重傳次數沒有超過預置的QPI鏈路重傳閾值時表示QPI鏈路沒有異常。需要說明的是,QPI鏈路重傳閾值的設定可以根據具體的應用場景而預先設定,例如可以根據用戶的實際需要將QPI鏈路重傳閾值設定的小一些,當然也可以將QPI鏈路重傳閾值設定的大一些,但不能超過QPI鏈路重傳次數寄存器的溢出值。105、快速通道互連鏈路監控設備將第二判斷結果和路由表信息映射為第二圖形化界面。其中,第二圖形化界面用于根據第二判斷結果和路由表信息顯示待測系統的節點之間的快速通道互連鏈路連接狀態。在本發明實施例中,QPI鏈路監控設備可以將第二判斷結果和路由表信息映射為第二圖形化界面。在該第二圖形化界面上,可以實時的顯示QPI鏈路的連接狀態,QPI鏈路監控設備可以隨時通過圖形化界面得到QPI鏈路的連接狀態,用戶可以使用普通PC控制機訪問QPI鏈路監控設備實時查看QPI鏈路的連接狀態。在實際應用中,一種可選的實現方式是,快速通道互連鏈路監控設備將第二判斷結果和路由表信息映射為第二圖形化界面具體可以包括如下操作Bi、快速通道互連鏈路監控設備從路由表信息中解析出待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系。快速通道互連鏈路監控設備通過路由表信息,可以得出待測系統中的所有節點之間的拓撲結構關系,如每一個節點都與哪些節點相連,進而可以得到全部節點之間的拓撲結構關系。B2、快速通道互連鏈路監控設備根據第二判斷結果獲取到待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障。快速通道互連鏈路監控設備從第二判斷結果中可以得到快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,若超過,則認為存在鏈路故障,若沒有超過,則認為不存在鏈路故障。B3、快速通道互連鏈路監控設備將節點之間存在鏈路故障的鏈路顯示在該拓撲結構關系上,得到第二圖形化界面。快速通道互連鏈路監控設備在每一個節點和待測系統中其它節點之間的拓撲結構關系上顯示節點之間存在鏈路故障的鏈路,就可以得到第二圖形化界面。需要說明的是,在本發明實施例中的操作10中,若第二判斷結果為快速通道互連鏈路重傳次數超過預置的快速通道互連鏈路重傳閾值,第二圖形化界面具體用于顯示異常的快速通道互連鏈路。若第二判斷結果為快速通道互連鏈路重傳次數沒有超過預置的快速通道互連鏈路重傳閾值,第二圖形化界面具體用于顯示正常的快速通道互連鏈路。當QPI鏈路監控設備通過該第二圖形化界面顯示異常的QPI鏈路時,本發明實施例還可以包括如下可選實現方式QPI鏈路監控設備對該異常的QPI鏈路上的異常節點進行隔離,并跳回操作102開始執行102及其后續的操作步驟。若第二判斷結果為快速通道互連鏈路重傳次數超過預置的快速通道互連鏈路重傳閾值,本發明實施例還可以包括如下實現方式快速通道互連鏈路監控設備觸發第二報警。在本發明實施例中,QPI鏈路監控設備的觸發第二報警方式也可以有多種,例如,向用戶發送郵件、向用戶發送手機短信、在QPI鏈路監控設備上顯示某種特殊文件(如彈出警告框、播放某種音頻文件、播放某種視頻文件)等。只要是用于向用戶顯示QPI鏈路異常的報警方式都可以作為第二報警的方式由快速通道互連鏈路監控設備觸發。另外需要說明的是,在快速通道互連鏈路監控設備將第二判斷結果和所述路由表信息映射為第二圖形化界面之前,快速通道互連鏈路監控設備可以觸發第二報警。第一報警的方式可以和第二報警的方式可以相同也可以不相同,此處不作限定。本發明實施例中,快速通道互連鏈路監控設備獲取到待測系統的循環冗余碼校驗誤碼信息和路由表信息之后,快速通道互連鏈路監控設備在循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值的情況下將第一判斷結果和路由表信息映射為第一圖形化界面,在循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值的情況下, 通過判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值得到第二判斷結果,將第二判斷結果和路由表信息映射為第二圖形化界面。通過第一圖形化界面或者第二圖形化界面用戶能夠直觀的查看到整個待測系統的QPI鏈路連接狀態。本發明實施例中獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息可以由一個軟件裝置(即本發明實施例中的快速通道互連鏈路監控設備)即可獲取得到,不需要增加單獨的測試設備(例如不需要增加負載檢測板)去實現,另外該快速通道互連鏈路監控設備由第一判斷結果或第二判斷結果結合路由表信息就能映射得到圖形化界面,也不需要單獨的測試設備 (即不需要增加示波器)轉化為波形文件輸出到一個測試軟件sigtest。本發明實施例可以通過圖形化界面就能夠實時的顯示QPI鏈路連接狀態,從而能夠降低測試成本,且操作過程簡單容易實現。以上實施例介紹了本發明實施例提供的快速通道互連鏈路監控方法,接下來以一個具體的應用場景來介紹該快速通道互連鏈路監控方法。如圖2所示,為本發明實施例提供的快速通道互連鏈路監控系統的系統組網圖。在圖2中,以快速通道互連鏈路監控設備安裝在OA服務器為例進行說明,用戶可以使用普通PC控制機通過網絡訪問快速通道互連鏈路監控設備實現對快速通道互連鏈路的實時監控。該監控系統可以包括運行QPI鏈路監控設備的OA服務器、用戶使用的普通PC控制機、待測系統SUT、交換機。其中,待測系統包括節點1、節點2、節點3、主節點。普通PC控制機通過交換機以網絡連接的方式訪問OA 服務器。所有節點(所有節點指的是節點1、節點2、節點3、主節點)的BMC通過交換機與 OA服務器相連接。為了能夠顯示待測系統中的主節點的操作系統(0S,0perating System), 可以將該主節點通過視頻圖形陣列(VGA,Video Graphics Array)與一顯示器相連。普通 PC控制機通過一串口與待測系統的主節點相連。如圖3所示,在一個具體的應用場景下,快速通道互連鏈路監控方法包括301、待測系統的主節點建立路由表信息。302、待測系統的BMC獲取路由表信息和CRC誤碼信息。303,OA服務器通過IMPI接收待測系統的BMC獲取的CRC誤碼信息和路由表信息。304、QPI鏈路監控設備通過與自身連接的OA服務器獲取待測系統的CRC誤碼信
息和路由表信息。305、QPI鏈路監控設備判斷CRC誤碼次數是否超過預置的CRC誤碼閾值,得到第一判斷結果。若第一判斷結果為CRC誤碼次數超過預置的CRC誤碼閾值,觸發操作306執行,若第一判斷結果為CRC誤碼次數沒有超過預置的CRC誤碼閾值,觸發操作309執行。306、QPI鏈路監控設備觸發第一報警,然后觸發307執行。307、QPI鏈路監控設備將第一判斷結果和路由表信息映射為第一圖形化界面,然后觸發308執行。308、QPI鏈路監控設備通過該第一圖形化界面顯示異常的快速通道互連鏈路,然后觸發314執行。309,QPI鏈路監控設備判斷QPI鏈路重傳次數是否超過預置的QPI鏈路重傳閾值, 得到第二判斷結果,若第二判斷結果為QPI鏈路重傳次數超過預置的QPI鏈路重傳閾值,觸發310執行。若第二判斷結果為QPl鏈路重傳次數沒有超過預置的QPI鏈路重傳閾值,直接觸發311執行。310, QPI鏈路監控設備觸發第二報警,然后觸發311執行。311、QPI鏈路監控設備將第二判斷結果和路由表信息映射為第二圖形化界面,根據第二判斷結果,若第二判斷結果為快速通道互連鏈路重傳次數超過預置的快速通道互連鏈路重傳閾值,第二圖形化界面具體用于顯示異常的快速通道互連鏈路,觸發312執行。根據第二判斷結果,若第二判斷結果為快速通道互連鏈路重傳次數沒有超過預置的快速通道互連鏈路重傳閾值,第二圖形化界面具體用于顯示正常的快速通道互連鏈路,觸發313執行。312、QPI鏈路監控設備通過該第二圖形化界面顯示正常的快速通道互連鏈路,然后結束整個監控過程。313、QPI鏈路監控設備通過該第二圖形化界面顯示異常的快速通道互連鏈路,觸發314執行。
314、QPI鏈路監控設備對異常QPI鏈路上的異常節點進行隔離,然后可以結束整個監控過程,也可以重新觸發305以及305之后的操作繼續執行。為了更加清楚描述本發明實施例提供的快速通道互連鏈路監控方法,請參閱圖4 所示的QPI互連鏈路實時監控的示意圖。在圖4中,待測系統包括四個節點A1、A2、A3、A4, 其中,Al為主節點。主節點Al的BIOS會通過KCS將路由表信息發送給待測系統的BMC, 待測系統的BMC會通過SMBUS讀取待測系統的節點的CRC誤碼信息。待測系統的BMC將待測系統的CRC誤碼信息和路由表信息通過IMPI發送給OA服務器。QPI鏈路監控設備通過 web連接從OA服務器上獲取到CRC誤碼信息和路由表信息。QPI鏈路監控設備判斷CRC誤碼次數是否超過預置的CRC誤碼閾值得到第一判斷結果,QPI鏈路監控設備將第一判斷結果和路由表信息映射為圖形化界面。QPI鏈路監控設備判斷QPI鏈路重傳次數是否超過預置的QPI鏈路重傳閾值,得到第二判斷結果,QPI鏈路監控設備將第二判斷結果和路由表信息映射為圖形化界面。當用戶使用普通PC控制機訪問QPI鏈路監控設備可以實時查看到待測系統的QPI鏈路連接狀態。以兩個節點Al和A2之間的鏈路出現故障為例,用戶可以直觀的從圖形化界面顯示出該待測系統的兩個節點Al和A2之間出現出現異常。以上實施例介紹了快速通道互連鏈路監控方法,接下來介紹一種快速通道互連鏈路監控設備。在實際應用中,快速通道互連鏈路監控設備具體可以是集成在一種單板管理者管理軟件上實現,用戶可以使用普通PC控制機通過網絡訪問單板管理者管理軟件實現對快速通道互連鏈路的實時監控。快速通道互連鏈路監控設備也可以是一種獨立的設備按照軟件控制硬件的方式安裝在單板管理者服務器上,用戶可以使用普通PC控制機通過快速通道互連鏈路監控設備實現對快速通道互連鏈路的實時監控。快速通道互連鏈路監控設備也可以是一種獨立的設備按照軟件控制硬件的方式安裝在普通PC控制機上實現。具體實現方式此處不作限定。如圖5所示,本發明實施例提供的QPI鏈路監控設備500,包括獲取單元501、第一判斷單元502、第一映射單元503、第二判斷單元504、第二映射單元505,其中,獲取單元501,用于獲取待測系統的CRC誤碼信息和路由表信息,其中,CRC誤碼信息包括CRC誤碼次數和QPI鏈路重傳次數。第一判斷單元502,用于判斷CRC誤碼次數是否超過預置的CRC誤碼閾值,得到第一判斷結果。若第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值,觸發第一報警單元503執行,若第一判斷結果為循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值,觸發第二判斷元505執行。第一映射單元503,用于當第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值時,將第一判斷結果和路由表信息映射為第一圖形化界面,其中, 第一圖形化界面用于根據第一判斷結果和路由表信息顯示待測系統的節點之間的快速通道互連鏈路連接狀態。第二判斷單元504,用于當第一判斷結果為循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值時,判斷QPI鏈路重傳次數是否超過預置的QPI鏈路重傳閾值,得到第二判斷結果。第二映射單元505,用于將第二判斷結果和路由表信息映射為圖形化界面。其中, 第二圖形化界面用于根據第二判斷結果和路由表信息顯示該待測系統的節點之間的QPI鏈路連接狀態。需要說明的是,對于獲取單元501而言,一種具體的實現方式是,獲取單元501具體用于通過與自身連接的單板管理者服務器獲取待測系統的CRC誤碼信息和路由表信息, CRC誤碼信息以及路由表信息通過待測系統的單板管理控制器BMC獲得后,再由單板管理控制器通過智能平臺管理接口 IPMI發送給單板管理者服務器。需要說明的是,對于第一映射單元504而言,一種具體的實現方式是,第一映射單元504具體可以包括解析模塊,用于從路由表信息中解析出待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系。第一獲取模塊,用于根據第一判斷結果獲取到待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障。第一顯示模塊,用于將節點之間存在鏈路故障的鏈路顯示在拓撲結構關系上,得到第一圖形化界面。需要說明的是,對于第二映射單元507而言,一種具體的實現方式是,第二映射單元507具體可以包括解析模塊,用于從路由表信息中解析出待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系。第二獲取模塊,用于根據第二判斷結果獲取到待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障。第二顯示模塊,用于將節點之間存在鏈路故障的鏈路顯示在拓撲結構關系上,得到第二圖形化界面。需要說明的是,對于QPI鏈路監控設備500而言,可選的是,還可以包括如下單元第一報警單元506,用于當第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值時,觸發第一報警。第二報警單元507,用于當第二判斷結果為快速通道互連鏈路重傳次數超過預置的快速通道互連鏈路重傳閾值時,觸發第二報警。需要說明的是,對于QPI鏈路監控設備500而言,可選的是,還可以包括如下單元第一隔離單元508,用于當第一圖形化界面顯示異常的快速通道互連鏈路時,對異常的快速通道互連鏈路上的異常節點進行隔離,并跳回第一判斷單元502執行。第二隔離單元509,用于當第二圖形化界面顯示異常的快速通道互連鏈路時,對異常的快速通道互連鏈路上的異常節點進行隔離,并跳回第一判斷單元502執行。需要說明的是,上述裝置各模塊/單元之間的信息交互、執行過程等內容,由于與本發明方法實施例基于同一構思,其帶來的技術效果與本發明方法實施例相同,具體內容可參見本發明如圖1所示的方法實施例中的敘述,此處不再贅述。本發明實施例中,獲取單元501獲取到待測系統的循環冗余碼校驗誤碼信息和路由表信息之后,第一判斷單元502判斷CRC誤碼次數是否超過預置的CRC誤碼閾值,得到第一判斷結果,當第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值時,第一映射單元503將第一判斷結果和路由表信息映射為第一圖形化界面,在循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值的情況下,第二判斷單元 504判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值得到第二判斷結果,第二映射單元505將第二判斷結果和路由表信息映射為第二圖形化界面,以便用戶能夠直觀查看到整個待測系統的QPI鏈路連接狀態。本發明實施例不需要增加單獨的測試設備和單獨的測試軟件,從而能夠降低測試成本,且操作過程簡單容易實現。本發明實施例提供的一種快速通道互連鏈路監控系統,包括待測系統、能夠顯示待測系統的節點之間的快速通道互連鏈路連接狀態的快速通道互連鏈路監控設備。其中,快速通道互連鏈路監控設備,用于獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息,循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;判斷循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若第一判斷結果為循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值,將第一判斷結果和路由表信息映射為第一圖形化界面,第一圖形化界面用于根據第一判斷結果和路由表信息顯示待測系統的節點之間的快速通道互連鏈路連接狀態;若第一判斷結果為循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值,判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果; 將第二判斷結果和路由表信息映射為第二圖形化界面,第二圖形化界面用于根據第二判斷結果和路由表信息顯示待測系統的節點之間的快速通道互連鏈路連接狀態。在實際應用中,一種可實現的方式是,快速通道互連鏈路監控系統還包括OA服務器和交換機,快速通道互連鏈路監控設備加載在OA服務器上,交換機用于實現OA服務器與待測系統的數據交互。待測系統包括主節點和單板管理控制器。其中,主節點用于建立待測系統的路由表信息;單板管理控制器用于從主節點處獲取路由表信息,通過系統管理總線SMBUS讀取待測系統的節點的循環冗余碼校驗誤碼信息,通過智能平臺管理接口 IPMI向OA服務器發送循環冗余碼校驗誤碼信息和路由表信息。OA服務器,用于接收單板管理控制器發送的循環冗余碼校驗誤碼信息和路由表信息;將循環冗余碼校驗誤碼信息和路由表信息發送給快速通道互連鏈路監控設備。在實際應用中,另一種可實現的方式是,快速通道互連鏈路監控系統還包括0A 服務器、普通個人電腦控制機和交換機,快速通道互連鏈路監控設備加載在普通個人電腦控制機上,交換機用于實現OA服務器與待測系統的數據交互、OA服務器與普通個人電腦控制機的交互。待測系統包括主節點和單板管理控制器。其中,主節點用于建立待測系統的路由表信息;單板管理控制器用于從主節點處獲取路由表信息,通過系統管理總線SMBUS讀取待測系統的節點的循環冗余碼校驗誤碼信息,通過智能平臺管理接口 IPMI向OA服務器發送循環冗余碼校驗誤碼信息和路由表信息。OA服務器,用于接收單板管理控制器發送的循環冗余碼校驗誤碼信息和路由表信息;將循環冗余碼校驗誤碼信息和路由表信息發送給快速通道互連鏈路監控設備。普通個人電腦控制機,用于顯示快速通道互連鏈路監控設備得到的第一圖形化界面或第二圖形化界面。
具體的系統組網結構,請參閱圖2所示,此處不再贅述。需要說明的是,上述裝置各模塊/單元之間的信息交互、執行過程等內容,由于與本發明方法實施例基于同一構思,其帶來的技術效果與本發明方法實施例相同,具體內容可參見本發明如圖1和圖2所示的方法實施例中的敘述,此處不再贅述。本發明實施例中,快速通道互連鏈路監控設備獲取到待測系統的循環冗余碼校驗誤碼信息和路由表信息之后,快速通道互連鏈路監控設備在循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值的情況下將第一判斷結果和路由表信息映射為第一圖形化界面,在循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值的情況下, 通過判斷快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值得到第二判斷結果,將第二判斷結果和路由表信息映射為第二圖形化界面。通過第一圖形化界面或者第二圖形化界面用戶能夠直觀查看到整個待測系統的QPI鏈路連接狀態。本發明實施例中獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息可以由一個軟件裝置(即本發明實施例中的快速通道互連鏈路監控設備)即可獲取得到,不需要增加單獨的測試設備(例如不需要增加負載檢測板)去實現,另外該快速通道互連鏈路監控設備由第一判斷結果或第二判斷結果結合路由表信息就能映射得到圖形化界面,也不需要單獨的測試設備 (即不需要增加示波器)轉化為波形文件輸出到一個測試軟件sigtest。本發明實施例可以通過圖形化界面就能夠實時的顯示QPI鏈路連接狀態,從而能夠降低測試成本,且操作過程簡單容易實現。本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件完成,該程序可以存儲于一種計算機可讀存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。以上對本發明所提供的一種快速通道互連鏈路監控方法和設備及系統進行了詳細介紹,對于本領域的一般技術人員,依據本發明實施例的思想,在具體實施方式
及應用范圍上均會有改變之處,因此,本說明書內容不應理解為對本發明的限制。
權利要求
1.一種快速通道互連鏈路監控方法,其特征在于,包括快速通道互連鏈路監控設備獲取待測系統SUT的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;所述快速通道互連鏈路監控設備判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,所述快速通道互連鏈路監控設備將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過所述預置的循環冗余碼校驗誤碼閾值,所述快速通道互連鏈路監控設備判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;所述快速通道互連鏈路監控設備將所述第二判斷結果和所述路由表信息映射為第二圖形化界面,所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。
2.根據權利要求1所述的快速通道互連鏈路監控方法,其特征在于,所述快速通道互連鏈路監控設備獲取待測系統的循環冗余碼校驗誤碼信息和路由表信息包括所述快速通道互連鏈路監控設備通過與自身連接的單板管理者服務器獲取所述循環冗余碼校驗誤碼信息和所述路由表信息,所述循環冗余碼校驗誤碼信息以及所述路由表信息通過所述待測系統的單板管理控制器BMC獲得后,再由所述單板管理控制器通過智能平臺管理接口 IPMI發送給所述單板管理者服務器。
3.根據權利要求2所述的快速通道互連鏈路監控方法,其特征在于,所述循環冗余碼校驗誤碼信息通過所述待測系統的單板管理控制器獲得,包括所述單板管理控制器通過系統管理總線SMBUS讀取所述待測系統的節點的循環冗余碼校驗誤碼信息。
4.根據權利要求2所述的快速通道互連鏈路監控方法,其特征在于,所述路由表信息通過所述待測系統的單板管理控制器獲得,包括所述單板管理控制器從所述主節點處獲取所述路由表信息,所述路由表信息由所述待測系統的主節點在所述待測系統的所有節點之間交換鏈路層參數之后建立。
5.根據權利要求4所述的快速通道互連鏈路監控方法,其特征在于,所述單板管理控制器從所述主節點處獲取所述路由表信息包括所述單板管理控制器通過鍵盤控制器規格接口 KCS接收所述主節點的基本輸入輸出系統BIOS發送的所述路由表信息;或,所述單板管理控制器通過系統管理總線讀取所述主節點的中央處理單元相關寄存器并解析出所述路由表信息。
6.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,其特征在于,若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,所述快速通道互連鏈路監控設備觸發第一報警。
7.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,其特征在于,若所述第二判斷結果為所述快速通道互連鏈路重傳次數超過所述預置的快速通道互連鏈路重傳閾值,所述快速通道互連鏈路監控設備觸發第二報警。
8.根據權利要求7所述的快速通道互連鏈路監控方法,其特征在于,在所述快速通道互連鏈路監控設備將所述第二判斷結果和所述路由表信息映射為第二圖形化界面之前,所述快速通道互連鏈路監控設備觸發第二報警。
9.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,所述方法還包括所述第一圖形化界面顯示異常的快速通道互連鏈路,所述快速通道互連鏈路監控設備對所述異常的快速通道互連鏈路上的異常節點進行隔離,并跳回判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值的步驟。
10.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,若所述第二判斷結果為所述快速通道互連鏈路重傳次數超過所述預置的快速通道互連鏈路重傳閾值,所述第二圖形化界面顯示異常的快速通道互連鏈路;若所述第二判斷結果為所述快速通道互連鏈路重傳次數沒有超過所述預置的快速通道互連鏈路重傳閾值,所述第二圖形化界面顯示正常的快速通道互連鏈路。
11.根據權利要求10所述的快速通道互連鏈路監控方法,其特征在于,所述方法還包括當所述第二圖形化界面顯示異常的快速通道互連鏈路時,所述快速通道互連鏈路監控設備對所述異常的快速通道互連鏈路上的異常節點進行隔離,并跳回判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值的步驟。
12.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,其特征在于,所述快速通道互連鏈路監控設備將所述第一判斷結果和所述路由表信息映射為第一圖形化界面包括所述快速通道互連鏈路監控設備從所述路由表信息中解析出所述待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系;所述快速通道互連鏈路監控設備根據所述第一判斷結果獲取到所述待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障;所述快速通道互連鏈路監控設備將節點之間存在鏈路故障的鏈路顯示在所述拓撲結構關系上,得到所述第一圖形化界面。
13.根據權利要求1至5中任一項所述的快速通道互連鏈路監控方法,其特征在于,所述快速通道互連鏈路監控設備將所述第二判斷結果和所述路由表信息映射為第二圖形化界面包括所述快速通道互連鏈路監控設備從所述路由表信息中解析出所述待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系;所述快速通道互連鏈路監控設備根據所述第二判斷結果獲取到所述待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障;所述快速通道互連鏈路監控設備將節點之間存在鏈路故障的鏈路顯示在所述拓撲結構關系上,得到所述第二圖形化界面。
14.一種快速通道互連鏈路監控設備,其特征在于,包括獲取單元,用于獲取待測系統SUT的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;第一判斷單元,用于判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;第一映射單元,用于當所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值時,將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;第二判斷單元,用于當所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過預置的循環冗余碼校驗誤碼閾值時,判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;第二映射單元,用于將所述第二判斷結果和所述路由表信息映射為第二圖形化界面, 所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。
15.根據權利要求14所述的快速通道互連鏈路監控設備,其特征在于,所述獲取單元具體用于通過與自身連接的單板管理者服務器獲取所述循環冗余碼校驗誤碼信息和所述路由表信息,所述循環冗余碼校驗誤碼信息以及所述路由表信息通過所述待測系統的單板管理控制器BMC獲得后,再由所述單板管理控制器通過智能平臺管理接口 IPMI發送給所述單板管理者服務器。
16.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述設備還包括第一報警單元,用于當所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過預置的循環冗余碼校驗誤碼閾值時,觸發第一報警。
17.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述設備還包括第二報警單元,用于當所述第二判斷結果為所述快速通道互連鏈路重傳次數超過預置的快速通道互連鏈路重傳閾值時,觸發第二報警。
18.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述設備還包括第一隔離單元,用于當所述第一圖形化界面顯示異常的快速通道互連鏈路時,對所述異常的快速通道互連鏈路上的異常節點進行隔離,并跳回所述第一判斷單元執行。
19.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述設備還包括第二隔離單元,用于當所述第二圖形化界面顯示異常的快速通道互連鏈路時,對所述異常的快速通道互連鏈路上的異常節點進行隔離,并跳回所述第一判斷單元執行。
20.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述第一映射單元包括解析模塊,用于從所述路由表信息中解析出所述待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系;第一獲取模塊,用于根據所述第一判斷結果獲取到所述待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障;第一顯示模塊,用于將節點之間存在鏈路故障的鏈路顯示在所述拓撲結構關系上,得到所述第一圖形化界面。
21.根據權利要求14或15所述的快速通道互連鏈路監控設備,其特征在于,所述第二映射單元包括解析模塊,用于從所述路由表信息中解析出所述待測系統中的每一個節點和待測系統中其它節點之間的拓撲結構關系;第二獲取模塊,用于根據所述第二判斷結果獲取到所述待測系統中的每一個節點和待測系統中其它節點之間是否存在鏈路故障;第二顯示模塊,用于將節點之間存在鏈路故障的鏈路顯示在所述拓撲結構關系上,得到所述第二圖形化界面。
22.一種快速通道互連鏈路監控系統,其特征在于,包括待測系統SUT、能夠顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態的快速通道互連鏈路監控設備,其中,所述快速通道互連鏈路監控設備,用于獲取所述待測系統的循環冗余碼校驗誤碼信息和路由表信息,所述循環冗余碼校驗誤碼信息包括循環冗余碼校驗誤碼次數和快速通道互連鏈路重傳次數;判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,將所述第一判斷結果和所述路由表信息映射為第一圖形化界面,所述第一圖形化界面用于根據所述第一判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過所述預置的循環冗余碼校驗誤碼閾值,判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;將所述第二判斷結果和所述路由表信息映射為第二圖形化界面,所述第二圖形化界面用于根據所述第二判斷結果和所述路由表信息顯示所述待測系統的節點之間的快速通道互連鏈路連接狀態。
23.根據權利要求22所述的快速通道互連鏈路監控系統,其特征在于,所述快速通道互連鏈路監控系統還包括單板管理者OA服務器和交換機,所述快速通道互連鏈路監控設備加載在所述OA服務器上,所述交換機用于實現所述OA服務器與所述待測系統的數據交互;所述待測系統包括主節點和單板管理控制器BMC,所述主節點用于建立所述待測系統的路由表信息;所述單板管理控制器用于從所述主節點處獲取路由表信息,通過系統管理總線SMBUS讀取所述待測系統的節點的循環冗余碼校驗誤碼信息,通過智能平臺管理接口 IPMI向所述OA服務器發送循環冗余碼校驗誤碼信息和路由表信息;所述OA服務器,用于將接收所述單板管理控制器發送的循環冗余碼校驗誤碼信息和路由表信息;將所述循環冗余碼校驗誤碼信息和路由表信息發送給所述快速通道互連鏈路監控設備。
24.根據權利要求22所述的快速通道互連鏈路監控系統,其特征在于,所述快速通道互連鏈路監控系統還包括OA服務器、普通個人電腦控制機和交換機,所述快速通道互連鏈路監控設備加載在所述普通個人電腦控制機上,所述交換機用于實現所述OA服務器與所述待測系統的數據交互、所述OA服務器與所述普通個人電腦控制機的數據交互;所述待測系統包括主節點和單板管理控制器BMC,所述主節點用于建立所述待測系統的路由表信息;所述單板管理控制器用于從所述主節點處獲取路由表信息,通過系統管理總線SMBUS讀取所述待測系統的節點的循環冗余碼校驗誤碼信息,通過智能平臺管理接口 IPMI向所述OA服務器發送循環冗余碼校驗誤碼信息和路由表信息;所述OA服務器,用于接收所述單板管理控制器發送的循環冗余碼校驗誤碼信息和路由表信息;將所述循環冗余碼校驗誤碼信息和路由表信息發送給所述快速通道互連鏈路監控設備;所述普通個人電腦控制機,用于顯示所述快速通道互連鏈路監控設備通過映射得到的第一圖形化界面或第二圖形化界面。
全文摘要
一種快速通道互連鏈路監控方法和設備及系統。方法包括獲取待測系統SUT的循環冗余碼校驗誤碼信息和路由表信息;判斷所述循環冗余碼校驗誤碼次數是否超過預置的循環冗余碼校驗誤碼閾值,得到第一判斷結果;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數超過所述預置的循環冗余碼校驗誤碼閾值,將所述第一判斷結果和所述路由表信息映射為第一圖形化界面;若所述第一判斷結果為所述循環冗余碼校驗誤碼次數沒有超過所述預置的循環冗余碼校驗誤碼閾值,判斷所述快速通道互連鏈路重傳次數是否超過預置的快速通道互連鏈路重傳閾值,得到第二判斷結果;將所述第二判斷結果和所述路由表信息映射為第二圖形化界面。
文檔編號H04L1/18GK102439888SQ201180002356
公開日2012年5月2日 申請日期2011年9月5日 優先權日2011年9月5日
發明者蔡幼明 申請人:華為技術有限公司