一種服務器監控方法及裝置的制造方法
【技術領域】
[0001]本發明涉及計算機技術領域,特別是涉及一種服務器監控方法及裝置。
【背景技術】
[0002]隨著用戶對計算需求的提高,用戶對單臺計算機的計算性能要求也隨之越來越高。64路服務器在計算性能和可靠性上,與傳統服務器相比具有很大的優勢,并在對實時性、可靠性和可用性要求苛刻的領域中應用越來越廣泛。64路服務器在機柜內部集成計算節點、存儲節點、交換機模塊、信息采集器模塊、CC模塊、PCIE設備、風扇和電源等設備。計算節點、存儲節點、交換機模塊、信息采集器模塊、CC模塊、PCIE設備、風扇和電源等設備都有自身的FW,可以進行自身設備的監控。
[0003]由于64路服務器內部設備繁多,設備的接口和通信協議各不相同,采用傳統服務器的一級監控架構,由BMC監控管理64路服務器內部所有設備的信息,無論從時間上還是管理的復雜度上都不能不能滿足機柜服務器的監控的要求。
[0004]因此,提供一種服務器監控方法及裝置是非常有必要的。
【發明內容】
[0005]本發明的目的是提供一種服務器監控方法及裝置,以及時有效地檢測到設備故障,并及時處理節點故障。
[0006]為解決上述技術問題,本發明提供一種服務器監控方法,包括:
[0007]實時監控服務器中每個機箱中各子設備的狀態信息,作為數據信息;
[0008]數據處理模塊分別獲取對應每個機箱中的所述數據信息,并將所述數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;
[0009]所述控制中心獲取各所述數據處理模塊保存的所述數據信息,對所述服務器進行實時監控以及故障監測。
[0010]可選地,所述實時監控服務器中每個機箱中各子設備的狀態信息,作為數據信息包括:
[0011]實時監控服務器每個機箱中各計算節點的狀態信息、各存儲節點的狀態信息、各風扇的狀態信息、各交換機的狀態信息以及電源信息的狀態信息,作為所述數據信息,并將監控得到的所述數據信息保存在內部緩存供所述數據處理模塊進行數據訪問。
[0012]本發明還提供了一種服務器監控裝置,包括:
[0013]監控模塊,用于實時監控服務器中每個機箱中各子設備的狀態信息,作為數據信息;
[0014]數據處理模塊,用于分別獲取對應每個機箱中的所述數據信息,并將所述數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;
[0015]控制中心,用于獲取各所述數據處理模塊保存的所述數據信息,對所述服務器進行實時監控以及故障監測。
[0016]可選地,所述監控模塊包括:
[0017]第一監控單元,用于監控所述服務器中各計算節點的狀態,并將得到的計算節點的狀態信息保存在內部緩存供所述數據處理模塊進行數據訪問;
[0018]第二監控單元,用于監控所述服務器中各存儲節點的狀態,并將得到的存儲節點的狀態信息保存在內部緩存供所述數據處理模塊進行數據訪問;
[0019]第三監控單元,用于監控所述服務器中各風扇的風扇信息;
[0020]第四監控單元,用于監控所述服務器中各交換機的狀態信息;
[0021]第五監控單元,用于監控所述服務器中電源模塊的狀態信息。
[0022]可選地,第三監控單元通過I2C總線與所述數據處理模塊相連。
[0023]可選地,所述第一監控單元、第二監控單元通過IPMB總線或網線與所述數據處理模塊相連。
[0024]可選地,所述電源模塊通過I2C與所述數據處理模塊相連。
[0025]可選地,所述控制中心通過網線與所述數據處理模塊相連。
[0026]本發明所提供的服務器監控方法及裝置,通過實時監控服務器每個機箱中各子設備的狀態信息,作為數據信息;數據處理模塊分別獲取對應每個機箱中的數據信息,并將數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;控制中心獲取各數據處理模塊保存的數據信息,對所述服務器進行實時監控以及故障監測。本發明所提供的服務器監控方法及裝置,提高了服務器對內部計算節點、存儲節點、交換機模塊、風扇等各子設備的監控的實時性,能夠及時有效地處理檢測設備故障,提高了服務器的可用性和可靠性。
【附圖說明】
[0027]圖1為本發明所提供的服務器監控方法的一種【具體實施方式】的流程圖;
[0028]圖2為本發明所提供的服務器監控裝置的一種【具體實施方式】的結構框圖;
[0029]圖3為本發明所提供的服務器監控裝置的另一種【具體實施方式】的示意圖。
【具體實施方式】
[0030]為了使本技術領域的人員更好地理解本發明方案,下面結合附圖和【具體實施方式】對本發明作進一步的詳細說明。顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0031]本發明所提供的服務器監控方法的一種【具體實施方式】的流程圖如圖1所示,該方法包括:
[0032]步驟S101:實時監控服務器中每個機箱中各子設備的狀態信息,作為數據信息;
[0033]上述步驟可以具體為:實時監控服務器每個機箱中各計算節點的狀態信息、各存儲節點的狀態信息、各風扇的狀態信息、各交換機的狀態信息以及電源信息的狀態信息,作為所述數據信息,并將監控得到的所述數據信息保存在內部緩存供所述數據處理模塊進行數據訪問。需要指出的是,本實施例中監控的數據信息包括但不限于:服務器每個機箱中各計算節點的狀態信息、各存儲節點的狀態信息、各風扇的狀態信息、各交換機的狀態信息以及電源信息的狀態信息。還可以對其他數據信息監控,這均不影響本發明的實現。
[0034]步驟S102:數據處理模塊分別獲取對應每個機箱中的所述數據信息,并將所述數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;
[0035]步驟S103:控制中心獲取各所述數據處理模塊保存的所述數據信息,對所述服務器進行實時監控以及故障監測。
[0036]本發明所提供的服務器監控方法,通過實時監控服務器每個機箱中各子設備的狀態信息,作為數據信息;數據處理模塊分別獲取對應每個機箱中的數據信息,并將數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;控制中心獲取各數據處理模塊保存的數據信息,對所述服務器進行實時監控以及故障監測。本發明所提供的服務器監控方法,提高了服務器對內部計算節點、存儲節點、交換機模塊、風扇等各子設備的監控的實時性,能夠及時有效地處理檢測設備故障,提高了服務器的可用性和可靠性。
[0037]與上述方法相對應,本發明還提供了一種服務器監控裝置,如圖2本發明所提供的服務器監控裝置的一種【具體實施方式】的結構框圖所示,該裝置包括:
[0038]監控模塊100,用于實時監控服務器中每個機箱中各子設備的狀態信息,作為數據信息;
[0039]該監控模塊100可以具體包括:
[0040]第一監控單元,用于監控所述服務器中各計算節點的狀態,并將得到的計算節點的狀態信息保存在內部緩存供所述數據處理模塊進行數據訪問;
[0041]第二監控單元,用于監控所述服務器中各存儲節點的狀態,并將得到的存儲節點的狀態信息保存在內部緩存供所述數據處理模塊進行數據訪問;
[0042]第三監控單元,用于監控所述服務器中各風扇的風扇信息;
[0043]第四監控單元,用于監控所述服務器中各交換機的狀態信息;
[0044]第五監控單元,用于監控所述服務器中電源模塊的狀態信息。
[0045]數據處理模塊200,用于分別獲取對應每個機箱中的所述數據信息,并將所述數據信息統一保存在內部緩存中,對控制中心提供信息訪問接口 ;
[0046]控制中