分布式存儲系統節點狀態監控方法、中心節點及系統的制作方法
【專利摘要】本發明實施例提供一種分布式存儲系統節點狀態監控方法。所述方法包括以下步驟:中心節點為工作節點配置心跳包發送的第一時間間隔;所述中心節點接收所述工作節點發送的心跳包,獲取所述工作節點的工作狀態參數;所述中心節點將所述工作狀態參數與預定閾值比較,當所述工作狀態參數大于或等于預定閾值時,為所述工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。此外,提供了相應的中心節點和系統,通過所述方法、中心節點和系統,解決了在業務負載過重和網絡情況不佳等情況下心跳異常的問題,實現了根據實際的負載情況和網絡不佳情況時自動調整心跳間隔,大幅提升了分布式存儲集群可靠性和可用性。
【專利說明】
分布式存儲系統節點狀態監控方法、中心節點及系統
技術領域
[0001]本發明實施例涉及計算機網絡存儲領域,尤其涉及一種分布式存儲系統節點狀態監控方法、中心節點及系統。
【背景技術】
[0002]分布式存儲系統,是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網絡存儲系統采用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展。
[0003]分布式存儲的系統架構需要心跳機制的支持,以確認各節點的狀態,并對異常的狀態及時處理。心跳間隔設定的過大,則工作正常的節點無法對處于異常狀態的節點及時做出處理,例如判定離線,啟動數據恢復或者數據迀移等。相反心跳間隔設定的過小,則對于網絡的異常抖動,對于業務負載過重,無法及時響應心跳消息的場景而做出錯誤的判斷。降低存儲系統的可靠性。
[0004]目前業內的分布式存儲系統對于心跳的設置都是設定一個固定值,無法根據復雜的網絡環境進行自動的動態配置,例如不能根據存儲系統的整體負載變化以及節點的工作狀態等實際情況,自動地調整心跳間隔。心跳間隔的過長或過短都會使得判斷的錯誤,導致監控結果的不真實準確,造成系統資源浪費或吃緊,從而使得節點工作狀態不穩定,影響分布式存儲系統整體的可靠性和可用性。
【發明內容】
[0005]為了解決現有技術中心跳間隔的值固定,不能應付現實操作中的復雜情況,導致監控不準確的問題,本發明實施例提供一種分布式存儲系統節點狀態監控方法、中心節點及系統。
[0006]本發明實施例一方面提供一種分布式存儲系統節點狀態監控方法,所述分布式存儲系統包括中心節點和多個工作節點,所述方法包括以下步驟:
[0007]所述中心節點為所述多個工作節點配置心跳包發送的第一時間間隔;
[0008]所述中心節點接收所述多個工作節點發送的心跳包,獲取所述多個工作節點的工作狀態參數;
[0009]所述中心節點將所述工作狀態參數與預定閾值比較:
[0010]當所述工作狀態參數大于或等于預定閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。
[0011]本發明實施例另一方面提供一種用于分布式存儲系統的中心節點,包括:用于配置心跳包發送時間間隔的時間間隔配置單元、工作狀態參數解析單元、比較單元,
[0012]其中,所述時間間隔配置單元用于為所述分布式存儲系統中的多個工作節點配置心跳包發送的第一時間間隔;
[0013]所述工作狀態參數解析單元用于接收所述多個工作節點發送的心跳包,獲取所述多個工作節點的工作狀態參數;
[0014]所述比較單元用于將所述工作狀態參數與預定閾值比較,將比較結果發送給所述時間間隔配置單元;
[0015]所述時間間隔配置單元用于接收所述比較結果,當所述工作狀態參數大于或等于預定閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。
[0016]本發明實施例另一方面提供一種分布式存儲系統,包括:中心節點和多個工作節點,其特征在于,所述中心節點為根據本發明實施例提供的用于分布式存儲系統的中心節點。
[0017]本發明實施例提供的一種可以廣泛適用于各種分布式存儲系統的自動調整心跳間隔的方法,解決了在業務負載過重和網絡情況不佳等情況下心跳異常的問題,實現了根據實際的負載情況和網絡不佳情況時自動調整心跳間隔,大幅提升了分布式存儲集群可靠性和可用性。
【附圖說明】
[0018]為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0019]圖1為本發明分布式存儲系統節點狀態監控方法實施例流程圖;
[0020]圖2為當外部負載過大時,本發明分布式存儲系統節點狀態監控方法實施例應用場景圖;
[0021]圖3為當節點出現故障時,本發明分布式存儲系統節點狀態監控方法實施例應用場景圖;
[0022]圖4為當節點磁盤容量出現偏差時,本發明分布式存儲系統節點狀態監控方法實施例應用場景圖;
[0023]圖5為本發明用于分布式存儲系統的中心節點實施例結構示意圖;
【具體實施方式】
[0024]為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0025]分布式存儲系統中一般包括兩類節點,一類為工作節點,工作節點為多個,另一類為中心節點,也即總控節點。
[0026]中心節點,該節點是系統的中心控制節點,主要用于維護數據分布信息,執行工作機管理,數據定位,故障檢測和恢復,負載均衡等全局調度工作。
[0027]系統中的所有資源都存儲在工作節點上。工作節點通過心跳(Heartbeat,定時發送)機制將節點負載相關的信息,如CPU,內存,磁盤,網絡等資源使用率,讀寫次數及讀寫數據量等發送給中心節點,并接受中心節點統一管理。所謂心跳機制,是收發心跳數據包(簡稱心跳包)的機制,心跳包是遵循心跳數據包協議定義的、周期性、循環發送的數據包,用于判斷網絡節點是否“存活”,即是否還在連接。實際運用時,首先需設計各網絡節點都支持心跳數據包協議,各網絡節點按照一定心跳機制向其它網絡節點發送心跳包,用于判斷對方(設備、進程或其它網元)是否正常運行,如果在指定時間段內未收到對方響應,即沒有收到對方發回的心跳包,則認為與對方的連接已經中斷,這樣可檢測TCP的異常斷開,如突然斷電、網絡中斷。雖然我們知道TCP是面向連接的,但是如果遇見拔網線,斷電等物理層的一些特殊情況,TCP還是沒有辦法快速的知道異常,所以心跳包的使用可以幫我們解決這些問題。
[0028]目前業內分布式存儲系統對于心跳的設置都是設定為一個固定值,心跳間隔設定的過大,則工作正常的節點無法對處于異常狀態的節點及時做出處理,例如判定離線,啟動數據恢復或者數據迀移等。相反心跳間隔設定的過小,則對于網絡的異常抖動,對于業務負載過重,無法及時響應心跳消息的場景而做出錯誤的判斷。
[0029]為此,本發明實施例提供了一種分布式存儲系統節點狀態監控方法。如圖1所示,本發明實施例提供的一種分布式存儲系統節點狀態監控方法的流程圖,所述方法包括以下步驟:
[0030]SlOl:中心節點為多個工作節點配置心跳包發送的第一時間間隔;
[0031]其中第一時間間隔為心跳包的初始心跳時間間隔,各節點以該時間間隔定期發送心跳包。
[0032]S102:中心節點接收多個工作節點發送的心跳包,獲取多個工作節點的工作狀態參數;
[0033]其中中心節點通過系統配置好的固定的時間間隔周期性獲取多個工作節點的工作狀態參數。其周期設置可根據歷史統計數據,比如業務負載突然增大或突然變小發生的時間周期,節點出現故障的時間規律性等綜合因素進行考慮,以免設置過大或過小。
[0034]S103:中心節點將所述工作狀態參數與預定閾值比較:
[0035]系統中的預定閾值可以以配置文件形式存儲在系統中,方便中心節點獲取。
[0036]S104:當所述工作狀態參數大于或等于預定閾值時,為多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。
[0037]其中,中心節點為多個工作節點配置心跳包發送的第二時間間隔的同時,還會向各節點發送的消息,所述消息基于TCP的消息,消息包括消息頭和消息體,例如消息體內容為“延長心跳間隔”其可根據本領域技術人員已知的開發語言來實現。
[0038]需要注意的是,中心節點的數量可以根據集群的需要設置,可以為一個或多個,當設置多個時就構成了一個監控集群。
[0039]這樣通過適時延長心跳包發送間隔,防止在業務負載過重、網絡的異常抖動等情境下因無法及時響應心跳消息而做出錯誤的判斷。有效的提升了分布式集群系統的可靠性和可用性。
[0040]如圖2,表示了當出現負載變化時應用本發明的本發明分布式存儲系統節點狀態監控方法的實施例。在此實施例中,步驟S102中所述工作狀態參數為多個工作節點組成的集群的業務負載參數,所述預定閾值為業務負載閾值;所述方法步驟如下:
[0041]-中心節點為多個工作節點配置心跳包發送的第一時間間隔;
[0042]各工作節點根據心跳包發送的第一時間間隔定期向中心節點發送心跳包。
[0043]-中心節點接收多個工作節點發送的心跳包,獲取多個工作節點組成的集群的業務負載參數;
[0044]中心節點會周期性的獲取各工作節點組成的集群的業務負載參數。
[0045]-中心節點將所述業務負載參數與業務負載閾值比較:
[0046]當中心節點獲取的所述業務負載參數大于或等于業務負載閾值時,中心節點向多個工作節點發送“延長心跳間隔”的消息,并為多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔;
[0047]當所述業務負載參數小于業務負載閾值時,中心節點向多個工作節點發送“縮短心跳間隔”的消息,為所述多個工作節點配置心跳包發送的第三時間間隔,所述第三時間間隔小于第一時間間隔。
[0048]這樣,當出現負載的過大或過小時,中心節點及時響應并重新配置心跳包的發送時間間隔,各工作節點接收到中心節點的消息,根據調整后的心跳時間間隔向中心節點發送心跳包。一方面防止了負載過大時心跑間隔設定的過小,系統無法及時響應心跳包消息而做出錯誤判斷,另一方面防止負載過小時心跳間隔設定的過大,無法對出現異常的節點做出及時響應和處理。有效提高了分布式存儲系統的可靠性和可用性。
[0049]如圖3,表示了當出現網絡節點異常情況時應用本發明的本發明的本發明分布式存儲系統節點狀態監控方法的實施例。在此實施例中,步驟S102中所述工作狀態參數為多個工作節點中停發心跳包的工作節點的故障數量,所述預定閾值為節點故障數量閾值;所述方法步驟如下:
[0050]-中心節點為多個工作節點配置心跳包發送的第一時間間隔;
[0051]各工作節點根據心跳包發送的第一時間間隔定期向中心節點發送心跳包。
[0052]-中心節點接收多個工作節點發送的心跳包,獲取多個工作節點中停發心跳包的工作節點的故障數量;
[0053]中心節點接收各工作節點發送的心跳包,并回發“ACK”消息進行響應。當其中某個節點心跳包超時時,就認定此節點發生故障。
[0054]單臺服務器故障的概率是不高的,然而,只要集群的規模足夠大,每天都可能有機器故障發生,系統需要能夠自動處理。容錯是分布式存儲系統設計的重要目標,只有實現了自動化容錯,才能減少人工運維成本,實現分布式存儲的規模效應。節點故障會影響系統服務,在故障檢測以及故障恢復的過程中,不能提供寫服務及強一致性讀服務。
[0055]其中節點故障的判斷,可依據節點向中心節點報告的系統消息來判斷,如果在指定時間內,中心節點沒有收到節點報告的系統消息,則認為節點故障。在本實施例中,采用節點向中心節點定期發送心跳包的方法來實現,當然也可以采用本領域技術人員已知的其它方法進行判斷。-中心節點將所述故障數量與節點故障數量閾值比較:
[0056]當所述故障數量大于或等于節點故障數量閾值時,在中心節點啟動數據恢復和/或數據重分布之前,中心節點向其它未出現故障的節點發送“延長心跳間隔”的消息,并為多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔;當中心節點完成數據恢復和/或數據重分布后,中心節點獲取到故障數量小于節點故障數量閾值的信息時,中心節點向多個工作節點發送“恢復正常心跳間隔”的消息,例如維持所述多個工作節點發送心跳包的第一時間間隔。
[0057]這里,需要注意的是,對于節點故障時是否啟動異常處理機制,如啟動數據恢復/或數據重分布等會引起集群進入高負載狀態的程序,有時系統會設置一個開關程序,即打開時默認進行心跳相應調整的操作,反之關閉時,對其不進行心跳的相應調整操作。
[0058]本發明實施例中,可根據存儲數據的重要性預設節點故障數量閾R,當存儲數據副本數量設定為N時(N多2時數據副本才具有冗余性,一般設定為3或者更高),其中,I彡R彡(N-1),當R = I時即為有一個數據節點故障即開始執行數據副本恢復操作,而當RXN-1)時可能出現數據副本丟失的風險。具體實施時,分布式存儲系統還可以根據系統的運行狀態或者設置的數據副本的數量,調整節點故障數量閾R。
[0059]優選地,節點故障數量閾值設為1,即認為只要分布式存儲系統中出現節點故障就啟動數據恢復等操作。這樣,當分布式存儲系統中出現一定數據量的節點故障時,中心節點及時響應并重新配置心跳包的發送時間間隔,各工作節點接收到中心節點的消息,根據調整后的心跳時間間隔向中心節點發送心跳包。通過調整心跳包發送時間間隔,當節點故障時,防止心跳間隔設定的過小,系統無法及時響應心跳包消息而做出錯誤判斷,例如判定離線,啟動數據恢復或者數據迀移等。有效提高了分布式存儲系統的可靠性和可用性。
[0060]如圖4,表示了當出現網絡節點磁盤容量出現偏差時應用本發明分布式存儲系統節點狀態監控方法的實施例。在此實施例中,步驟S102中所述工作狀態參數為多個工作節點組成的集群的集群平均剩余容量百分比和多個工作節點的磁盤剩余容量百分比,所述預定閾值為磁盤容量偏差閾值;所述方法步驟如下:
[0061]-中心節點為多個工作節點配置心跳包發送的第一時間間隔;
[0062]各工作節點根據心跳包發送的第一時間間隔定期向中心節點發送心跳包。
[0063]-中心節點接收多個工作節點發送的心跳包,獲取集群平均剩余容量百分比以及多個工作節點的磁盤剩余容量百分比;
[0064]中心節點接收各工作節點發送的心跳包,并回發“ACK”消息進行響應。
[0065]-中心節點將所述磁盤剩余容量百分比與所述集群平均剩余容量百分比相比獲得偏差,所述偏差例如等于所述磁盤剩余容量百分比減去所述集群平均剩余容量百分比:
[0066]當所述偏差大于或等于磁盤容量偏差閾值時,在中心節點啟動數據均衡之前,中心節點向其它節點發送“延長心跳間隔”的消息,并為多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔;
[0067]當中心節點完成數據均衡后,中心節點獲取磁盤剩余容量百分比,并與集群平均剩余容量百分比相比,當其偏差小于磁盤容量偏差閾值時,中心節點向多個工作節點發送“恢復正常心跳間隔”的消息,例如維持所述多個工作節點發送心跳包的第一時間間隔。
[0068]這樣,當分布式存儲系統中工作節點出現磁盤剩余容量百分比與集群平均剩余容量百分比的偏差大于系統預設的磁盤容量偏差閾值時,為了更有效的利用磁盤剩余空間,而啟動數據均衡,中心節點及時響應并重新配置心跳包的發送時間間隔,各工作節點接收到中心節點的消息,根據調整后的心跳時間間隔向中心節點發送心跳包。這樣防止心跳間隔設定的過小,系統無法及時響應心跳包消息而做出錯誤判斷。在保證分布式存儲系統資源有效利用的前提下,有效提高了分布式存儲系統的可靠性和可用性。進一步地,參照圖5本發明提供了一種用于分布式存儲系統的中心節點,包括:用于配置心跳包發送時間間隔的時間間隔配置單元、工作狀態參數解析單元、比較單元,
[0069]其中,時間間隔配置單元用于為分布式存儲系統中的多個工作節點配置心跳包發送的第一時間間隔;
[0070]工作狀態參數解析單元用于接收多個工作節點發送的心跳包,獲取多個工作節點的工作狀態參數;
[0071]比較單元用于將工作狀態參數與預定閾值比較,將比較結果發送給時間間隔配置單元;
[0072]時間間隔配置單元用于接收所述比較結果,當工作狀態參數大于或等于預定閾值時,為多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。
[0073]更進一步地,中心節點中工作狀態參數包括多個工作節點組成的集群的業務負載參數,預定閾值包括業務負載閾值;
[0074]比較單元用于將業務負載參數與業務負載閾值比較,將比較結果發送給時間間隔配置單元;
[0075]時間間隔配置單元用于接收比較結果,當業務負載參數大于或等于業務負載閾值時,為多個工作節點配置心跳包發送的第二時間間隔,第二時間間隔大于第一時間間隔;
[0076]當業務負載參數小于業務負載閾值時,多個工作節點配置心跳包發送的第三時間間隔,所述第三時間間隔小于第一時間間隔。
[0077]更進一步地,中心節點中工作狀態參數包括多個工作節點中停發心跳包的工作節點的故障數量,預定閾值包括節點故障數量閾值;
[0078]比較單元用于將故障數量與節點故障數量閾值比較,將比較結果發送給時間間隔配置單元;
[0079]時間間隔配置單元用于接收所述比較結果,當故障數量大于或等于節點故障數量閾值時,為多個工作節點配置心跳包發送的第二時間間隔,第二時間間隔大于第一時間間隔;
[0080]當故障數量小于節點故障數量閾值時,維持所述多個工作節點發送心跳包的第一時間間隔。
[0081]更進一步地,中心節點中工作狀態參數包括多個工作節點組成的集群的集群平均剩余容量百分比和多個工作節點的磁盤剩余容量百分比,預定閾值包括磁盤容量偏差閾值;
[0082]比較單元用于將集群平均剩余容量百分比和磁盤剩余容量百分比之間的偏差與磁盤容量偏差閾值相比較,將比較結果發送給時間間隔配置單元;
[0083]時間間隔配置單元用于接收比較結果,當偏差大于或等于磁盤容量偏差閾值時,為多個工作節點配置心跳包發送的第二時間間隔,第二時間間隔大于第一時間間隔;
[0084]當偏差小于磁盤容量偏差閾值時,維持多個工作節點發送心跳包的第一時間間隔。
[0085]此外,本發明還提供了一種分布式存儲系統,包括:根據本發明實施例提供的任一項所述的中心節點和多個工作節點。
[0086]以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下,即可以理解并實施。
[0087]通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件。基于這樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在計算機可讀存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行各個實施例或者實施例的某些部分所述的方法。
[0088]最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和范圍。
【主權項】
1.一種分布式存儲系統節點狀態監控方法,所述分布式存儲系統包括中心節點和多個工作節點,所述方法包括以下步驟: 所述中心節點為所述多個工作節點配置心跳包發送的第一時間間隔; 所述中心節點接收所述多個工作節點發送的心跳包,獲取所述多個工作節點的工作狀態參數;所述中心節點將所述工作狀態參數與預定閾值比較: 當所述工作狀態參數大于或等于預定閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。2.根據權利要求1所述的方法,其特征在于,所述工作狀態參數包括所述多個工作節點組成的集群的業務負載參數,所述預定閾值包括業務負載閾值; 所述中心節點將所述業務負載參數與業務負載閾值比較: 當所述業務負載參數大于或等于業務負載閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述業務負載參數小于業務負載閾值時,為所述多個工作節點配置心跳包發送的第三時間間隔,所述第三時間間隔小于第一時間間隔。3.根據權利要求1所述的方法,其特征在于,所述工作狀態參數包括所述多個工作節點中停發心跳包的工作節點的故障數量,所述預定閾值包括節點故障數量閾值; 所述中心節點將所述故障數量與節點故障數量閾值比較: 當所述故障數量大于或等于節點故障數量閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述故障數量小于節點故障數量閾值時,維持所述多個工作節點發送心跳包的第一時間間隔。4.根據權利要求1所述的方法,其特征在于,所述工作狀態參數包括所述多個工作節點組成的集群的集群平均剩余容量百分比和所述多個工作節點的磁盤剩余容量百分比,所述預定閾值包括磁盤容量偏差閾值; 所述中心節點將所述磁盤剩余容量百分比與所述集群平均剩余容量百分比相比獲得偏差: 當所述偏差大于或等于磁盤容量偏差閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述偏差小于磁盤容量偏差閾值時,維持所述多個工作節點發送心跳包的第一時間間隔。5.一種用于分布式存儲系統的中心節點,包括:用于配置心跳包發送時間間隔的時間間隔配置單元、工作狀態參數解析單元、比較單元, 其中,所述時間間隔配置單元用于為所述分布式存儲系統中的多個工作節點配置心跳包發送的第一時間間隔; 所述工作狀態參數解析單元用于接收所述多個工作節點發送的心跳包,獲取所述多個工作節點的工作狀態參數; 所述比較單元用于將所述工作狀態參數與預定閾值比較,將比較結果發送給所述時間間隔配置單元; 所述時間間隔配置單元用于接收所述比較結果,當所述工作狀態參數大于或等于預定閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔。6.根據權利要求5所述的中心節點,所述工作狀態參數包括所述多個工作節點組成的集群的業務負載參數,所述預定閾值包括業務負載閾值; 所述比較單元用于將所述業務負載參數與業務負載閾值比較,將比較結果發送給所述時間間隔配置單元; 所述時間間隔配置單元用于接收所述比較結果,當所述業務負載參數大于或等于業務負載閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述業務負載參數小于業務負載閾值時,為所述多個工作節點配置心跳包發送的第三時間間隔,所述第三時間間隔小于第一時間間隔。7.根據權利要求5所述的中心節點,所述工作狀態參數包括所述多個工作節點中停發心跳包的工作節點的故障數量,所述預定閾值包括節點故障數量閾值; 所述比較單元用于將所述故障數量與節點故障數量閾值比較,將比較結果發送給所述時間間隔配置單元; 所述時間間隔配置單元用于接收所述比較結果,當所述故障數量大于或等于節點故障數量閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述故障數量小于節點故障數量閾值時,維持所述多個工作節點發送心跳包的第一時間間隔。8.根據權利要求5所述的中心節點,所述工作狀態參數包括所述多個工作節點組成的集群的集群平均剩余容量百分比和所述多個工作節點的磁盤剩余容量百分比,所述預定閾值包括磁盤容量偏差閾值; 所述比較單元用于將所述集群平均剩余容量百分比和磁盤剩余容量百分比之間的偏差與所述磁盤容量偏差閾值相比較,將比較結果發送給所述時間間隔配置單元; 所述時間間隔配置單元用于接收所述比較結果,當所述偏差大于或等于磁盤容量偏差閾值時,為所述多個工作節點配置心跳包發送的第二時間間隔,所述第二時間間隔大于第一時間間隔; 當所述偏差小于磁盤容量偏差閾值時,維持所述多個工作節點發送心跳包的第一時間間隔。9.一種分布式存儲系統,包括:中心節點和多個工作節點,其特征在于,所述中心節點為根據權利要求5-8中任一項所述的中心節點。
【文檔編號】H04L29/08GK105897499SQ201510888065
【公開日】2016年8月24日
【申請日】2015年12月7日
【發明人】陳積
【申請人】樂視云計算有限公司