本公開涉及計算機信息,尤其涉及一種節點故障處理方法、裝置、電子設備、介質及產品。
背景技術:
1、業務系統由業務程序、多種中間件及數據庫組成,高可用技術是確保業務系統高質量穩定運行的關鍵要素。高可用是指對后端的服務器進行健康檢測,如果后端哪臺服務器出現問題,就不會再將請求轉發給它,從而避免用戶訪問不了服務器,起到容錯的功能。
2、目前部分中間件例如redis,zookeeper,kafka等已原生實現分布式高可用架構,具備高可用性;而例如nginx,mysql等中間件原生未實現高可用架構,需要技術人員采用第三方高可用軟件例如keepalived來實現高可用,用以保障業務系統高質量穩定運行。相關技術中通常采用虛擬ip地址(virtual?ip,vip)的方式實現高可用,然而這種方式在運行過程中容易出現vip腦裂情況,即同一時刻有多個節點對外提供服務,會導致集群中數據不一致的情況。
技術實現思路
1、本公開提供一種節點故障處理方法、裝置、電子設備、介質及產品,以解決相關技術中的問題,通過確定服務器集群中節點的故障原因,以匹配不同的領導者選舉方法,從而可以避免服務器集群因為節點故障導致腦裂情況的發生,提高了服務器集群的穩定性,同時保證了服務器集群的高可用性。
2、本公開的第一方面實施例提出了一種節點故障處理方法,該方法包括:對服務器集群中的領導者節點進行故障探測;基于故障檢測獲取的故障信息,利用與故障信息對應的選舉方法,更新服務器集群中的領導者節點;將客戶端與更新后的領導者節點連接。
3、在本公開的一些實施例中,基于故障檢測獲取的故障信息,利用與故障信息對應的選舉方法,更新服務器集群中的領導者節點包括:當故障信息為服務器集群中存在不能被領導者節點探測的第一節點時,利用領導者選舉算法,確定更新后的領導者節點;當故障信息為服務器集群中的領導者節點宕機,且服務器集群中不存在網絡分區時,利用第一節點的節點優先級,確定更新后的領導者節點。
4、在本公開的一些實施例中,利用領導者選舉算法,確定更新后的領導者節點包括:接收第一節點發起的投票請求;響應于投票請求,獲取第一節點的選票;基于第一節點的節點優先級,對第一節點獲取的選票進行加權求和,以確定更新后的領導者節點。
5、在本公開的一些實施例中,利用預訓練圖像評價模型,對第一局部特征矩陣和第一全局特征矩陣解碼,以確定待評價圖像的評分包括:將第一局部特征矩陣、第一全局特征矩陣和圖像特征進行融合,以得到融合圖像特征;對融合圖像特征上采樣;基于上采樣后的融合圖像特征,利用預訓練圖像評價模型,確定待評價圖像的評分。
6、在本公開的一些實施例中,將客戶端與領導者節點連接包括:將更新前的領導者節點的虛擬ip地址轉移到更新后的領導者節點,以使客戶端與更新后的領導者節點連接;或,利用第一節點的狀態信息,確定更新后的領導者節點,并將客戶端與更新后的領導者節點連接,狀態信息用于指示第一節點是否為領導者節點的指示信息。
7、在本公開的一些實施例中,利用第一節點的狀態信息,確定更新后的領導者節點包括:從第一節點處獲取多個第一節點的狀態信息,第一節點內存儲有多個第一節點的狀態信息;根據多個第一節點的狀態信息,確定更新后的領導者節點。
8、在本公開的一些實施例中,故障探測的探測方法包括以下至少一項:傳輸控制協議探測法、超文本傳輸協議探測法、執行命令探測法。
9、本公開的第二方面實施例提出了一種節點故障處理裝置,該裝置包括:探測單元,用于對服務器集群中的領導者節點進行故障探測;選舉單元,用于基于故障檢測獲取的故障信息,利用與故障信息對應的選舉方法,更新服務器集群中的領導者節點;連接單元,用于將客戶端與更新后的領導者節點連接。
10、本公開的第三方面實施例提出了一種電子設備,包括:處理器和用于存儲能夠在處理器上運行的計算機程序的存儲器,其中,處理器用于運行計算機程序時,執行本公開第一方面實施例中描述的方法。
11、本公開的第四方面實施例提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,計算機指令用于使計算機執行本公開第一方面實施例中描述的方法。
12、本公開的第五方面實施例提出了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現本公開第一方面實施例中描述的方法。
13、綜上,根據本公開提出的節點故障處理方法,包括:對服務器集群中的領導者節點進行故障探測;基于故障檢測獲取的故障信息,利用與故障信息對應的選舉方法,更新服務器集群中的領導者節點;將客戶端與更新后的領導者節點連接。本公開的方法,通過確定服務器集群中節點的故障原因,以匹配不同的領導者選舉方法,從而可以避免服務器集群因為節點故障導致腦裂情況的發生,提高了服務器集群的穩定性,同時保證了服務器集群的高可用性。
14、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。
1.一種節點故障處理方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述故障檢測獲取的故障信息,利用與所述故障信息對應的選舉方法,更新所述服務器集群中的領導者節點包括:
3.根據權利要求2所述的方法,其特征在于,所述利用領導者選舉算法,確定更新后的領導者節點包括:
4.根據權利要求1所述的方法,其特征在于,所述將客戶端與所述領導者節點連接包括:
5.根據權利要求4所述的方法,其特征在于,所述利用所述第一節點的狀態信息,確定所述更新后的領導者節點包括:
6.根據權利要求1所述的方法,其特征在于,所述故障探測的探測方法包括以下至少一項:傳輸控制協議探測法、超文本傳輸協議探測法、執行命令探測法。
7.一種節點故障處理裝置,其特征在于,所述裝置包括:
8.一種電子設備,其特征在于,包括:處理器和用于存儲能夠在處理器上運行的計算機程序的存儲器,
9.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其特征在于,所述計算機指令用于使所述計算機執行根據權利要求1-6中任一項所述的方法。
10.一種計算機程序產品,其特征在于,包括計算機程序,所述計算機程序在被處理器執行時實現根據權利要求1-6中任一項所述的方法。