一種任務(wù)分發(fā)方法和系統(tǒng)的制作方法
【專利摘要】本申請公開了一種任務(wù)分發(fā)方法和系統(tǒng),該任務(wù)分發(fā)方法和系統(tǒng)基于分布式協(xié)調(diào)服務(wù)實現(xiàn),首先對節(jié)點進行注冊;當(dāng)新任務(wù)到達時,將新任務(wù)加入任務(wù)隊列,并判斷所述新任務(wù)請求的目的計算節(jié)點是否為已注冊節(jié)點,如果是,將該新任務(wù)的信息添加入分布式協(xié)調(diào)服務(wù)中的任務(wù)存儲模塊,通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù),并從任務(wù)隊列中刪除所述新任務(wù),否則,將所述新任務(wù)置于任務(wù)隊列尾部,并在預(yù)設(shè)時間內(nèi)以預(yù)設(shè)的時間間隔執(zhí)行所述判斷的操作,直至找到相應(yīng)的節(jié)點,如果超過所述預(yù)設(shè)時間沒有找到相應(yīng)的節(jié)點,則將所述新任務(wù)從所述任務(wù)隊列中刪除。應(yīng)用本申請公開的技術(shù)方案,能夠充分保證任務(wù)分發(fā)的一致性和可靠性能,并提供高可用的任務(wù)分發(fā)服務(wù)。
【專利說明】_種任務(wù)分發(fā)方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請屬于計算機領(lǐng)域的任務(wù)分發(fā)【技術(shù)領(lǐng)域】,特別涉及一種基于分布式協(xié)調(diào)服務(wù)的任務(wù)分發(fā)方法和系統(tǒng)。
【背景技術(shù)】
[0002]在信息產(chǎn)業(yè)高速發(fā)展的今天,計算需求日益豐富,計算機服務(wù)系統(tǒng)規(guī)模不斷擴大,系統(tǒng)結(jié)構(gòu)由過去單一的集中式發(fā)展到現(xiàn)在相對流行的分布式,這一系列變化使得計算環(huán)境變得更加復(fù)雜且未知,也對協(xié)同計算過程中常用的任務(wù)分發(fā)技術(shù)提出了更高的要求。
[0003]計算過程中,通常會在不同時間,甚至不同地點,產(chǎn)生不同數(shù)量、不同類型的任務(wù)請求,需要利用任務(wù)分發(fā)技術(shù),將每個請求有秩序地分發(fā)給相應(yīng)的目的計算節(jié)點,減少任務(wù)沖突或丟失,以保證任務(wù)的有效執(zhí)行。現(xiàn)有常見的任務(wù)分發(fā)技術(shù)主要有兩種,一種為集中式任務(wù)分發(fā),另一種為多層次任務(wù)分發(fā)。其中:
[0004]集中式任務(wù)分發(fā)技術(shù)采用獨立的任務(wù)分發(fā)控制器,由單個控制節(jié)點收集所有的任務(wù)請求,并將請求按照時間、類型等相關(guān)屬性信息有序分發(fā)到相關(guān)目的計算節(jié)點上,具有安全、統(tǒng)一、靈活的特點。然而,這種分發(fā)技術(shù)在分布式計算環(huán)境中會存在明顯的性能瓶頸,對于短時間內(nèi)較大數(shù)量的任務(wù)請求,容易出現(xiàn)過度負載,引起單點失效等故障,降低其所在系統(tǒng)的可靠性。與此同時,分發(fā)控制信息集中在一臺控制器上處理,不具備良好的可擴展性。
[0005]多層次任務(wù)分發(fā)技術(shù)采用多個任務(wù)分發(fā)控制器協(xié)同完成任務(wù)分發(fā)工作,各個控制節(jié)點之間互相獨立,在分布性較強或單位時間內(nèi)計算任務(wù)較多的環(huán)境下,可對控制器層級化,控制器之間通過數(shù)據(jù)同步實現(xiàn)任務(wù)分發(fā)信息一致性,這就較容易由于網(wǎng)絡(luò)問題或者部分節(jié)點故障而導(dǎo)致任務(wù)分發(fā)錯誤,如任務(wù)重復(fù)分發(fā)、任務(wù)信息丟失等,使得其所在系統(tǒng)無法滿足計算需求,順利完成計算任務(wù),從而降低系統(tǒng)的可用性。
【發(fā)明內(nèi)容】
[0006]本申請?zhí)峁┝艘环N基于分布式協(xié)調(diào)服務(wù)的任務(wù)分發(fā)方法和系統(tǒng),以滿足不斷復(fù)雜的計算環(huán)境對任務(wù)分發(fā)方法和系統(tǒng)提出的新要求。
[0007]本申請?zhí)峁┝艘环N任務(wù)分發(fā)方法,包括:
[0008]對節(jié)點進行注冊;
[0009]當(dāng)新任務(wù)到達時,將新任務(wù)加入任務(wù)隊列,并判斷所述新任務(wù)請求的目的計算節(jié)點是否為已注冊節(jié)點,如果是,將所述新任務(wù)的信息添加入分布式協(xié)調(diào)服務(wù)中的任務(wù)存儲模塊,通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù),并從任務(wù)隊列中刪除所述新任務(wù),否則,將所述新任務(wù)置于任務(wù)隊列尾部,并在預(yù)設(shè)時間內(nèi)以預(yù)設(shè)的時間間隔執(zhí)行所述判斷的操作,直至找到相應(yīng)的節(jié)點,如果超過所述預(yù)設(shè)時間沒有找到相應(yīng)的節(jié)點,則將所述新任務(wù)從所述任務(wù)隊列中刪除。
[0010]較佳地,所述對節(jié)點進行注冊包括:
[0011]節(jié)點開始活動時,查找已注冊節(jié)點中是否存在所述節(jié)點;
[0012]如果存在,則查詢是否存在對應(yīng)于所述節(jié)點的待執(zhí)行任務(wù),如果有,執(zhí)行所述待執(zhí)行任務(wù);
[0013]如果不存在,則注冊所述節(jié)點,并將節(jié)點狀態(tài)置為空閑。
[0014]較佳地,注冊所述節(jié)點包括:創(chuàng)建對應(yīng)于所述節(jié)點的任務(wù)存儲模塊。
[0015]較佳地,所述通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù)包括:
[0016]節(jié)點接收到新任務(wù)到達通知;
[0017]所述節(jié)點獲取新任務(wù)的任務(wù)名及任務(wù)參數(shù);
[0018]所述節(jié)點利用所述任務(wù)名查詢?nèi)蝿?wù)相關(guān)描述信息,并根據(jù)獲取到任務(wù)參數(shù)和任務(wù)相關(guān)描述信息執(zhí)行相應(yīng)的任務(wù),并將所述任務(wù)的狀態(tài)置為執(zhí)行中;
[0019]任務(wù)執(zhí)行完成后,將所述任務(wù)的狀態(tài)置為已完成,并反饋執(zhí)行結(jié)果。
[0020]較佳地,該方法還包括:
[0021]創(chuàng)建存儲目錄,所述存儲目錄包括兩個子目錄:任務(wù)類型存儲目錄和節(jié)點信息存儲目錄,其中:
[0022]任務(wù)類型存儲目錄用于存儲收到的任務(wù)的信息,包括但不限于:任務(wù)描述信息、任務(wù)相關(guān)命令;
[0023]節(jié)點信息存儲目錄用于存儲所有注冊節(jié)點的信息,包括但不限于:節(jié)點資源信息、收到的任務(wù)信息、節(jié)點狀態(tài)。
[0024]本申請?zhí)峁┑囊环N任務(wù)分發(fā)系統(tǒng),包括:分布式協(xié)調(diào)組件和任務(wù)分發(fā)組件,其中:
[0025]所述分布式協(xié)調(diào)組件基于分布式協(xié)調(diào)服務(wù),用于對節(jié)點進行注冊和管理;
[0026]所述任務(wù)分發(fā)組件用于進行任務(wù)分發(fā),當(dāng)新任務(wù)到達時,將新任務(wù)加入任務(wù)隊列,并向分布式協(xié)調(diào)組件查詢所述新任務(wù)請求的目的計算節(jié)點是否為已注冊節(jié)點,如果是,通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù),并從任務(wù)隊列中刪除所述新任務(wù),否則,將所述新任務(wù)置于任務(wù)隊列尾部,并在預(yù)設(shè)時間內(nèi)以預(yù)設(shè)的時間間隔執(zhí)行所述判斷的操作,直至找到相應(yīng)的節(jié)點,如果超過所述預(yù)設(shè)時間沒有找到相應(yīng)的節(jié)點,則將所述新任務(wù)從所述任務(wù)隊列中刪除。
[0027]較佳地,所述分布式協(xié)調(diào)組件包括:節(jié)點信息管理組件、事件通知組件和任務(wù)信息存儲組件,其中:
[0028]節(jié)點信息管理組件以類Unix文件系統(tǒng)的樹形結(jié)構(gòu),存儲各注冊節(jié)點的相關(guān)信息;
[0029]事件通知組件與節(jié)點信息管理組件和任務(wù)信息存儲組件通訊,用于通知任務(wù)分發(fā)組件相關(guān)的事件;
[0030]任務(wù)信息存儲組件以隊列的方式存儲任務(wù)信息,并通過事件通知組件傳遞給任務(wù)分發(fā)組件。
[0031]較佳地,所述任務(wù)分發(fā)組件包括:節(jié)點監(jiān)控組件、任務(wù)管理組件和節(jié)點管理組件,其中:
[0032]節(jié)點監(jiān)控組件用于監(jiān)控節(jié)點的信息并將其更新到分布式協(xié)調(diào)組件中,監(jiān)控的信息包括節(jié)點的靜態(tài)信息、動態(tài)信息、節(jié)點狀態(tài)等;
[0033]任務(wù)管理組件通過與節(jié)點管理組件通訊來定位對應(yīng)的節(jié)點,給對應(yīng)的節(jié)點分配任務(wù),并反饋任務(wù)進行情況到分布式協(xié)調(diào)組件;
[0034]節(jié)點管理組件負責(zé)與分布式協(xié)調(diào)組件的節(jié)點信息管理組件通訊,提供具體的節(jié)點操作功能,包括但不限于:注冊節(jié)點、查詢節(jié)點信息、注銷節(jié)點、修改節(jié)點。由上述技術(shù)方案可見,本申請?zhí)峁┑幕诜植际絽f(xié)調(diào)服務(wù)的任務(wù)分發(fā)方法和系統(tǒng),主要解決了傳統(tǒng)方法和系統(tǒng)無法適應(yīng)分布式計算環(huán)境的問題,對于物理分布性強、單位時間內(nèi)待分發(fā)任務(wù)數(shù)量大的系統(tǒng),本申請?zhí)峁┑姆椒ê拖到y(tǒng)能夠充分保證任務(wù)分發(fā)的一致性和可靠性能,并提供高可用的任務(wù)分發(fā)服務(wù)。
[0035]在本申請?zhí)峁┑娜蝿?wù)分發(fā)方法和系統(tǒng)中,分布式協(xié)調(diào)組件主要提供任務(wù)類型查詢、任務(wù)信息存儲、計算節(jié)點信息存儲和事件通知功能,這些功能都依賴于分布式協(xié)調(diào)服務(wù),利用它針對大型分布式系統(tǒng)設(shè)計的可靠數(shù)據(jù)管理服務(wù)的特點,可以有效保障任務(wù)請求數(shù)據(jù)的安全及一致性。由于分布式協(xié)調(diào)服務(wù)是一種具有高可擴展性的服務(wù),可充分適應(yīng)分布式計算環(huán)境及高吞吐量的任務(wù)信息讀寫,為任務(wù)分發(fā)服務(wù)的高可用性提供了保障。
[0036]在任務(wù)分發(fā)方面,通過在每個計算節(jié)點上部署任務(wù)分發(fā)組件,與分布式協(xié)調(diào)組件異步通訊來獲取和同步計算節(jié)點的狀態(tài)以及任務(wù)的狀態(tài)。由分布式協(xié)調(diào)組件來確保任務(wù)分發(fā)的可靠性,可用性以及一致性。
[0037]為了提高提高分布式協(xié)調(diào)服務(wù),本申請依賴于分布式協(xié)調(diào)服務(wù)中使用的類似于Unix文件系統(tǒng)的數(shù)據(jù)模型,并自主設(shè)計了與任務(wù)分發(fā)相關(guān)的數(shù)據(jù)存儲框架。本申請中數(shù)據(jù)模型的不同點在于,沒有文件系統(tǒng)中對文件和目錄的明顯區(qū)分,它統(tǒng)一使用節(jié)點(node)的概念,節(jié)點可以作為數(shù)據(jù)存儲文件以及其他節(jié)點的容器。這樣的設(shè)計不單是為了存儲而設(shè)計,還擁有高吞吐、低延遲的特性。
【專利附圖】
【附圖說明】
[0038]圖1為本申請一較佳任務(wù)分發(fā)系統(tǒng)的模塊示意圖;
[0039]圖2為本申請任務(wù)分發(fā)系統(tǒng)的信息存儲結(jié)構(gòu)模型;
[0040]圖3為本申請任務(wù)分發(fā)系統(tǒng)的部署方式示意圖;
[0041]圖4為本申請任務(wù)到達處理流程不意圖;
[0042]圖5為本申請節(jié)點注冊流程示意圖;
[0043]圖6為本申請任務(wù)執(zhí)彳丁流程不意圖;
[0044]圖7為本申請一較佳實施例中任務(wù)分發(fā)系統(tǒng)的數(shù)據(jù)模型示意圖。
【具體實施方式】
[0045]為使本申請的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下參照附圖并舉實施例,對本申請作進一步詳細說明。
[0046]分布式協(xié)調(diào)服務(wù)是一種針對大型分布式系統(tǒng)提供的可靠協(xié)調(diào)服務(wù),主要用于解決分布式應(yīng)用中的可靠性和一致性問題,它的主要功能包括數(shù)據(jù)維護、分布式同步和命名服務(wù)等。
[0047]下面以Zookeeper為例,來說明分布式協(xié)調(diào)服務(wù)的特征和基本原理。Zookeeper是分布式協(xié)調(diào)服務(wù)的一種開源實現(xiàn),其思想是基于google的論文:〃The Chubby lockservice for loosely-coupled distributed systems.〃。
[0048]其基本原理為:服務(wù)器和客戶端,以心跳檢測機制(即在一定時間內(nèi)ping客戶端)來保持連接。服務(wù)器之間通過選舉來確定一個唯一的leader,并由leader來進行不同服務(wù)器間數(shù)據(jù)的同步。Leader機制保證在超過半數(shù)服務(wù)器正常運行的情況下,系統(tǒng)能夠穩(wěn)定提供一致性服務(wù)。并且,通過一個類Unix文件系統(tǒng)的儲存方式來對數(shù)據(jù)進行存儲。
[0049]其特點是:通過建立一個分布式集群系統(tǒng),來為外界提供一個穩(wěn)定的一致的數(shù)據(jù)服務(wù),包括數(shù)據(jù)維護、分布式同步和命名服務(wù)等;并且,保證數(shù)據(jù)在發(fā)生變化時對關(guān)注該數(shù)據(jù)的客戶端進行通知,保證不同客戶端接收的通知順序一致。
[0050]分布式協(xié)調(diào)服務(wù)中分布式的多節(jié)點協(xié)同工作方式能夠解決集中式任務(wù)分發(fā)系統(tǒng)的過度負載,單點失效等問題;而節(jié)點間的同步、沖突解決機制又能夠彌補多層次任務(wù)分發(fā)技術(shù)的任務(wù)重復(fù)分發(fā)、分發(fā)錯誤、任務(wù)丟失的不足。本申請以這種可靠的分布式協(xié)調(diào)服務(wù)作為基礎(chǔ)保障,提出一種任務(wù)分發(fā)方法和系統(tǒng),該方法和系統(tǒng)主要通過提供任務(wù)類型查詢、任務(wù)請求到達通知及任務(wù)信息獲取等功能來實現(xiàn)任務(wù)分發(fā)。
[0051]圖1為本申請一較佳任務(wù)分發(fā)系統(tǒng)的模塊示意圖。參見圖1,本申請任務(wù)分發(fā)系統(tǒng)主要包括兩部分:分布式協(xié)調(diào)組件和任務(wù)分發(fā)組件,其中:
[0052]分布式協(xié)調(diào)組件基于分布式協(xié)調(diào)服務(wù)設(shè)計了組件中的數(shù)據(jù)存儲框架。該組件主要包括3個子模塊,分別是:節(jié)點信息管理組件、事件通知組件和任務(wù)信息存儲組件,其中:
[0053]I)節(jié)點信息管理組件:以類Unix文件系統(tǒng)的樹形結(jié)構(gòu),存儲各計算節(jié)點的相關(guān)信息;
[0054]2)事件通知組件:與節(jié)點信息管理組件和任務(wù)信息存儲組件通訊,用于通知任務(wù)分發(fā)組件相關(guān)的事件,如新任務(wù)到達,節(jié)點信息變更等;
[0055]3)任務(wù)信息存儲組件:以隊列的方式存儲任務(wù)信息,并通過事件通知組件傳遞給任務(wù)分發(fā)組件。
[0056]任務(wù)分發(fā)組件主要包括3個子模塊,分別是:節(jié)點監(jiān)控組件、任務(wù)管理組件和節(jié)點管理組件,其中:
[0057]I)節(jié)點監(jiān)控組件:用于監(jiān)控計算節(jié)點的信息并將其更新到分布式協(xié)調(diào)組件中,監(jiān)控的信息包括節(jié)點的靜態(tài)信息(如處理器型號、MAC地址等不變信息)、動態(tài)信息(如CPU利用率、內(nèi)存利用率等動態(tài)數(shù)據(jù))、節(jié)點活動狀態(tài)(是否在線)等;
[0058]2)任務(wù)管理組件:通過與節(jié)點管理組件通訊來定位對應(yīng)指定節(jié)點,給指定計算節(jié)點分配任務(wù),并反饋任務(wù)進行情況到分布式協(xié)調(diào)組件;
[0059]3)節(jié)點管理組件:負責(zé)與分布式協(xié)調(diào)組件的節(jié)點信息管理組件通訊,提供具體的節(jié)點操作功能,包括:注冊節(jié)點、查詢節(jié)點信息、注銷節(jié)點、修改節(jié)點等操作。
[0060]下面結(jié)合圖2,描述本申請任務(wù)分發(fā)系統(tǒng)的信息存儲結(jié)構(gòu)模型。如圖2所示:
[0061]整個存儲目錄分為兩個子目錄,分別是任務(wù)類型存儲目錄和節(jié)點信息存儲目錄,其中:
[0062]任務(wù)類型存儲目錄:用于存儲收到的任務(wù)的信息,包括任務(wù)描述信息、任務(wù)相關(guān)命令(例如:待執(zhí)行的命令)等;
[0063]節(jié)點信息存儲目錄:用于存儲所有注冊節(jié)點的信息,包括節(jié)點資源信息(包括:CPU利用率、內(nèi)存利用率等)、收到的任務(wù)信息、節(jié)點狀態(tài)等。其中,節(jié)點即被管理節(jié)點,代表執(zhí)行任務(wù)的計算機、服務(wù)器或類似設(shè)備(包括虛擬機)等。
[0064]上述信息存儲模型存在于分布式協(xié)調(diào)服務(wù)中。通過這樣的存儲結(jié)構(gòu),我們就可以利用分布式協(xié)調(diào)服務(wù)進行高可用的任務(wù)分發(fā)。這套存儲結(jié)構(gòu)存儲在分布式協(xié)調(diào)組件中,在進行任務(wù)分發(fā)時,任務(wù)分發(fā)組件與分布式協(xié)調(diào)組件通訊獲取所需信息,從而完成任務(wù)分發(fā)功能,具體流程將在后續(xù)進行描述。
[0065]下面結(jié)合圖3,描述本申請任務(wù)分發(fā)系統(tǒng)的部署方式。參見圖3:
[0066]分布式協(xié)調(diào)組件由多個分布式協(xié)調(diào)服務(wù)節(jié)點協(xié)同工作實現(xiàn)。它可以接收任務(wù),并創(chuàng)建任務(wù)隊列,通過數(shù)據(jù)存儲功能記錄下隊列中每個任務(wù)的相關(guān)信息,如任務(wù)執(zhí)行參數(shù)、任務(wù)請求的目的計算節(jié)點等。同時,分布式協(xié)調(diào)組件還將存儲所有可能的任務(wù)類型,為節(jié)點提供任務(wù)類型查詢功能,節(jié)點可以根據(jù)任務(wù)名在服務(wù)中找到該任務(wù)對應(yīng)的具體描述,甚至相關(guān)任務(wù)指令。為了讓節(jié)點可以及時接收并執(zhí)行相關(guān)任務(wù),每個節(jié)點都在分布式協(xié)調(diào)組件的節(jié)點信息管理組件中進行注冊,并擁有屬于自己的任務(wù)存儲模塊(任務(wù)存儲模塊由任務(wù)信息存儲組件管理),當(dāng)某節(jié)點的任務(wù)存儲模塊中被寫入新任務(wù)時,系統(tǒng)將通知相應(yīng)的節(jié)點接收并執(zhí)行該新任務(wù)。
[0067]在節(jié)點池中,每個節(jié)點都安裝有任務(wù)分發(fā)組件(安裝在節(jié)點中的任務(wù)分發(fā)組件可以理解為本申請任務(wù)分發(fā)系統(tǒng)的客戶端),通過任務(wù)分發(fā)組件與分布式協(xié)調(diào)組件的協(xié)同工作,完成任務(wù)分發(fā)功能。
[0068]本申請如圖3所示的任務(wù)分發(fā)系統(tǒng)主要涉及任務(wù)到達、節(jié)點注冊及任務(wù)執(zhí)行三個主要的應(yīng)用場景,下面結(jié)合附圖分別予以詳細說明。
[0069]圖4為本申請任務(wù)到達處理流程示意圖,主要包括以下處理:
[0070]a.新任務(wù)到達;
[0071]b.新任務(wù)加入任務(wù)隊列;
[0072]c.查詢?nèi)蝿?wù)請求中的目的計算節(jié)點信息;
[0073]d.在分布式協(xié)調(diào)組件中根據(jù)目的計算節(jié)點信息查找相應(yīng)的節(jié)點是否存在;
[0074]e.若存在,則對該節(jié)點在分布式協(xié)調(diào)組件中的任務(wù)存儲模塊進行修改,將該任務(wù)相關(guān)的信息添加到該節(jié)點對應(yīng)的任務(wù)存儲模塊中,并通知該節(jié)點有新任務(wù)到達,將該任務(wù)的狀態(tài)更改為等待執(zhí)行,并從任務(wù)隊列中刪除該任務(wù);
[0075]f.若不存在,則將該任務(wù)置于隊列尾部,在規(guī)定時間內(nèi)以一定的時間間隔對分布式協(xié)調(diào)組件的節(jié)點信息管理組件發(fā)起輪詢,若找到目的計算節(jié)點,則按e步驟執(zhí)行;若在規(guī)定時間內(nèi)未找到目的計算節(jié)點,返回任務(wù)執(zhí)行錯誤信息,并從任務(wù)隊列中刪除該任務(wù)。
[0076]圖5為本申請節(jié)點注冊流程示意圖,主要包括以下處理:
[0077]a.節(jié)點開始活動(即已做好執(zhí)行任務(wù)到準(zhǔn)備)時,節(jié)點運行任務(wù)分發(fā)組件,進行節(jié)點初始化;
[0078]b.在分布式協(xié)調(diào)組件中查找節(jié)點信息;
[0079]c.若存在相應(yīng)的節(jié)點,則節(jié)點開始接收任務(wù),查詢是否存在待執(zhí)行任務(wù)(也可稱為未完成任務(wù)),如果有未完成任務(wù),則執(zhí)行未完成任務(wù);
[0080]d.若不存在相應(yīng)的節(jié)點,則在分布式協(xié)調(diào)組件中創(chuàng)建對應(yīng)于該節(jié)點的唯一的任務(wù)存儲模塊,將節(jié)點狀態(tài)置為空閑,等待新任務(wù)到達。
[0081]圖6為本申請任務(wù)執(zhí)行流程示意圖,主要包括以下處理:
[0082]a.節(jié)點接收到新任務(wù)到達通知;
[0083]b.節(jié)點中的任務(wù)分發(fā)組件與分布式協(xié)調(diào)組件進行通信,獲取新任務(wù)的任務(wù)名及任務(wù)參數(shù);
[0084]c.利用任務(wù)名在分布式協(xié)調(diào)組件中查詢?nèi)蝿?wù)相關(guān)描述信息(如執(zhí)行指令);
[0085]d.節(jié)點根據(jù)獲取的任務(wù)參數(shù)、任務(wù)指令等信息執(zhí)行計算任務(wù),將其在分布式協(xié)調(diào)組件中存儲的任務(wù)狀態(tài)更改為執(zhí)行中;
[0086]e.任務(wù)執(zhí)行完成后,將任務(wù)狀態(tài)修改為已完成,并將執(zhí)行結(jié)果反饋到分布式協(xié)調(diào)組件中。
[0087]下面通過一個較佳實施例對本申請技術(shù)方案進行進一步詳細說明。
[0088]本實施例是將本發(fā)明中的任務(wù)分發(fā)方法和系統(tǒng)應(yīng)用到分布式集群環(huán)境中,實現(xiàn)一個集群內(nèi)部地任務(wù)分發(fā)系統(tǒng)。該任務(wù)分發(fā)系統(tǒng)主要接收來自集群管理節(jié)點發(fā)出的任務(wù)請求,將任務(wù)分發(fā)給指定的目的計算節(jié)點,并對任務(wù)執(zhí)行狀態(tài)進行記錄。涉及的具體技術(shù)包括分布式協(xié)調(diào)服務(wù)框架zookeeper及python編程語言。
[0089]本實施例中,利用zookeeper提供分布式協(xié)調(diào)服務(wù),實現(xiàn)數(shù)據(jù)管理服務(wù)。通過對
zookeeper類似文件系統(tǒng)的數(shù)據(jù)模型--znode樹進行設(shè)計,使每個計算節(jié)點在zookeeper
都對應(yīng)有唯一的任務(wù)存儲模塊,同時利用zookeeper中對znode的狀態(tài)變化監(jiān)聽機制,實現(xiàn)任務(wù)到達通知等功能。系統(tǒng)的數(shù)據(jù)模型詳細設(shè)計如圖7所示:
[0090]在ZooKeeper數(shù)據(jù)模型中,默認根znode下主要有兩個子znode樹:
[0091]—個為用于存儲所有可能類型任務(wù)的znode樹。該樹的根節(jié)點是名為Tasks的
znode,其子znode由具體的任務(wù)名稱命名,如圖7所示的task_l、task_2、......task_n。每個任務(wù)znode下都有兩個固定的子znode,分別被命名為descript1n,用于存儲任務(wù)描述信息;以及co_ands,用于存儲任務(wù)相關(guān)執(zhí)行指令。該znode樹的主要功能是枚舉系統(tǒng)所有的任務(wù)類型,為節(jié)點提供基本的任務(wù)明細,使節(jié)點了解指定任務(wù)的具體任務(wù)內(nèi)容、任務(wù)要求和其涉及的執(zhí)行指令,方便節(jié)點執(zhí)行具體任務(wù)。
[0092]另一個是用于存儲各節(jié)點相關(guān)任務(wù)請求的znode樹。該樹的根節(jié)點是名為Nodes
的znode,其子znode由集群中各節(jié)點名稱命名,如圖7所示的member-01、member-02、......member-no每個節(jié)點znode下也擁有兩個固定的子znode,分別為request,用于存儲該節(jié)點接收到的所有任務(wù)請求;以及machine,用于標(biāo)記節(jié)點的活動狀態(tài)。需要注意的是,machine是一個臨時znode,只有當(dāng)節(jié)點開始運行任務(wù)分發(fā)系統(tǒng)客戶端時,才會自動創(chuàng)建該znode,以表示節(jié)點處于活動狀態(tài),可接收并執(zhí)行任務(wù)。request及其子znode樹則對應(yīng)節(jié)點的任務(wù)存儲模塊,它的每個子znode都對應(yīng)一個節(jié)點收到的任務(wù)請求,znode由任務(wù)名稱命名,同時,znode的存儲值為該任務(wù)請求的相關(guān)信息,如任務(wù)請求時間、任務(wù)請求參數(shù)、任務(wù)執(zhí)行狀態(tài)、任務(wù)執(zhí)行結(jié)果等。
[0093]對于任務(wù)分發(fā)系統(tǒng)主要涉及的三種場景,結(jié)合本實施例設(shè)計的上述ZooKeeper數(shù)據(jù)模型,具體方法實現(xiàn)如下:
[0094]1.任務(wù)到達
[0095]a.當(dāng)新任務(wù)到達時,根據(jù)任務(wù)的目的節(jié)點名,在ZooKeeper的Nodes目錄下查找是否存在以該節(jié)點名命名的子znode ;
[0096]b.若存在,貝Ij在該znode目錄中名為request的子znode下創(chuàng)建一個以任務(wù)名命名的znode,存儲值為該任務(wù)請求的相關(guān)信息,其中狀態(tài)信息為等待執(zhí)行;
[0097]c.若不存在,則等待一個預(yù)設(shè)的時間間隔,之后再次發(fā)起相同的任務(wù)請求,輪詢ZooKeeper中是否存在該目的節(jié)點,若存在,則按照b步驟執(zhí)行。假設(shè)每個任務(wù)輪詢發(fā)起請求的次數(shù)上限為10次,10次之后若仍無法找到目的節(jié)點接收,則丟棄此任務(wù),并返回錯誤提不。
[0098]2.節(jié)點注冊
[0099]a.節(jié)點運行任務(wù)分發(fā)系統(tǒng)客戶端后,客戶端主動與ZooKeeper服務(wù)器端建立通信連接;
[0100]b.通信連接成功后,在ZooKeeper的Nodes目錄下查找是否存在以該節(jié)點名命名的子znode ;
[0101]c.若存在,貝丨」在節(jié)點對應(yīng)znode目錄下建立machine臨時znode,并對request目錄下的各任務(wù)狀態(tài)進行讀取。對于標(biāo)記為等待執(zhí)行的任務(wù),立即開始執(zhí)行;同時對request目錄進行監(jiān)聽,若出現(xiàn)新的任務(wù),節(jié)點將通過客戶端收到通知;
[0102]d.若不存在,貝丨」在Nodes目錄下建立節(jié)點對應(yīng)的znode子樹,并對樹中的request目錄進行監(jiān)聽,等待新任務(wù)到達。
[0103]3.任務(wù)執(zhí)行
[0104]a.當(dāng)新任務(wù)到達時,節(jié)點對應(yīng)的znode目錄下的request目錄下將創(chuàng)建一個對應(yīng)的任務(wù)znode,ZooKeeper服務(wù)將監(jiān)測到這一變化,并通知節(jié)點上運行的任務(wù)分發(fā)系統(tǒng)客戶端,節(jié)點對應(yīng)的任務(wù)存儲模塊有變化;
[0105]b.節(jié)點收到通知后,通過任務(wù)分發(fā)系統(tǒng)客戶端與ZooKeeper服務(wù)器建立通信,通過遍歷request目錄下的子znode,找到新的任務(wù)znode,并通過讀取該znode的存儲值獲取任務(wù)參數(shù);
[0106]c.獲取到充足的任務(wù)信息后,節(jié)點在本地執(zhí)行具體的任務(wù),并將對應(yīng)znode存儲值的任務(wù)狀態(tài)字段更新為執(zhí)行中;
[0107]d.當(dāng)任務(wù)執(zhí)行完成后,節(jié)點再次通過任務(wù)分發(fā)系統(tǒng)客戶端將任務(wù)執(zhí)行結(jié)果寫入到對應(yīng)znode存儲值的任務(wù)結(jié)果字段中。
[0108]本實施例中的任務(wù)分發(fā)方法和系統(tǒng)通過利用ZooKeeper在數(shù)據(jù)管理方面的高容錯性和高一致性,可靠的實現(xiàn)了任務(wù)相關(guān)數(shù)據(jù)的存儲和讀寫,并通過編程實現(xiàn)相關(guān)業(yè)務(wù)邏輯實現(xiàn)任務(wù)分發(fā)方法。同時,該系統(tǒng)還利用ZooK^per的高可擴展性,充分適應(yīng)了彈性規(guī)模的環(huán)境,保證了系統(tǒng)的服務(wù)質(zhì)量。
[0109]由上述可見,本申請以分布式協(xié)調(diào)服務(wù)為基礎(chǔ)建立了一種任務(wù)分發(fā)方法和系統(tǒng),充分利用了分布式協(xié)調(diào)服務(wù)在數(shù)據(jù)管理方面的優(yōu)勢來維護任務(wù)分發(fā)狀態(tài)信息的一致性,并利用分布式協(xié)調(diào)服務(wù)的可擴展性滿足了分布式計算環(huán)境對任務(wù)分發(fā)系統(tǒng)提出的高吞吐量需求,能夠保證服務(wù)的高可用性。
[0110]以上所述僅為本申請的較佳實施例而已,并不用以限制本申請,凡在本申請的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本申請保護的范圍之內(nèi)。
【權(quán)利要求】
1.一種任務(wù)分發(fā)方法,其特征在于,包括: 對節(jié)點進行注冊; 當(dāng)新任務(wù)到達時,將新任務(wù)加入任務(wù)隊列,并判斷所述新任務(wù)請求的目的計算節(jié)點是否為已注冊節(jié)點,如果是,將所述新任務(wù)的信息添加入分布式協(xié)調(diào)服務(wù)中的任務(wù)存儲模塊,通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù),并從任務(wù)隊列中刪除所述新任務(wù),否則,將所述新任務(wù)置于任務(wù)隊列尾部,并在預(yù)設(shè)時間內(nèi)以預(yù)設(shè)的時間間隔執(zhí)行所述判斷的操作,直至找到相應(yīng)的節(jié)點,如果超過所述預(yù)設(shè)時間沒有找到相應(yīng)的節(jié)點,則將所述新任務(wù)從所述任務(wù)隊列中刪除。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對節(jié)點進行注冊包括: 節(jié)點開始活動時,查找已注冊節(jié)點中是否存在所述節(jié)點; 如果存在,則查詢是否存在對應(yīng)于所述節(jié)點的待執(zhí)行任務(wù),如果有,執(zhí)行所述待執(zhí)行任務(wù); 如果不存在,則注冊所述節(jié)點,并將節(jié)點狀態(tài)置為空閑。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于: 注冊所述節(jié)點包括:創(chuàng)建對應(yīng)于所述節(jié)點的任務(wù)存儲模塊。
4.根據(jù)權(quán)利要求1至3任一項所述的方法,其特征在于,所述通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù)包括: 節(jié)點接收到新任務(wù)到達通知; 所述節(jié)點獲取新任務(wù)的任務(wù)名及任務(wù)參數(shù); 所述節(jié)點利用所述任務(wù)名查詢?nèi)蝿?wù)相關(guān)描述信息,并根據(jù)獲取到任務(wù)參數(shù)和任務(wù)相關(guān)描述信息執(zhí)行相應(yīng)的任務(wù),并將所述任務(wù)的狀態(tài)置為執(zhí)行中; 任務(wù)執(zhí)行完成后,將所述任務(wù)的狀態(tài)置為已完成,并反饋執(zhí)行結(jié)果。
5.根據(jù)權(quán)利要求1至3任一項所述的方法,其特征在于,該方法還包括: 創(chuàng)建存儲目錄,所述存儲目錄包括兩個子目錄:任務(wù)類型存儲目錄和節(jié)點信息存儲目錄,其中: 任務(wù)類型存儲目錄用于存儲收到的任務(wù)的信息,包括但不限于:任務(wù)描述信息、任務(wù)相關(guān)命令; 節(jié)點信息存儲目錄用于存儲所有注冊節(jié)點的信息,包括但不限于:節(jié)點資源信息、收到的任務(wù)信息、節(jié)點狀態(tài)。
6.一種任務(wù)分發(fā)系統(tǒng),其特征在于,包括:分布式協(xié)調(diào)組件和任務(wù)分發(fā)組件,其中: 所述分布式協(xié)調(diào)組件基于分布式協(xié)調(diào)服務(wù),用于對節(jié)點進行注冊和管理; 所述任務(wù)分發(fā)組件用于進行任務(wù)分發(fā),當(dāng)新任務(wù)到達時,將新任務(wù)加入任務(wù)隊列,并向分布式協(xié)調(diào)組件查詢所述新任務(wù)請求的目的計算節(jié)點是否為已注冊節(jié)點,如果是,通知對應(yīng)的節(jié)點執(zhí)行所述新任務(wù),并從任務(wù)隊列中刪除所述新任務(wù),否則,將所述新任務(wù)置于任務(wù)隊列尾部,并在預(yù)設(shè)時間內(nèi)以預(yù)設(shè)的時間間隔執(zhí)行所述判斷的操作,直至找到相應(yīng)的節(jié)點,如果超過所述預(yù)設(shè)時間沒有找到相應(yīng)的節(jié)點,則將所述新任務(wù)從所述任務(wù)隊列中刪除。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述分布式協(xié)調(diào)組件包括:節(jié)點信息管理組件、事件通知組件和任務(wù)信息存儲組件,其中: 節(jié)點信息管理組件以類Unix文件系統(tǒng)的樹形結(jié)構(gòu),存儲各注冊節(jié)點的相關(guān)信息; 事件通知組件與節(jié)點信息管理組件和任務(wù)信息存儲組件通訊,用于通知任務(wù)分發(fā)組件相關(guān)的事件; 任務(wù)信息存儲組件以隊列的方式存儲任務(wù)信息,并通過事件通知組件傳遞給任務(wù)分發(fā)組件。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述任務(wù)分發(fā)組件包括:節(jié)點監(jiān)控組件、任務(wù)管理組件和節(jié)點管理組件,其中: 節(jié)點監(jiān)控組件用于監(jiān)控節(jié)點的信息并將其更新到分布式協(xié)調(diào)組件中,監(jiān)控的信息包括節(jié)點的靜態(tài)信息、動態(tài)信息、節(jié)點狀態(tài)等; 任務(wù)管理組件通過與節(jié)點管理組件通訊來定位對應(yīng)的節(jié)點,給對應(yīng)的節(jié)點分配任務(wù),并反饋任務(wù)進行情況到分布式協(xié)調(diào)組件; 節(jié)點管理組件負責(zé)與分布式協(xié)調(diào)組件的節(jié)點信息管理組件通訊,提供具體的節(jié)點操作功能,包括但不限于:注冊節(jié)點、查詢節(jié)點信息、注銷節(jié)點、修改節(jié)點。
【文檔編號】G06F9/50GK104503845SQ201510018653
【公開日】2015年4月8日 申請日期:2015年1月14日 優(yōu)先權(quán)日:2015年1月14日
【發(fā)明者】崔毅東, 金躍輝, 張一文, 雷友珣, 漆濤, 陳莉萍, 楊談, 李文韻 申請人:北京郵電大學(xué)