專利名稱:一種分布式云計算環境中信息處理服務的部署方法
技術領域:
本發明涉及一種云計算環境中的處理方法,特別是一種云計算中信息處理服務的部署方法。
背景技術:
在IT商業界與產業界,云計算已經受到越來越多的關注與應用。云為服務的創建、部署、管理和適用提供了相當多的機會。云計算的即用即付的商業模式,使得云提供商一個關鍵的驅動力就是合理地適用基礎設施資源以最優化地滿足用戶的服務質量需求,從而達到降低服務成本,擴大收益的目的。信息處理服務是云計算中一類應用廣泛的服務類型,如對廣域分布的連鎖超市的銷售與庫存信息的分析以指導貨物的調配,對銀行各服務網點的監控信息進行處理以發現欺詐等行為,對網絡流量的探測信息進行整理以避免擁塞,對線上游戲等數據的挖掘以提升用戶體驗等等。這類服務的特點是處理的信息量大,對服務器的計算能力要求高,信息來源廣域分布。此外,很多的信息處理請求需要能夠得到及 時的響應。因此,需要結合云計算環境的網絡狀況,服務器的計算能力,服務部署與維護開銷等因素,合理地部署這類信息處理服務,以滿足廣域的信息源(即用戶)的服務質量需求。然而,現有的服務部署技術大多追求整體服務性能的提升,從而忽略了某些用戶的服務質量需求,這不滿足目前云計算發展的需要。此外,這些現有的部署技術難以適應用戶服務請求數據率隨著時間推移而增長這一云計算環境中的常見情況。
發明內容
發明目的本發明所要解決的技術問題是針對現有技術的不足,提供一種云計算中信息處理服務的部署方法,通過選擇合適的服務器以部署信息處理服務,從而在嚴格保證分布式云計算環境中用戶的服務質量需求的前提下,減小盡可能低的服務部署與維護開銷以滿足穩定的用戶請求,或在指定的服務部署與維護開銷的基礎上,盡可能適應用戶請求可能的擴展情況。為了解決上述技術問題,本發明公開了一種分布式云計算環境中信息處理服務的部署方法,在確定了云計算平臺終端個體用戶的服務請求數據率相關信息及其服務質量需求、服務器可行計算容量及其之上的服務部署與維護開銷之后,選取合適的服務器以用來部署信息處理服務,包括以下步驟網絡狀況監控步驟,按照網絡拓撲結構對網絡鏈路狀況進行監測,從而獲取每條網絡鏈路上的傳輸時延;服務部署方案選擇步驟,按照網絡狀況以及當前服務器可行計算容量,結合終端用戶的服務請求數據率相關信息和服務質量需求,明確服務部署方案的約束條件,并結合服務部署開銷選取最優的服務部署方案,明確相應的用戶請求分配方案。服務部署步驟,按照最優服務部署方案,將服務部署到相應的服務器上。本發明中,云計算平臺終端用戶的服務請求數據以數據流的形式出現。
本發明中,云計算平臺終端用戶的服務請求數據率相關信息以明確的數值或者以隨時間的遞增函數形式出現。明確的數值一般可以取[2,4000]之間的任意數值。隨時間的遞增函數形式可以是隨時間t遞增函數#。(0 = (1+入。0艮(0),其中艮(0) —般可以取[2,200]間任意數值,而λ。一般可以取[O. 1,20]間任意數值。本發明中,云計算平臺終端用戶的服務質量需求以用戶任意數據片段發出與相應數據處理結果返回給用戶的時延不能超過給定值的形式出現。云計算平臺終端個體用戶的服務質量需求定義為,云計算平臺終端個體用戶發出任意數據片段與相應數據處理結果返回給云計算平臺終端個體用戶的時延的最大閾值。最大閾值為時間值,取值范圍為自然數。本發明中,服務器可行計算容量以其單位時間可處理的服務請求數據量的形式出現。本發明中,終端用戶與服務器之間的傳輸時延以兩者之間最短傳輸路徑時延的形式出現。本發明中,服務部署方案的約束條件包括傳輸時延約束條件,即終端用戶與服務 器間的往返傳輸時延不能超過用戶服務質量需求,和計算容量約束條件,即每個部署服務的服務器上相連的終端用戶服務請求的數據率之和不能超過該服務器的可行計算容量。本發明中如何選取最優的服務部署方案與服務請求數據率相關信息出現的形式以及服務器容量信息密切相關。本發明中,當所有服務器可行計算容量充足(如服務器本身計算能力十分強大或可為服務器追加計算資源)時,最優服務部署方案的選擇采用基于集合覆蓋的算法,包括以下子步驟確定每一對服務器與用戶間的傳輸時延,并按照服務部署方案的傳輸時延約束條件,明確每一個服務器所能處理的用戶對象;在每一個迭代過程中,以未部署服務的服務器所能處理的用戶對象個數(需排除已處理的用戶對象)與其上的服務部署與維護開銷的比值為性價比衡量指標,選取性價比最高的服務器,直到所有用戶對象均以處理或服務器均被挑選。若迭代結束時,仍有用戶對象未被處理,則返回找不到可行解。本發明中,當服務器可行計算容量受限且服務請求數據率以明確數值提供時,最優服務部署方案的選擇采用基于背包的迭代算法,主要包括以下子步驟確定每一對服務器與用戶間的傳輸時延,并按照服務部署方案的傳輸時延約束條件,明確每一個服務器所能處理的用戶對象。在每一個迭代過程中,為每一個未部署服務的服務器按照背包問題求解算法計算該服務器可處理的最大的服務數據率之和,即以該服務器的可行計算容量為背包大小,以該服務器所能處理的用戶對象(需排除已處理的用戶對象)為物品,其數據率為物品大小,按照經典的背包問題求解算法(如動態規劃算法等)計算出該服務器可處理的最大的服務數據率之和;再以服務器所能處理的最大服務數據率之和與其上的服務部署與維護開銷的比值為性價比衡量指標,選取性價比最高的服務器,直到所有用戶對象均以處理或服務器均被挑選。若迭代結束時,仍有用戶對象未被處理,則返回找不到可行解。 本發明中,當服務器可行計算容量一般且服務請求數據率以時間的遞增函數形式出現時,最優服務部署方案的選擇采用基于結合二分法的基于背包的迭代算法,包括以下子步驟選取一個大于零的時間,計算該時間下的每個用戶的請求數據率,并采用基于背包的迭代 算法計算當前狀態下最低的服務部署與維護的總開銷;如果該開銷小于指定開銷(一般可以指定為[100,1000]內的數值),則以二分法的方法提高該時間,如果該開銷大于指定開銷,則以二分法的方法降低該時間,并循環執行上一子步驟,直至可行的時間最大(誤差范圍內)。有益效果本發明通過考慮云中所有用戶的服務請求情況以及用戶請求擴展情況,使得信息處理服務通過合理部署,來充分滿足每個用戶的服務質量需求;通過對服務的容量限制,避免了服務超載擁塞等狀況;通過考慮服務的部署與維護等開銷,達到了降低成本的目的。本發明可以廣泛應用于企業的資源優化配置、電子商務等領域,為私有云或公共云環境中的服務部署提供具有服務質量保證的方法,支持外包資源的配置選擇,屬于計算機應用領域。
下面結合附圖和具體實施方式
對本發明做更進一步的具體說明,本發明的上述和/或其他方面的優點將會變得更加清楚。圖Ia 圖Id為舉例說明云計算中信息服務的部署問題示意圖。圖2為本發明總體流程圖。圖3服務器容量充足時,基于集合覆蓋的算法流程圖。圖4服務器容量受限時,基于背包的迭代算法流程圖。
具體實施例方式圖Ia 圖Id為本發明通過一個簡單直觀的例子來說明該服務部署問題所關心的要素,重點說明本發明所要解決的問題。考慮一個分布式的網絡系統,其含有三個服務器(用S表示)和六個客戶端(用C表示),如圖la,其客戶端比如是連鎖超市的分店,而服務器由云提供商提供并分布在各地,可以用來處理分店數據。每個客戶端會產生大量的分布式數據,而服務器需要及時地處理這些數據,并將信息反饋給客戶。在這個例子中,如果本發明假設每個客戶都必須指派到相鄰的服務器,否則會因為距離過遠而不能保證服務質量;而且每個服務器由于容量限制只能處理三個客戶的服務請求。同時,由于需要消耗一定的資源以在服務器上部署和維護服務,本發明希望盡量減少開銷并保證每個用戶的服務質量。圖Ib描繪了一種不能滿足需求的部署形式,圖中“X”表示由于距離過遠服務無法保證用戶的服務質量需求。在這種部署方式中,無論如何向SI與S3分派用戶,必有某部分用戶的服務質量不能得到滿足。在圖Ic中,用戶CfC4都被分配給了 S3,使得S3超過了負載。因此,當本發明進行服務部署與分配用戶請求的時候,需要同時考慮用戶的服務質量保證和服務器的容量。圖Id給出了符合要求的最優化部署與服務分配的策略。由此例可以看出,在服務部署過程中,需要考慮的因素包括用戶節點服務請求的數據率,服務的響應時間,服務器的容量限制,服務部署的開銷等。圖2給出了本發明總體流程圖,按照流程圖中的步驟分別做闡述
I.網絡狀況監測考慮一個由無向圖G=(V,E)表示的分布式云計算系統,其中V代表節點的集合,而i 是節點之間物理或者邏輯邊的集合。對于E中的每條邊,本發明可以通過網絡監測獲取到其上的傳輸時延。更進一步,可以通過最短路徑算法,獲取到每一對節點U,V e V之間的最短路徑上的傳輸時延,表示為d(u,v)。2.明確服務部署約束條件本發明稱需要處理的數據源節點為用戶節點,并將用戶節點集合表示為C。每個單獨的用戶c e C的服務請求速率,本發明記為R。,該速率可能保持穩定或者隨著時間變化。如果一個節點可以用來部署服務,本發明稱其為服務器。所有這樣的節點組成了服務器集合,由S表示。每個服務器節點s e S的可行計算容量,本發明記為Us,S卩服務器s單位時間內能夠處理的數據量最多是Us。每個服務器s e S都有一個權重Cs,代表將指定服務部署在服務器s e S上需要的部署和維護的開銷。這個開銷包括對服務器資源(如CPU和內存)的消耗,以及對服務的維護(如服務的更新等操作)。由于用戶產生的數據在很多情況下是連續性的,源源不斷地,所以數據不能被分割,否則會導致數據的丟失影響服務質量。因此,·本發明要使得每個用戶請求對應于一個服務器。本發明的目標是將服務放置在選定的服務器上,使得每個用戶都能得到服務質量保證,并使得服務器不會發生超載,同時盡可能地降低開銷。為了及時地為用戶提供服務以便于決策等操作,本發明需要使每個用戶都在其指定的時間范圍內收到服務處理的反饋。具體來講,用戶請求的響應時間包括兩個部分數據傳輸時間即用戶與服務器之間的最短路徑傳輸時延。服務處理時間當數據到達某個服務器,需要等待然后進行服務的計算。通常來說,本發明需要避免服務器上接受的用戶請求量超過其可行計算容量,否則必存在某個用戶服務等待時間過長,從而該用戶請求的服務質量需求不能滿足。而一旦該條件能夠滿足,服務器上的請求數據均能夠得到及時處理,可以把處理時間近似為O。本發明假設Qc表示用戶c能容忍的響應時間的上限(即服務質量需求)。假設用戶C由服務器S處理,令Rss 表示分配給服務器S的用戶服務請求的總和。基于上述考慮,為了保證用戶c的服務質量,必須滿足如下兩個限制條件(l)d(c, s) ^ Qc ;(2) RssumS Us.由上所述,當用戶數據請求數據率為明確數值(一般可以取[2,4000]之間的任意數值)時,該服務部署問題的形式化定義為給定一個無向圖G=(V,E),任何一對節點{u,V}之間的最短路徑長度d (U,V).對用戶節點集合C c: F中的每個用戶c來說,其用戶請求數據率記為R。,服務質量需求記為Qc。對服務器節點集合S c K中的每個服務器s來說,其可行計算容量記為Us,部署維護服務的開銷記為cs。服務部署問題的目標是找到一個子集D c S和函數f:C —D,最小化EsellCs同時滿足如下兩個限制條件1)時延限制對每個用戶c e C,d(c,f (c)) ^ Qc ;2)容量限制:對每個服務器 s e D,Σ。eC:f(c) = SRC ( Us。3.用戶請求數據率與服務器容量的不同場景下的最優化服務部署方案選擇I)如圖3所示,當服務器可行計算容量充足時,采用基于集合覆蓋的算法當服務器容量充足時,服務部署只需要考慮傳輸時延約束條件。本發明采用基于集合覆蓋的算法來解決。
用G=(V,E)表示網絡拓撲,C代表用戶集,S代表服務器集;對每個用戶c e C,Qc代表用戶的服務質量要求;對每個服務器s e SyR表服務開銷。D用來保存選到的服務器集合,初始值D賦值為Φ。首先構造一個二部圖G1= (S U C,E’),其中E’={(s,c) s e S, c e C,且d(s,c) ( QJ,即滿足每個用戶c e C的服務質量要求。對每個服務器s e S,所有連接到該服務器的用戶節點組成一個子集,記為Cs=Ic e C|d(c, s) < QJ,Cs中元素的個數為s在匕中的度ds,性價比cs/ds。據此產生了集合覆蓋問題的一個實例元素的全集是C,而對每個s e S,Cs組成了 C的子集的集合。Cs的權值是cs。目標是找到一個最小總代價的可以覆蓋所有C中用戶的Cs的集合。用戶到服務器的請求分配也可以在挑選合適的服務器節點進行服務部署的過程中確定。在算法的每一輪迭代過程中,性價比最高的服務器被挑選出來,即選擇s’=argmincs/ds,由此將s’加入選出的服務器集合D中。C’為s’覆蓋的用戶集,所有可以連接到此服務器但還沒有被分配的客戶都被指派到該服務器上。將選出的服務器與服務器覆蓋的用戶從G1中去掉,并判斷用戶集C是否被全部覆蓋。如果C為空集,則選出的服務器集合為D。否則,判斷服務器是否被分配完全。如果剩余的S不是空集,SP還有沒有被分配的服務器,此時,將去掉選出的服務器與分配的用戶后的子圖進行迭代;如果S是空集,則現有的服務器不能滿足要求,由此需要加入新的服務器。
如圖4所示,當服務器容量受限時,且用戶請求數據率為明確數值時,采用基于背包的迭代算法用G=(V,E)表示網絡拓撲,C代表用戶集,S代表服務器集;對每個用戶c e C,Qc代表用戶的服務質量要求;對每個服務器s e S,cs代表服務開銷,US代表服務器容量。D用來保存選到的服務器集合,初始值D賦值為Φ。根據每個用戶c e C的服務質量要求建立服務器與用戶之間的連接關系。由于服務器有容量上限,因此本發明希望服務部署到的服務器節點能夠在容量范圍內盡可能服務于更多的用戶。基于背包的迭代算法與背包問題密切相關每個服務器s相當于容積為Us的背包,而每個連接到服務器的用戶c相當于體積為Rc且收益為R。的物品。本發明可以通過背包問題的動態規劃算法或其他近似算法來獲取該服務器所能處理的最大服務請求數據率之和。在基于背包的算法的每次迭代過程中,選擇一個服務器然后首先將相連的葉子用戶(給定一個圖G,本發明稱度為I的節點為葉子節點,并稱唯一的那條連結到該節點的邊為懸掛邊。顯而易見,所有連結到懸掛邊的服務器必須部署服務,否則相應的葉子用戶的服務質量不能滿足)都分配到該服務器,剩余的用戶根據服務器的剩余容量按照背包問題的解決方案分配到服務器。KBA的具體執行流程見圖4。其細節介紹如下步驟1,處理葉子用戶如果存在用戶節點是葉子節點,那么它相鄰的服務器直接被選出。接著先將所有與其相連的葉子用戶都連接到該服務器上。如果服務器的容量不足以容納這些用戶,那么找不到可行解,算法終止(此時需要添加新的服務器,并不在本發明考慮范圍內)。否則,利用導出的背包問題將服務器的剩余容量分配給用戶。對于圖中其它的葉子用戶,本發明將在下一輪迭代中進行處理。步驟2,選擇一個服務器如果網絡中沒有葉子用戶節點存在,則選擇性價比最高的服務器,然后通過解決背包問題將所有可以裝載入該服務器的用戶去除,服務器S的性價比被定義為當s處理其能處理到的最大用戶請求(即s作為背包被裝滿)時的平均開銷,即,cs/Ps,其中Ps是作為背包問題目標函數的服務器的最大收益。
步驟3,迭代執行完步驟I和步驟2,選到的服務器和被分配的用戶從圖中移出。每個連接到被選擇到但未被分配的用戶的度都將減1,因此一些用戶可能成為新的葉節點。迭代執行步驟1-3,直到所有的用戶都被分配,或者算法找到一個不可能被滿足的用戶而終止。2)當服務器可行計算容量受限且服務請求數據率以時間的遞增函數形式出現時,采用基于結合二分法的基于背包的迭代算法本發明假設對每個用戶節點c e C來講,用戶請求RJt)隨著時間t增長,可以是隨時間遞增函數艮(0 = (1+入。0艮(0)。這種模型在現實中的許多應用場景中是有用的。例如,許多公司的管理者希望增長銷售額,并且會制定詳細的計劃并給出接下來一段時間內營業額的期望增長率。一般來講,在這種場景下需要處理的數據率近似正比于營業額,則請求增長函數RJt)可以由歷史數據進行預測和評估。其中RJ0) —般可以取[2,200]間任意數值,而λ。一般可以取[O. 1,20]間任意數值。選取一個大于零的時間(如選擇時間為I個月),計算該時間下的每個用戶的請求數據率,并采用基于背包的迭代算法計算當前狀態 下最低的服務部署與維護的總開銷;如果該開銷小于指定開銷,則以二分法的方法提高該時間為原來的兩倍(由上示例即提高為2個月),如果該開銷大于指定開銷,則以二分法的方法降低該時間為原來的二分之一(由上示例則降為0.5個月),并循環執行上一子步驟,直至可行的時間最大(誤差范圍內)。在云計算應用飛速發展的今天,個體終端用戶希望云計算平臺能夠嚴格保證他們的服務質量需求,而云計算平臺則需要通過合理的部署信息處理服務,以降低服務提供的成本,提高經濟收益。本發明達到以下效果(1)平臺接受的個體服務請求的服務質量需求均能夠得到嚴格保證;(2)當個體服務請求的數據率穩定時,平臺能夠以盡可能低的成本來部署服務;(3)當個體服務請求數據率隨時間增長時,平臺能夠在一定服務部署成本范圍內,盡可能地延長服務質量保證的時間。實施例信息處理服務的服務器由云提供商提供并分布在各地。其用戶可以是連鎖超市的分店、金融網點等等,信息處理服務負責處理用戶產生的信息,這些需要在服務器上部署的信息處理服務多種多樣,例如,財政金融監督中對欺詐行為的發現,電子商務應用中對用戶點擊行為的觀察分析,因特網網絡通信流量與擁塞的監控,以及在電信或者零售行業中的數據挖掘等等。一個具體點的應用實例如連鎖超市的各分店,會產生大量的數據,如商品銷售狀態信息,對人為破壞的視頻監控錄像圖像,傳感器收集的溫度濕度等信息,這些數據需要被及時的分析和處理,可以使分店之間調節庫存與鋪貨信息以防止斷貨,阻止并處理人為損壞,食物保鮮延緩腐爛變質等。下面我們舉一種信息處理服務(處理各分店產生的商品銷售狀態信息,決策分店調節庫存與鋪貨的服務)的部署方法來描述本發明的內容。首先根據超市分店節點(用戶,客戶端)與云服務器節點(服務提供者,服務端)建立網絡拓撲。需要獲得的參數是分店產生的各種商品銷售/鋪貨/貨存相關信息數據的數據率,用戶節點與服務節點的最短傳輸路徑時延,服務器的可行計算容量,服務部署與維護的開銷。下面明確服務部署的約束條件I、用戶節點可能位于世界各地,由于距離遠近、網絡狀態的不同,每個服務器能夠覆蓋的用戶受到服務質量的約束。也就是說,每個用戶與服務器的傳輸時延不能超過服務質量要求。2、服務器可行計算容量的約束,即相連用終端用戶服務請求的數據率之和不能超過該服務器的可行計算容量。對約束條件2,根據實際應用情況,從兩個方面進行方法的設計(I)當云提供商提供的服務器容量充足(如服務器本身計算能力十分強大或可為服務器追加計算資源)且服務請求數據率以明確數值提供時,最優服務部署方案的選擇采用基于集合覆蓋的算法。該算法會根據服務器覆蓋的用戶范圍的限制,通過盡可能小的開銷覆蓋所有的用戶節點。例如如圖I的網絡拓撲,有3個服務器節點,由于在這種情況下不考慮服務器容量約束,因此每個服務器獲取的參數表示為SiH服務器部屬與維護的開銷}。為每個服務 器節點的參數示例如下#={150},S2= {180},S3= {200}。有6個用戶節點,每個用戶獲取的參數表示為Cf{用戶請求的數據率,用戶的服務質量需求},其中用戶的服務質量需求即云計算平臺終端個體用戶發出任意數據片段與相應數據處理結果返回給云計算平臺終端個體用戶的時延的最大閾值,最大閾值為時間值,取值范圍為自然數。為每個用戶節點的參數示例如下=C1=KOMBZs, 6s},C2={100MB/s, 12s} , C3= {125MB/s,16s},C4= {150MB/s, 20s},C5={100MB/s, 15s},C6={75MB/s,8s}。根據S與C之間構成的網絡拓撲,Si到Cj之間的最短
Cl Cl Γ.; (.4 (\ Cr,
Si Γ 5 8 17 22 20 25~
路徑時延表示為du,其構成矩陣D(單位秒)。i) =。 4 ]5 20 15 10 1()。那么根
,S、 10 10 15 18 20 6
據用戶的服務質量要求,Si到C的時延小于服務質量要求的記為1,否則記為0,得到矩
G /^f /-y /^t ,.·τ /^f
L2 C3 C4 C 5 Le
I I O O O O
陣= Λ IOOll O。由此可得,S1可以服務到的用戶C為2個,性價
夕3 O I I I O I
比為2/150=1/75 ;S2可以服務到的用戶C為3個,性價比為3/180=1/60 ;S3可以服務到的用戶C為4個,性價比為4/200=1/50,則性價比最高的是S3,那么先開通S3,服務于C2,C3, C4,
Cl C、
c6。則01將已開通與分配的&與(2,(3,(;,(6去掉,得到迭代子圖,即£>2二& Γ1 010
Si L1 1
照如上過程,開通S2,分配CpC515此輪迭代后,由于C=CK因此算法結束。最終的結果是選擇在S2,S3上部署服務;s2上分配的用戶為C1, C5 ;S3上分配的用戶為C2,C3,C4,C6。(2)當服務器容量有限且服務請求數據率以明確數值提供時,最優服務部署方案的選擇采用基于背包的迭代算法;該算法會根據服務器容量充分裝載滿足服務質量需求的用戶節點,以同時滿足兩個約束條件,并降低開銷。例如,同樣對于如圖I所示的網絡拓撲,由于此時需要考慮服務器S的容量限制,因此對每個服務器節點參數賦值如下=Si= {服務器容量(服務器每秒可以處理的最大數據量)服務器部屬與維護的開銷}。為每個服務器節點的參數示例如下=S1=USOMBZs, 150},S2= {340MB/S, 180},S3= {340MB/s, 200}。其余假設同上例,有6個用戶節點,每個用戶獲取的參數表示為4={用戶請求的數據率,用戶的服務質量需求}。為每個用戶節點的參數示例如下=C1=KOMBZs, 6s},C2={100MB/s, 12s} , C3= {125MB/s,16s},C4= {150MB/s, 20s},C5= {ΙΟΟΜΒ/s, 15s},C6= {75MB/s, 8s}。根據S與C之間構成的網絡拓撲,Si到Cj之間的最短路徑時延表示為du,其構成矩陣D(單位秒)。那么根據用戶q的服務質量要求,Si到的時延
Cl ('」(' Ca C CuΛ [I I O O O 0_小于服務質量要求 的記為1,否則記為0,得到矩陣D115D1= ^ 1 0 0 t j 0 =
S:、 0 1110 1
首先遍歷用戶節點,此時存在葉子節點(即根據服務質量要求僅能由一個服務器覆蓋到),根據節點的先后順序,首先處理葉子節點c3,由于可以滿足C3服務質量需求的節點只有S3,因此S3為首先選擇的服務器。S3的容量為340MB/S,S3根據服務質量要求可以覆蓋到的用戶節點為 C2={100MB/s},C3={125MB/s},C4={150MB/s},C6= {75MB/s},開通 S3,并首先將葉子節點C3,C6裝入,然后運用背包算法將S3裝滿,則根據容量限制,S3可以服務的節點為C2,C3,
r 丨 η ('
C6。則D1將已開通與分配的S3與C2,C3,C6去掉,得到迭代子圖,即"Γ1 0 Q"!。處
Si L1 1 1
理葉子節點C4,可以滿足C4服務質量需求的節點是S2,因此S2為選擇的服務器,S2根據服務質量要求可以覆蓋到的用戶節點為CfbOMB/s},C4={150MB/s},C5= {ΙΟΟΜΒ/s},全部裝載不超過其容量限制,因此開通S2,可以服務的節點為CpC4A5tj此輪迭代后,由于C=(K因此算法結束。最終的結果是選擇在S2,S3上部署服務;S2上分配的用戶為C1, C4, C5 ;S3上分配的用戶為c2,c3,c6。考慮到有些時候服務請求數據率會發生比較大的變化,特別是會隨著時間的推演,由于數據產生源業務的增長等而增長,比如分店規模擴大,商品品種增加,營業額增加等。此時,我們僅能評估當信息處理的云服務環境建立時的用戶數據請求數據率,或者學習到用戶請求數據與時間的關系。在這種情況下,服務部署后,我們希望系統在較長的時間內保持穩定,以減少由于重部署帶來的開銷,或者數據與服務請求的丟失。在對用戶進行服務部署和服務提供之前,通常有一個服務部署與維護的預算,限制服務部署總體開銷的范圍。此時給出結合二分法的基于背包的迭代算法,此算法可以在預算范圍內,即使用戶請求數據率處于增長的狀態,仍在盡可能長的時間內維持云計算中信息處理服務的穩定提供。例如,同樣如上例的網絡拓撲,將用戶初始請求的數據率記為Rc(O),參數賦值為R1 (0)=50MB/s,R2(0)=100MB/s, R3(0)=125MB/s, R4(0) =150MB/s, R5(0)=100MB/s, R6(0) =75MB/s,用戶月艮務請求的數據率是隨時間線性增長的函數,即為Μυ = (ι+λ。0艮(0)。假設每個月的數據增長率為10%,服務部署與維護的開銷預算為400,其余假設與上例相同。那么根據二分法,選取t=l個月時,用戶請求數據率增長到原來的I. I倍,運行上例所示基于背包的方法,可以得到開通S2與S3,開銷為380,在預算范圍內。由此根據二分法將時間提高到原來的兩倍,t=2個月時,由于數據率增長到了原來的I. 2倍,運行基于背包的方法發現需要將S1S2與S3同時開通,預算超過400。因此最后所得的t在I個月與2個月之間,再根據二分法,選取t=(l+2)/2=l. 5個月運行基于背包的方法,同樣超過預算。再根據二分法選擇t=(l+l. 5)/2=1. 25個月,運行基于背包的方法,可以找到滿足要求的解。如此迭代運行二分法與基于背包結合的方法,在不超過一天的誤差范圍內,得到了在預算范圍內開通S2與S3,S2上分配的用戶為C1, C4,C5 ;S3上分配的用戶為C2,C3,C6,可以保持最長在1,25個月之內,維持系統穩定運行。超過這一時間,如果數據請求率繼續增長,需要增加預算投入,增加預算的部分不在本專利權利要求范圍內。值得指出的是,上例給出的結果都是在節點數量較少的情況下,當網絡節點規模較大時,實施例的迭代過程的復雜度將大大提升,因此不再人工模擬執行舉例。最后,將信息處理服務部署到選擇的服務器上,用來處理各分店產生的信息。本發明提供了一種云計算中信息處理服務的部署方法,具體實現該技術方案的方 法和途徑很多,以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護范圍。本實施例中未明確的各組成部分均可用現有技術加以實現。
權利要求
1.一種分布式云計算環境中信息處理服務的部署方法,在確定云計算平臺終端個體用戶的服務請求數據率、云計算平臺終端個體用戶服務質量要求、服務器可行計算容量及服務器上的服務部署與維護開銷后,其特征在于,根據以下步驟選取服務器部署信息處理服務: 網絡狀況監測步驟,按照網絡拓撲結構對網絡鏈路狀況進行監控,獲取每條鏈路上的傳輸時延; 服務部署方案選擇步驟,按照網絡鏈路狀況以及當前服務器可行計算容量,結合個體終端用戶的服務請求數據率和服務質量要求,確定服務部署方案的約束條件,并結合服務部署與維護開銷選取最優的服務部署方案,確定相應的云計算平臺終端個體用戶請求分配方案; 服務部署步驟,按照最優服務部署方案,將服務部署到相應的服務器上。
2.根據權利要求I所述的分布式云計算環境中信息處理服務的部署方法,其特征在·于,云計算平臺終端個體用戶的服務請求數據為數據流的形式; 云計算平臺終端個體用戶的服務請求數據率為確定的數值或者隨時間遞增的函數; 云計算平臺終端個體用戶的服務質量需求定義為,云計算平臺終端個體用戶發出任意數據片段與相應數據處理結果返回給云計算平臺終端個體用戶的時延的最大閾值。
3.根據權利要求2所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,服務器可行計算容量為其單位時間可處理的服務請求數據量; 云計算平臺終端個體用戶與服務器之間的傳輸時延為兩者之間最短傳輸路徑時延。
4.根據權利要求I所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,服務部署方案的約束條件為云計算平臺終端個體用戶與服務器間的傳輸時延不超過云計算平臺終端個體用戶服務質量需求,相連云計算平臺終端個體用戶服務請求的數據率之和不超過該服務器的可行計算容量。
5.根據權利要求I所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,服務部署方案選擇步驟中包括 (O當所有服務器容量充足,即相連云計算平臺終端個體用戶服務請求的數據率之和不超過該服務器的可行計算容量,且服務請求數據率以明確數值提供時,最優服務部署方案的選擇采用基于集合覆蓋的算法; (2)當服務器容量有限,即相連云計算平臺終端個體用戶服務請求的數據率之和大于該服務器的可行計算容量,且服務請求數據率以明確數值提供時,最優服務部署方案的選擇采用基于背包的迭代算法; (3)當服務請求數據率以隨時間的線性增長函數形式提供時,最優服務部署方案的選擇采用結合二分法的基于背包的迭代算法。
6.根據權利要求5所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,基于集合覆蓋的算法包含如下步驟 (1)確定每一對服務器與云計算平臺終端個體用戶間的傳輸時延,并按照服務部署方案的傳輸時延約束條件,明確每一個服務器所能處理的云計算平臺終端個體用戶對象; (2)在每一個迭代過程中,在排除已處理的云計算平臺終端個體用戶對象的基礎上,以未部署服務的服務器所能處理的云計算平臺終端個體用戶對象個數與該服務器上的服務部署與維護開銷的比值為性價比衡量指標,選取性價比衡量指標最高的服務器,直到所有云計算平臺終端個體用戶對象均已處理或服務器均被挑選,若迭代結束時,仍有云計算平臺終端個體用戶對象未被處理,則判定需要加入新的服務器滿足云計算平臺終端個體用戶需求。
7.根據權利要求6所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,背包的迭代算法包含如下步驟 (1)確定每一對服務器與云計算平臺終端個體用戶間的傳輸時延,并按照服務部署方案的傳輸時延約束條件,確定每一個服務器所能處理的云計算平臺終端個體用戶對象; (2)在每一個迭代過程中,為每一個未部署服務的服務器按照背包問題求解算法計算該服務器可處理的最大的服務數據率之和,即以該服務器的可行計算容量為背包大小,以該服務器所能處理的云計算平臺終端個體用戶對象為物品,其數據率為物品大小,按照背 包問題求解算法計算出該服務器可處理的最大的服務數據率之和;再以服務器所能處理的最大服務數據率之和與其上的服務部署與維護開銷的比值為性價比衡量指標,選取性價比衡量指標最高的服務器,直到所有云計算平臺終端個體用戶對象均以處理或服務器均被挑選,若迭代結束時,仍有云計算平臺終端個體用戶對象未被處理,則判定需要加入新的服務器滿足云計算平臺終端個體用戶需求。
8.根據權利要求7所述的分布式云計算環境中信息處理服務的部署方法,其特征在于,結合二分法的基于背包的迭代算法,包含如下步驟 (1)選取一個大于零的時間,計算該時間下的每個云計算平臺終端個體用戶的請求數據率,并采用基于背包的迭代算法計算當前狀態下最低的服務部署與維護的總開銷; (2)如果該總開銷小于指定開銷,則以二分法的方法提高該時間,如果該總開銷大于指定開銷,則以二分法的方法降低該時間,并循環執行上一步驟,直至可行的時間最大。
全文摘要
本發明公開了一種分布式云計算環境中信息處理服務的部署方法,在確定了云計算平臺個體終端用戶的服務請求數據率相關信息及其服務質量需求、服務器可行計算容量及其之上的和服務部署與維護開銷之后,選取合適的服務器以用來部署信息處理服務,包括以下步驟網絡狀況監測步驟、服務部署方案選擇步驟、服務部署步驟。按照用戶服務請求數據率相關信息和服務器可行計算容量情況,服務部署方案選擇采用基于集合覆蓋的算法、基于背包的迭代算法或結合二分法的基于背包的迭代算法。本發明可以廣泛應用于企業的資源優化配置、電子商務等領域,提供私有云或公共云環境中具有服務質量保證的服務部署方法,支持外包資源的配置選擇,屬于計算機應用領域。
文檔編號H04L12/851GK102904969SQ20121045417
公開日2013年1月30日 申請日期2012年11月13日 優先權日2012年11月13日
發明者游坤, 丁峰 申請人:中國電子科技集團公司第二十八研究所