一種基于貝葉斯組合的Web服務(wù)QoS預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于貝葉斯組合的Web服務(wù)QoS預(yù)測方法,使用幾種組合模型對 時間序列進(jìn)行預(yù)測,通過模型評估標(biāo)準(zhǔn)對結(jié)果進(jìn)行評估,并及時調(diào)整模型權(quán)重,以優(yōu)化測試 結(jié)果。
【背景技術(shù)】
[0002] 面向服務(wù)系統(tǒng)越來越多地通過互聯(lián)網(wǎng)訪問第三方Web服務(wù),質(zhì)量保證和軟件維護(hù) 由第三方控制,軟件本身執(zhí)行和管理也取決于第三方。面向服務(wù)系統(tǒng)的執(zhí)行能力以及服務(wù) 質(zhì)量越來越依賴于第三方提供的服務(wù),然而在復(fù)雜多變的Internet環(huán)境中,這種對于第三 方服務(wù)的依賴會帶來不確定的問題,使得服務(wù)無法滿足QoS (Quality of Service,服務(wù)質(zhì) 量)需求。因此,需要對服務(wù)質(zhì)量進(jìn)行預(yù)測,通過預(yù)測判斷是否可能發(fā)生服務(wù)失效,提前采 取行動消除或減輕對系統(tǒng)質(zhì)量的負(fù)面影響,避免威脅發(fā)生。近年來,Web服務(wù)QoS預(yù)測技術(shù) 受到越來越多的關(guān)注,很多模型被提出并用于運行時QoS的預(yù)測,如神經(jīng)網(wǎng)絡(luò)模型、時間序 列分析等。
[0003] 目前針對原子Web服務(wù),主要采用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘的方法來預(yù)測QoS值,可以 歸納劃分為以下幾類:(1)基于相似度的QoS預(yù)測方法。(2)基于神經(jīng)網(wǎng)絡(luò)的QoS預(yù)測方 法。(3)基于時間序列預(yù)測的QoS預(yù)測方法。(4)其他QoS預(yù)測方法。單一的模型通常會 在某一時段有良好的預(yù)測精度,但各種預(yù)測方法有特殊的信息特征和適用場合,目前還沒 有一種算法能在不同狀況下、不同時刻都保持絕對優(yōu)良的預(yù)測性能。Web服務(wù)在動態(tài)環(huán)境 下,服務(wù)質(zhì)量具有動態(tài)性和易變性,單一模型難以保持較好的預(yù)測性能,需要將預(yù)測方法組 合起來,利用各種預(yù)測方法的長處,提高精度并擴(kuò)大適用范圍。因此提出了貝葉斯組合預(yù)測 模型,根據(jù)QoS屬性時間序列的特征,選取不同的基本預(yù)測模型進(jìn)行組合,預(yù)測過程中通過 已選取的基本預(yù)測模型的預(yù)測表現(xiàn),更新各個基本模型的權(quán)重,使得模型預(yù)測結(jié)果能夠逼 近最優(yōu)模型,從而具有穩(wěn)定良好的預(yù)測精度。
【發(fā)明內(nèi)容】
[0004] 發(fā)明目的:針對現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種Web服務(wù)QoS貝葉斯組 合預(yù)測的方法,根據(jù)QoS歷史數(shù)據(jù)不同的特征形態(tài)組合不同的基本模型進(jìn)行預(yù)測,并給出 預(yù)測模型評估標(biāo)準(zhǔn),對響應(yīng)時間、吞吐量及可靠性進(jìn)行了預(yù)測實驗。以提前發(fā)現(xiàn)軟件的異常 和一些QoS狀況,為軟件系統(tǒng)的動態(tài)自適應(yīng)調(diào)整和演化等活動提供決策依據(jù),從而保證軟 件系統(tǒng)的安全可靠運行。
[0005] 技術(shù)方案:一種基于貝葉斯組合的Web服務(wù)QoS預(yù)測方法,包括以下步驟:
[0006] 步驟1 :識別時間序列特征,采用自相關(guān)分析法,時間序列的自相關(guān)系數(shù)計算公式
rk表示i期屬性值X ;與i+k期屬 性值x1+k的相關(guān)程度。根據(jù)公式判別時間序列是平穩(wěn)模式、趨勢模式、周期模式還是隨機(jī)模 式。
[0007] 步驟2 :對各個基本模型分別進(jìn)行訓(xùn)練建模。
[0008] 步驟3 :用訓(xùn)練好的基本預(yù)測模型對時間序列進(jìn)行預(yù)測。
[0009] 步驟4 :由貝葉斯組合模型對各個基本模型的預(yù)測結(jié)果進(jìn)行組合。擬采用基于小 波分析的ARIMA預(yù)測模型(WARIMA)、小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型(WNN)以及ARIMAGARCH預(yù)測模 型3種基本預(yù)測模型對QoS進(jìn)行預(yù)測,來驗證貝葉斯組合模型的有效性。針對平穩(wěn)型、趨勢 型、周期型QoS屬性,可以采用某個函數(shù)或者方程擬合,即采用RBF神經(jīng)網(wǎng)絡(luò),多元自回歸模 型,K-近鄰模型作為基本預(yù)測模型進(jìn)行貝葉斯組合,通過實驗及結(jié)果分析來驗證貝葉斯組 合模型的有效性。
[0010] 步驟5 :預(yù)測模型精度評估及有效性評估
[0011] 精度評估:
[0012] 1、相對誤差均值
其中N為預(yù)測時段中預(yù)測量的個數(shù),yi 表示第i個實際觀測值,V i為第i個預(yù)測值。MSPE反映預(yù)測值偏離實際值的程度。
[0013] 2、均方根誤差:
,其中N為預(yù)測時段中預(yù)測量的個數(shù), Y1表示第i個實際觀測值,太i為第i個預(yù)測值。RMSE不僅反映相對誤差的大小,還反映 預(yù)測結(jié)果的穩(wěn)定性。
[0014] 3、相對誤差概率分布: 其中N為預(yù)測時段中預(yù)測 量的個數(shù),
為相對誤差小于P值的預(yù)測量個數(shù),Y1表示第i個實際觀測值,V i 為第i個預(yù)測值。其中誤差概率分布表示預(yù)測結(jié)果的可信度。以上誤差值越小,意味著模 型預(yù)測越準(zhǔn)確。
[0015] 有效性評估:
[0016] 引入"二進(jìn)制"預(yù)測評估指標(biāo),QoS屬性是否違反約束,服務(wù)是否發(fā)生失效,這個 問題本身要么為肯定,要么為否定,實例要么屬于肯定類,要么屬于否定類,因而QoS失 效預(yù)測屬于二分問題。二分問題會出現(xiàn)四種情況,如果一個實例是肯定類且被預(yù)測為肯 定類,則稱為真肯定(True positive, TP),如果實例是肯定類被預(yù)測為否定類,則稱為 假否定(False positive, FP),如果實例是否定類被預(yù)測為否定類,則稱為真否定(True negative, TN),如果實例是否定類被預(yù)測為肯定類,則稱為假肯定(False negative, FN)。 列聯(lián)表表示為:
[0017]
[0018] 根據(jù)聯(lián)表,引入尺度評價:
[0019] 真肯定率(r)描述實際失效的樣本被預(yù)測為真肯定的概率:
精度(P)描 述預(yù)測真肯定占肯定的比率:
假肯定率(fpr)描述被預(yù)測為假肯定的實例占所有 否定類的比例
正確率(a)描述正確預(yù)測的概率:
。?值(Ffi)描述 P和r的調(diào)和均值:
> 對于失效預(yù)測來說,P值用來評估正確自適應(yīng)行為在所有自 適應(yīng)中的比率,P值越大,誤報的可能性越低。r值用來評估正確預(yù)報失效的的概率,r值越 大,漏報概率越低。P和r都要高,才能取得較高的F值。因此F值越高,預(yù)測越準(zhǔn)確。
[0020] 步驟6 :修正組合模型參數(shù)。第t+Ι時刻,組合模型預(yù)測的結(jié)果為:
式中q t+1為t+Ι時刻貝葉斯組合模型預(yù)測值;Pf為t+Ι時刻第 m個基本預(yù)測模型在組合模型中的權(quán)值;C^1為t+Ι時刻第m個基本預(yù)測模型預(yù)測值。
[0021] 步驟7 :根據(jù)各個模型與真實值的誤差比較判斷模型預(yù)測表現(xiàn)是否較好;
[0022] 步驟8 :若表現(xiàn)較好,就賦予較高的期望并繼續(xù)預(yù)測。否則,重復(fù)步驟2-6。
【附圖說明】
[0023] 圖1為ARIMA模型的建模流程圖;
[0024] 圖2為BP神經(jīng)網(wǎng)絡(luò)的算法流程圖;
[0025] 圖3為ARIMAGARCH模型預(yù)測流程圖;
[0026] 圖4為RBF神經(jīng)網(wǎng)絡(luò)模型K-均值聚類算法流程圖;
[0027] 圖5為多元回歸分析模型預(yù)測流程圖;
[0028] 圖6為本發(fā)明實施例的整體框架圖;
[0029] 圖7為各模型及貝葉斯組合模型對響應(yīng)時間的預(yù)測結(jié)果;
[0030] 圖8為各模型及貝葉斯組合模型對可靠性的預(yù)測結(jié)果;
[0031] 圖9為各模型及貝葉斯組合模型對吞吐量的預(yù)測結(jié)果。
[0032] 圖10為誤差分布箱線圖;
[0033] 圖11為F值分布箱線圖。
【具體實施方式】
[0034] 下面結(jié)合具體實施例,進(jìn)一步闡明本發(fā)明,應(yīng)理解這些實施例僅用于說明本發(fā)明 而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對本發(fā)明的各種等價 形式的修改均落于本申請所附權(quán)利要求所限定的范圍。
[0035] 本實施例提供的Web服務(wù)QoS貝葉斯組合預(yù)測的方法包含了兩個主要部分:對隨 機(jī)型QoS屬性,采用神經(jīng)網(wǎng)絡(luò)模型(WNN)、基于小波分析的ARIMA (WARIMA)、ARIMAGARCA進(jìn) 行組合預(yù)測、對平穩(wěn)型、趨勢型、和周期型QoS屬性,采用K-近鄰預(yù)測模型、RBF神經(jīng)網(wǎng)絡(luò)模 型、多元回歸分析模型進(jìn)行組合預(yù)測。
[0036] 識別時間序列特征,采用自相關(guān)分析法,時間序列的自相關(guān)系數(shù)計算公式如下:
良示i期屬性值X i與i+k期屬性值X i+k 的相關(guān)程度。
[0037] 如圖1所示:ARIMAGARCH模型在已建立ARIMA(p,q)模型的基礎(chǔ)上,對模型殘差方 差使用GARCH(r,s)模型建模,ARIMA (p,q)模型與GARCH (r,s)模型分別表示序列的均值 和條件方差?;谛〔ǚ治龅腁RIMA模型建模步驟如下:
[0038] 步驟101 :判斷時間序列是否是白噪聲時間序列,即是否是平穩(wěn)序列。
[0039] 步驟102 :如果是白噪聲序列,就表示序列不存在相關(guān)性,則不必要再進(jìn)行預(yù)測。 如果是非平穩(wěn)則需要對數(shù)據(jù)差分,直到平穩(wěn)。
[0040] 步驟103 :初步判斷p,q,識別時間序列模型。
[0041] 步驟104 :根據(jù)p,q,對小于p,q的模型進(jìn)行分析,一般以取得AIC值最小的模型 作為最優(yōu)模型。
[0042] 小波神經(jīng)網(wǎng)絡(luò)以BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),采用小波函數(shù)作為激勵函數(shù)。BP神 經(jīng)網(wǎng)絡(luò)相應(yīng)的算法如下:
[0043] 步驟201 :初始化。在區(qū)間(_1,1)對各層的連接權(quán)值以及闕值設(shè)置一個非零隨機(jī) 數(shù),對學(xué)習(xí)速率,目標(biāo)誤差ε,最大學(xué)習(xí)次數(shù)M進(jìn)行初始化。
[0044] 步驟202 :導(dǎo)入N個學(xué)習(xí)樣本X及其相應(yīng)的期望輸出Υ,對第η個樣本進(jìn)行歸一化 處理。
[0045] 步驟203 :依次對各層實際輸出以及誤差計算:分別將輸入層數(shù)據(jù)導(dǎo)入隱藏層第 一、第二個神經(jīng)節(jié)點內(nèi)進(jìn)行計算,再將隱藏層數(shù)據(jù)導(dǎo)入輸入層神經(jīng)節(jié)點計算。得到最終的輸 出值。
,是權(quán)重,Θ ,是偏倚