數(shù)據(jù)度量分辨率排序系統(tǒng)和方法
【專利說明】
[0001] 相關(guān)申請的交叉引用
[0002] 本專利申請要求于2012年9月28日提交的美國臨時專利申請61/707, 602、于 2013年8月30日提交的美國專利申請14/014, 637和于2013年8月30日提交的美國專利 申請14/014, 707的優(yōu)先權(quán),并且這些申請的全部公開通過引用合并到本文。
技術(shù)領(lǐng)域
[0003] 本發(fā)明一般性地涉及數(shù)據(jù)分析,且尤其但非限制性地涉及用于對時段組合進(jìn)行排 序的系統(tǒng)和方法。
【背景技術(shù)】
[0004] 對計算和/或網(wǎng)絡(luò)資源的需求的預(yù)測是復(fù)雜的。與組織或機(jī)構(gòu)相關(guān)聯(lián)的用戶能夠 查看從一個月至下一個月所使用的資源以確定是否未來將需要額外的資源。然而,該分析 通常是不充分的,因為例如在給定時間段內(nèi)使用的資源的量很少是靜態(tài)的。假設(shè)該機(jī)構(gòu)是 企業(yè),則在工作日期間的資源消耗通常更大。另外,在午餐期間,資源消耗會下降。在一些 情況中,通常與低資源消耗相關(guān)聯(lián)的時間段(例如午夜)有時會因為例如預(yù)定的備份操作 或復(fù)制操作而具有高的資源消耗。在一些情況中,資源消耗有時會以比組織的平均消耗更 高水平的消耗而達(dá)到峰值。另外,各種計算資源會在不同時間段或因不同類型的操作而受 到不同的影響。在一些情況中,資源消耗會因為例如會增加計算資源(例如,網(wǎng)絡(luò)服務(wù)器、 銷售服務(wù)器等)的使用的招聘潮或成功的產(chǎn)品發(fā)布會而突然改變。
[0005] 至少由于上述原因,以預(yù)定的周期為基礎(chǔ)來比較資源使用對于許多組織來說可能 是不充分的。另外,不同類型的資源會以不同方式被消耗。例如,處理器利用率會在一天內(nèi) 消長,但峰值利用率會在閾值利用率水平內(nèi)保持恒定。相反,存儲器利用率會因為例如維護(hù) 與一個或多個計算系統(tǒng)相關(guān)聯(lián)的一個或多個存儲設(shè)備(例如,硬盤驅(qū)動、固態(tài)驅(qū)動等)的預(yù) 定備份而隨著時間而增加。而且,隨著信息價值和使用的持續(xù)增長,個人和企業(yè)都在探尋更 多的處理和存儲信息的方法。用戶可用的一種選擇是信息處理系統(tǒng)。信息處理系統(tǒng)通常處 理、編譯、存儲和/或傳送用于企業(yè)、個人或其他用途的信息或數(shù)據(jù),從而允許用戶充分利 用該信息。由于技術(shù)和信息處理需求與要求會因不同用戶或應(yīng)用而變化,因此信息處理系 統(tǒng)還可以隨著以下情況而變化:處理什么樣的信息,如何處理信息,處理、存儲或傳遞多少 信息,以及如何快速而有效地處理、存儲或傳遞信息。信息處理系統(tǒng)的多樣性允許信息處理 系統(tǒng)可以是一般的信息處理系統(tǒng),也可以是針對特定用戶或特定用途而配置的信息處理系 統(tǒng),該特定用途例如是金融交易處理、航班預(yù)約、企業(yè)數(shù)據(jù)存儲或全球通信。另外,信息處理 系統(tǒng)可以包括各種被配置成用來處理、存儲和傳送信息的硬件和軟件部件,并且可以包括 一個或多個計算機(jī)系統(tǒng)、數(shù)據(jù)存儲系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)。
【發(fā)明內(nèi)容】
[0006] 在一種實施方式中,一種方法包括:由包括計算機(jī)硬件的計算機(jī)系統(tǒng)識別針對感 興趣度量的多個時段組合。每個時段組合包括一個或多個時間段并且一個或多個時間段中 的每個時間段包括一個或多個分段。該方法還包括:對于所述多個時段組合中的每個時段 組合以及所述感興趣的度量的多個歷史值中的每個歷史值,計算機(jī)系統(tǒng)遞增地將該歷史值 插入所述一個或多個時間段中的相應(yīng)分段中。該遞增地插入包括:對于所述一個或多個時 間段中的每個時間段,識別針對該歷史值的相應(yīng)分段,計算該相應(yīng)分段的預(yù)測值,基于所述 時段組合的任何更高頻率的時間段來調(diào)整所述歷史值,以及將調(diào)整后的歷史值插入該相應(yīng) 分段中。該方法還包括:基于所述多個歷史值與相應(yīng)預(yù)測值的組之間的比較,由所述計算機(jī) 系統(tǒng)對所述多個時段組合進(jìn)行排序。而且,該方法還包括:由計算機(jī)系統(tǒng)將排序最高的時段 組合選為最佳表征感興趣度量的時段組合。
[0007] 在一個實施方式中,一種信息處理系統(tǒng)包括至少一個計算機(jī)處理器。該至少一個 計算機(jī)處理器可操作以實施一種方法。該方法包括識別針對感興趣度量的多個時段組合。 每個時段組合包括一個或多個時間段并且一個或多個時間段中的每個時間段包括一個或 多個分段。該方法還包括:對于所述多個時段組合中的每個時段組合以及所述感興趣的度 量的多個歷史值中的每個歷史值,遞增地將該歷史值插入所述一個或多個時間段中的相應(yīng) 分段中。該遞增地插入包括:對于所述一個或多個時間段中的每個時間段,識別針對該歷史 值的相應(yīng)分段,計算該相應(yīng)分段的預(yù)測值,基于所述時段組合的任何更高頻率的時間段來 調(diào)整所述歷史值,以及將調(diào)整后的歷史值插入該相應(yīng)分段中。而且,該方法還包括:基于所 述多個歷史值與相應(yīng)預(yù)測值的組之間的比較,對所述多個時段組合進(jìn)行排序。該方法還包 括:將排序最高的時段組合選為最佳表征感興趣度量的時段組合。
[0008] 在一個實施方式中,計算機(jī)程序產(chǎn)品包括具有在其中實施的計算機(jī)可讀程序代碼 的非短暫性計算機(jī)可使用介質(zhì)。所述計算機(jī)可讀程序代碼適用于被執(zhí)行以實施一種方法。 該方法包括識別針對感興趣度量的多個時段組合。每個時段組合包括一個或多個時間段并 且一個或多個時間段中的每個時間段包括一個或多個分段。該方法還包括:對于所述多個 時段組合中的每個時段組合以及所述感興趣的度量的多個歷史值中的每個歷史值,遞增地 將該歷史值插入所述一個或多個時間段中的相應(yīng)分段中。該遞增地插入包括:對于所述一 個或多個時間段中的每個時間段,識別針對該歷史值的相應(yīng)分段,計算該相應(yīng)分段的預(yù)測 值,基于所述時段組合的任何更高頻率的時間段來調(diào)整所述歷史值,以及將調(diào)整后的歷史 值插入該相應(yīng)分段中。而且,該方法還包括:基于所述多個歷史值與相應(yīng)預(yù)測值的組之間的 比較,對所述多個時段組合進(jìn)行排序。該方法還包括:將排序最高的時段組合選為最佳表征 感興趣度量的時段組合。
【附圖說明】
[0009] 通過結(jié)合附圖參考以下的【具體實施方式】部分可以對本發(fā)明方法和裝置有更完整 的理解,其中;
[0010] 圖1是網(wǎng)絡(luò)計算環(huán)境的一個實施方式的框圖;
[0011] 圖2A示出了度量值預(yù)測過程的一個實施方式的流程圖;
[0012] 圖2B示出了總預(yù)測過程250的一個實施方式的流程圖;
[0013] 圖3示出了時段組合的結(jié)構(gòu)的示例;
[0014] 圖4A示出了學(xué)習(xí)過程的一個實施方式的流程圖;
[0015]圖4B示出了學(xué)習(xí)過程的一個實施方式的流程圖;
[0016]圖5示出了逐步增量地將歷史數(shù)據(jù)值插入時段組合中的過程的一個實施方式的 流程圖;
[0017] 圖6示出了相對于度量對時段組合進(jìn)行排序的過程的一個實施方式的流程圖;
[0018] 圖7示出了聚集(aggregation)過程的一個實施方式的流程圖;
[0019]圖8示出了預(yù)測過程的一個實施方式的流程圖;
[0020] 圖9示出了計算預(yù)測值的過程的一個實施方式的流程圖;
[0021] 圖10示出了相對于度量對時段組合進(jìn)行排序的過程的一個實施方式的流程圖;
[0022] 圖11示出了執(zhí)行值的噪聲過濾的過程的一個實施方式的流程圖;以及
[0023] 圖12示出了執(zhí)行分段的噪聲過濾的過程的一個實施方式的流程圖。
【具體實施方式】
[0024] 出于本公開的目的,信息處理系統(tǒng)可以包括任何裝置或裝置的集合,該裝置或裝 置的集合可操作以計算、運算、確定、分類、處理、傳送、接收、檢索、創(chuàng)建、切換、存儲、顯示、 傳遞、表明、檢測、記錄、復(fù)制、操作或利用任何形式的用于商務(wù)、科學(xué)、控制或其他目的的信 息、智能或數(shù)據(jù)。例如,信息處理系統(tǒng)可以是個人計算機(jī)(例如,臺式或便攜式電腦)、平 板計算機(jī)、移動設(shè)備(例如,個人數(shù)字助理(PDA)或智能電話)、服務(wù)器(例如,刀片服務(wù) 器(bladeserver)或機(jī)架服務(wù)器(rackserver))、網(wǎng)絡(luò)存儲設(shè)備或任意其他合適的設(shè)備, 并且其尺寸、形狀、性能、功能和價格可以不同。信息處理系統(tǒng)可以包括隨機(jī)存取存儲器 (RAM)、一個或多個處理資源(例如中央處理單元(CPU)或硬件或軟件控制邏輯)、R0M、和 /或其它類型的非易失性存儲器。信息處理系統(tǒng)的其他部件還可以包括一個或多個磁盤驅(qū) 動器、一個或多個用于與外部設(shè)備通信的網(wǎng)絡(luò)端口、以及各種輸入和輸出(I/O)設(shè)備(例如 鍵盤、鼠標(biāo)、觸摸屏和/或視頻顯示器)。信息處理系統(tǒng)還可以包括一條或多條總線,總線可 操作以在各種硬件部件之間傳送通信。
[0025]本公開的實施方式描述了基于一個或多個度量來預(yù)測或規(guī)劃資源的使用的系統(tǒng) 和過程。在一些情況中,至少一些度量可以反映與計算系統(tǒng)相關(guān)聯(lián)的資源,諸如處理器使用 或可用性、存儲器使用或可用性等??商鎿Q地或另外地,至少一些度量可以與計算機(jī)特征相 關(guān)聯(lián),該計算機(jī)特征能夠與資源相關(guān)聯(lián)但是其與計算資源之間可以沒有一對一的對應(yīng)性。 例如,一個度量可以是通過網(wǎng)絡(luò)訪問文件的平均訪問時間。該度量可以與網(wǎng)絡(luò)帶寬相關(guān)聯(lián), 但是也能夠與其他計算資源(諸如計算系統(tǒng)的內(nèi)存量、存儲器的速度、存儲設(shè)備能夠同時 支持的訪問連接的數(shù)量等)相關(guān)聯(lián)。
[0026]出于本專利申請的目的,"時段組合"可被認(rèn)為是在其期間生成、聚集和/或分析數(shù) 據(jù)的一個或多個時間段的集合。時間段在這里通常被簡稱為時段,其典型地表示時間單位, 諸如時鐘時間單位、系統(tǒng)時間單位和/或用于測量時間的流逝的其他單位(任意的或者其 他形式的單位)。例如,在利用時鐘時間的某些實施方式中,時段組合能夠包括小時、天、星 期、月等的時段。為了簡化描述,本公開的剩余部分將提供利用時鐘時間的時間段的示例。 然而,應(yīng)當(dāng)意識到,術(shù)語"時間段"并不局限于此,并且各種實施方式可以利用其他用于測量 或劃分時間的方式。測量分段這里通常簡稱為分段,其典型地為時間段的劃分。例如,"天" 時間段可以包括24個1小時分段、12個2小時分段、6個4小時分段等。
[0027] 如下面更詳細(xì)描述的,這里描述的某些實施方式利用時段組合作為用于為感興趣 的度量提供