一種根據特征選擇負載的方法和系統的制作方法
【技術領域】
[0001] 本發明屬于算法領域,尤其涉及一種根據特征選擇負載的方法和系統。
【背景技術】
[0002] 無論是傳統的物理機或者云計算中的虛擬集群,對于系統的優化都非常重要。為 了適應不同的應用要求,對系統的優化會采取不同的優化方法。在這種情況下,首先需要對 物理機或者虛擬機進行負載分類,根據其屬于CPU密集型,內存密集型,IO密集型和網絡密 集型等分別采取不同的優化方法,以提高效率。
[0003]負載分類方法是系統優化的前提,其效率的好壞直接影響著系統優化的效率。在 負載分類過程中,準確度與效率是一個相互制約的因素,通常提高準確度的同時意味著效 率的下降。
[0004] 在負載分類過程中,一般情況下,增加特征的維度可以提高分類的準確度,但會降 低分類的效率。但盲目地增加特征的維度并不能提高準確度,因為有相關關系的特征維度 會相互影響并降低分類準確率。所以在特征選擇中,需要選擇與分類相關度高的特征,避免 特征的盲目增加。
【發明內容】
[0005] 鑒于此,本發明提供一種根據特征選擇負載的方法和系統,以解決現有技術的負 載選擇效率低的技術問題。
[0006] 本發明實施例是這樣實現的,一種根據特征選擇負載的方法,所述方法包括以下 步驟:
[0007] 對待處理特征數據進行預處理;
[0008] 通過特征聚類算法對所述待處理特征數據進行分類,并獲取各類的代表元;
[0009]根據互信息值和所述代表元,選擇高準確度的特征對應的負載。
[0010] 本發明實施例還提供一種根據特征選擇負載的系統,所述系統包括:
[0011] 預處理單元,用于對待處理特征數據進行預處理;
[0012] 代表元獲取單元,用于通過特征聚類算法對所述預處理單元處理的待處理特征數 據進行分類,并獲取各類的代表元;
[0013] 負載選擇單元,用于根據互信息值和所述代表元獲取單元獲取的代表元,選擇高 準確度的特征對應的負載。
[0014] 本發明實施例,對待處理特征數據進行預處理,通過特征聚類算法對待處理特征 數據進行分類,獲取各類的代表元,根據互信息值和代表元,選擇高準確度的特征對應的負 載,提供了一種高效率的負載選擇方法和系統,提高了負載選擇的效率。
【附圖說明】
[0015] 為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述 中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些 實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些 附圖獲得其他的附圖。
[0016] 圖1是本發明實施例提供根據特征選擇負載方法的流程圖;
[0017]圖2是本發明實施例提供的根據特征選擇負載系統的結構圖。
【具體實施方式】
[0018] 為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對 本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并 不用于限定本發明。
[0019] 為了說明本發明所述的技術方案,下面通過具體實施例來進行說明。
[0020] 實施例一
[0021] 如圖1所示為本發明實施例提供根據特征選擇負載方法的流程圖,所述方法包括 以下步驟:
[0022] 步驟S101,對待處理特征數據進行預處理。
[0023] 在本發明實施例中,對待處理的特征數據進行預處理,通過該預處理,可以獲取該 特征數據的有效數據,該特征數據為負載在運行時表現出的特征,該特征包括但不限于: CPU密集型、內存密集型、IO密集型和網絡密集型。所述對待處理特征數據進行預處理的步 驟,包括:
[0024] 1、通過粒度選擇將所述待處理特征數據組成數據矩陣。
[0025] 在本發明實施例中,對待處理特征數據進行粒度選擇,即:取一段時間內的特征數 據,將不同時間的數據按行排列、同一時間的不同指標數據按列排列,并將上述按行列排列 的數據組成數據矩陣。
【主權項】
1. 一種根據特征選擇負載的方法,其特征在于,所述方法包括以下步驟: 對待處理特征數據進行預處理; 通過特征聚類算法對所述待處理特征數據進行分類,并獲取各類的代表元; 根據互信息值和所述代表元,選擇高準確度的特征對應的負載。
2. 如權利要求1所述的方法,其特征在于,所述對待處理特征數據進行預處理的步驟, 包括: 通過粒度選擇將所述待處理特征數據組成數據矩陣; 通過公5
對所述數據矩陣進行正規化處理。
3. 如權利要求1所述的方法,其特征在于,所述通過特征聚類算法對所述待處理特征 數據進行分類,并獲取各類的代表元的步驟,具體為: 計算所述特征之間的皮爾森相關系數PCC ; 根據所述PCC衡量特征之間的關聯性,并根據所述關聯性進行聚類; 從各類別中選擇一個特征作為所述類別的代表元。
4. 如權利要求1所述的方法,其特征在于,所述根據互信息值和所述代表元,選擇高準 確度的特征對應的負載的步驟,包括: 根據公?
i計算所述代表元的互信息值; 根據所述互信息值對所述代表元進行排序; 根據所述排序選擇高準確度的特征對應的負載。
5. -種根據特征選擇負載的系統,其特征在于,所述系統包括: 預處理單元,用于對待處理特征數據進行預處理; 代表元獲取單元,用于通過特征聚類算法對所述預處理單元處理的待處理特征數據進 行分類,并獲取各類的代表元; 負載選擇單元,用于根據互信息值和所述代表元獲取單元獲取的代表元,選擇高準確 度的特征對應的負載。
6. 如權利要求5所述的系統,其特征在于,所述預處理單元,包括: 數據矩陣組成子單元,用于通過粒度選擇將所述待處理特征數據組成數據矩陣; 正規化處理子單元,用于通過公式
對所述數據矩陣組成子 單元組成的數據矩陣進行正規化處理。
7. 如權利要求5所述的系統,其特征在于,所述代表元獲取單元,包括: PPC計算子單元,用于計算所述特征之間的PCC ; 聚類子單元,用于根據所述PPC計算子單元計算的PCC衡量特征之間的關聯性,并根據 所述關聯性進行聚類; 代表元獲取子單元,用于從所述聚類子單元計算的各類別中選擇一個特征作為所述類 別的代表元。
8.如權利要求5所述的系統,其特征在于,所述負載選擇單元,包括: 互信息值計算子單元,用于根據公式
j計 算所述代表元的互信息值; 排序子單元,用于根據所述互信息值計算子單元計算的互信息值對所述代表元進行排 序; 負載選擇子單元,用于根據所述排序子單元計算的排序選擇高準確度的特征對應的負 載。
【專利摘要】本發明適用于算法領域,提供了一種根據特征選擇負載的方法和系統,所述方法包括:對待處理特征數據進行預處理;通過特征聚類算法對所述待處理特征數據進行分類,并獲取各類的代表元;根據互信息值和所述代表元,選擇高準確度的特征對應的負載。本發明實施例,對待處理特征數據進行預處理,通過特征聚類算法對待處理特征數據進行分類,獲取各類的代表元,根據互信息值和代表元,選擇高準確度的特征對應的負載,提供了一種高效率的負載選擇方法和系統,提高了負載選擇的效率。
【IPC分類】G06F17-30
【公開號】CN104765804
【申請號】CN201510147870
【發明人】尹建偉, 林鵬翔, 趙新奎, 李瑩, 鄧水光, 吳健, 吳朝暉
【申請人】浙江大學
【公開日】2015年7月8日
【申請日】2015年3月31日