專利名稱:一種設定監控指標閾值的方法和裝置的制作方法
技術領域:
本發明涉及應用系統監控技術領域,特別涉及一種設定監控指標閾值的方法和裝置。
背景技術:
隨著計算機技術的不斷發展,很多企業為了提高運營效率都大規模的應用IT技 術,使企業核心業務對IT系統的依賴性越來越強,企業應用系統以及IT系統基礎架構的可 用、穩定、高效和安全對企業的生產、經營和聲譽都有著至關重要的影響。國際上具有品類齊全和紛繁復雜的IT系統運維管理解決方案,但在針對IT系統 管理人員最為關心的應用系統健康狀況監測上,市場上卻沒有針對性強和功能全面的產 品。許多產品雖然能夠為用戶提供大量的監測指標和數據,但是如何從這些紛繁復雜的監 控指標中準確、自動的分析和判斷出應用系統是否健康卻非常困難。IT系統管理人員最希 望得到的是一個基本判斷應用系統現在是否健康、是否可用。因此在應用系統監控過程 中,如何全面、準確地發現導致應用系統性能的嚴重下降的監控指標值,是一個非常重要的 問題。目前,判斷應用系統是否健康或是否可用的常見方法是由人工設定監控指標閾 值(包括預警閾值或告警閾值),也就是運維人員根據自己的維護經驗確定某些監控指標 的閾值后,為這些監控指標設定監控指標閾值。當檢測到的監控指標值大于監控指標閾值 時,說明系統處于不健康狀態,進行預警或告警。人工設定監控指標閾值,運維人員主要依靠自身的維護經驗,憑借主觀判斷能力 確定監控指標閾值,因此設定監控指標閾值的準確性較低。同時,對于設置復雜度較高的關 聯指標閾值(由多個組合的監控指標共同設置閾值),不但人工操作復雜度高,設定監控指 標閾值的準確性也偏低。綜上所述,現有技術中人工設定監控指標閾值的準確性較低。
發明內容
本發明實施例提供一種設定監控指標閾值的方法和裝置,用以解決現有技術中人 工設定監控指標閾值的準確性較低的問題。本發明實施提供一種設定監控指標閾值的方法,包括從數據庫中采集多條監控數據,其中每條監控數據包括監控指標值和應用系統響 應時間值;根據采集的所述監控指標值,確定所述監控指標值對應的監控指標離散狀態,根 據采集的所述應用系統響應時間值,確定所述應用系統響應時間值對應的應用系統響應時 間離散狀態,確定所述監控指標離散狀態與所述應用系統響應時間離散狀態的關聯規則;根據所述關聯規則設定監控指標閾值。所述確定監控指標值對應的監控指標離散狀態,包括
將所述監控指標值映射到預先設置的多個離散狀態中,得到所述監控指標值對應 的監控指標離散狀態;所述確定應用系統響應時間值對應的應用系統響應時間離散狀態,包括將所述應用系統響應時間值映射到預先設置的多個離散狀態中,得到所述監控指 標值對應的監控指標離散狀態。采用K-means聚類算法對所述監控指標值進行數據離散化。通過對所述監控指標離散狀態和所述系統響應時間離散狀態進行關聯規則挖掘, 確定所述監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。所述通過關聯規則挖掘確定關聯規則包括通過Apriori算法,從監控指標離散狀態和應用系統響應時間離散狀態組成的項 集中確定支持度不小于最小支持度的頻繁項集;通過可信度計算算法,從所述確定的頻繁項集中確定可信度不小于最小可信度的 頻繁項集,得到所述監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。所述最小支持度是10% ;所述最小可信度是85 %。所述從數據庫中采集多條監控數據包括選取監控指標,并采集包含選取的監控指標對應的監控指標值的監控數據。一種設定監控指標閾值的裝置,包括采集模塊,用于從數據庫中采集多條監控數據,其中每條監控數據包括監控指標 值和應用系統響應時間值;關聯規則模塊,用于根據采集的所述監控指標值,確定所述監控指標值對應的監 控指標離散狀態,根據采集的所述應用系統響應時間值,確定所述應用系統響應時間值對 應的應用系統響應時間離散狀態,確定所述監控指標離散狀態與所述應用系統響應時間離 散狀態的關聯規則;閾值模塊,用于根據所述關聯規則設定監控指標閾值。所述關聯規則模塊包括第一離散模塊,用于將所述監控指標值映射到預先設置的多個離散狀態中,得到 所述監控指標值對應的監控指標離散狀態;第二離散模塊,用于對所述應用系統響應時間值進行數據離散化,將所述應用系 統響應時間值映射到預先設置的多個離散狀態中,得到所述應用系統響應時間值對應的應 用系統響應時間離散狀態。所述第一離散模塊還具體用于采用K-means聚類算法對所述監控指標值進行數據離散化。所述關聯規則模塊還包括挖掘模塊,用于對所述監控指標離散狀態和所述系統響應時間離散狀態進行關聯 規則挖掘,確定監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。所述挖掘模塊還具體用于通過Apriori算法,從監控指標離散狀態和應用系統響應時間離散狀態組成的項 集中確定支持度不小于最小支持度的頻繁項集;
通過可信度計算算法,從所述確定的頻繁項集中確定可信度不小于最小可信度的 頻繁項集,得到所述監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。所述采集模塊還具體用于選取監控指標,并采集包含選取的監控指標對應的監控指標值的監控數據。由于能夠將關聯規則技術應用到設定監控指標閾值領域,能夠提高設定監控指標 閾值的準確性,進一步地,本發明實施例可以由計算機設備設定監控指標閾值,簡化人工操作。
圖1為本發明實施例中設定監控指標閾值的方法示意圖;圖2為本發明實施例中產生關聯規則的過程示意圖;圖3為本發明實施例中設定監控指標閾值的裝置示意圖。
具體實施例方式本發明實施例從數據庫中采集監控數據,其中監控數據包括監控指標值和應用系 統響應時間值;根據所述監控指標值和所述應用系統響應時間值,確定所述監控指標值對 應的監控指標離散狀態與所述應用系統響應時間值對應的應用系統響應時間離散狀態的 關聯規則;根據所述關聯規則設定監控指標閾值。由于將關聯規則技術應用到設定監控指 標閾值領域,能夠提高設定監控指標閾值的準確性。此外,本發明實施例可以由計算機設備 設定監控指標閾值,簡化人工操作。下面結合說明書附圖對本發明方案作進一步詳細說明。參見圖1,本發明實施例提供的一種設定監控指標閾值的方法,包括如下步驟步驟101、從數據庫中采集多條監控數據,其中每條監控數據包括監控指標值和應 用系統響應時間值。步驟102、根據采集的所述監控指標值,確定所述監控指標值對應的監控指標離散 狀態,根據采集的所述應用系統響應時間值,確定所述應用系統響應時間值對應的應用系 統響應時間離散狀態,確定所述監控指標離散狀態與所述應用系統響應時間離散狀態的關 聯規則。步驟103、根據關聯規則設定監控指標閾值。步驟101中,每條監控數據包括監控指標值和應用系統響應時間值,可以理解為 一個時間點對應一條監控數據,在同一個時間點,應用系統的監控指標的具體數值與應用 系統響應時間的具體數值稱為一條監控數據。比如,數據庫中的包含如下數據
權利要求
一種設定監控指標閾值的方法,其特征在于,該方法包括從數據庫中采集多條監控數據,其中每條監控數據包括監控指標值和應用系統響應時間值;根據采集的所述監控指標值,確定所述監控指標值對應的監控指標離散狀態,根據采集的所述應用系統響應時間值,確定所述應用系統響應時間值對應的應用系統響應時間離散狀態,確定所述監控指標離散狀態與所述應用系統響應時間離散狀態的關聯規則;根據所述關聯規則設定監控指標閾值。
2.如權利要求1所述的方法,其特征在于,所述確定監控指標值對應的監控指標離散 狀態,包括將所述監控指標值映射到預先設置的多個離散狀態中,得到所述監控指標值對應的監 控指標離散狀態;所述確定應用系統響應時間值對應的應用系統響應時間離散狀態,包括 將所述應用系統響應時間值映射到預先設置的多個離散狀態中,得到所述監控指標值 對應的監控指標離散狀態。
3.如權利要求2所述的方法,其特征在于,采用K-means聚類算法對所述監控指標值進 行數據離散化。
4.如權利要求1-3任一所述的方法,其特征在于,通過對所述監控指標離散狀態和所 述系統響應時間離散狀態進行關聯規則挖掘,確定所述監控指標離散狀態與應用系統響應 時間離散狀態的關聯規則。
5.如權利要求4所述的方法,其特征在于,所述通過關聯規則挖掘確定關聯規則包括 通過Apriori算法,從監控指標離散狀態和應用系統響應時間離散狀態組成的項集中確定支持度不小于最小支持度的頻繁項集;通過可信度計算算法,從所述確定的頻繁項集中確定可信度不小于最小可信度的頻繁 項集,得到所述監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。
6.如權利要求5所述的方法,其特征在于,所述最小支持度是10%; 所述最小可信度是85%。
7.如權利要求1-3、5-6任一所述的方法,其特征在于,所述從數據庫中采集多條監控 數據包括選取監控指標,并采集包含選取的監控指標對應的監控指標值的監控數據。
8.一種設定監控指標閾值的裝置,其特征在于,該裝置包括采集模塊,用于從數據庫中采集多條監控數據,其中每條監控數據包括監控指標值和 應用系統響應時間值;關聯規則模塊,用于根據采集的所述監控指標值,確定所述監控指標值對應的監控指 標離散狀態,根據采集的所述應用系統響應時間值,確定所述應用系統響應時間值對應的 應用系統響應時間離散狀態,確定所述監控指標離散狀態與所述應用系統響應時間離散狀 態的關聯規則;閾值模塊,用于根據所述關聯規則設定監控指標閾值。
9.如權利要求8所述的裝置,其特征在于,所述關聯規則模塊包括第一離散模塊,用于將所述監控指標值映射到預先設置的多個離散狀態中,得到所述監控指標值對應的監控指標離散狀態;第二離散模塊,用于對所述應用系統響應時間值進行數據離散化,將所述應用系統響 應時間值映射到預先設置的多個離散狀態中,得到所述應用系統響應時間值對應的應用系 統響應時間離散狀態。
10.如權利要求9所述的裝置,其特征在于,所述第一離散模塊還具體用于 采用K-means聚類算法對所述監控指標值進行數據離散化。
11.如權利要求8-10任一所述的裝置,其特征在于,所述關聯規則模塊還包括挖掘模塊,用于對所述監控指標離散狀態和所述系統響應時間離散狀態進行關聯規則 挖掘,確定監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。
12.如權利要求11所述的裝置,其特征在于,所述挖掘模塊還具體用于通過Apriori算法,從監控指標離散狀態和應用系統響應時間離散狀態組成的項集中 確定支持度不小于最小支持度的頻繁項集;通過可信度計算算法,從所述確定的頻繁項集中確定可信度不小于最小可信度的頻繁 項集,得到所述監控指標離散狀態與應用系統響應時間離散狀態的關聯規則。
13.如權利要求8-10、12任一所述的裝置,其特征在于,所述采集模塊還具體用于 選取監控指標,并采集包含選取的監控指標對應的監控指標值的監控數據。
全文摘要
本發明實施例公開了一種設定監控指標閾值的方法和裝置,用以解決現有技術中人工設定監控指標閾值的準確性較低的問題,該方法包括從數據庫中采集監控數據,其中監控數據包括監控指標值和應用系統響應時間值;根據所述監控指標值和所述應用系統響應時間值,確定所述監控指標值對應的監控指標離散狀態與所述應用系統響應時間值對應的應用系統響應時間離散狀態的關聯規則;根據所述關聯規則設定監控指標閾值。采用本發明的方法,可以提高設定監控指標閾值的準確性。
文檔編號G06F11/30GK101984415SQ20101052994
公開日2011年3月9日 申請日期2010年11月2日 優先權日2010年11月2日
發明者吳軍慶, 周亮 申請人:中興通訊股份有限公司