本申請屬于計算機,尤其涉及一種檢測規則的修正方法、裝置、設備、存儲介質和程序產品。
背景技術:
1、為保障存儲系統運行安全、存儲系統內個人信息安全,在收集存儲系統日志時應對敏感信息進行過濾。
2、現有的數據敏感性檢測模型,在訓練后的初始階段的敏感性檢測正確率較高,但是隨著時間的推移,由于會有新的法規或者新的敏感性判斷規則的出現,原有的數據敏感性檢測模型的檢測能力會下降,相當于發生了模型的漂移,會導致誤報漏報較多,降低了數據敏感性檢測模型的檢測結果的準確性。
3、因此,現有技術存在的問題是:數據敏感性檢測模型會在一定階段后發生漂移,導致檢測能力下降,檢測結果不準確。
技術實現思路
1、本申請實施例提供了一種檢測規則的修正方法、裝置、設備、存儲介質和程序產品,解決了數據敏感性檢測模型會在一定階段后發生漂移,導致檢測能力下降,檢測結果不準確的問題。
2、第一方面,本申請實施例提供了一種檢測規則的修正方法,包括:
3、獲取預設時長內的檢測結果的錯誤量和總數量,其中,檢測結果基于預設的第一檢測規則對目標數據的敏感性進行檢測得到;
4、將錯誤量除以總數量,得到第一檢測規則的錯誤率;
5、錯誤率在預設時長內的部分時段內從告警閾值持續增長至漂移閾值的情況下,獲取訓練樣本數據和訓練樣本數據的敏感性真實結果,其中,告警閾值小于漂移閾值;
6、根據訓練樣本數據和敏感性真實結果,對第一檢測規則進行修正,得到第一目標檢測規則。
7、在一些可能的實現方式中,檢測結果包括第一檢測結果,第一檢測結果為具有敏感性。
8、在一些可能的實現方式中,訓練樣本數據包括錯誤率大于漂移閾值之后的目標數據;或者,
9、訓練樣本數據包括錯誤率大于告警閾值之后的目標數據。
10、在一些可能的實現方式中,在獲取預設時長內的檢測結果的錯誤量和總數量之前,該方法還包括:
11、獲取待檢測的目標數據;
12、利用預設的領域詞檢測模型,檢測目標數據中的領域詞;
13、利用預設的第一檢測規則,檢測領域詞的敏感性,得到檢測結果。
14、在一些可能的實現方式中,在利用預設的領域詞檢測模型,檢測目標數據中的領域詞之前,該方法還包括:
15、獲取第一預設時間段內的第一歷史數據;
16、基于第一歷史數據,對通用詞庫進行修正,得到領域詞庫;
17、基于領域詞庫,生成領域詞檢測模型。
18、在一些可能的實現方式中,基于第一歷史數據,對通用詞庫進行修正,得到領域詞庫,包括:
19、基于第一歷史數據,對通用詞庫進行修正,得到歷史領域詞庫;
20、按照預設的擴充規則,對歷史領域詞庫進行擴充,得到領域詞庫。
21、在一些可能的實現方式中,在利用預設的第一檢測規則,檢測領域詞的敏感性,得到檢測結果之前,該方法還包括:
22、獲取第二預設時間段內的第二歷史數據和第二歷史數據的第一敏感性歷史標簽;
23、利用預設的第二檢測規則,檢測第二歷史數據的敏感性,得到歷史檢測結果;
24、基于歷史檢測結果和第一敏感性歷史標簽,對第二檢測規則進行修正,得到第一檢測規則。
25、在一些可能的實現方式中,在利用預設的第二檢測規則,檢測第二歷史數據的敏感性,得到歷史檢測結果之前,方法還包括:
26、獲取第三預設時間段內的第三歷史數據和第三歷史數據對應的第二敏感性歷史標簽;
27、利用預設的領域詞檢測模型,檢測第三歷史數據中的歷史領域詞;
28、基于歷史領域詞和第二敏感性歷史標簽,生成第二檢測規則。
29、第二方面,本申請實施例還提供了一種檢測規則的修正裝置,包括:
30、獲取模塊,用于獲取預設時長內的檢測結果的錯誤量和總數量,其中,檢測結果基于預設的第一檢測規則對目標數據的敏感性進行檢測得到;
31、計算模塊,用于將錯誤量除以總數量,得到第一檢測規則的錯誤率;
32、獲取模塊,還用于錯誤率在預設時長內的部分時段內從告警閾值持續增長至漂移閾值的情況下,獲取訓練樣本數據和訓練樣本數據的敏感性真實結果,其中,告警閾值小于漂移閾值;
33、修正模塊,用于根據訓練樣本數據和敏感性真實結果,對第一檢測規則進行修正,得到第一目標檢測規則。
34、第三方面,本申請實施例還提供了一種檢測規則的修正設備,該設備包括:處理器以及存儲有計算機程序指令的存儲器;處理器執行計算機程序指令時實現第一方面,或第一方面任一可能實現方式中的檢測規則的修正方法。
35、第四方面,本申請實施例還提供了一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序指令,計算機程序指令被處理器執行時實現第一方面,或第一方面任一可能實現方式中的檢測規則的修正方法。
36、第五方面,本申請實施例還提供了一種計算機程序產品,計算機程序產品中的指令由電子設備的處理器執行時,使得電子設備能夠執行第一方面,或第一方面任一可能實現方式中的檢測規則的修正方法。
37、本申請實施例的檢測規則的修正方法、裝置、設備、存儲介質和程序產品,該方法通過獲取檢測結果的錯誤量和總數量,其中,檢測結果基于預設的第一檢測規則對目標數據的敏感性進行檢測得到,然后將錯誤量除以總數量,可以得到第一檢測規則的錯誤率,接著在錯誤率在預設時長內的部分時段內從告警閾值持續增長至漂移閾值的情況下,其中,告警閾值小于漂移閾值,例如錯誤率大于告警閾值之后還需要繼續觀察錯誤率的波動情況,在錯誤率大于告警閾值后又下降到低于告警閾值時,說明并未發生實質的規則漂移,無需對第一檢測規則進行重新訓練,但是當錯誤率持續增大至超過漂移閾值后,說明的第一檢測規則發生了漂移,即舊的檢測規則不再適用,此時需要重新訓練第一檢測規則,即可以獲取訓練樣本數據和訓練樣本數據的敏感性真實結果,再根據訓練樣本數據和敏感性真實結果,對第一檢測規則進行修正,得到第一目標檢測規則。通過監測錯誤率的波動情況,可以判斷何時第一檢測規則發生了漂移,何時需要學習新的規則,從而提高了第一檢測規則的準確性,從而能夠對第一檢測規則進行自適應學習調整,解決了數據敏感性檢測模型會在一定階段后發生漂移,檢測能力下降,檢測結果不準確的問題。
1.一種檢測規則的修正方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述檢測結果包括第一檢測結果,所述第一檢測結果為具有敏感性。
3.根據權利要求1所述的方法,其特征在于,所述訓練樣本數據包括所述錯誤率大于所述漂移閾值之后的所述目標數據;或者,
4.根據權利要求1至3任一項所述的方法,其特征在于,在所述獲取預設時長內的檢測結果的錯誤量和總數量之前,所述方法還包括:
5.根據權利要求4所述的方法,其特征在于,在所述利用預設的領域詞檢測模型,檢測所述目標數據中的領域詞之前,所述方法還包括:
6.根據權利要求5所述的方法,其特征在于,所述基于所述第一歷史數據,對通用詞庫進行修正,得到領域詞庫,包括:
7.根據權利要求4所述的方法,其特征在于,在所述利用預設的所述第一檢測規則,檢測所述領域詞的敏感性,得到所述檢測結果之前,所述方法還包括:
8.根據權利要求7所述的方法,其特征在于,在所述利用預設的第二檢測規則,檢測所述第二歷史數據的敏感性,得到歷史檢測結果之前,所述方法還包括:
9.一種檢測規則的修正裝置,其特征在于,包括:
10.一種檢測規則的修正設備,其特征在于,所述設備包括:處理器以及存儲有計算機程序指令的存儲器;所述處理器執行所述計算機程序指令時實現如權利要求1至8任一項所述的檢測規則的修正方法。
11.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序指令,所述計算機程序指令被處理器執行時實現如權利要求1至8任意一項所述的檢測規則的修正方法。
12.一種計算機程序產品,其特征在于,所述計算機程序產品中的指令由設備的處理器執行時,使得所述設備能夠執行如權利要求1-8任意一項所述的檢測規則的修正方法。