本發明涉及網絡安全,尤其涉及一種智能分析數據安全識別方法、裝置、電子設備及存儲介質。
背景技術:
1、隨著時代發展,大數據技術和人工智能技術發展迅速,相關自動化與智能化的識別和處理能力、數據分析能力逐漸與網絡安全技術進行了深度協同,對網絡安全的技術、方法、應用產生了重要影響。可以預見的是安全數據采集和安全智能數據分析技術的成熟將會大幅提升網絡安全威脅檢測、網絡安全風險評估等關鍵安全防御環節的效率,大幅度減少網絡的安全性。
2、目前的安全防護手段主要還是基于傳統安全思想,現有的安全防護技術為利用傳統安全設備進行阻攔,如:防火墻,入侵防御系統,網站應用級入侵防御系統。傳統安全設備使用阻攔規則來根據數據指紋和訪問量級判別是否存在網絡攻擊或異常行為,這些阻攔規則可以根據實際需求進行配置,以提供一定程度上的安全防護。然而,對于新型漏洞或凌日漏洞,傳統的阻攔規則缺乏行之有效的安全防護策略,導致智能分析數據識別能力較低。
技術實現思路
1、本發明提供一種智能分析數據安全識別方法、裝置、電子設備及存儲介質,用以解決現有技術中智能分析數據安全識別能力低下的問題。
2、第一方面,本發明提供一種智能分析數據安全識別方法,包括:
3、獲取數據源;所述數據源包括用戶信息和用戶流量數據;
4、基于所述數據源進行特征提取,得到第一特征向量;
5、將所述第一特征向量輸入至數據分析模型,得到流量類型識別結果;所述數據分析模型是基于目標懲罰因子、目標核函數參數和目標加權系數進行訓練所得到的;所述目標懲罰因子、所述目標核函數參數和所述目標加權系數是基于遺傳算法結合樣本特征向量、高斯核函數與預設懲罰因子進行參數優化所得到的;
6、將所述第一特征向量和所述流量類型識別結果輸入至流量異常檢測模型,得到特征異常率;所述流量異常檢測模型是基于流量類型樣本向量進行訓練所得到的;
7、基于所述特征異常率進行異常識別,得到智能分析數據安全識別結果。
8、在一個實施例中,所述數據分析模型是基于如下步驟確定的:
9、確定樣本特征向量;
10、確定所述樣本特征向量中各特征的信息熵貢獻率;所述信息熵貢獻率用于反映特征對于預測任務的重要程度;
11、基于各信息熵貢獻率,對高斯核函數進行加權,得到加權核函數;
12、基于所述加權核函數與非線性核函數進行線性組合,得到組合核函數;
13、確定所述組合核函數中的初始核函數參數和初始加權系數;核函數參數用于優化支持向量機的泛化能力;加權系數用于調節所述加權核函數與所述非線性核函數在所述組合核函數中的權重;
14、基于遺傳算法,對所述預設懲罰因子、所述初始核函數參數和所述初始加權系數進行參數優化,得到目標懲罰因子、目標核函數參數和目標加權系數;
15、基于所述目標懲罰因子、所述目標核函數參數和所述目標加權系數,對支持向量機進行訓練,得到數據分析模型。
16、在一個實施例中,所述基于遺傳算法,對所述預設懲罰因子、所述初始核函數參數和所述初始加權系數進行參數優化,得到目標懲罰因子、目標核函數參數和目標加權系數,包括:
17、基于所述預設懲罰因子、所述初始核函數參數和所述初始加權系數進行二進制編碼,得到多條第一待選染色體編碼;
18、從所有第一待選染色體編碼中選擇第一預設數量的第一染色體編碼;
19、基于各第一染色體編碼進行交叉處理,得到第一預設數量的第一交叉編碼;
20、對各第一交叉編碼進行變異處理,得到第一預設數量的第一變異編碼;
21、根據各第一變異編碼和各剩余染色體編碼更新所述第一待選染色體編碼;所述剩余染色體編碼指的是所有第一待選染色體編碼中,除了第一染色體編碼之外剩下的第一待選染色體編碼;
22、迭代執行所述從所有第一待選染色體編碼中選擇第一預設數量的第一染色體編碼的步驟,直至迭代次數達到預設次數或更新后的第一待選染色體編碼滿足預設規則,得到染色體編碼最優解;
23、基于所述染色體編碼最優解,確定目標懲罰因子、目標核函數參數和目標加權系數。
24、在一個實施例中,所述流量異常檢測模型包括流量特征檢測模型、字符特征檢測模型和時間序列統計特征檢測模型;所述流量特征檢測模型是基于流量特征樣本向量進行訓練所得到的;所述字符特征檢測模型是基于字符特征樣本向量進行訓練所得到的;所述時間序列統計特征檢測模型是基于時間序列統計特征樣本向量進行訓練所得到的;所述特征異常率包括流量特征異常率、字符特征異常率和時間序列統計特征異常率。
25、在一個實施例中,所述基于所述特征異常率,確定智能分析數據安全識別結果,包括:
26、確定第一預設權重系數、第二預設權重系數和第三預設權重系數;
27、基于所述第一預設權重系數,對流量特征異常率進行加權計算,得到流量特征加權值;
28、基于所述第二預設權重系數,對字符特征異常率進行加權計算,得到字符特征加權值;
29、基于所述第三預設權重系數,對時間序列統計特征異常率進行加權計算,得到時間序列統計特征加權值;
30、對所述流量特征加權值、所述字符特征加權值和所述時間序列統計特征加權值進行均值計算,得到特征異常平均值;
31、基于所述特征異常平均值進行異常識別,得到智能分析數據安全識別結果。
32、在一個實施例中,所述基于所述特征異常平均值進行異常識別,得到智能分析數據安全識別結果,包括:
33、若所述特征異常平均值大于預設閾值,則確定智能分析數據安全識別結果為存在網絡異常;
34、若所述特征異常平均值小于或等于預設閾值,則確定智能分析數據安全識別結果為網絡正常。
35、在一個實施例中,所述基于所述數據源進行特征提取,得到第一特征向量,包括:
36、對所述數據源進行字段化處理,得到字段數據;
37、對所述字段數據進行特征提取,得到第二特征向量;
38、基于特征哈希函數,對所述第二特征向量進行特征提取,得到第一特征向量;所述特征哈希函數用于將高維特征向量映射到低維特征向量。
39、第二方面,本發明還提供一種智能分析數據安全識別裝置,包括:
40、獲取模塊,用于獲取數據源;所述數據源包括用戶信息和用戶流量數據;
41、特征提取模塊,用于基于所述數據源進行特征提取,得到第一特征向量;
42、流量類型識別模塊,用于將所述第一特征向量輸入至數據分析模型,得到流量類型識別結果;所述數據分析模型是基于目標懲罰因子、目標核函數參數和目標加權系數進行訓練所得到的;所述目標懲罰因子、所述目標核函數參數和所述目標加權系數是基于遺傳算法結合樣本特征向量、高斯核函數與預設懲罰因子進行參數優化所得到的;
43、流量異常檢測模塊,用于將所述第一特征向量和所述流量類型識別結果輸入至流量異常檢測模型,得到特征異常率;
44、安全識別模塊,用于基于所述特征異常率進行異常識別,得到智能分析數據安全識別結果。
45、第三方面,本發明提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述任一種所述智能分析數據安全識別方法的步驟。
46、第四方面,本發明還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如上述任一種所述智能分析數據安全識別方法的步驟。
47、本發明提供的智能分析數據安全識別方法、裝置、電子設備及存儲介質,采用遺傳算法結合樣本特征向量、高斯核函數與預設懲罰因子進行參數優化,得到優化后的數據分析模型,提高了數據分析模型的分類準確性和泛化能力,因此,通過將第一特征向量輸入至數據分析模型,可以實現對用戶用網行為所產生的數據進行嚴格數據分析,得到流量類型識別結果,進一步將第一特征向量和流量類型識別結果輸入至流量異常檢測模型,得到特征異常率,以確定出智能分析數據安全識別結果,對用戶用網行為的安全性進行實時評估,可以實現有效的非法行為檢測,確保用戶用網時的數據安全性和業務完整性,從而提高智能分析數據安全識別能力。