本申請涉及人工智能,具體涉及一種基于聯邦學習的惡意域名識別模型訓練方法、裝置和設備。
背景技術:
1、不斷增加的在線活動讓互聯網用戶面臨潛在的網絡威脅和安全問題,這些威脅和攻擊中最主要的攻擊形式是以域名為依托而展開的,如點擊欺詐、網頁篡改、sql注入攻擊、網站后門、緩存投毒等。域名作為互聯網的基礎設施,與各種網絡活動有著內在的聯系。由于域名的靈活性和可訪問性,進而惡意域名也就成為網絡攻擊者所使用的主要手段。因此,如何有效地識別惡意域名和惡意網站一直是網絡安全研究的重要課題。
2、目前,通常基于深度學習識別惡意網站。一方面,深度學習是以數據為驅動的,要訓練出高性能的模型,往往需要大批量、高質量的數據,而惡意域名在每個單一機構的樣本量很少,各個運營商又有各自的隱私政策,無法共用數據進行模型訓練,導致訓練的模型對惡意域名識別的準確率不高;另一方面,現有的深度學習模型都是基于文本序列信息進行訓練的,單一的數據模態降低了模型識別的準確率。
3、因此,如何提高惡意域名識別模型的準確率成為亟待解決的問題。
技術實現思路
1、本發明提供一種基于聯邦學習的惡意域名識別模型訓練方法、裝置和設備,用以解決現有技術中惡意域名識別模型的準確率較低的技術問題。
2、本發明提供一種基于聯邦學習的惡意域名識別模型訓練方法,包括:
3、執行循環過程直至滿足預設迭代條件;所述循環過程包括:
4、使用域名訓練數據訓練惡意域名識別模型后,對所述惡意域名識別模型的參數進行加密,得到加密模型參數,所述域名訓練數據由包含域名對應網頁文字內容的第一訓練數據和包含域名對應網頁圖像內容的第二訓練數據組成;
5、將所述加密模型參數發送至服務端;
6、獲得所述服務端反饋的聚合模型參數后,對所述聚合模型參數進行解密,得到解密模型參數;
7、基于所述解密模型參數對所述惡意域名識別模型進行更新。
8、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,所述第二訓練數據是使用預置圖像語言模型對源網頁圖像進行識別得到的,所述預置圖像語言模型是基于如下步驟訓練的:
9、獲取預訓練模型中除輸出層以外的模型參數,所述預訓練模型是預先訓練的適用于各場景的視覺語言生成模型;
10、將所述模型參數代入待訓練圖像語言模型后,使用圖像語言訓練數據對所述待訓練圖像語言模型進行訓練,得到預置圖像語言模型,所述圖像語言訓練數據包括多個圖像-文本對數據,所述預置圖像語言模型是惡意域名場景下的視覺語言生成模型。
11、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,所述預訓練模型是一個多任務模型,所述預訓練模型包括:
12、單模態編碼器,用于分別對輸入圖像及對應的文本進行編碼;
13、基于圖像的文本編碼器,用于基于交叉注意力層模擬圖文信息交互,預測圖像-文本對是正匹配或負匹配;
14、基于圖像的文本解碼器,用于生成輸入圖像的文本描述。
15、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,所述惡意域名識別模型基于如下步驟進行惡意域名識別:
16、使用嵌入層對輸入數據進行編碼,得到詞向量序列;
17、使用轉換器編碼器將所述詞向量序列轉化為基于上下文表示的中間向量;
18、將所述中間向量輸入至輸出層,得到輸出層輸出的惡意域名識別結果。
19、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,基于如下公式對所述惡意域名識別模型的參數進行加密:
20、m=wi;
21、s=rnmodn2,n=pq;
22、
23、其中,wi表示第i個參數,pk表示公鑰,表示使用公鑰pk對第i個參數wi進行加密后得到的密文,p和q是兩個質數。
24、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,所述聚合模型參數是基于如下公式計算得到的:
25、
26、其中,dj表示第j個客戶端的域名訓練數據的數據量,k表示所述惡意域名識別模型的參數個數,wavg表示第i個參數對應的聚合參數。
27、根據本發明提供的一種基于聯邦學習的惡意域名識別模型訓練方法,基于如下公式對所述聚合模型參數進行解密:
28、
29、λ=lcm(p-1,q-1);
30、b=λ-1modn;
31、c=wavg;
32、wi=b·l(cλmodn2)modn。
33、本發明還提供一種基于聯邦學習的惡意域名識別模型訓練裝置,包括:
34、循環迭代模塊,用于:執行循環過程直至滿足預設迭代條件;所述循環過程包括:
35、使用域名訓練數據訓練惡意域名識別模型后,對所述惡意域名識別模型的參數進行加密,得到加密模型參數,所述域名訓練數據由包含域名對應網頁文字內容的第一訓練數據和包含域名對應網頁圖像內容的第二訓練數據組成;
36、將所述加密模型參數發送至服務端;
37、獲得所述服務端反饋的聚合模型參數后,對所述聚合模型參數進行解密,得到解密模型參數;
38、基于所述解密模型參數對所述惡意域名識別模型進行更新。
39、本發明還提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述任一種所述基于聯邦學習的惡意域名識別模型訓練方法。
40、本發明還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如上述任一種所述基于聯邦學習的惡意域名識別模型訓練方法。
41、本申請實施例提供的基于聯邦學習的惡意域名識別模型訓練方法、裝置和設備,執行循環過程直至滿足預設迭代條件;所述循環過程包括:使用域名訓練數據訓練惡意域名識別模型后,對所述惡意域名識別模型的參數進行加密,得到加密模型參數,所述域名訓練數據由包含域名對應網頁文字內容的第一訓練數據和包含域名對應網頁圖像內容的第二訓練數據組成;將所述加密模型參數發送至服務端;獲得所述服務端反饋的聚合模型參數后,對所述聚合模型參數進行解密,得到解密模型參數;基于所述解密模型參數對所述惡意域名識別模型進行更新。惡意網址上都有大量的圖像,且這些圖像大多與這個網址的類別相關,而圖像能提供直觀的信息特征,因此基于圖像訓練的惡意域名識別模型可以利用網址上的圖像預測網址是否為惡意網址,從而提高惡意域名識別的準確性;將模型參數同態加密上傳服務器進行計算,解決了多個企業組織客戶端大規模數據分散、不易集中且具有高度隱私的問題。
1.一種基于聯邦學習的惡意域名識別模型訓練方法,應用于客戶端,其特征在于,包括:
2.根據權利要求1所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,所述第二訓練數據是使用預置圖像語言模型對源網頁圖像進行識別得到的,所述預置圖像語言模型是基于如下步驟訓練的:
3.根據權利要求2所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,所述預訓練模型是一個多任務模型,所述預訓練模型包括:
4.根據權利要求1所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,所述惡意域名識別模型基于如下步驟進行惡意域名識別:
5.根據權利要求1所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,基于如下公式對所述惡意域名識別模型的參數進行加密:
6.根據權利要求5所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,所述聚合模型參數是基于如下公式計算得到的:
7.根據權利要求6所述的基于聯邦學習的惡意域名識別模型訓練方法,其特征在于,基于如下公式對所述聚合模型參數進行解密:
8.一種基于聯邦學習的惡意域名識別模型訓練裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至7任一項所述基于聯邦學習的惡意域名識別模型訓練方法。
10.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述基于聯邦學習的惡意域名識別模型訓練方法。