本技術涉及軟件,尤其涉及一種生成內容檢測方法及相關裝置。
背景技術:
1、現階段,生成式人工智能(generative?ai)在諸如圖像、視頻等內容創作方向得到了快速發展,生成內容(比如圖像生成算法的生成圖像、視頻生成算法的生成視頻)可以達到以假亂真的程度。
2、在對生成內容進行檢測時,往往只能針對特定的內容生成算法,一旦內容生成算法更新,其泛化性就會大打折扣,這就導致檢測的準確率會大幅下降。
技術實現思路
1、鑒于上述問題,本技術提供了一種生成內容檢測方法及相關裝置,以實現在不損失泛化性的前提下有效識別生成內容的目的。具體方案如下:
2、本技術第一方面提供一種生成內容檢測方法,所述生成內容檢測方法包括:
3、獲取待檢測的目標內容;
4、調取預先訓練的內容分類模型,所述內容分類模型能夠提取不同內容生成算法的內容特征、并通過特征融合進行分類;其中,所述內容分類模型的訓練過程,包括構建基礎模型,所述模型中包含特征提取層、特征融合網絡和分類頭,所述特征提取層中包含多個預先訓練的特征提取器,一個特征提取器對應一個內容生成算法;獲取訓練數據集合,所述訓練數據集合中包含真實內容、以及每個特征提取器對應的內容生成算法所生成的生成內容;從所述真實內容和所述生成內容中選取本次訓練的樣本內容,對所述樣本內容標注分類標簽,將所述樣本內容輸入至所述基礎模型中,以對所述基礎模型進行訓練,直至損失函數值滿足對應的收斂條件時,結束訓練;將結束訓練后的所述基礎模型作為所述內容分類模型;
5、將所述目標內容輸入至所述內容分類模型中,通過所述內容分類模型預測所述目標內容的目標分類結果,所述目標分類結果用于表征所述目標內容是否屬于生成內容。
6、在一種可能的實現中,所述目標內容為目標圖像、所述內容分類模型為圖像分類模型、所述內容生成算法為圖像生成算法、所述內容特征為圖像特征、所述生成內容為生成圖像;
7、所述圖像分類模型的訓練過程,包括:
8、構建第一基礎模型,所述第一基礎模型中包含第一特征提取層、第一特征融合網絡和第一分類頭,所述第一特征提取層中包含多個預先訓練的第一特征提取器,一個第一特征提取器對應一個圖像生成算法;
9、獲取第一訓練數據集合,所述第一訓練數據集合中包含第一真實圖像、以及每個第一特征提取器對應的圖像生成算法所生成的第一生成圖像;
10、從所述第一真實圖像和所述第一生成圖像中選取本次訓練的第一樣本圖像,對所述第一樣本圖像標注第一分類標簽,將所述第一樣本圖像輸入至所述第一基礎模型中,以實現:
11、通過每個第一特征提取器提取所述第一樣本圖像的第一圖像特征;對每個第一特征提取器提取到的所述第一圖像特征進行拼接、并加入可學習的第一特征變量;通過所述第一特征融合網絡對加入所述第一特征變量的所述第一圖像特征進行基于自注意力機制的融合學習,得到第二圖像特征;從所述第二圖像特征中提取所述第一特征變量對應的特征,并將提取到的特征輸出給所述第一分類頭;通過所述第一分類頭對其所獲得的特征進行分類預測,得到所述第一樣本圖像的第一分類結果,所述第一分類結果用于表征所述第一樣本圖像是否屬于所述生成圖像;根據所述第一分類結果和所述第一分類標簽計算所述第一樣本圖像的第一損失函數值,根據所述第一損失函數值更新所述第一特征融合網絡和所述第一分類頭的權重參數,并返回執行所述從所述第一真實圖像和所述第一生成圖像中選取本次訓練的第一樣本圖像這一步驟,直到所述第一損失函數值滿足對應的第一收斂條件時,結束訓練;
12、將結束訓練后的所述第一基礎模型作為所述圖像分類模型。
13、在一種可能的實現中,每個第一特征提取器的訓練過程,包括:
14、構建第二基礎模型,所述第二基礎模型中包含第一原始特征提取器和第二分類頭,所述第一原始特征提取器中包含單個第一特征提取網絡;
15、獲取第二訓練數據集合,所述第二訓練數據集合中包含第二真實圖像、以及目標圖像生成算法所生成的第二生成圖像,所述目標圖像生成算法為待訓練的第一特征提取器對應的圖像生成算法;
16、從所述第二真實圖像和所述第二生成圖像中選取本次訓練的第二樣本圖像,對所述第二樣本圖像標注第二分類標簽,將所述第二樣本圖像輸入至所述第二基礎模型中,以實現:
17、通過所述第一特征提取網絡提取所述第二樣本圖像的第三圖像特征;通過所述第二分類頭對所述第三圖像特征進行分類預測,得到所述第二樣本圖像的第二分類結果,所述第二分類結果用于表征所述第二樣本圖像是否屬于所述生成圖像;根據所述第二分類結果和所述第二分類標簽計算所述第二樣本圖像的第二損失函數值,根據所述第二損失函數值更新所述第一特征提取網絡和所述第二分類頭的權重參數,并返回執行所述從所述第二真實圖像和所述第二生成圖像中選取本次訓練的第二樣本圖像這一步驟,直到所述第二損失函數值滿足對應的第二收斂條件時,結束訓練;
18、將結束訓練后的所述第一原始特征提取器作為所述目標圖像生成算法對應的第一特征提取器。
19、在一種可能的實現中,所述獲取第一訓練數據集合,包括:
20、按照所述第一特征提取層中多個第一特征提取器的數量,對每個第一特征提取器對應的圖像生成算法所生成的第三生成圖像進行采樣;
21、將采樣到的所述第三生成圖像作為所述第一生成圖像;
22、抓取所述第一真實圖像,所述第一真實圖像的數量與所述第一生成圖像的數量相同。
23、在一種可能的實現中,所述圖像分類模型的訓練過程,還包括:
24、響應圖像生成算法更新指令,返回執行所述構建第一基礎模型。
25、在一種可能的實現中,所述目標內容為目標視頻、所述內容分類模型為視頻分類模型、所述內容生成算法為視頻生成算法、所述內容特征為視頻特征、所述生成內容為生成視頻;
26、所述視頻分類模型的訓練過程,包括:
27、構建第三基礎模型,所述第三基礎模型中包含第二特征提取層、第二特征融合網絡和第三分類頭,所述第二特征提取層中包含多個預先訓練的第二特征提取器,一個第二特征提取器對應一個視頻生成算法;
28、獲取第三訓練數據集合,所述第三訓練數據集合中包含第一真實視頻、以及每個第二特征提取器對應的視頻生成算法所生成的第一生成視頻;
29、從所述第一真實視頻和所述第一生成視頻中選取本次訓練的第一樣本視頻,對所述第一樣本視頻標注第三分類標簽,將所述第一樣本視頻輸入至所述第三基礎模型中,以實現:
30、通過每個第二特征提取器提取所述第一樣本視頻的第一視頻特征,所述第一視頻特征中的部分特征屬于可學習的第二特征變量;通過所述第二特征融合網絡對每個第二特征提取器提取到的所述第一視頻特征進行基于交叉注意力機制的融合學習,得到第二視頻特征;從所述第二視頻特征中提取所述第二特征變量對應的特征,并將提取到的特征輸出給所述第三分類頭;通過所述第三分類頭對其所獲得的特征進行分類預測,得到所述第一樣本視頻的第三分類結果,所述第三分類結果用于表征所述第一樣本視頻是否屬于所述生成視頻;根據所述第三分類結果和所述第三分類標簽計算所述第一樣本視頻的第三損失函數值,根據所述第三損失函數值更新所述第二特征融合網絡和所述第三分類頭的權重參數,并返回執行所述從所述第一真實視頻和所述第一生成視頻中選取本次訓練的第一樣本視頻這一步驟,直到所述第三損失函數值滿足對應的第三收斂條件時,結束訓練;
31、將結束訓練的所述第三基礎模型作為所述視頻分類模型。
32、在一種可能的實現中,每個第二特征提取器的訓練過程,包括:
33、構建第四基礎模型,所述第四基礎模型中包含第二原始特征提取器和第四分類頭,所述第二原始特征提取器包含多個第二特征提取網絡和第三特征融合網絡;
34、獲取第四訓練數據集合,所述第四訓練數據集合中包含第二真實視頻、以及目標視頻生成算法所生成的第二生成視頻,所述目標視頻生成算法為待訓練的第二特征提取器對應的視頻生成算法;
35、從所述第二真實視頻和所述第二生成視頻中選取本次訓練的第二樣本視頻,對所述第二樣本視頻標注第四分類標簽,將所述第二樣本視頻輸出至所述第四基礎模型中,以實現:
36、通過每個第二特征提取網絡提取所述第二樣本視頻的第三視頻特征;對每個第二特征提取網絡提取到的所述第三視頻特征進行拼接,并加入可學習的第三特征變量;通過所述第三特征融合網絡對加入所述第三特征變量的所述第三視頻特征進行基于自注意力機制的融合學習,得到第四視頻特征;從所述第四視頻特征中提取所述第三特征變量對應的特征,并將提取到的特征輸出給所述第四分類頭;通過所述第四分類頭對其所獲得的特征進行分類預測,得到所述第二樣本視頻的第四分類結果,所述第四分類結果用于表征所述第二樣本視頻是否屬于所述生成視頻;根據所述第四分類結果和所述第四分類標簽計算所述第二樣本視頻的第四損失函數值,根據所述第四損失函數值更新所述多個第二特征提取網絡、所述第三特征融合網絡和所述第四分類頭的權重參數,并返回執行所述從所述第二真實視頻和所述第二生成視頻中選取本次訓練的第二樣本視頻這一步驟,直到所述第四損失函數值滿足對應的第四收斂條件時,結束訓練;
37、將結束訓練后的所述第二原始特征提取器作為所述目標視頻生成算法對應的第二特征提取器。
38、在一種可能的實現中,所述獲取第三訓練數據集合,包括:
39、按照所述第二特征提取層中多個第二特征提取器的數量,對每個第二特征提取器對應的視頻生成算法所生成的第三生成視頻進行采樣;
40、將采樣到的所述第三生成視頻作為所述第一生成視頻;
41、抓取所述第一真實視頻,所述第一真實視頻的數量與所述第一生成視頻的數量相同。
42、在一種可能的實現中,所述視頻分類模型的訓練過程,還包括:
43、響應視頻生成算法更新指令,返回執行所述構建第三基礎模型。
44、本技術第二方面提供一種生成內容檢測裝置,所述生成內容檢測裝置包括:
45、內容獲取模塊,用于獲取待檢測的目標內容;
46、內容檢測模塊,用于調取預先訓練的內容分類模型,所述內容分類模型能夠提取不同內容生成算法的內容特征、并通過特征融合進行分類;將所述目標內容輸入至所述內容分類模型中,通過所述內容分類模型預測所述目標內容的目標分類結果,所述目標分類結果用于表征所述目標內容是否屬于生成內容。
47、本技術第三方面提供一種計算機程序產品,包括計算機可讀指令,當所述計算機可讀指令在電子設備上運行時,使得所述電子設備實現上述第一方面或第一方面任一實現方式的生成內容檢測方法。
48、本技術第四方面提供一種電子設備,包括至少一個處理器和與所述處理器連接的存儲器,其中:
49、所述存儲器用于存儲計算機程序;
50、所述處理器用于執行所述計算機程序,以使所述電子設備能夠實現第一方面或第一方面任一實現方式的生成內容檢測方法。
51、本技術第五方面提供一種計算機存儲介質,所述存儲介質承載有一個或多個計算機程序,當所述一個或多個計算機程序被電子設備執行時,能夠使所述電子設備實現第一方面或第一方面任一實現方式的生成內容檢測方法。
52、借由上述技術方案,本技術提供的一種生成內容檢測方法及相關裝置,預先訓練內容分類模型,該內容分類模型能夠提取不同內容生成算法的內容特征并通過特征融合進行分類。獲取待檢測的目標內容,進而調取內容分類模型,進一步將目標內容輸入至內容分類模型中,通過內容分類模型預測目標內容的目標分類結果,目標分類結果用于表征目標內容是否屬于生成內容。本技術能夠將不同內容生成算法的內容特征進行融合來訓練內容分類模型,這就使得該內容分類模型在新老內容生成算法上泛化性、準確性都很高,從而保證生成內容檢測的準確率。