本公開涉及計算機,具體而言,涉及一種視頻內容審核方法、裝置、計算機設備及存儲介質。
背景技術:
1、隨著互聯網的快速發展,越來越多的視頻在互聯網上傳播,為了維護良好的互聯網環境,對視頻進行審核已成為一種重要的技術手段。其中在計算機中視頻是一系列的圖片與音頻數據按照時間線排列的一個數據集合,因此可以通過審核視頻中的圖片內容,實現對視頻內容的審核。
2、一般的,可以先從待審核視頻中進行抽幀,再利用人工智能算法,對提取的視頻幀進行檢測,確定視頻幀的內容是否存在問題,實現對待審核視頻的內容審核。但是,上述方式中利用人工智能算法對提取每個視頻幀進行檢測,檢測效率較低,進而導致視頻審核的效率較低。
技術實現思路
1、本公開實施例至少提供一種視頻內容審核方法、裝置、計算機設備及存儲介質。
2、第一方面,本公開實施例提供了一種視頻內容審核方法,包括:
3、獲取待檢測視頻;
4、確定所述待檢測視頻中當前時間段內的有效視頻幀,其中所述有效視頻幀為與相鄰視頻幀的視頻內容不同的視頻幀;
5、確定所述當前時間段內的有效視頻幀與黑名單數據庫中第一圖像數據的第一相似度檢測結果,以及確定所述當前時間段內的有效視頻幀與白名單數據庫中第二圖像數據的第二相似度檢測結果;其中所述黑名單數據庫中存儲的是內容存在問題但被漏檢的圖像數據,所述白名單數據庫存儲的是內容不存在問題但被誤檢的圖像數據;
6、在基于所述第一相似度檢測結果和所述第二相似度檢測結果,確定所述有效視頻幀與所述黑名單數據庫和所述白名單數據庫均不匹配時,利用用于進行內容審核的神經網絡模型,對所述有效視頻幀進行檢測,確定所述有效視頻幀的內容審核結果。
7、一種可選的實施方式中,在確定所述第一相似度檢測結果和所述第二相似度檢測結果之后,還包括:
8、在基于所述第一相似度檢測結果,確定所述有效視頻幀與所述黑名單數據庫匹配,以及基于所述第二相似度檢測結果,確定所述有效視頻幀與所述白名單數據庫不匹配時,確定所述有效視頻幀的內容審核結果為審核不通過,并展示警示信息;
9、在基于所述第一相似度檢測結果,確定所述有效視頻幀與所述黑名單數據庫不匹配,以及基于所述第二相似度檢測結果,確定所述有效視頻幀與所述白名單數據庫匹配時,確定所述有效視頻幀的內容審核結果為審核通過,并播放所述有效視頻幀。
10、一種可選的實施方式中,在所述利用用于進行內容審核的神經網絡模型,對所述有效視頻幀進行檢測,得到所述有效視頻幀的內容審核結果之后,還包括:
11、展示所述有效視頻幀的內容審核結果;
12、對所述有效視頻幀的內容審核結果進行校驗,并在校驗確定所述有效視頻幀的內容審核結果有誤時,對所述有效視頻幀的內容審核結果進行調整,得到所述有效視頻幀對應的調整后的內容審核結果。
13、一種可選的實施方式中,所述方法還包括:
14、在所述有效視頻幀的所述內容審核結果為審核未通過,但校驗確定所述有效視頻幀的內容不存在問題時,將所述有效視頻幀作為所述第二圖像數據更新至所述白名單數據庫;
15、在所述有效視頻幀的所述內容審核結果為審核通過,但校驗確定所述有效視頻幀的內容存在問題時,將所述有效視頻幀作為所述第一圖像數據更新至所述黑名單數據庫。
16、一種可選的實施方式中,所述方法還包括:
17、針對所述待檢測視頻中所述當前時間段內的除所述有效視頻幀之外的其他視頻幀,將與所述其他視頻幀相似的有效視頻幀的內容審核結果,確定為所述其他視頻幀的內容審核結果。
18、一種可選的實施方式中,所述確定所述待檢測視頻中當前時間段內的有效視頻幀,包括:
19、從所述待檢測視頻包括的多個視頻幀中,獲取位于所述當前時間段的多個候選視頻幀;
20、獲取在所述當前時間段之前確定的歷史有效視頻幀;
21、針對每個所述候選視頻幀,確定所述候選視頻幀與相鄰的前一視頻幀之間的圖像相似度,以及確定所述候選視頻幀與所述歷史有效視頻幀之間的圖像相似度;在根據所述圖像相似度確定所述候選視頻幀滿足相似度條件時,確定所述候選視頻幀屬于有效視頻幀。
22、一種可選的實施方式中,所述針對每個所述候選視頻幀,確定所述候選視頻幀與相鄰的前一視頻幀之間的圖像相似度,包括:
23、利用第一目標神經網絡模型,提取所述候選視頻幀的特征數據、和所述相鄰的前一視頻幀的特征數據;其中所述第一目標神經網絡模型為使用附加角裕度損失函數additive?angular?margin?loss訓練得到的;
24、基于所述候選視頻幀的特征數據和所述相鄰的前一視頻幀的特征數據,確定所述候選視頻幀與所述相鄰的前一視頻幀之間的圖像相似度。
25、一種可選的實施方式中,所述確定所述當前時間段內的有效視頻幀與黑名單數據庫中第一圖像數據的第一相似度檢測結果,包括:
26、根據所述待檢測視頻的場景特征,從確定的多個預設特征長度中確定所述待檢測視頻對應的目標特征長度;
27、利用第二目標神經網絡模型,提取所述當前時間段內有效視頻幀的圖像特征數據;
28、從所述有效視頻幀的圖像特征數據中選取所述目標特征長度的特征數據,作為所述有效視頻幀的目標特征數據;
29、根據所述有效視頻幀的目標特征數據和所述第一圖像數據的特征數據,確定所述第一相似度檢測結果。
30、一種可選的實施方式中,根據下述步驟訓練得到所述第二目標神經網絡模型:
31、獲取訓練樣本;
32、將所述訓練樣本輸入至構建的第二待訓練神經網絡,提取得到所述訓練樣本的樣本特征數據;
33、根據所述樣本特征數據的特征維度,確定多個預設特征長度,其中所述多個預設特征長度中的最大特征長度與所述樣本特征數據的特征維度匹配;
34、針對除所述最大特征長度之外的每個預設特征長度,從所述樣本特征數據中獲取所述預設特征長度的局部特征數據;
35、基于所述局部特征數據和損失函數,確定第一損失值,以及基于所述樣本特征數據和所述損失函數,確定第二損失值;
36、將所述第一損失值和所述第二損失值的損失和值,作為目標損失值,基于所述目標損失值,調整所述第二待訓練神經網絡的網絡參數,得到所述第二目標神經網絡模型。
37、第二方面,本公開實施例還提供一種視頻內容審核裝置,包括:
38、獲取模塊,用于獲取待檢測視頻;
39、第一確定模塊,用于確定所述待檢測視頻中當前時間段內的有效視頻幀,其中所述有效視頻幀為與相鄰視頻幀的視頻內容不同的視頻幀;
40、第二確定模塊,用于確定所述當前時間段內的有效視頻幀與黑名單數據庫中第一圖像數據的第一相似度檢測結果,以及確定所述當前時間段內的有效視頻幀與白名單數據庫中第二圖像數據的第二相似度檢測結果;其中所述黑名單數據庫中存儲的是內容存在問題但被漏檢的圖像數據,所述白名單數據庫存儲的是內容不存在問題但被誤檢的圖像數據;
41、第三確定模塊,用于在基于所述第一相似度檢測結果和所述第二相似度檢測結果,確定所述有效視頻幀與所述黑名單數據庫和所述白名單數據庫均不匹配時,利用用于進行內容審核的神經網絡模型,對所述有效視頻幀進行檢測,確定所述有效視頻幀的內容審核結果。
42、第三方面,本公開可選實現方式還提供一種計算機設備,處理器、存儲器,所述存儲器存儲有所述處理器可執行的機器可讀指令,所述處理器用于執行所述存儲器中存儲的機器可讀指令,所述機器可讀指令被所述處理器執行時,所述機器可讀指令被所述處理器執行時執行上述第一方面,或第一方面中任一種可能的實施方式中的步驟。
43、第四方面,本公開可選實現方式還提供一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被運行時執行上述第一方面,或第一方面中任一種可能的實施方式中的步驟。
44、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,而非限制本公開的技術方案。
45、本公開實施例提供的視頻內容審核方法、裝置、計算機設備及存儲介質,在獲取待檢測視頻之后,通過確定待檢測視頻中當前時間段內的有效視頻幀,其中有效視頻幀為與相鄰視頻幀的視頻內容不同的視頻幀,避免對內容重復的視頻幀進行檢測,進而提高視頻審核效率。并在確定了有效視頻幀之后,確定當前時間段內的有效視頻幀與黑名單數據庫中第一圖像數據的第一相似度檢測結果,以及確定當前時間段內的有效視頻幀與白名單數據庫中第二圖像數據的第二相似度檢測結果;其中黑名單數據庫中存儲的是內容存在問題但被漏檢的圖像數據,白名單數據庫存儲的是內容不存在問題但被誤檢的圖像數據,即黑名單數據中的第一圖像數據必然是存在問題的數據,白名單數據中的第二圖像數據必然是不存在問題的數據,通過確定有效視頻幀與第一圖像數據的相似度,可以判斷有效視頻幀是否與黑名單數據庫匹配,以及通過確定有效視頻幀與第二圖像數據的相似度,可以判斷有效視頻幀是否與白名單數據庫匹配;若有效視頻幀與黑名單數據庫匹配,可以直接確定有效視頻幀的內容存在問題,或者,若有效視頻幀與白名單數據庫匹配,可以直接確定有效視頻幀的內容不存在問題,并無需利用用于進行內容審核的神經網絡模型,對有效視頻幀進行檢測,減少了神經網絡模型的工作量,可以緩解神經網絡模型工作量較多時精度下降的問題。
46、若在基于第一相似度檢測結果和第二相似度檢測結果,確定有效視頻幀與黑名單數據庫和白名單數據庫均不匹配時,表征有效視頻幀與第一圖像數據和第二圖像數據均不相似,故可以利用用于進行內容審核的神經網絡模型,對有效視頻幀進行檢測,較準確的確定有效視頻幀的內容審核結果。
47、為使本公開的上述目的、特征和優點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。