能的直接電路結構,例如,存儲器、處理、邏輯、查表等。此外,這些組件、元件或者單元中的至少一個可通過包括一個或多個用于執行特定邏輯功能的可執行指令的模塊、程序或部分代碼來專門實施。此外,這些組件、元件或者單元中的至少一個還可包括執行各個的功能的處理器(例如,中央處理單元)、微處理器等。這些組件、元件或者單元中的兩個或者更可被組合為一個組件、元件或單元中,所述一個組件、元件或單元執行組合的兩個或者更多個組件、元件或單元的所有操作或者功能。此外,雖然在上述框圖中沒有示出總線,但是所述組件、元件或者單元之間的通信可通過總線來執行。上述示例性實施例的功能性方面可被實施為在一個或多個處理器上運行的算法。此外,通過框表示的組件、元件或單元或處理步驟可采用任何數量的用于電子配置、信號處理和/或控制、數據處理等的相關領域的技術。
[0089]應該理解,在此描述的示例性實施例應被認為僅是描述性的意義,而不是為了限制的目的。每個實施例內的特征或方面的描述通常應該被認為是可用于其他實施例中的其他類似特征或方面。
[0090]盡管已經參照附圖描述了一個或多個示例性實施例,但是本領域普通技術人員將理解,在不脫離由權利要求限定的本發明構思的精神和范圍的情況下,可在此做出形式和細節上的各種改變。
【主權項】
1.一種在視頻再現設備中提供組合摘要的方法,所述方法包括: 接收至少一個相機捕獲的音頻和視頻; 通過從音頻和視頻中的至少一個檢測至少一個視頻事件來產生視頻摘要; 通過從音頻和視頻中的至少一個檢測至少一個音頻事件來產生音頻摘要; 提取與所述至少一個音頻事件相應的視頻摘要的至少一個段,并將提取的視頻摘要的至少一個段與音頻摘要進行存儲; 向視頻再現設備的顯示器提供用于控制視頻摘要的視頻摘要控制接口和用于控制音頻摘要的音頻摘要控制接口。2.如權利要求1所述的方法,還包括: 使用視頻摘要控制接口,選擇視頻摘要的檢測到特定視頻事件的段; 使用音頻摘要控制接口,選擇音頻摘要的檢測到特定音頻事件的段; 如果選擇的視頻摘要的段和選擇的音頻摘要的段互相重疊,則在視頻再現設備的顯示器中,標識重疊的段以與視頻摘要和音頻摘要的其他段進行區分。3.如權利要求1所述的方法,還包括: 使用音頻摘要控制接口,選擇音頻摘要的檢測到特定音頻事件的段;使用視頻摘要控制接口,選擇視頻摘要的檢測到特定視頻事件的段; 如果選擇的視頻摘要的段和選擇的音頻摘要的段互相重疊,則在視頻再現設備的顯示器中,標識重疊的段以與其他段進行區分。4.如權利要求1所述的方法,還包括:再現音頻摘要和視頻摘要中的至少一個。5.如權利要求1所述的方法,其中,通過如果從所述音頻和視頻中的至少一個檢測到可識別的特征則確定所述至少一個音頻事件已經發生,來從所述音頻和視頻中的至少一個檢測所述至少一個音頻事件, 其中,所述可識別的特征包括以下項中的至少一個:特定詞語、特定特征、特定聲音。6.如權利要求5所述的方法,其中,產生所述音頻摘要的步驟包括: 確定與檢測到的至少一個音頻事件相應的時間范圍; 確定可識別的特征是否滿足預設條件; 如果可識別的特征滿足預設條件,則將所述時間范圍增加在檢測到的至少一個音頻事件之前和之后的預定量; 提取與增加的時間范圍相應的音頻幀以產生音頻摘要。7.如權利要求5所述的方法,還包括: 將可識別的特征轉換為文字; 將音頻摘要中的文字與關于檢測到可識別的特征時的時間信息進行顯示。8.如權利要求7所述的方法,還包括: 使用音頻摘要控制接口,選擇顯示在音頻摘要中的文字; 作為選擇的結果,檢測構成音頻摘要的至少一個音頻段和視頻摘要的與所述至少一個音頻段相應的至少一個段。9.如權利要求7所述的方法,還包括:在音頻摘要中以標簽的其形式提供轉換為文字的可識別的特征。10.如權利要求5所述的方法,其中,基于頻率特征從音頻檢測特定聲音。11.如權利要求5所述的方法,還包括:通過音頻摘要控制接口接收輸入的頻率特征值; 檢測匹配輸入頻率特征值的聲音作為所述特定聲音。12.如權利要求11所述的方法,其中,所述音頻摘要控制接口支持用于選擇或者輸入所述輸入的頻率特征值的聲音選擇接口, 其中,所述聲音選擇接口基于所述輸入的頻率特征值提供用于選擇以下項中的至少一個項的接口:女人、男人、幼兒、老人、高音調的聲音、低音調的聲音、緊急狀態。13.—種從終端接收音頻和視頻并提供組合摘要的方法,所述方法包括: 從音頻和視頻提取包括可識別的特征的音頻幀; 提取與音頻幀相應的視頻幀或視頻幀的視頻摘要; 將音頻幀鏈接到視頻幀或者視頻幀的視頻摘要; 插入表不首頻幀所屬的視頻的時間的時間標簽。14.如權利要求13所述的方法,其中,可識別的特征包括以下項中的至少一個:特定詞語、特定特性、特定聲音。15.一種用于提供組合摘要的視頻再現設備,所述視頻再現設備包括: 接收器,被配置為接收至少一個相機捕獲的音頻和視頻; 視頻摘要產生器,被配置為通過從音頻和視頻中的至少一個檢測至少一個視頻事件來產生視頻摘要; 音頻摘要產生器,被配置為通過從音頻和視頻中的至少一個檢測至少一個音頻事件來產生音頻摘要; 音頻摘要存儲器,被配置為提取與所述至少一個音頻事件相應的視頻摘要的至少一個段,并將提取的視頻摘要的至少一個段與音頻摘要進行存儲; 視頻摘要控制接口,被提供用于控制視頻再現設備的顯示器上的視頻摘要; 音頻摘要控制接口,被提供用于控制視頻再現設備的顯示器上的音頻摘要。16.如權利要求15所述的視頻再現設備,其中,所述音頻摘要產生器還被配置為:通過如果從所述音頻和視頻中的至少一個檢測到可識別的特征,則確定所述至少一個音頻事件已經發生,來從所述音頻和視頻中的至少一個檢測所述至少一個音頻事件, 其中,所述可識別的特征包括以下項中的至少一個:特定詞語、特定特性、特定聲音。17.如權利要求16所述的視頻再現設備,還包括:文字轉換器,被配置為將可識別的特征轉換為文字,并將音頻摘要中的文字與關于檢測到可識別的特征時的時間信息進行顯不O18.如權利要求17所述的視頻再現設備,其中,所述音頻摘要控制接口被配置為允許選擇顯示在視頻摘要中的文字, 作為選擇的結果,所述音頻摘要產生器被配置為檢測構成音頻摘要的至少一個音頻段和視頻摘要的與所述至少一個音頻段相應的至少一個段。19.如權利要求16所述的視頻再現設備,其中,所述音頻摘要產生器還被配置為通過所述音頻摘要控制接口接收輸入的頻率特征值,并檢測匹配輸入的頻率特征值的聲音作為所述特定聲音。20.如權利要求15所述的視頻再現設備,其中,所述音頻摘要產生器包括音頻幀提取器, 其中,所述音頻幀提取器被配置為確定與檢測到的至少一個音頻事件相應的時間范圍,確定可識別的特征是否滿足預設條件,如果可識別的特征滿足預設條件,則將所述時間范圍增加在檢測到的至少一個音頻事件之前和之后的預定量,提取與增加的時間范圍相應的視頻幀以產生音頻摘要。
【專利摘要】提供用于在成像設備中提供組合摘要的方法和設備。提供一種通過接收監控的音頻和視頻而提供組合摘要的方法和設備。所述方法包括:接收至少一個網絡相機捕獲的音頻和視頻;通過從音頻和視頻中的至少一個檢測至少一個視頻事件來產生視頻摘要;通過從音頻和視頻中的至少一個檢測至少一個音頻事件來產生音頻摘要;提取與所述至少一個音頻事件相應的視頻摘要的至少一個段,并將提取的視頻摘要的至少一個段與音頻摘要進行存儲;向視頻再現設備的顯示器提供用于控制視頻摘要的視頻摘要控制接口和用于控制音頻摘要的音頻摘要控制接口。
【IPC分類】H04N7/18, H04N21/8549
【公開號】CN105516651
【申請號】CN201510661822
【發明人】趙成峯
【申請人】韓華泰科株式會社
【公開日】2016年4月20日
【申請日】2015年10月14日
【公告號】US20160104045