專利名稱:壓縮視頻中靜態場景的快速定位方法
技術領域:
本發明提出了一種從壓縮視頻文件或視頻流中快速定位靜態場景的方法,可對用 于基于內容的視頻管理、視頻編輯、視頻截圖、視頻文件的分割等應用。屬于多媒體和計算 機應用領域,也可用于工業控制和安全領域的視頻監控。
背景技術:
攝錄像根本目的在于獲取理想的畫面,在捕獲人物場景時通常對定格畫面,即拍 攝時攝錄像器械保持穩定且不進行畫面的推拉,因此定格的畫面通常對應了視頻中比較重 要的內容,也是觀眾最感興趣的內容之一。把定格的畫面從視頻中定位和提取出來,首先要 進行鏡頭的切分,把時間和空間上連續的視頻變為一個個不同的鏡頭一是時間上對鏡頭 的劃分和定位,二是空間上對場景的劃分和定位。鏡頭切分是實現對動態視頻基于內容檢 索的第一步,以檢測出來的影像幀為基元,可對視頻內容進行分析和建立索引。隨著攝錄像器械的普及和應用的深入,動態視頻資料的數據呈現快速增長趨勢。 為了管理上的便利以及節約存儲空間和網絡帶寬,這些視頻通常是以壓縮形式存儲和傳 輸,因此壓縮視頻的處理具有重要的實際意義。根據處理的數據不同,現有的針對攝像機拍攝時的運動狀態和鏡頭推拉進行鏡頭 切分的方法可以分為兩類一是將視頻解壓為圖像序列后,通過圖像序列分析檢測攝像機 的運動,如光流法、基于圖像特征的運動模型估計法等,計算量大,算法復雜不易實現;二是 直接操作壓縮域數據,利用壓縮視頻提供的運動補償信息進行分析,效率較高。現有方法普 遍存在的問題是要么非常精確但計算量大難以實用,要么非常計算快速但由于運動補償信 息的不精確導致結果不穩定。
發明內容
本方法首先直接利用視頻流中的運動補償信息初步定位,從壓縮視頻中找出相對 靜止的影像幀,然后再使用初定位后剩余的參考幀所對應的連續宏塊的統計信息對比對靜 態場景幀進行確認,由于無需解壓縮,計算速度快,應用參考幀宏塊的統計信息增加了檢測 方法對噪聲的魯棒性,可快速準確地定位到壓縮視頻中的靜態幀,且在連續的靜態幀僅保 留一個,避免了冗余,更便于后續應用。(1)基于運動補償幀信息統計的靜態影像初查,根據壓縮視頻流的幀存儲格式,跳 過其中的參考幀,選擇B幀和P幀,獲得補償幀中存儲的宏塊運動補償向量,為避免干擾,可 選擇是否先進行濾波處理,以去除其中個別宏塊運動信息的干擾,按運動補償方向分類按 照各進行統計,若各方向上運動補償信息其模的大小均較小,且不存在某個方向的運動補 償向量的個數不明顯占優,則標記之進入備選;(2)由于實際拍攝時對于目標場景的采集通常會有一定時間上的延續性,因此還 要對進入備選的幀進一步篩選,考慮到魯棒性的因素,方法是其所處的視頻片斷中進入備 選的幀數要超過一定的比例或連續出現的個數超過一個數值則保留,則把被連續標記的幀序列中除首位兩幀外的幀如取其中運動補償向量模之和最小的幀作為候選幀再進行確 認;(3)對保留下來的候選幀取其所在序列如所處幀塊(GOP)中其前后相鄰的參考 幀,取其宏塊的內容分別進行統計后進行比對,若差異較小則確認此幀為靜態幀,否則舍 棄;可根據需要決定是否解壓縮I幀的內容作為輸出。
無。
具體實施例方式實施例1 靜態幀的提取(1)打開壓縮視頻流或視頻文件;(2)根據壓縮編碼方式挑選其中的P幀,獲得各宏塊的運動補償向量;(3)對獲得的補償向量進行中值濾波,然后按照8個方向對運動補償向量進行統 計各方向上補償向量的個數,并計算各方向上向量模的最大值和所有模的和;(3)若各方向上的運動補償向量模的和均小于某個預先設定的值a,且補償向量 個數最多的那個方向的向量個數占總補償向量個數的比例小于某個預先設定的值b,則予 以標記;(4)若被標記的幀連續出現的次數超過某個預先設定的值C,則把此前及后續被 標記的視頻幀序列中除起點和終點對應的幀之外的運動補償向量模之和最小的幀作為初 選結果;(5)統計對比初選結果中各幀前后的I幀,若差異值小于某個預先設定的值d,則 輸出該幀的影像。
權利要求
基于運動補償幀信息統計的靜態影像初查,該技術在各種壓縮格式的視頻中的應用均在保護范圍之內,并不限定所用運動補償信息的具體格式,對B幀、P幀、BP幀的組合或混合方式的應用均在保護范圍之內;。
2.本發明不限定濾波方式的使用,無論對宏塊運動補償信息是否進行濾波以及采用何 種方式濾波之后對本發明的應用均在保護范圍之內;。
3.本發明以連續標記的備選區域為選擇初查結果的重要依據,并不對連續標記幀的長 度做限度,對候選幀的確定不限定為說明書中示意的運動補償向量模之和最小的幀,可以 為連續標記幀序列中的任一幀;。
4.對候選幀的確認,其前后幀的選用方式不限于說明書中示意性的描述,也可以是前 面的幀或后面的幀與該候選幀的比較,無論是否輸出找到的靜態幀該方法的使用都在保護 范圍之內。
全文摘要
本發明提出了一種從壓縮視頻文件或視頻流中快速定位靜態場景的方法,直接利用視頻流中的運動補償信息初步定位,從壓縮視頻中找出相對靜止的影像幀,然后再使用初定位后剩余的參考幀所對應的連續宏塊的統計信息對比對靜態場景幀進行確認,由于無需解壓縮,計算速度快,應用參考幀宏塊的統計信息增加了檢測方法對噪聲的魯棒性,可快速準確地定位到壓縮視頻中的靜態幀,且在連續的靜態幀僅保留一個,避免了冗余,更便于后續應用。可對用于基于內容的視頻管理、視頻編輯、視頻截圖、視頻文件的分割等應用。屬于多媒體和計算機應用領域,也可用于工業控制和安全領域的視頻監控。
文檔編號H04N7/26GK101902631SQ20091008567
公開日2010年12月1日 申請日期2009年5月26日 優先權日2009年5月26日
發明者彭啟民 申請人:北京風格九州文化傳播有限公司