專利名稱:一種適用于低對比度視頻的人體上半身檢測及分割的方法
技術領域:
本發明涉及視頻處理技術領域,尤其涉及人體上半身區域的檢測和提取方法,具體地說是一種適用于低對比度視頻的人體上半身檢測及分割的方法。
背景技術:
自動檢測和視頻中的人體區域分割是兩個不同的監控應用的關鍵步驟。人體檢測方法通常從視頻中找到前景對象并基于形狀、顏色以及其它特征把它們標識為人或非人區域。背景剔除法是一種常見的提取前景區域的預處理技術。另一類為基于機器學習的方法,并應用了許多適用于機器學習的新特征。基于梯度的特征最具有代表性。這些方法不需要進行背景剔除的預處理但是卻以高昂的計算成本為代價,因此限制了其在實時系統的應用。視頻分割方法同樣基于背景剔除技術,同時集成了概率框架,如貝葉斯理論和馬爾可夫鏈蒙特卡羅模型。由于許多方法需要提供一個相對較好的背景剔除算法結果,一旦由于光照變化使得環境光照發生改變,這些方法便會失效。雖然一些改進的背景剔除算法能夠解決上述問題,但如果前景對象在鏡頭前保持相當長的一段時間靜止不動,那么前景會逐漸變化為背景。另外因為許多監控系統所配備的攝像機其CCD芯片的質量并不高,從而使得所獲得的視頻對比度較低,現有的方法處理這些視頻將更加困難。
發明內容
(1)前景提取首先指定視頻的第一幀作為背景幀,把其格式從RGB顏色空間轉換到Lab顏色空間,然后對于輸入的每一幀,都用同樣的方式進行顏色轉換;轉換后的輸出幀與背景幀使用背景剔除的方法來提取前景對象區域;然后對提取后的每個區域,使用膨脹腐蝕的形態學操作對噪點及空洞進行濾波,最后使用廣度優先連通區域搜索算法對前背景區域進行標記,生成前景區域掩碼;(2)形狀特征提取首先通過輪廓檢測算法提取出前景區域的輪廓線并對其采樣;然后以區域質心為原點建立一個極坐標系,對于每個采樣輪廓點,把其映射到一個二維平面,最終所有采樣點便形成了一二維直方圖;最后對得到的直方圖歸一化并展開,便可以
獲得一高維向量;(3)基于支持向量機的人體上半身模型訓練以上一步驟中獲得的向量作為樣本,使用以半徑基函數為核函數的非線性支持向量機算法對所有訓練樣本進行K次交叉驗證分析,最終生成一非線性決策超平面作為人體上半身區域與非人體上半身區域的分類器;(4)基于支持向量機的人體上半身模型分類同樣以步聚O)中所獲得的向量作為步驟(3)中訓練所得分類器的輸入,輸出經分類器決策映射后的類標簽;(5)能量函數最小化優化過程對于一個開始被認為是人體區域的前景區域,當其處理過程中被分類器檢測到其類標簽為非人體區域時,用一個能量函數來對輪廓曲線進行建模,以前一幀中正確的輪廓曲線為初始值,用歐拉-拉格朗日方法求解。本發明的方法主要由兩大過程構成。首先,從當前幀中通過背景剔除技術及形態學方法提取出表示前景對象的連通區域,然后對于每個前景區域,提取出其對應的基于極坐標二維直方圖的形狀特征,作為一個預先訓練好的基于支持向量機的分類器的輸入,輸出一個對應于人體上半身類及非人體上半身類的類標簽。第二步過程,當已經被識別為人體的區域被誤判為非人體區域時,本發明用一個能量函數來表征相應區域,同時通過一個能量函數最小化過程糾正錯誤的輪廓線。最后在獲得正確的前景人體輪廓的基礎上更新背景幀。本發明能夠實時處理較低對比度及分辨率的視頻,檢測正確率及分割結果都能滿足應用的需求。
圖1為本發明的流程圖。
具體實施例方式下面根據本發明的流程1對各個部分進行詳細說明1.前景提取首先指定視頻的第一幀作為背景幀,把其格式從RGB顏色空間轉換到Lab顏色空間。然后對于輸入的每一幀,都用同樣的方式進行顏色轉換,轉換后的輸出幀與背景幀使用背景剔除的方法來提取前景對象區域(即用兩幀按像素求差取絕對值的方式,其值高于一定的閾值,便認為是前景像素,否則為背景像素)。對提取后的每個區域,使用膨脹腐蝕的形態學操作對噪點及空洞進行濾波,最后使用廣度優先連通區域搜索算法對前背景區域進行標記,生成前景區域掩碼。2.形狀特征提取本發明所提出的特征較之于局部的有相梯度直方圖特征更加能夠描述人體上半身的形狀,因此具有更大的區分度,同時具有更小的計算復雜度。一個人的輪廓,特別是上半身的輪廓,可以看做是一個星凸集。若集S中存在一點 Xtl,使得由&到S中任何一點的直線段都屬于s,則稱s為星形域或星形凸集。本發明的形狀特征便是以此為依據而設計的。對于一個特定的前景區域,本發明通過廣度優先搜索找到前景區域的質心,然后通過邊界跟隨算法找到同一區域的邊界輪廓線。接著在輪廓線上等角度地對輪廓線進行逆時針采樣,即以前景區域的質心做為一極坐標系原點,則輪廓線上的每個采樣點在此坐標系下便可表示成一組級坐標(θ i,ri),i = 1,2,. . .,N,其中ri為區域質心到每個輪廓點的歐式距離,N為采樣點的總數。隨后這些級坐標值被投影到一個二維平面上,平面的χ軸表示θ值,y軸表示r值,每個維度分別被量化,均分成m和η份。當一個極坐標值(θ ”
滿足下列條件時θ k 彡 θ j ^ θ k+1,rx ^ Ti ^ r1+1, k = 0,· · ·,m_l,1 = 0,· · ·,n_l則增加相應的單元(k,1)的值。當按上述方法遍歷完所有的點時,將會形成一具有特定模式的二維直方圖。此特定的模式表征著對應輪廓線的特定形狀。最后,按行展開此直方圖各單元格的值并對其進行歸一化后將得到一個mXn維的向量f。顯然經本發明獲得的形狀特征與物體的位置和大小無關。 3.基于支持向量機的人體上半身模型訓練與檢測 在訓練階段,大量人體上半身圖像和非人體上半身圖像被搜集,通過手工標記前景區域從而提取前景的形狀特征。這些形狀特征所對應高維向量的集合組成了本發明用于訓練的樣本集。本發明用支持向量機作為訓練的算法,其核函數采用了高斯半徑基函數
權利要求
1.一種適用于低對比度視頻的人體上半身檢測及分割的方法,其特征在于該方法包括以下步驟(1)前景提取首先指定視頻的第一幀作為背景幀,把其格式從RGB顏色空間轉換到 Lab顏色空間,然后對于輸入的每一幀,都用同樣的方式進行顏色轉換;轉換后的輸出幀與背景幀使用背景剔除的方法來提取前景對象區域;然后對提取后的每個區域,使用膨脹腐蝕的形態學操作對噪點及空洞進行濾波,最后使用廣度優先連通區域搜索算法對前背景區域進行標記,生成前景區域掩碼;(2)形狀特征提取首先通過輪廓檢測算法提取出前景區域的輪廓線并對其采樣 ’然后以區域質心為原點建立一個極坐標系,對于每個采樣輪廓點,把其映射到一個二維平面, 最終所有采樣點便形成了一二維直方圖;最后對得到的直方圖歸一化并展開,獲得一高維向量;(3)基于支持向量機的人體上半身模型訓練以上一步驟中獲得的向量作為樣本,使用以半徑基函數為核函數的非線性支持向量機算法對所有訓練樣本進行K次交叉驗證分析,最終生成一非線性決策超平面作為人體上半身區域與非人體上半身區域的分類器;(4)基于支持向量機的人體上半身模型分類同樣以步驟O)中所獲得的向量作為步驟(3)中訓練所得分類器的輸入,輸出經分類器決策映射后的類標簽;(5)能量函數最小化優化對于一個開始被認為是人體區域的前景區域,當其處理過程中被分類器檢測到其類標簽為非人體區域時,用一個能量函數來對輪廓曲線進行建模, 以前一幀中正確的輪廓曲線為初始值,用歐拉-拉格朗日方法求解,并用最后的結果更新背景區域。
2.如權利要求1所述的適用于低對比度視頻的人體上半身檢測及分割的方法,其特征在于步驟(1)中所述的使用背景剔除的方法來提取前景對象區域的過程如下用兩幀按像素求差取絕對值的方式,其值高于一定的閾值,便認為是前景像素,否則為背景像素。
3.如權利要求1所述的適用于低對比度視頻的人體上半身檢測及分割的方法,其特征在于步驟O)的具體過程如下對于一個特定的前景區域,通過廣度優先搜索找到前景區域的質心,然后通過邊界跟隨算法找到同一區域的邊界輪廓線;接著在輪廓線上等角度地對輪廓線進行逆時針采樣, 前景區域的質心標記為一極坐標系原點,輪廓線上的每個采樣點在此坐標系下便可表示成一組級坐標(θ yr》,i = 1,2,...,N,其中ri為區域質心到每個輪廓點的歐式距離,N為采樣點的總數;隨后這些級坐標值被投影到一個二維平面上,平面的χ軸表示θ值,y軸表示 r值,每個維度分別被量化,均分成m和η份;當一個極坐標值(Qi^i)滿足下列條件時θ k < θ j ^ θ k+1,rx ^ Ti ^ r1+1, k = 0, . . . , m_l, 1=0,..., n_l則增加相應的單元(k,1)的值;當按上述方法遍歷完所有的點時,將會形成一具有特定模式的二維直方圖,此特定的模式表征著對應輪廓線的特定形狀;最后,按行展開此直方圖各單元格的值并對其進行歸一化后將得到一個mXn維的向量f。
4.如權利要求1所述的適用于低對比度視頻的人體上半身檢測及分割的方法,其特征在于步驟(3)的具體過程如下在訓練階段,大量人體上半身圖像和非人體上半身圖像被搜集,通過手工標記前景區域從而提取前景的形狀特征,這些形狀特征所對應高維向量的集合組成了本發明用于訓練的樣本集,采用支持向量機作為訓練的算法,其核函數采用高斯半徑基函數
5.如權利要求1所述的適用于低對比度視頻的人體上半身檢測及分割的方法,其特征在于步驟(5)的具體過程如下用一個能量泛函數E。(s)來表征一段閉合的完整輪廓
全文摘要
本發明涉及一種適用于低對比度視頻的人體上半身檢測及分割的方法,主要由兩個過程構成。首先,從當前幀中通過背景剔除技術及形態學方法提取出表示前景對象的連通區域,然后對于每個前景區域,提取出其對應的基于極坐標二維直方圖的形狀特征,作為一個預先訓練好的基于支持向量機的分類器的輸入,輸出一個對應于人體上半身類及非人體上半身類的類標簽。第二步過程,當已經被識別為人體的區域被誤判為非人體區域時,用一個能量函數來表征相應區域,同時通過一個能量函數最小化過程糾正錯誤的輪廓線。最后在獲得正確的前景人體輪廓的基礎上更新背景幀。本發明能夠實時處理較低對比度及分辨率的視頻,檢測正確率及分割結果都能滿足應用的需求。
文檔編號G06K9/00GK102521582SQ20111044659
公開日2012年6月27日 申請日期2011年12月28日 優先權日2011年12月28日
發明者童若鋒, 謝迪 申請人:浙江大學