本發明屬于數字圖像處理和計算機視覺技術領域,特指一種多視點圖像中的快速目標提取方法。
背景技術:
近年來隨著計算機性能的大幅提高、網絡帶寬的不斷擴展和相機傳感器的普遍應用,交互式多媒體越來越受到用戶的喜愛。其中對于某一場景或目標,可以從不同的時刻或角度得到關于它的一組觀測圖像,這些圖像的整體就叫做多視點圖像。人們借助交互式多媒體和圖像處理技術可以對多視點圖像進行編輯,根據自己的喜好去選擇和操作目標。
在多視點圖像處理中,目標提取是其中一個關鍵技術。目標提取的過程實際上就是圖像分割的過程,從圖像中將感興趣的運動目標與背景進行分割,即提取出感興趣的目標。目標提取是計算機視覺領域低層次視覺中最為基礎和重要的領域之一。目標提取的效果對于后續中高層次圖像處理(如目標分類、身份識別和行為理解等)非常重要。
目標提取在近幾十年里受到國內外學者的廣泛關注,提出了大量的目標提取方法。目前比較受關注的目標提取方法可以歸納為兩類:基于閾值分割的方法和基于圖割優化模型的方法。基于閾值分割的方法有:雙峰法、最大類間方差法、模糊閾值分割法等。這類方法計算簡單、效率較高,但受獲取圖像的自然環境影響最大,提取的準確率較低。基于圖割優化模型的方法是近年來發展起來的一種基于圖論的目標提取方法,將目標提取轉換成為一個求能量函數最優化的問題。這類方法可以根據情況構造各種能量函數,且可以得到能量函數的全局最優解,因此具有魯棒性強、分割效果較好等特點。但求解能量函數需要進行迭代計算,算法復雜度較高、需要的時間較長,很難達到實時處理。
技術實現要素:
為了解決現有技術的不足,本發明的目的在于提出一種多視點圖像中的快速目標提取方法,通過對通過彩色圖像的低頻和高頻信息,對圖像進行一個增強處理,突出圖像中的主體目標,并削弱目標周圍場景對于目標的影響,然后對增強灰度圖像進行二值化,采用全局閾值和局部閾值相結合的方法對每個像素進行判斷,最后通過形態學方法找到目標所在的連通區域,也即完成對目標的提取過程。本發明提出的方法簡單實用,算法復雜度小,可以實時處理各類圖像,擁有很好的實用價值。
為實現上述技術目的,本發明的技術方案是,
一種多視點圖像中的快速目標提取方法,包括以下步驟:
S1.任取一副多視點彩色圖像,圖像格式為RGB,將該彩色圖像記為P(x,y,z),對該圖像進行增強處理,突出圖像中的主體目標,并削弱目標周圍場景對于目標的影響,獲得增強灰度圖像;
本發明中S1通過以下方法實現:
S11對彩色圖像P(x,y,z)做高斯低通濾波,獲得P(x,y,z)的低頻分量Q(x,y,z),公式如下:
其中表示做卷積運算,Gσ是標準差為σ的二維高斯核
S12計算彩色圖像P(x,y,z)在RGB顏色空間上的3個均值,公式如下:
其中z∈{1,2,3}是RGB顏色通道的序號,N是圖像的像素總數,{μi|i=1,2,3}即為3個均值。
S13使用S11中得到的低頻分量Q(x,y,z)和S12中得到的均值信息,對目標進行增強,得到增強灰度圖像D(x,y),具體計算公式如下:
說明:低頻分量Q(x,y,z),z∈{1,2,3}是一個RGB圖像,所以Q(x,y,1)就是z取1時的值,Q(x,y,2)就是z取2時的值,Q(x,y,3)就是z取3時的值。
S2.對增強灰度圖像進行二值化,采用全局閾值和局部閾值相結合的方法對每個像素進行判斷,得到二值化圖像;
本發明中S2通過以下方法實現:
S21通過最大類間方差Otsu對灰度圖像D(x,y)計算,求得初始閾值Ψ0;
最大類間方差Otsu是經典的二值化方法,該方法是本領域的公知常識,所以這里沒有寫計算過程。
S22利用初始閾值Ψ0對灰度圖像D(x,y)的每個像素(x,y)進行判斷,將其分成3個類別:前景區域、背景區域、待定區域;
其中f(x,y)表示像素的標簽,1表示前景區域,-1表示背景區域,0表示待定區域,α表示控制參數,這里取值0.15。
S23對于待定區域也即f(x,y)為0的每個像素,再通過領域信息計算一個新的局部閾值,并根據新的局部閾值對該像素進行二次判斷,得到二值化圖像,方法如下:
任取待定區域的一個像素,記為(x0,y0),在灰度圖像D(x,y)中以其為中心,選擇一個大小為9×9的圖像塊d(x,y),計算此圖像塊d(x,y)的均值μd和方差ωd:
其中Nd表示圖像塊d(x,y)的像素總數也即81。
根據此圖像塊d(x,y)的均值μd和方差ωd,對像素(x0,y0)進行二次判斷:
其中β表示控制參數,這里取值0.1。
根據上述方法,可以對灰度圖像D(x,y)的所有像素進行判斷,也即二值化處理,記得到的二值化圖像為F(x,y)。
S3.對二值化圖像進行形態學處理,得到最大的連通區域也即目標區域,完成目標提取。
由于復雜的自然光照條件,不可避免的存在某些目標區域的像素存在少量誤判的情況。這里本發明對二值化圖像F(x,y)進行數學形態學上的膨脹操作,令B表示水平結構像素集合,用B對二值圖像集合F(x,y)的膨脹表示為:
其中表示膨脹算子,φ表示空集合,B(x)表示表示對結構像素集合B先做原點映射然后做平移x的運算;記膨脹后的二值化圖像為FB(x,y)。這樣做的目的是把一些斷裂的邊緣連接起來,使獲得的邊界更加完整。
最后對二值化圖像FB(x,y),做連通區域分析,其中面積最大的連通區域就是目標所在區域,也即獲得目標提取的結果。
本發明的有益效果是:
本發明提出了一種多視點圖像中的快速目標提取方法,通過對通過彩色圖像的低頻和高頻信息,對圖像進行一個增強處理,突出圖像中的主體目標,并削弱目標周圍場景對于目標的影響,然后對增強灰度圖像進行二值化,采用全局閾值和局部閾值相結合的方法對每個像素進行判斷,最后通過形態學方法找到目標所在的連通區域,也即完成對目標的提取過程。本發明提出的方法簡單實用,算法復雜度小,可以實時處理各類圖像,擁有很好的實用價值。
附圖說明
圖1本發明的流程圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明實施方式作進一步地詳細描述。
參照圖1,本發明提出了一種多視點圖像中的快速目標提取方法,具體步驟如下:
S1.任取一副多視點彩色圖像,圖像格式為RGB,將該彩色圖像記為P(x,y,z)。由于圖像的獲取會受到各種自然環境的影響,因此本發明首先對該圖像進行增強處理,突出圖像中的主體目標,并削弱目標周圍場景對于目標的影響,獲得增強灰度圖像;具體步驟如下:
S11對彩色圖像P(x,y,z)做高斯低通濾波,獲得P(x,y,z)的低頻分量Q(x,y,z),公式如下:
其中表示做卷積運算,Gσ是標準差為σ的二維高斯核
S12計算彩色圖像P(x,y,z)在RGB顏色空間上的3個均值,公式如下:
其中z∈{1,2,3}是RGB顏色通道的序號,N是圖像的像素總數,{μi|i=1,2,3}即為3個均值。
S13使用S11中得到的低頻分量Q(x,y,z)和S12中得到的均值信息,對目標進行增強,得到增強灰度圖像D(x,y),具體計算公式如下:
經過S1中的這種圖像處理方法,首先通過低頻信息突出目標主體,然后利用部分高頻信息(均值)對圖像進行進一步的增強,最終得到一個突出目標,并削弱了目標周圍場景對于目標影響的灰度圖像。
由于灰度圖像D(x,y)是經過特殊處理得到的,因此不再需要如圖割優化等復雜的算法進行目標提取。接下來本發明提出一個改進的二值化方法對目標像素進行判斷提取,能夠在有限的幾次迭代計算下,得到穩定高效的目標像素區域。
S2.對增強灰度圖像進行二值化,采用全局閾值和局部閾值相結合的方法對每個像素進行判斷,得到二值化圖像;
S21通過經典的二值化方法最大類間方差Otsu對灰度圖像D(x,y)計算,求得初始閾值Ψ0;
S22利用初始閾值Ψ0對灰度圖像D(x,y)的每個像素(x,y)進行判斷,將其分成3個類別:前景區域、背景區域、待定區域;
其中f(x,y)表示像素的標簽,1表示前景區域,-1表示背景區域,0表示待定區域,α表示控制參數,這里取值0.15。
S23對于待定區域也即f(x,y)為0的每個像素,再通過領域信息計算一個新的局部閾值,并根據新的局部閾值對該像素進行二次判斷,得到二值化圖像,方法如下:
任取待定區域的一個像素,記為(x0,y0),在灰度圖像D(x,y)中以其為中心,選擇一個大小為9×9的圖像塊d(x,y),計算此圖像塊d(x,y)的均值μd和方差ωd:
其中Nd表示圖像塊d(x,y)的的像素總數也即81。
根據此圖像塊d(x,y)的均值μd和方差ωd,對像素(x0,y0)進行二次判斷:
其中β表示控制參數,這里取值0.1。
根據上述方法,可以對灰度圖像D(x,y)的所有像素進行判斷,也即二值化處理,記得到的二值化圖像為F(x,y)。
由于復雜的自然光照條件,不可避免的存在某些目標區域的像素存在少量誤判的情況。接下來本發明對獲得二值化圖像進一步處理。
S3.對二值化圖像進行形態學處理,得到最大的連通區域也即目標區域,完成目標提取。
由于復雜的自然光照條件,不可避免的存在某些目標區域的像素存在少量誤判的情況。這里本發明對二值化圖像F(x,y)進行數學形態學上的膨脹操作,令B表示水平結構像素集合,用B對二值圖像集合F(x,y)的膨脹表示為:
其中表示膨脹算子,φ表示空集合,B(x)表示表示對結構像素集合B先做原點映射然后做平移x的運算;記膨脹后的二值化圖像為FB(x,y)。這樣做的目的是把一些斷裂的邊緣連接起來,使獲得的邊界更加完整。
最后對二值化圖像FB(x,y),做連通區域分析,其中面積最大的連通區域就是目標所在區域,也即獲得目標提取的結果。
以上包含了本發明優選實施例的說明,這是為了詳細說明本發明的技術特征,并不是想要將發明內容限制在實施例所描述的具體形式中,依據本發明內容主旨進行的其他修改和變型也受本專利保護。本發明內容的主旨是由權利要求書所界定,而非由實施例的具體描述所界定。