自然場景中的顯著目標的自動檢測方法
【技術領域】
[0001] 本發明涉及人類視覺模擬技術領域,具體地講是一種自然場景中的顯著目標的自 動檢測方法。
【背景技術】
[0002] 隨著信息技術的發展,計算機視覺已經被廣泛應用于低層特征檢測和描述、模式 識別、人工智能推理和機器學習算法等領域。然而,傳統的計算機視覺方法通常是任務驅動 型,即需要限定許多條件,并根據實際任務來設計相應的算法,缺乏通用性;需要解決高維 非線性特征空間、超大數據量對問題求解和實時處理等問題,使得其研宄和應用面臨巨大 的挑戰。
[0003] 人類視覺系統能夠在不同環境下高效、可靠地工作,其具有以下優點:具有關注 機制、顯著性檢測和與此相關的視覺處理中的選擇性和目的性;能夠從低層視覺處理中利 用先驗知識,使數據驅動的自底向上處理與自頂向下的知識指導在視覺處理中相互協調配 合;上下境信息在視覺處理的各個層次都發揮著重要作用,并且能夠綜合利用環境中各種 模態的信息。但在人類視覺感知機理尚不完全明了的情況下,如何構造具有人類視覺特點 的機器視覺仍存在較大困難,若能夠構建模擬人類視覺的機器視覺系統,必然會給計算機 視覺的各個實際應用領域帶來重要的影響。
【發明內容】
[0004] 有鑒于此,本發明要解決的技術問題是,提供一種能夠模擬人類視覺的自然場景 中的顯著目標的自動檢測方法,通過模擬人類主動視覺行為、對目標場景作快速有效注視, 實現機器對目標場景中顯著目標的自動檢測。
[0005] 本發明的技術解決方案是,提供以下步驟的自然場景中的顯著目標的自動檢測方 法,包括以下各步驟:
[0006] 1)通過譜殘差法對目標圖像作顯著性檢測,得到相應的像素顯著度圖,所述像素 顯著度圖與所述目標圖像的像素位置信息一致;
[0007] 2)對所述的像素顯著度圖中的顯著點,依據顯著度進行排序;
[0008] 3)選取前N個顯著點作為注視點,包含這些注視點的最小矩形范圍作為注視區 域;
[0009] 4)對所述的注視區域內部像素進行隨機采樣,并對注視區域外部進行等量的像素 隨機采樣;采樣得到的注視區域內部像素作為正樣本,注視區域外部像素作為負樣本;
[0010] 5)利用支持向量機集成訓練策略,訓練得到多個二分類的SVM模型,通過這些模 型分類所述目標圖像的全部像素,將被分為正樣本的像素區域做投票集成后、作為第一檢 測結果;
[0011] 選取前N+M個顯著點作為注視點,依照步驟3)形成注視區域,再經步驟4)和5) 得到相應的第二檢測結果;
[0012] 比較第一檢測結果和第二檢測結果的重疊程度,重疊程度大則表明對目標的視覺 感知強度大;重疊程度小則表明還未形成足夠的對目標的視覺感知強度,繼續重復上述過 程,直至達到足夠的視覺感知強度,最終的檢測結果為上述過程所有檢測結果的疊加;
[0013] 獲得最終的檢測結果后,在目標圖像和像素顯著度圖中該區域被清零,對更新后 的像素顯著度圖中的顯著點,依據顯著度再次排序,重復步驟3)、4)和5),得到新的檢測結 果,直至目標圖像中的所有目標檢測完畢。
[0014] 采用本發明的方法,與現有技術相比,本發明具有以下優點:通過譜殘差法進行顯 著性檢測,能夠快速形成像素顯著度圖;依據顯著度排序像素,可粗略定位顯著度高的注視 區域;對該區域內部和外部同時進行少量像素采樣,組成正負樣本數據集訓練SVM(支持向 量機)模型,隨后借助該SVM模型分類像素,能獲得顯著度高的、更精確的區域作為第一檢 測結果;且可在建立第一檢測結果的基礎上,適當擴大顯著度高的注視區域范圍,再次經 SVM學習-分類形成相應的檢測結果,并與第一檢測結果進行比較,以判斷注視目標區是否 穩定。本發明根據人類視覺注視的過程,通過注視點排序和SVM模型,來模擬人類視覺,實 現機器對目標場景中顯著目標的自動檢測。
[0015] 作為改進,所述的譜殘差法是指通過超復數傅立葉變換,將彩色圖像中的紅、綠、 藍三個分量作為超復數的三個虛部參與傅立葉變換,只保留幅度譜殘差和相位譜信息,經 傅立葉反變換獲得像素顯著度圖。該設計用于解決現有技術僅能處理灰度圖像的問題,有 效地針對彩色圖像相應地改進了原譜殘差法的具體步驟。
[0016] 作為改進,所述隨機采樣針對的像素所具有的梯度值大于其所在區域的平均梯度 值。這是由于圖像中由梯度較大像素產生的信息熵會大于原圖信息熵,表明高梯度像素對 所注視的目標區域具有代表性,有助于消除圖像信息冗余。
【附圖說明】
[0017] 圖1為本發明自然場景中的顯著目標的自動檢測方法的流程圖。
【具體實施方式】
[0018] 下面就具體實施例對本發明作進一步說明,但本發明并不僅僅限于這些實施例。
[0019] 本發明涵蓋任何在本發明的精髓和范圍上做的替代、修改、等效方法以及方案。為 了使公眾對本發明有徹底的了解,在以下本發明優選實施例中詳細說明了具體的細節,而 對本領域技術人員來說沒有這些細節的描述也可以完全理解本發明。此外,本發明之附圖 中為了示意的需要,并沒有完全精確地按照實際比例繪制,在此予以說明。
[0020] 如圖1所示,本發明的自然場景中的顯著目標的自動檢測方法,包括以下各步驟:
[0021] 1)通過譜殘差法對目標圖像作顯著性檢測,得到相應的像素顯著度圖,所述像素 顯著度圖與所述目標圖像的像素位置信息一致;
[0022] 2)對所述的像素顯著度圖中的顯著點,依據顯著度進行排序;
[0023] 3)選取前N個顯著點作為注視點,包含這些注視點的最小矩形范圍作為注視區 域;
[0024] 4)對所述的注視區域內部像素進行隨機采樣,并對注視區域外部進行等量的像素 隨機采樣;采樣得到的注視區域內部像素作為正樣本,注視區域外部像素作為負樣本;
[0025] 5)利用支持向量機集成訓練策略,訓練得到多個二分類的SVM模型,通過這些模 型分類所述目標圖像的全部像素,將被分為正樣本的像素區域做投票集成后、作為第一檢 測結果;
[0026] 選取前N+M個顯著點作為注視點,依照步驟3)形成注視區域,再經步驟4)和5) 得到相應的第二檢測結果;
[0027] 比較第一檢測結果和第二檢測結果的重疊程度,重疊程度大則表明對目標的視覺 感知強度大;重疊程度小則表明還未形成足夠的對目標的視覺感知強度,繼續重復上述過 程,直至達到足夠的視覺感知強度,最終的檢測結果為上述過程所有檢測結果的疊加;
[0028] 獲得最終的檢測結果后,在目標圖像和像素顯著度圖中該區域被清零,對更新后 的像素顯著度圖中的顯著點,依據顯著度再次排序,重復步驟3)、4)和5),得到新的檢測結 果,直至目標圖像中的所有目標檢測完畢。
[0029]自然場景相當于人類視覺所注視的場景,無論場景大小,在視網膜上成像的范圍 的不變的,因而自然場景之于機器之于機器視覺也是如此。
[0030] 通過譜殘差法對目標圖像作顯著性檢測,可采用以下步驟實施:對于給定的待感 知圖像I(x)(此處x表示像素坐標向量),首先對其進行二維離散傅里葉變換F[I(x)],將 圖像由空間域轉換到頻域,得到幅值A(f)和相位P(f)信息:
[0031] A(f) = |F[I(x)] (1)
[0032]
-- (2)
[0033] 接著對幅值取對數,得到log譜L(f):
[0034] L(f) = log(A(f)) (3)
[0035] 式中F表示二維離散傅里葉變換,|. |表示幅值運算,P()表示相位運算。由于log 曲線滿足局部線性條件,所以用局部平均濾波器hn(f)對其進行平滑,獲得log譜的大致形 狀:
[0036]V(f) =L(f)*hn(f) (4)
[0037] 其中hn(f)是一個nXn的矩陣(本實施例實驗中n= 3。),定義如下:
[0038] ' , (5)
[0039] 譜殘差R(f)則是對圖像中的突變區域的描述:
[0040] R(f) = L(f)-V(f) (6)
[0041] 通過傅里葉逆變換,可以在空間域得到顯著度圖像。
[0042] S(x) = |F^[exp{R(f)+jP(f)}] |2 (7)
[0043] 顯著度圖上每點的值表示該位置的顯著度。考慮到人眼視覺的局部成組效應,為 了消除少數孤立的顯著點,得到更好的視覺效果,可在得到S(x)后再用平均濾波器進行一 次平滑,得到最終的顯著度圖Z(x)。
[0044] Z(x) = S(x)*hn(f) (8)
[0045] 圖1中,涉及訓練數據、分類模型、結果等均為采用支持向量機(SVM)訓練策略相 應實施過程。具體實施過程如下:
[0046] 設包含1