一種目標區域的定位方法和裝置的制造方法
【技術領域】
[0001]本發明涉及圖像技術領域,尤其涉及一種目標區域的定位方法和裝置。
【背景技術】
[0002]針對待檢測圖像,需要從待檢測圖像中定位出目標區域,如待檢測圖像包含人、沙發時,需要定位出人所在區域為目標區域,而沙發所在區域為非目標區域。為了實現這一過程,通常采用RCNN(Reg1n Convolut1nal Neural Network,區域卷積神經網絡)目標定位算法。首先,使用Selective Search(選擇性搜索)算法對待檢測圖像進行分割,得到X個候選窗口。之后,利用CNN(Convolut1nal Neural Network,卷積神經網絡)算法對X個候選窗口分別提取特征向量,得到X個候選窗口對應的X個特征向量。之后,利用SVM(SupportVector Machine,支持向量機)分類器對X個特征向量進行分類,得到包含目標區域的候選窗口,這些候選窗口對應的區域即目標區域。
[0003]由于X的數值很大,如2000個,而且對候選窗口提取特征向量的過程比較復雜,運算量較大,因此,對X個候選窗口分別提取特征向量的計算復雜度較高,運算量很大,影響設備的計算性能,目標區域的定位時間很長。
【發明內容】
[0004]本發明提供一種目標區域的定位方法,所述方法包括以下步驟:
[0005]獲得待檢測圖像,并對所述待檢測圖像進行分割,得到X個候選窗口;
[0006]對所述待檢測圖像進行縮放處理,得到A個不同尺度的檢測縮放圖像;
[0007]針對所述X個候選窗口中的每個候選窗口,執行以下處理過程,并得到Y個未被過濾的候選窗口:從所述A個不同尺度的檢測縮放圖像中,為所述候選窗口選擇一個尺度的檢測縮放圖像,并利用所述一個尺度的檢測縮放圖像所對應的訓練信息,判斷所述候選窗口中是否包含目標區域,如果否,則過濾所述候選窗口,如果是,則保留所述候選窗口;
[0008]對所述Y個候選窗口分別提取特征向量,得到Y個特征向量;
[0009]對所述Y個特征向量進行分類,定位出目標區域。
[0010]所述訓練信息具體包括判別參數(Vi,Ti)和權重向量W,所述方法還包括:維護所述A個不同尺度的檢測縮放圖像分別對應的訓練信息,且所述A個不同尺度的檢測縮放圖像分別對應的訓練信息的維護過程,具體包括:
[0011]獲得已知目標位置的訓練圖像,并選擇包含所述目標位置的正樣本窗口、未包含所述目標位置的負樣本窗口 ;利用方向梯度直方圖H0G特征對所述正樣本窗口進行特征提取,得到正樣本特征向量,利用H0G特征對所述負樣本窗口進行特征提取,得到負樣本特征向量;對所述正樣本特征向量進行縮放處理,得到M*N的正樣本特征向量,對所述負樣本特征向量進行縮放處理,得到M*N的負樣本特征向量;對所述M*N的正樣本特征向量以及所述M*N的負樣本特征向量進行線性訓練,得到所述權重向量W ;
[0012]對所述訓練圖像進行縮放處理,得到A個不同尺度的訓練縮放圖像;針對每個尺度的訓練縮放圖像,將所述訓練縮放圖像劃分成一個或者多個M*N的子區域,并利用所述目標位置確定每個子區域的特征值,并利用所述特征值和所述權重向量W,得到所述訓練縮放圖像的判別參數(Vnh),并將所述判別參數(VnTO作為對應尺度的檢測縮放圖像的判別參數^丁山
[0013]所述利用所述目標位置確定每個子區域的特征值,并利用所述特征值和所述權重向量W,得到所述訓練縮放圖像的判別參數(VnTO的過程,具體包括:針對所述訓練縮放圖像中的每個M*N的子區域,當所述目標位置位于所述子區域時,則確定所述子區域的特征值0工為正值;當所述目標位置不位于所述子區域時,則確定所述子區域的特征值⑴為負值;以及,將所述子區域與所述權重向量W進行卷積,得到所述子區域的分數S1;
[0014]利用如下公式對所述訓練縮放圖像的每個子區域的分數SjP特征值⑴進行線性訓練,得到所述訓練縮放圖像的判別參數(HhOFVdSi+Ti。
[0015]所述從所述A個不同尺度的檢測縮放圖像中,為所述候選窗口選擇一個尺度的檢測縮放圖像的過程,具體包括:
[0016]確定所述候選窗口在所述A個不同尺度的檢測縮放圖像中的每個檢測縮放圖像中的像素大小,并選擇像素大小最接近M*N的檢測縮放圖像,并將當前選擇的檢測縮放圖像作為為所述候選窗口選擇的檢測縮放圖像;其中,所述Μ為預設的水平像素大小,所述N為預設的垂直像素大小。
[0017]針對所述X個候選窗口中的每個候選窗口,所述利用所述一個尺度的檢測縮放圖像所對應的訓練信息,判斷所述候選窗口中是否包含目標區域,具體包括:將所述候選窗口與所述檢測縮放圖像對應的權重向量W進行卷積,得到所述候選窗口對應的分數Sj;基于所述分數Sj、所述檢測縮放圖像對應的判別參數(VnTi),利用如下公式確定所述候選窗口的特征值0」:=;當所述候選窗口的特征值為正值時,確定所述候選窗口中包含目標區域;當所述候選窗口的特征值為負值時,確定所述候選窗口中未包含目標區域。
[0018]本發明提供一種目標區域的定位裝置,所述裝置具體包括:
[0019]獲得模塊,用于獲得待檢測圖像,對待檢測圖像進行分割,得到X個候選窗口;對待檢測圖像進行縮放處理,得到A個不同尺度的檢測縮放圖像;
[0020]處理模塊,用于針對所述X個候選窗口中的每個候選窗口,執行以下處理過程,并得到Y個未被過濾的候選窗口:從所述A個不同尺度的檢測縮放圖像中,為所述候選窗口選擇一個尺度的檢測縮放圖像,并利用所述一個尺度的檢測縮放圖像所對應的訓練信息,判斷所述候選窗口中是否包含目標區域,如果否,則過濾所述候選窗口,如果是,則保留所述候選窗口 ;
[0021]提取模塊,用于對Y個候選窗口分別提取特征向量,得到Y個特征向量;
[0022]定位模塊,用于對所述Y個特征向量進行分類,定位出目標區域。
[0023 ]所述訓練信息具體包括判別參數(Vi,Ti)和權重向量W ;
[0024]所述處理模塊,還用于維護所述A個不同尺度的檢測縮放圖像分別對應的訓練信息,且在所述A個不同尺度的檢測縮放圖像分別對應的訓練信息的維護過程中,獲得已知目標位置的訓練圖像,并選擇包含所述目標位置的正樣本窗口、未包含所述目標位置的負樣本窗口;利用方向梯度直方圖HOG特征對所述正樣本窗口進行特征提取,得到正樣本特征向量,利用HOG特征對所述負樣本窗口進行特征提取,得到負樣本特征向量;對所述正樣本特征向量進行縮放處理,得到M*N的正樣本特征向量,對所述負樣本特征向量進行縮放處理,得到M*N的負樣本特征向量;對所述M*N的正樣本特征向量以及所述M*N的負樣本特征向量進行線性訓練,得到所述權重向量W ;
[0025]對所述訓練圖像進行縮放處理,得到A個不同尺度的訓練縮放圖像;針對每個尺度的訓練縮放圖像,將所述訓練縮放圖像劃分成一個或者多個M*N的子區域,并利用所述目標位置確定每個子區域的特征值,并利用所述特征值和所述權重向量W,得到所述訓練縮放圖像的判別參數(Vnh),并將所述判別參數(VnTO作為對應尺度的檢測縮放圖像的判別參數^丁山
[0026]所述處理模塊,具體用于在利用所述目標位置確定每個子區域的特征值,并利用所述特征值和所述權重向量W,得到所述訓練縮放圖像的判別參數(VnTO的過程中,針對所述訓練縮放圖像中的每個M*N的子區域,當所述目標位置位于所述子區域時,則確定所述子區域的特征值⑴為正值;當所述目標位置不位于所述子區域時,則確定所述子區域的特征值⑴為負值;以及,將所述子區域與所述權重向量W進行卷積,得到所述子區域的分數S1;
[0027]利用如下公式對所述訓練縮放圖像的每個子區域的分數SjP特征值⑴進行線性訓練,得到所述訓練縮放圖像的判別參數(HhOFVdSi+Ti。
[0028]所述處理模塊,具體用于在從所述A個不同尺度的檢測縮放圖像中,為所述候選窗口選擇一個尺度的檢測縮放圖像的過程中,確定所述候選窗口在