大數據環境下的行人檢測的方法
【專利摘要】本發明公開了一種大數據環境下的行人檢測的方法,步驟如下:1)將所選取的訓練樣本圖像統一為相同尺寸大小的圖像,計算樣本圖像的特征;2)使用漢明碼距離相似性度量方法,計算特征相似性;3)根據特征的相似性對樣本進行聚類,將樣本分為多個類別;4)對于每一個類別分別進行訓練,得到多個分類器模型;5)聯合多個分類器對新樣本進行測試。?本發明計算效率高,為實時處理提供了有利條件。
【專利說明】大數據環境下的行人檢測的方法
【技術領域】
[0001] 本發明涉及計算機視覺和模式識別領域,更具體地說,是一種在大數據環境下對 行人檢測的方法。
【背景技術】
[0002] 行人檢測是指在輸入圖像或者視頻序列中將人體區域從背景中分割出來的過程。 隨著信息化時代的高速發展,圖像數據規模日益增大,如何有效利用大規模圖像數據進行 行人檢測,成為一個新的挑戰。
[0003] 大規模圖像數據行人檢測的主要難點在于數據規模龐大、數據維度高,對計算機 的處理效率要求高,以及數據本身的低信噪比和弱配準。低信噪比是指人體數據中噪聲所 占比例較大而能夠被用于對人體進行判別的信息相對較少。弱配準是指因人體形態上的差 異而很難將人體的各個部分進行比較好的對齊。這些難點問題綜合作用結果就是人體數據 具有非常大的類內散度。因此如何從大規模圖像數據中提取有效的特征信息對行人檢測至 關重要,直接影響到行人檢測的準確率。
[0004] 常見的行人檢測特征提取方法有方向梯度直方圖(Histogram of Oriented Gradient, HOG)、局部二值模式(Local Binary Pattern, LBP)、局部輪廓方向特征 (Edgelet)等方法。HOG特征主要是通過刻畫圖像的局部梯度幅值和方向特征來描述行人, 這種方法可以有效的提取人體的邊緣特征,其缺點在于維度高、計算慢等;LBP是一種用于 描述圖像局部紋理特征的算子,對于單調變化的灰度特征具有不變性,但是對于低分辨率 的圖像其判別能力較差;Edgelet主要是用于描述行人的局部輪廓方向特征,缺點主要是 該特征的計算比較復雜。這些特征在大規模圖像數據環境下表現為特征數據維度高,計算 開銷大,以及難以有效的描述行人的多變性。另外,在大規模圖像數據下的行人檢測需慮到 大規模圖像數據本身特征信息的相關性,直接訓練分類器對行人進行檢測,會使得特征本 身對行人的描述能力不夠強,檢測準確率不高。
【發明內容】
[0005] 本發明的目的在于針對大規模圖像數據環境下的數據規模大和類內散度大的問 題,提出一種隨機特征的方法來對大規模圖像數據進行聚類和訓練分類器,最終完成在大 規模圖像數據環境下的行人檢測的方法。
[0006] 實現本發明目的的技術方案為:該方法主要包括以下步驟:
[0007] 1)將所選取的訓練樣本圖像統一為相同尺寸大小的圖像,計算樣本圖像的特征;
[0008] 2)使用漢明碼距離相似性度量方法,計算特征相似性;
[0009] 3)根據特征的相似性對樣本進行聚類,將樣本分為多個類別;
[0010] 4)對于每一個類別分別進行訓練,得到多個分類器模型;
[0011] 5)聯合多個分類器對新樣本進行測試。
[0012] 上述方法中,所述步驟1)中樣本分為正例樣本和反例樣本,正例樣本是指含有 行人的圖像,反例樣本是指不含有行人的圖像。
[0013] 所述步驟1)中計算樣本圖像的特征包括以下具體步驟:
[0014] 11)針對樣本圖像隨機初始化fn個的相同大小的區域塊,fn的取值范圍為 1000?10000,每個區域塊隨機初始化tn個的坐標點對,這里可以設tn = {4, 8, 16, 32};
[0015] 12)針對每一個區域塊,計算坐標點對的像素差值,若差值大于自定義的閾值P, 則該坐標點對的形成的特征值為1,若差值小于或等于自定義的閾值P則為0。每個區域 塊的特征是由〇和1組成,長度為tn的序列;
[0016] 13)對于每一個樣本圖像,計算fn個區域塊的特征,所有區域塊的特征最終形成 樣本圖像的特征T,特征T是由fn個長度為tn的序列組成。
[0017] 上述方法中,所述步驟2)中計算特征相似性包括以下具體步驟:
[0018] 21)計算碼長為tn的漢明碼距離,并將其存儲于查找表LUT中;
[0019] 22)計算特征的漢明碼距離,例如,對于樣本圖像\的特征凡和樣本圖像Χ』的特 征I,計算公式如下 :
[0020]
【權利要求】
1. 一種大數據環境下的行人檢測的方法,其特征在于步驟如下: 1) 將所選取的訓練樣本圖像統一為相同尺寸大小的圖像,計算樣本圖像的特征; 2) 使用漢明碼距離相似性度量方法,計算特征相似性; 3) 根據特征的相似性對樣本進行聚類,將樣本分為多個類別; 4) 對于每一個類別分別進行訓練,得到多個分類器模型; 5) 聯合多個分類器對新樣本進行測試。
2. 根據權利要求1所述的大數據環境下的行人檢測的方法,其特征在于:所述步驟1) 包括以下具體步驟: 11) 針對樣本圖像隨機初始化fn個的相同大小的區域塊,fn的取值范圍為1000? 10000,每個區域塊隨機初始化tn個的坐標點對,設tn = {4, 8, 16, 32}; 12) 針對每一個區域塊,計算坐標點對的像素差值,若差值大于自定義的閾值P,則該 坐標點對的形成的特征值為1,若差值小于或等于自定義的閾值P則為〇,因此,每個區域 塊的特征是由〇和1組成,長度為tn的序列; 13) 對于每一個樣本圖像,計算fn個區域塊的特征,所有區域塊的特征最終形成樣本 圖像的特征T,特征T是由fn個長度為tn的序列組成。
3. 根據權利要求1所述的大數據環境下的行人檢測的方法,其特征在于:所述步驟2) 計算特征相似性包括以下具體步驟: 21) 計算碼長為tn的漢明碼距離,并將其存儲于查找表LUT中; 22) 計算特征的漢明碼距離,對于樣本圖像\的特征?\和樣本圖像X」的特征Τ」,計算 公式如下:
(1) 其中,If表示特征Ti第k段序列,:Γ,4表示特征L第k段序列,符號·'表示異或運算,符 號?表示取反運算。
4. 根據權利要求1所述的大數據環境下的行人檢測的方法,其特征在于:樣本分為正 例樣本和反例樣本,正例樣本是指含有行人的圖像,反例樣本是指不含有行人的圖像,所述 步驟3)樣本聚類包括以下具體步驟: 31) 正例樣本聚類; 32) 反例樣本聚類。
5. 根據權利要求4所述的大數據環境下的行人檢測的方法,其特征在于:所述步驟31) 包括以下具體步驟: 311) 初始化類個數為零,即c = 0,類的特征向量為空,即V = NULL ; 312) 對于正例樣本\的特征1\,利用步驟2)分別計算?\與現有類的特征向量Vj的漢 明碼距離 Du, j = 0, 1,. . . c ; 313) 在Di」,j = 0, l,...c中,其最大值記為Max{Dik},若Max{Dik}為負或小于閾值Pp 則該樣本歸為新的一類,并且該類的特征向量為否則該樣本歸為第k類; 314) 重復312)?313)直至計算完所有正樣本,最終生成c個類別。
6. 根據權利要求4所述大數據環境下的行人檢測的方法,其特征在于:所述步驟32) 包括以下具體步驟: 321) 對于反例樣本Xi的特征1\,利用步驟2)分別計算?\與c個類的特征向量'的漢 明碼距離 Du, j = 0, 1,. . . c ; 322) 在Di」,j = 0, 1,· · · c中,其最大值記為Max {Dik},若Max {Dik}大于或等于閾值P N 則該樣本歸為第k類,否則該樣本歸為第c+1類; 323) 重復321)?322)直至計算完所有負樣本。
7. 根據權利要求1所述的大數據環境下的行人檢測的方法,其特征在于:所述步驟4) 訓練分類器模型包括以下具體步驟: 41) 對于第i類,分別將正例樣本和反例樣本的第i類對應所有樣本特征載入libsvm 分類器中,得到該類的分類器模型Mi ; 42) 重復步驟41)直至所有的類別都已經訓練完。
8. 根據權利要求1所述的大數據環境下的行人檢測的方法,其特征在于:所述步驟5) 包括以下具體步驟: 51) :對于每一個測試樣本\,按照步驟1)提取特征1\,選取所有c個分類器模型作為 組合分類器; 52) :將特征?\載入到模型%中進行測試得到測試分數Sj ; 53) :重復步驟52)直至所有的模型已經測試完并且得到總分數:
(2) 54) :若Sum大于0,則該樣本測試為正例,否則該樣本測試為反例; 55) :重復上述步驟51)?步驟54)直至所有的樣本測試完畢。
【文檔編號】G06K9/62GK104091152SQ201410308037
【公開日】2014年10月8日 申請日期:2014年6月30日 優先權日:2014年6月30日
【發明者】劉亞洲, 袁文, 孫權森 申請人:南京理工大學