一種基于方向倒角距離特征的行人檢測方法
【技術領域】
[0001] 本發明設及模式識別、機器學習、計算機視覺領域,直接應用于行人檢測等領域。
【背景技術】
[0002] 作為多數計算機視覺問題中的重要組成部分,人及人的個體動作、人與人之間的 交互、人與機器的交互等越來越引起人們的重視。檢測、識別和跟蹤人體成為近些年最具有 挑戰性的課題之一。僅在美國本±,每年近35000起意外交通事故中就有約5000起與行人直 接相關,所W設計實現自動行人檢測系統已刻不容緩。
[0003] 行人檢測作為識別和跟蹤的基礎步驟,在諸多領域應用廣泛:
[0004] 1)視頻監控
[0005] 隨著監控攝像頭的普及,公共場所的監控已經在交通疏導、疑犯追蹤、人流量監測 等方面起到了重要作用。較大的監控區域和持續的監控時間都不利于人工監控。同時,人工 進行視頻監控難W在監控同時完成對視頻主體的有效跟蹤與分析。自動行人檢測技術的應 用可W有效提高視頻監控的準確率和效率,必要時完成對異常情況的報警和追蹤,大大減 少人力、物力、財力的投入。
[0006] 2)智能交通
[0007] 根據2013年南京市統計局公布的數據顯示,南京全市機動車擁有量已達180.68萬 輛,其中私家車擁有量為117.73萬輛,W目前常住人口818.78萬人計算,平均每7人中就有1 輛私家車。交通擁堵、事故頻發、疲勞駕駛、停車難等一系列問題逐漸涌現。將行人檢測技術 作為輔助駕駛系統的一部分,用于提醒駕駛員前方的行人,將極大提高行車安全。事實上, 目前已有一些行人檢測技術被應用于實際的智能交通系統中,但是其性能仍未令人滿意。 從Google公司的自動駕駛汽車Google化r上,我們能夠看到行人檢測技術在智能交通領域 的巨大潛力。
[000引3)多媒體檢索與理解
[0009] 數字多媒體技術的迅猛發展無疑為當今的大數據時代創造了更多了解世界、了解 我們自身的契機。由于數據的爆炸性增長,對多媒體數據的檢索與理解就顯得尤為重要。 現有的多媒體檢索多依靠于捜索引擎,包括Google、百度、Bing、化hoo!等,然而現有的捜索 技術在圖像和視頻捜索上遠不如文檔捜索成熟和高效。作為多媒體的信息來源主體之一, 有關于人的行為動作等相關多媒體數據極為豐富,也是我們最為關注的熱點之一。利用行 人檢測技術實現對于多媒體數據的人物信息檢索和理解,將為下一步的數據分類和進一步 數據理解提供了極大幫助。
[0010] 除了相較于一般人體檢測所具有的兼具剛性和柔性物體的特征,外觀、姿態、尺 度、遮擋、視角等多變的情況,行人檢測更多面臨的是開放的環境,不同的光照、天氣、路況 對檢測結果的影響很大;運動的攝像機帶來的行人檢測問題使得普通的動態目標檢測算法 并不能完全照搬照套,運動攝像機對于運動行人的檢測更是難上加難;多數行人檢測設備 多采用普通監控攝像機,原始圖像和視頻質量得不到保證,也基本沒有紅外和雷達等的額 外輔助設備;針對設及圖像和視頻理解的行人檢測對于具體的情景更加敏感,有時甚至要 求算法達到實時性,運都對行人檢測的研究提出了更多的要求。
[0011] 由于行人檢測技術的挑戰性和巨大的應用前景,越來越多的研究機構、高等院校、 研發型公司等都投入到運項研究中來,包括美國麻省理工學院、卡內基梅隆大學、日本豐田 汽車研究中屯、、戴姆勒-克萊斯勒研發中屯、、清華大學、中科院自動化所、中國科學技術大學 等。經過十余年的發展,1順14、61'山1'師-8^33613、1)日111116'、(:日116油-1]54、1(11'1'1等行人檢 測數據集也成為本領域里最具有代表性的一批數據集。
[0012] 行人特征描述子一般可W分為底層特征、基于學習的特征和混合特征。底層特征 從圖像紋理、梯度等方向描述行人,計算速度較快,但判別能力較弱,魯棒性不夠;基于學習 的特征采用監督學習技術,從大量樣本從學習判別能力較強的特征,訓練使用的正樣本是 否具有代表性直接決定了最終生成特征的判別能力,訓練時間也隨之變化;混合特征則多 為多個底層的融合,有些也添加了學習特征的高階統計特征,一般情況下準確率更高,但特 征維數增加,計算復雜度較高,不利于實現算法的實時性。表1給出了十余年來典型的行人 檢測算法特點。
[0013]
[0014]
[0015]
[0016] 表1典型行人檢測算法特點
[0017] 可W發現,行人檢測方法一般可W分為基于表觀的表示方法和基于人體模型的表 示方法。基于表觀的表示方法側重于尋找特定的行人描述,可W是單純的圖像顏色信息、灰 度信息、甚至是網格特征等。表觀也可W是行人輪廓或區域,如Kale等使用行人輪廓判別步 態,Veerara曲aVan等使用輪廓標記點分析人體運動。人體運動信息也可W通過光流、目標 軌跡、速度等表現。表1中列出的行人特征也都屬于基于表觀的表示方法。基于人體模型的 表示方法重屯、在于對人體及其運動姿態建模,分析參數變化識別行人及其運動,一般可W 用于手勢識別等比較精細的運動識別。某些行人姿態檢測算法也采用了類似的方法。對行 人進行建模一般使用線圖模型和2D模型。3D模型由于計算復雜度過高并且參數整定困難, 在單一攝像機或缺乏圖像深度信息的情況下應用較少。
[0018] 盡管在行人檢測領域已經成果頗豐,但離大規模實用化仍有相當一段距離,許多 問題仍有待解決,需要我們進一步努力探索。
【發明內容】
[0019] 本發明提供了一種基于方向倒角距離(化iented化amfer Distance,0CD)特征的 行人檢測方法,在回顧了行人檢測領域十余年的研究成果的基礎上,集中不同特征描述方 法各自的優勢,設計了一種行人輪廓特征描述子OCD特征。同時,使用Bag Of Words(BOW)模 型中的特征量化方法,提高了特征對噪聲的抗干擾能力,并為OCD特征添加了圖像的多尺度 特征,進一步提高了 OCD特征對于行人輪廓的描述能力。
[0020] -種基于方向倒角距離特征的行人檢測方法,其特征在于:包括如下步驟:
[0021] 步驟(1):輸入待檢測圖像,對待檢測圖像進行預處理得到待檢測邊緣圖像;
[0022] 步驟(2):提取方向倒角距離特征,所述方向倒角距離特征為
[0023] dA(X) = (l-人)?山ham'T(X)+A ?山rient(x) (8)
[0024] 其中,A為方向特異性參數,表征基本倒角距離定義和其方向定義的權重;
[0025] 步驟(3): W方向倒角距離作為距離度量比較經步驟(1)處理的待檢測邊緣圖像 輪廓與模板圖像輪廓的相似性判斷待檢測邊緣圖像是否為行人圖像;模板圖像為已判斷為 是行人輪廓的圖像。
[0026] 對所述步驟(1)得到的所述待檢測邊緣圖像進行圖像塊有效性判斷,過程如下:
[0027] 步驟(11):獲取步驟(1)處理后待檢測邊緣圖像的圖像塊序列;
[0028] 步驟(12):選取其中某一圖像塊,判斷選取的圖像塊是否有效;若無效,則重復本 步驟重新選取另一圖像塊;若有效,貝峭巧專到步驟(13);其中,所述圖像塊的有效性根據圖 像塊間的方向倒角距離大小判斷;
[0029] 步驟(13):得到有效圖像塊序列;確定所有圖像塊的有效性是否已經判斷完畢;若 未判斷完畢,則返回步驟(12);若已經判斷完畢,則得到有效圖像塊序列。
[0030] 本發明提供了一種基于方向倒角距離特征的行人檢測方法,本發明將原始倒角距 離特征進行擴展,加入輪廓方向特征,并進一步對特征進行碼本和多尺度描述,形成具有尺 度不變性的強OCD特征,針對人體輪廓特征表示的特點,并使用BOW模型和圖像多尺度結構, 提高了 OCD特征對噪聲的抗干擾能力,充分提升了行人檢測系統的正確率。
【附圖說明】
[0031 ]圖1為傳統模式識別流程。
[0032] 圖2為方向倒角距離示意圖。
[0033] 圖3為本發明行人檢測實驗流程圖。
[0034] 圖4為本發明OCD特征提取流程圖。
[0035] 圖5為化nny算子邊緣檢測流程圖。
[0036] 圖6為不同輪廓檢測方法在Weizmann數據集上的匹配結果。
[0037] 圖7為實驗正樣本舉例。
[003引圖8為CART示例圖。
[0039] 圖9為兩層CART的5-fold交叉驗證特征選擇結果對比圖。
[0040] 圖10為S層CART特征選擇結果對比圖。
[0041] 圖11為分類器過擬合示意圖。
[0042] 圖12為5-fold SVM參數grid-search優化結果對比圖。
[0043] 圖13為SVM參數PSO優化結果對比圖。
[0044] 圖14為SVM參數GA優化結果對比圖。
[0045] 圖15為不同采樣窗口數下的OCD特征統計分布圖。
[0046] 圖16為不同融合闊值下的OCD特征統計分布圖。
【具體實施方式】
[0047] 下面結合附圖對本發明的技術方案進行詳細說明:
[0048] 按照傳統模式識別理論,行人檢測問題可W按照圖1轉化為一個二分類問題,即判 別輸入圖像是否為行人。運樣,行人檢測的重點在于特征提取和分類器設計兩個部分。
[0049] 行人檢測領域的經典特征包括Haar-Iike特征、HOG化istOgram ofOriented Gradient)特征、輪廓特征等。作為普通的目標分類問題,貝有SIFT(Scale Invariant Fea1:ure Transform)特征、SURF(Speeded-Up Robust Fea1:ures)特征和其他特征描述子。 分類器也已經存在較