基于視角自適應子空間學習算法的行人重識別方法及系統的制作方法
【技術領域】
[0001] 本發明涉及一種計算機視覺領域的方法,具體地,涉及一種基于視角自適應子空 間學習算法的行人重識別方法及系統。
【背景技術】
[0002] 隨著信息技術的不斷發展,智能處理終端已經變得非常普及,多媒體數據的采集 也變得越來越方便。面對海量的多媒體數據,如何對它們進行智能分析,做到為我所用、為 社會服務,已經成為計算機視覺領域的重要研究課題。目標檢測技術、目標跟蹤技術以及目 標識別技術等都獲得了巨大的發展,而針對行人的檢測、跟蹤和識別技術由于其重要的實 用價值得到了諸多研究者的關注。在安防和居家養老等領域,我們往往關注針對特定行人 的長期鎖定跟蹤問題,這涉及到行人檢測、行人跟蹤等多個技術。而當行人從一個攝像頭下 消失,當他再次出現在另一個攝像頭下時,我們希望能夠識別出該行人并繼續進行跟蹤,這 涉及到行人重識別技術。行人重識別要實現的目標是將兩個互不交疊的攝像頭中檢測出的 目標聯系起來,以實現跨攝像頭的接力跟蹤。但是由于不同的攝像頭配置、安放的位置、場 景不同,導致不同攝像頭下的行人圖像存在不同程度的顏色變化和幾何變化,再加上復雜 的監控場景下,行人之間存在不同程度的遮擋,使得不同攝像頭下的行人重識別問題變得 更加棘手。目前的行人重識別主要針對圖片之間的匹配,還沒有利用視頻信息,主流的算法 可以分為兩大類:基于底層特征提取的行人外貌特征匹配算法,以及基于度量學習的特征 匹配算法。第一類算法致力于提取更加魯棒的、有區分度的行人特征,以提高行人外貌的匹 配準確率。而第二類算法則致力于學習到更加合理的特征空間,以減小同一行人由于姿勢、 視角等變化造成的特征差異。第一類方法不需要訓練樣本,因此便于推廣使用,但是它需要 繁雜的特征設計,而且現實情況下引起行人外貌特征發生變化的因素過于復雜,很難找到 普適的有區分度的特征。本發明專利所研究的內容屬于第二類算法,目標是利用訓練數據 得到更優的特征子空間,使得在新的特征子空間中同一行人特征更加靠近,而不同行人特 征更加遠離。
[0003] 通過大量的文獻檢索,我們發現現有的度量學習算法主要是對馬氏距離的變換, 目標是學習一種特征變換矩陣,使得變換后的特征更加符合理想的特征分布(即同一行 人的特征分布更加靠近,不同行人的特征更加遠離)。Alexis Mignon等人在2012年 的 Internaltional Conference on Computer Vision and Pattern Recogintion 中的 aPCCA:A New Approach for Distance Learning from Sparse Pairwise Constraints', 一文中,提出利用訓練數據學習得到一個低維子空間,在此空間中標定好的訓練樣本對滿 足理想的特征分布(同一個行人的特征樣本對距離小于一個閾值,而不同行人的特征樣本 對大于該閾值)。該方法適用于高維特征空間,并且在訓練樣本較少的情況下也能夠取得 不錯的效果。Wei-Shi Zheng 等人在 2011 年的 Internaltional Conference on Computer Vision and Pattern Recogintion 中的 "Person Re-identification by Probabilistic Relative Distance Comparison" 一文中,提出一種基于三元組輸入的度量學習算法,目標 是使得屬于同一行人的特征樣本對之間的距離小于屬于不同行人的特征樣本對之間距離 的概率最大化。但是這種方法對輸入數據有較多限制(三元組),且在高維特征輸入情況下 處理速度較慢。
[0004] 中國專利文獻號CN103500345A,公開(公告)日2014. 01. 08,公開了一種基于度 量學習的行人重識別算法,該發明通過采用新設計的光滑正則化距離度量模型進行行人重 驗證,充分考慮了模型中協方差矩陣估計偏差問題。具有不需要復雜的優化迭代過程的優 點。但是該方法沒有考慮不同攝像頭視角下的行人圖像對應著不同的光照、視角等的變化, 因此得到的度量也不是最佳的。
【發明內容】
[0005] 針對現有技術中的缺陷,本發明的目的是提供一種基于視角自適應子空間學習算 法的行人重識別方法及系統,能夠充分挖掘不同攝像頭對行人特征的影響,并針對性地為 每一個攝像頭學習相應的變換關系,以使得攝像頭對行人外貌特征的影響降到最小,在行 人重識別的特征匹配階段就可以只關注行人外貌特征的不同,從而大大提高行人重識別的 準確率。
[0006] 根據本發明的一個方面,提供一種基于視角自適應子空間學習算法的行人重識別 方法,所述方法以只包含單個行人的矩形圖像或通過跟蹤結果從原始視頻圖像中裁取出目 標矩形框作為輸入圖像,在輸入圖像上提取特征向量,并且將數據集劃分為訓練數據集和 測試數據集,在訓練數據集上按照視角自適應子空間學習算法學習得到變換矩陣,在測試 數據集上利用學習得到的變換矩陣進行距離計算和行人重識別。
[0007] 所述方法包括如下步驟:
[0008] 步驟1):利用特征提取算法對輸入圖像進行特征提取,得到特征向量集合,特征 向量集合進一步又被分為訓練數據集和測試數據集;
[0009] 步驟2),在訓練數據集上,對每個攝像頭學習得到視角自適應的子空間變換矩陣, 其中學習映射矩陣的過程通過優化損失函數實現;
[0010] 步驟3),在測試數據集上,首先將所有測試圖像的特征矩陣映射到相應的子空間, 得到映射后的特征向量,并在此基礎上進行行人重識別。
[0011] 進一步的,步驟2)中,所述的損失函數如公式(1)所示:
[0012]
[0013] 其中:LA,Lb是需要學習的映射矩陣,La為補償攝像頭A給該鏡頭下行人外貌特征 向量帶來的變化,L b為補償攝像頭B給該鏡頭下行人外貌特征向量帶來的變化,所有的訓 練樣本都是成對出現,攝像頭A下的特征向量為:(X i, i = 1,2,…,NtraiJ,攝像頭B下的特 征向量為:Iy1, i = 1,2,…,NttalJ,兩個特征集合中對應位置的特征對應于不同攝像頭下的 同一行人即\與y i對應于同一行人;ISI,IDI分別表示正樣本對即同一行人特征對和負樣 本對的個數;λ,μΑ,μ Β為調節損失函數中各個項的重要程度的參數;M · I I F對應矩陣的 Frobenius 范數;
[0014] 公式(1)中的損失函數能夠在攝像頭的光照、視角托變化不是特別復雜的情況下 取得不錯的效果,但是對每個攝像頭下的特征向量只能進行線性變換操作,為了更好地適 應復雜的實際場景,通過核函數來引入非線性變換,從而給模型帶來更多的靈活性,能夠更 好地還原行人本身的外貌特征;所述的引入核函數的方法如下:
[0015] 特征向量在核空間的距離通過下式進行計算:
[0016]
(!)
[0017] 其中:Φ (X1),Φ (I)是核空間的特征向量,4是對應的核空間的映射矩陣;
[0018] 在公式⑵的基礎上,將公式⑴中的損失函數推廣到核空間,因為核空間的維度 很高,不能直接對Xlif進行學習,因此引入變換矩陣Q A,Qb來表