使用合成訓練數據的實時騎車人檢測的制作方法
【專利摘要】本發明的各實施方式總體上涉及使用合成訓練數據的實時騎車人檢測。具體地,涉及實時地進行關于騎車人是否存在于目標圖像中的確定。接收目標圖像。使用線性分類器對目標圖像分類并且確定目標圖像的誤差值。如果誤差值不超過閾值,則輸出分類。否則,如果誤差值超過閾值,則使用非線性分類器對目標圖像分類。
【專利說明】使用合成訓練數據的實時騎車人檢測
[0001]相關申請
[0002]本申請要求2012年12月21日提交的第61/745,225號美國臨時申請的權益,該臨時申請通過引用全文結合于此。
【技術領域】
[0003]本申請總體上涉及對象檢測的領域,并且尤其涉及使用層級分類器檢測騎車人的存在。
【背景技術】
[0004]“對象檢測”是指自動檢測視頻圖像或靜止圖像中對象的存在的任務。例如,檢測系統可以檢測靜止圖像中人或騎車人(bicyclist)的存在。如本文所使用的,“騎車人”是指自行車及其騎行者的組合。
[0005]對象檢測例如可以在車輛(例如,汽車)中使用以提高車輛駕駛員、乘客、騎車人以及與車輛分享道路的任意其他人的安全性。
[0006]當前的對象檢測系統存在許多問題。對象檢測系統所存在的一個問題是缺少用于訓練對象檢測模型的擴展訓練集合。包括正樣本(positive sample)(包括所要檢測的對象的圖像)和負樣本(negative sample)(不包括所要檢測的對象的圖像)的訓練集合被提供給機器學習算法以產生對象檢測模型。正樣本對于有限數量的對象類型(例如,行人)可能是可用的,但是可能難以找出用于其它類型的對象(例如,騎車人)的正樣本。
[0007]此外,當生成用于某個類型的對象的新的訓練集合時,利用某些信息對圖像進行手動注釋。例如,可以將對象存在于圖像中這一指示和/或對象的某些參數(例如,對象的顏色以及對象在圖像中的位置)添加至圖像。機器學習算法使用那些注釋和圖像來生成用于檢測對象的模型。該注釋過程可能是冗長的和耗時的。
[0008]此外,準確檢測某些類型的對象的存在可能是過于復雜的,并且因此對于實時應用而言可能是過于緩慢的。例如,騎車人識別比行人識別更復雜,因為在騎車人中由于視角所產生的外表變化遠比在行人中更明顯。而且,騎車人的上部身體姿態比典型的行人的姿態變化大。此外,騎車人移動得更快,并且他們經常極其接近車輛。這導致了對象大小的較大變化以及通過運動模糊和散焦的降低的圖像質量。與行人檢測相比,騎車人檢測的復雜度的增加意味著大多數檢測系統不適用于實時應用。因此,某些應用(例如,車輛系統中的騎車人檢測)可能受益于更快的對象識別方案。
【發明內容】
[0009]以上問題和其它問題通過一種用于實時確定騎車人是否存在于目標圖像中的方法、非暫態計算機可讀存儲介質和系統而得以解決。該方法的實施例包括接收目標圖像。使用線性分類器對目標圖像分類并且確定目標圖像的誤差值。如果誤差值不超過閾值,則輸出分類。否則,如果誤差值超過閾值,則使用非線性分類器對目標圖像分類。[0010]該介質的實施例存儲用于實時確定騎車人是否存在于目標圖像中的可執行計算機程序指令。該指令接收目標圖像。該指令隨后使用線性分類器對目標圖像分類并且確定目標圖像的誤差值。如果誤差值不超過閾值,則輸出分類。否則,如果誤差值超過閾值,則該指令使用非線性分類器對目標圖像分類。
[0011]用于實時確定騎車人是否存在于目標圖像中的系統的實施例包括至少一個存儲可執行計算機程序指令的非暫態計算機可讀存儲介質。該指令接收目標圖像。該指令隨后使用線性分類器對目標圖像分類并且確定目標圖像的誤差值。如果誤差值不超過閾值,則輸出分類。否則,如果誤差值超過閾值,則該指令使用非線性分類器對目標圖像分類。
[0012]說明書中所描述的特征和優勢并非是無所不包的,并且特別地,考慮到附圖、說明書和權利要求,許多附加的特征和優勢對本領域普通技術人員而言將是顯而易見的。此外,應當注意到,已經主要出于可讀性和指導性的目的對說明書中所使用的語言進行了選擇,而并非被選擇以限制或限定本發明主題。
【專利附圖】
【附圖說明】
[0013]圖1是依據實施例的圖示騎車人檢測系統的高層次框圖。
[0014]圖2是依據實施例的圖示用于用作圖1中圖示的騎車人檢測系統的計算機的示例的高層次框圖。
[0015]圖3A是依據實施例的圖示圖1中圖示的正訓練圖像生成模塊的詳細視圖的高層次框圖。
[0016]圖3B是依據實施例的圖示圖1中圖示的檢測模塊的詳細視圖的高層次框圖。
[0017]圖4A是依據實施例的圖示用于生成用于訓練騎車人檢測模型的正樣本的方法的流程圖。
[0018]圖4B是依據實施例的圖示用于確定靜止圖像中騎車人的存在的方法的流程圖。
[0019]附圖僅出于說明的目的而描繪了實施例中的各個實施例。本領域技術人員從以下討論將容易地認識到,可以采用本文所圖示的結構和方法的備選實施例而不背離本文所描述的實施例的原理。
【具體實施方式】
[0020]現在參考附圖對實施例進行描述,其中相同的附圖標記指示相同或功能上相似的部件。而且,在圖中,每個附圖標記最左側的數字對應于其中首次使用該附圖標記的附圖。
[0021]圖1是依據實施例的圖示騎車人檢測系統100的高層次框圖。騎車人檢測系統100包括正訓練圖像生成模塊105、學習模塊110和檢測模塊120。騎車人檢測系統100可以在車輛中被用來確定在車輛周邊存在(或不存在)騎車人。如本文所使用的,“騎車人”是指自行車及其騎行者的組合。
[0022]騎車人檢測系統100例如可以在車輛中使用,以提高車輛內人員的安全性以及與車輛分享道路的騎車人的安全性。在駕駛車輛時,駕駛員可能需要注意多個對象以及在其周邊發生的事件。例如,駕駛員可能需要注意交通信號(例如,交通燈、速度標志和警告標志)、車輛參數(例如,車輛速度、發動機速度、機油溫度和汽油水平)、分享道路的其它車輛、試圖穿越街道的行人,等等。有時,同樣與車輛分享道路的騎車人可能被忽視并且可能被卷入事故之中。
[0023]騎車人檢測系統100可以被用來檢測騎車人的存在。如果檢測到這樣的存在,則駕駛員能夠被警告存在騎車人。駕駛員還能夠被警告騎車人的位置(例如,車輛右側、車輛左側和車輛前方)、騎車人的速度、騎車人前進的方向、車輛與騎車人之間的距離,等等。
[0024]正訓練圖像生成模塊105接收騎車人的三維(3D)虛擬模型作為輸入,生成騎車人的二維(2D)圖像,并且輸出所生成的2D圖像。由于2D圖像必然包括騎車人,所以該2D圖像被用作用于訓練對象檢測模型的“正樣本”。正訓練圖像生成模塊105還可以接收一組參數,以在生成騎車人的2D圖像時使用。
[0025]學習模塊110接收正訓練圖像生成模塊105所生成的2D圖像(正樣本)以及不包括騎車人的圖像(負樣本)作為輸入。學習模塊110隨后使用正樣本和負樣本來訓練用于在圖像中檢測騎車人的存在的層級分類器,并且輸出經訓練的層級分類器。以下參考圖3A對正樣本進一步進行描述。通過以隨機的尺度和位置隨機地裁剪街景的自然圖像來生成負樣本。
[0026]檢測模塊120接收通過學習模塊110訓練的層級分類器和靜止圖像,生成對象假設,并且輸出該假設。在一些實施例中,通過安裝在車輛上的相機來捕捉靜止圖像。例如,可以使用具有1/1.8英寸傳感器的電荷耦合器件(CCD)相機來捕捉靜止圖像。為了提高相機的快門速度并且減少圖像模糊,還可以使用具有更大傳感器的相機。在一些實施例中,通過從視頻提取所選擇的幀來獲得靜止圖像。該對象假設可以是二元結果(例如,是/否或者騎車人存在/不存在)。
[0027]圖2是依據實施例的圖示用于用作圖1中圖示的騎車人檢測系統100的計算機200的示例的高層次框圖。圖示了耦合至芯片組204的至少一個處理器202。芯片組204包括存儲器控制器集線器250和輸入/輸出(I/O)控制器集線器255。存儲器206和圖形適配器213耦合至存儲器控制器集線器250,并且顯示設備218耦合至圖形適配器213。存儲設備208、鍵盤210、指向設備214和網絡適配器216耦合至I/O控制器集線器255。計算機200的其它實施例具有不同架構。例如,在一些實施例中,存儲器206直接耦合至處理器202。
[0028]存儲設備208包括一個或多個非暫態計算機可讀存儲介質,諸如硬盤驅動器、緊致盤只讀存儲器(⑶-ROM)、DVD或固態存儲器設備。存儲器206保存由處理器202使用的指令和數據。指向設備214與鍵盤210結合使用以將數據輸入到計算機系統200中。圖形適配器213在顯示設備218上顯示圖像和其它信息。在一些實施例中,顯示設備218包括用于接收用戶輸入和選擇的觸摸屏功能。網絡適配器216將計算機系統200耦合至通信網絡或其它計算機系統(未示出)。
[0029]計算機200的一些實施例具有與圖2中所示的那些組件相比不同和/或其它的組件。例如,計算機200可以是嵌入式系統并且缺少圖形適配器213、顯示設備218、鍵盤210、指向設備214和其它組件。
[0030]計算機200適于執行用于提供本文所描述的功能的計算機程序模塊。如本文所使用的,術語“模塊”是指用來提供指定功能的計算機程序指令和/或其它邏輯。因此,模塊能夠以硬件、固件和/或軟件來實施。在一個實施例中,由可執行計算機程序指令所形成的程序模塊被存儲在存儲設備208上,加載到存儲器206中并且被處理器202執行。[0031]圖3A是依據實施例的圖示圖1中圖示的正訓練圖像生成模塊105的詳細視圖的高層次框圖。正訓練圖像生成模塊105包括騎車人呈現模塊301、背景合并模塊303、圖像后處理模塊305和圖像注釋模塊307。
[0032]騎車人呈現模塊301接收騎車人(自行車和騎自行車的人)的三維(3D)虛擬模型和參數集合作為輸入,基于所接收的參數呈現騎車人的二維(2D)圖像,并且輸出所呈現的2D圖像。該參數集合例如可以包括自行車的顏色、騎自行車的人的性別、騎自行車的人的衣著、騎自行車的人的姿勢、騎車人的照明,等等。
[0033]在一個實施例中,騎車人呈現模塊301接收自行車模型和人類模型作為輸入,并且將兩個模型組合以生成騎車人模型。人類模型可以接收一個或多個參數(諸如性別(例如,男性或女性)、體型(瘦型體質、胖型體質或中型體質)、發型(長發、短發、禿頂等)、頭發顏色(黑色、棕色、金色等),等等)作為輸入。此外,人類模型還可以包括一件或多件衣著(襯衫、褲子、鞋等)和/或配飾(帽子、背包、手表等)的模型。在一些實施例中,衣著和/或配飾模型可以存儲在數據庫或儲存庫中。
[0034]自行車模型可以接收一個或多個參數(諸如顏色、大小、反光性、紋理等)作為輸入。在一些實施例中,騎車人檢測系統100可以包括存儲多個自行車模型的自行車模型數據存儲(未示出),正訓練圖像生成模塊105能夠從中選擇要使用的自行車模型以生成騎車人模型。
[0035]此外,正訓練圖像生成模塊105還可以接收照明參數(例如,照明光源方位、照明光源高度、照明光源強度和環境光能量)、相機參數(例如,相機方位、相機高度和相機旋度)和呈現參數(圖像大小、邊框大小等)。
[0036]背景合并模塊303接收通過騎車人呈現模塊301生成的2D騎車人圖像和2D背景圖像作為輸入,將騎車人圖像和背景圖像組合,并且輸出組合的2D圖像。在一些實施例中,背景圖像選自背景圖像庫。背景合并模塊303還可以接收指示騎車人應當在背景圖像內放在哪里的位置作為參數,并且將騎車人圖像放在所接收的位置。例如,背景合并模塊303可以接收指示在背景圖像內要在哪里放置騎車人圖像的坐標點作為參數。備選地,背景合并模塊303可以接收定義應當將騎車人圖像置于其中的方塊的兩個點作為參數。
[0037]圖像后處理模塊305接收具有背景的騎車人的2D圖像,編輯所接收的圖像以使得其能夠被學習模塊110使用,并且輸出所編輯的圖像。例如,圖像后處理模塊305可以平滑圖像、降采樣圖像、裁剪圖像等。
[0038]圖像注釋模塊307接收由圖像后處理模塊305輸出的圖像作為輸入,使用所接收圖像的地面實況注釋所接收的圖像,并且輸出經注釋的圖像。在一些實施例中,地面實況是二元值,或者為“是”(存在騎車人)或者為“否”(不存在騎車人)。在其它實施例中,地面實況還包括用來呈現圖像的一個或多個參數(例如,關于騎自行車的人的信息,諸如姿勢;或者關于自行車自身的信息,諸如自行車的類型)。該地面實況還可以包括騎車人在圖像中的位置。例如,圖像注釋模塊307可以使用指示騎車人位于圖像中何處的坐標點(或定義方塊的兩個點)來注釋圖像。
[0039]圖3B是依據實施例的圖示圖1中圖示的檢測模塊120的詳細視圖的高層次框圖。檢測模塊120包括面向直方圖的梯度(HOG)提取模塊311、線性分類模塊313和非線性分類模塊315。[0040]面向直方圖的梯度(HOG)提取模塊311接收靜止圖像,從所接收的靜止圖像提取HOG特征,并且輸出所提取的特征。如本文所使用的,面向直方圖的梯度(HOG)是出于對象檢測的目的在計算機視覺和圖像處理中使用的特征描述符。HOG特征指示在圖像的局部部分中出現梯度方向的數量。
[0041]HOG提取模塊311通過將所接收的圖像劃分為多個單元來提取HOG特征。例如,HOG提取模塊311可以使用8X8像素的單元大小來計算HOG特征。對于每個單元,HOG提取模塊311在該單元的像素上計算梯度方向的一維(1D)直方圖。在一些實施例中,HOG提取模塊311通過將圖像劃分成塊、計算塊的局部直方圖能量并且基于所計算的局部直方圖能量歸一化塊內的單元來針對貫穿所接收的圖像的照明變化歸一化該圖像。例如,HOG提取模塊311可以使用2X2個單元的塊大小來計算局部直方圖能量。
[0042]在一個實施例中,HOG提取模塊311從具有預定義大小的圖像提取HOG特征。例如,HOG提取模塊311可以從48X48像素的圖像提取HOG特征。如果所接收的圖像的大小更大或更小,則HOG提取模塊縮小或放大該圖像,直至圖像大小等于預定義圖像大小。
[0043]線性分類模塊313接收HOG圖像特征的集合作為輸入,使用線性分類器(例如,線性支持向量機或“線性SVM”)和HOG特征來確定騎車人是否存在于與該特征相關聯的圖像中,并且輸出分類和誤差值。該誤差值指示該分類不正確的概率。如本文所使用的,線性分類器基于對象的特性或特征的線性組合(或函數)來識別對象(例如,靜止圖像)屬于哪個類(例如,騎車人存在/不存在)。在一個實施例中,線性分類器的輸出由
[0044]y = f ( ω.χ)
[0045]給出,其中y是線性分類模塊的輸出,ω是由學習模塊110確定的權重向量,并且X是包含正在被分類的對象的特征值的特征向量。
[0046]非線性分類 模塊315接收HOG圖像特征的集合作為輸入,使用非線性分類器(例如,徑向基函數支持向量機或RBF-SVM^P HOG特征來確定騎車人是否存在于與該特征相關聯的圖像中,并且輸出該分類。如本文所使用的,非線性分類器基于對象的特征的非線性組合(或函數)來識別對象(例如,圖像)屬于哪個類(例如,騎車人存在/不存在)。
[0047]圖4Α是依據實施例的圖示用于生成用于訓練騎車人檢測模型的正樣本的方法的流程圖。正訓練圖像生成模塊105接收401騎車人模型和正訓練圖像參數。
[0048]騎車人呈現模塊301基于所接收的騎車人模型和所接收的正訓練圖像參數呈現403騎車人的圖像。
[0049]背景合并模塊303將背景添加405至所呈現的騎車人圖像。
[0050]在一些實施例中(未不出),圖像后處理模塊305可以向具有背景的騎車人的圖像應用圖像后處理技術(例如,平滑、降采樣、裁剪)。
[0051]圖像注釋模塊307使用地面實況注釋407所組合的圖像(騎車人加背景)。例如,圖像注釋模塊307可以使用指示圖像是正樣本的二元值注釋圖像。在其它實施例中,圖像注釋模塊307進一步使用用來呈現騎車人圖像的一個或多個所接收的正訓練圖像參數(諸如騎自行車的人的姿勢或自行車的類型)來注釋圖像。
[0052]圖4Α中圖示的步驟可以多次重復(使用不同的騎車人模型、正訓練圖像參數和/或背景)以生成多個正樣本。例如,圖4Α的步驟可以被重復數千次以產生數千個正樣本。
[0053]圖4Β是依據實施例的圖示用于確定靜止圖像中騎車人的存在的方法的流程圖。檢測模塊120接收411要被分類的靜止圖像。在一些實施例中,可以使用安裝在車輛中的相機來捕捉該圖像。
[0054]HOG提取模塊311分析所接收的靜止圖像并且從所接收的靜止圖像提取413H0G特征。
[0055]線性分類模塊313使用線性分類器和由HOG提取模塊311提取的HOG特征對圖像分類415,輸出分類和誤差值。
[0056]將由線性分類模塊313輸出的誤差值與閾值比較417。如果由線性分類模塊313輸出的誤差值小于閾值,則由線性分類模塊313輸出的分類被用來確定騎車人是否存在于圖像中。否則,如果由線性分類模塊313輸出的誤差值大于閾值,則由非線性分類模塊315使用非線性分類器和由HOG提取模塊311提取的HOG特征來對所接收的圖像分類419,輸出分類。
[0057]分類結果被輸出421。在一些實施例中,騎車人檢測系統100的輸出是二元結果(例如,騎車人存在/不存在)。在其它實施例中,騎車人檢測系統100輸出諸如騎車人相對于所接收的圖像的位置之類的附加信息。騎車人檢測系統100的輸出例如可以被用來警告車輛駕駛員附近的騎車人的存在。
[0058]在一些實施例中,騎車人檢測系統100使用分辨率金字塔(resolution pyramid)和滑動的固定大小檢測窗口來確定在接收的靜止圖像中騎車人的存在。例如,檢測模塊120可以使用以原始圖像分辨率開始、具有10級.#的因數的分辨率金字塔以及48X48像素的
檢測窗口大小和4像素的步幅長度。也就是說,使用4像素的步幅長度從原始圖像中提取48X48像素的子圖像,并且所提取的圖像被發送至檢測模塊120以確定騎車人是否存在于48X48像素的子圖像中。在每個子圖像被檢測模塊分析之后,使用#的因數縮小原始圖像。從縮小的圖像中提取48X48像素的子圖像并且將其發送至檢測模塊120以確定騎車人是否存在于48X48像素的子圖像中。重復該處理,直至已經分析了來自每個等級(例如,10個等級)的子圖像。
[0059]騎車人檢測系統100可以進一步抑制冗余檢測(例如,在兩個不同等級檢測到的相同騎車人)。在一個實施例中,對于給定的原始分辨率的圖像,為了抑制冗余檢測,每個檢測被添加至檢測列表并且根據逐漸降低的檢測強度(例如,逐漸降低的SVM值)分類。列表中的第一元素被選擇為當前最大值,并且對于在其余檢測的檢測窗口中與當前最大值的重疊來測試其余檢測。對于給定的檢測,如果該檢測和當前最大值的交集和并集之間的比率大于閾值(例如,25%),則該檢測被添加至被當前最大值抑制的檢測群組。一旦被抑制或被選擇為最大值,該檢測就從檢測列表移除。重復該處理,直至所有檢測從檢測列表移除。隨后,通過在處于群組的中等級別之內的窗口上取平均值來對于每個群組計算單個檢測窗□。
[0060]說明書中對“一個實施例”或者對“實施例”的引用意味著結合該實施例所描述的特定特征、結構或特性包括在至少一個實施例中。在說明書中各處出現的短語“一個實施例”或“實施例”并非必然都指代相同的實施例。
[0061]【具體實施方式】的一些部分以對計算機存儲器內的數據比特的運算的算法和符號表示的形式呈現。這些算法描述和表示是數據處理領域的技術人員用來向該領域的其他技術人員最為有效地傳遞其工作實質的手段。這里以及總體上,算法被理解為導致所期望結果的步驟(指令)的自洽序列。步驟是需要對物理量進行物理操控的那些步驟。通常,雖然并非必要,這些量采取能夠被存儲、傳輸、組合、比較以及以其它方式操控的電信號、磁信號或光信號的形式。主要出于一般使用的原因,將這些信號稱作比特、數值、元素、符號、字符、項、數字等有時是方便的。此外,不失一般性,將需要物理量或物理量的表示的物理操控或變換的步驟的某些布置稱作模塊或代碼設備有時也是方便的。
[0062]然而,所有這些術語和類似的術語將與適當的物理量相關聯并且僅是被應用于這些量的方便標簽。除非如從以下討論顯而易見的那樣另外特別指出,否則應當意識到,貫穿整個描述,使用諸如“處理”或“運算”或“計算”或“確定”或“顯示”等術語的討論是指計算機系統或類似電子計算設備(諸如特定計算機器)的動作和處理,其操控和變換在計算機系統存儲器或寄存器或其它這樣的信息存儲、傳輸或顯示設備內被表示為物理(電子)量的數據。
[0063]實施例的某些方面包括本文以算法形式描述的處理步驟和指令。應當注意的是,實施例的處理步驟和指令可以以軟件、固件或硬件來體現,并且當以軟件體現時,能夠被下載以駐留在由各種操作系統使用的不同平臺上并且從該不同平臺進行操作。實施例還能夠處于能夠在計算系統上執行的計算機程序產品中。
[0064]實施例還涉及用于執行本文的操作的裝置。該裝置可以出于例如特定計算機的目的而被特別構造,或者其可以包括被存儲在計算機中的計算機程序選擇性地激活或重新配置的通用計算機。這樣的計算機程序可以存儲在計算機可讀存儲介質(諸如但不限于任意類型的碟片,包括軟盤、光盤、CD-ROM、磁性光盤、只讀存儲器(ROM)、隨機訪問存儲器(RAM)、EPROM、EEPR0M、磁性或光學卡、專用集成電路(ASIC)或者適于存儲電子指令的任意類型的介質,并且各自耦合至計算機系統總線)中。存儲器可以包括能夠存儲信息/數據/程序的任意以上設備和/或其它設備,并且可以為暫態或非暫態介質,其中非瞬態或非暫態介質可以包括比最小持續時間更久地存儲信息的存儲器/儲存器。此外,說明書中提到的計算機可以包括單個處理器,或者可以是為了提高計算能力而采用多個處理器設計的架構。
[0065]本文提出的算法和顯示并非固有地涉及任何特定計算機或其它裝置。各種通用系統也可以與依據本文的教導的程序一起使用,或者構造更為專用的裝置來執行方法步驟可以證明是便利的。用于各種這些系統的結構將源自本文的描述。此外,實施例未參考任何特定的編程語言進行描述。將要意識到的是,可以使用各種編程語言來實施如本文所描述的實施例的教導,并且本文對特定語言的任何引用是為了公開實現和最佳模式而被提供。
[0066]此外,已經主要出于可讀性和指示性的目的對說明書中所使用的語言進行了選擇,而并非被選擇以限制或限定本發明主題。因此,實施例的公開旨在說明而非限制權利要求中提出的實施例的范圍。
[0067]雖然本文已經說明并描述了特定的實施例和應用,但是應當理解的是,實施例不限于本文所公開的確切構造和組件,并且可以在實施例的方法和裝置的布置、操作和細節方面進行各種修改、改變和變化而不背離如所附權利要求中所定義的實施例的精神和范圍。
【權利要求】
1.一種用于實時確定騎車人是否存在于目標圖像中的方法,包括以下步驟: 接收所述目標圖像; 使用線性分類器確定所述目標圖像的第一分類和誤差值,其中所述誤差值指示所述第一分類不正確的概率; 響應于所述誤差值不超過閾值: 輸出所述第一分類;以及 響應于所述誤差值超過所述閾值: 使用非線性分類器確定所述目標圖像的第二分類;以及 輸出所述第二分類。
2.根據權利要求1所述的方法,進一步包括: 基于騎車人的三維模型生成所述騎車人的多個合成圖像;以及 使用所生成的多個合成圖像訓練所述線性分類器和所述非線性分類器。
3.根據權利要求2所述的方法,其中生成所述騎車人的所述多個合成圖像包括: 基于所述騎車人的所述三維模型呈現騎自行車的人的圖像;以及 將背景添加至所呈現的圖像,由此生成組合圖像。
4.根據權利要求3所述的方法,其中生成所述騎車人的所述多個合成圖像進一步包括以下各項中的至少一 項:降采樣所述組合圖像、平滑所述組合圖像以及裁剪所述組合圖像。
5.根據權利要求3所述的方法,其中生成所述騎車人的所述多個合成圖像基于所述騎車人的所述三維模型以及基于參數來執行。
6.根據權利要求5所述的方法,其中所述參數包括以下各項中的一項:關于所述人的信息、關于所述自行車的信息以及關于所述騎車人在所呈現的圖像內的位置的信息。
7.根據權利要求5所述的方法,進一步包括使用所述參數注釋所述組合圖像。
8.根據權利要求2所述的方法,進一步包括基于自行車的三維模型和人的三維模型來生成所述騎車人的所述三維模型。
9.根據權利要求1所述的方法,進一步包括: 接收多個負訓練圖像,其中負訓練圖像不顯示騎車人;以及 使用所述多個負訓練圖像訓練所述線性分類器和所述非線性分類器。
10.根據權利要求1所述的方法,其中所述線性分類器包括線性支持向量機(SVM)。
11.根據權利要求1所述的方法,其中所述非線性分類器包括徑向基函數(RBF)支持向量機(SVM)。
12.根據權利要求1所述的方法,其中所述線性分類器基于方向梯度直方圖(HOG)圖像特征來執行分類。
13.根據權利要求12所述的方法,進一步包括從所述目標圖像提取HOG圖像特征。
14.一種非暫態計算機可讀存儲介質,被配置為存儲用于實時確定騎車人是否存在于目標圖像中的指令,當被處理器執行時,所述指令使得所述處理器: 接收所述目標圖像; 使用線性分類器確定所述目標圖像的第一分類和誤差值,其中所述誤差值指示所述第一分類不正確的概率; 響應于所述誤差值不超過閾值:輸出所述第一分類;以及 響應于所述誤差值超過所述閾值: 使用非線性分類器確定所述目標圖像的第二分類;以及 輸出所述第二分類。
15.根據權利要求14所述的非暫態計算機可讀存儲介質,其中當被所述處理器執行時,所述指令進一步使得所述處理器: 基于騎車人的三維模型生成所述騎車人的多個合成圖像;以及 使用所生成的多個合成圖像訓練所述線性分類器和所述非線性分類器。
16.根據權利要求15所述的非暫態計算機可讀存儲介質,其中生成所述騎車人的所述多個合成圖像包括: 基于所述騎車人的所述三維模型呈現騎自行車的人的圖像;以及 將背景添加至所呈現的圖像,由此生成組合圖像。
17.根據權利要求16所述的非暫態計算機可讀存儲介質,其中生成所述騎車人的所述多個合成圖像基于所述騎車人的所述三維模型以及基于參數來執行。
18.—種用于實時確定騎車人是否存在于目標圖像中的系統,包括: 處理器;以及 存儲指令的非暫態計算機可讀存儲介質, 當被所述處理器執行時,所述指令使得所述處理器: 接收所述目標圖像;` 使用線性分類器確定所述目標圖像的第一分類和誤差值,其中所述誤差值指示所述第一分類不正確的概率; 響應于所述誤差值不超過閾值: 輸出所述第一分類;以及 響應于所述誤差值超過所述閾值: 使用非線性分類器確定所述目標圖像的第二分類;以及 輸出所述第二分類。
19.根據權利要求18所述的系統,其中當被所述處理器執行時,所述指令進一步使得所述處理器: 基于騎車人的三維模型生成所述騎車人的多個合成圖像;以及 使用所生成的多個合成圖像訓練所述線性分類器和所述非線性分類器。
20.根據權利要求19所述的系統,其中生成所述騎車人的所述多個合成圖像包括: 基于所述騎車人的所述三維模型呈現騎自行車的人的圖像;以及將背景添加至所呈現的圖像,由此生成組合圖像。
【文檔編號】G06K9/00GK103886279SQ201310625897
【公開日】2014年6月25日 申請日期:2013年11月28日 優先權日:2012年12月21日
【發明者】B·海斯勒 申請人:本田技研工業株式會社