本發(fā)明涉及一種用于在執(zhí)行高速檢測處理的同時(shí)保持精確度的方法以及一種物體檢測裝置。
背景技術(shù):作為從圖像中檢測目標(biāo)的傳統(tǒng)方法之一,有這樣一種方法,該方法包括:利用預(yù)先學(xué)習(xí)的模型執(zhí)行檢測處理;基于檢測結(jié)果限制進(jìn)行目標(biāo)搜索的層的范圍;然后基于更準(zhǔn)確的模型執(zhí)行檢測處理。日本專利申請JP4498296討論了這樣一種方法,該方法包括:在分層圖像上執(zhí)行第一檢測;然后針對下一個(gè)輸入圖像僅在從第一檢測中檢測出的相同的分層圖像上執(zhí)行第二檢測。但是,根據(jù)日本專利申請JP4498296討論的方法,被搜索的層僅限于同一層,但是對于下一個(gè)輸入圖像同一層并不總是具有最高的被檢測的可能性。另外,如果在第一檢測和第二檢測中使用了不同的模型,那么很可能檢測到的目標(biāo)中的層并不總是在第一檢測和第二檢測中的同一層,因此導(dǎo)致了這樣的問題:整體上的檢測精確度被降低了。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明的一個(gè)方面提供了一種物體檢測方法,其包括:圖像的圖像獲取步驟,其獲取包括目標(biāo)物體;分層圖像生成步驟,其通過以多個(gè)不同的比例尺放大和/或縮小所述圖像而生成多個(gè)分層圖像;第一檢測步驟,其從每個(gè)所述分層圖像檢測目標(biāo)物體的至少一部分區(qū)域作為第一檢測區(qū)域;選擇步驟,其基于檢測到的第一檢測區(qū)域和預(yù)先學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù)選擇所述分層圖像的至少一層;第二檢測步驟,其檢測在選擇步驟中選擇的分層圖像中的目標(biāo)物體的至少一部分區(qū)域作為第二檢測區(qū)域;以及合成步驟,其將在第一檢測步驟中檢測到的檢測結(jié)果和在第二檢測步驟中檢測到的檢測結(jié)果合成。根據(jù)本發(fā)明的示例性實(shí)施方式,可以加快整個(gè)處理而同時(shí)保持監(jiān)測的精確度。根據(jù)下述示例性實(shí)施例的詳細(xì)描述并結(jié)合附圖,本發(fā)明的其他特征及各方面將顯而易見。附圖說明附圖包含在說明書中并構(gòu)成說明書的一部分,附圖描述了本發(fā)明的示例性實(shí)施方式、特征和各方面,并和說明書一起用于解釋本發(fā)明的原理。圖1展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測裝置的配置。圖2展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖3展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖4展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖5展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖6展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖7是流程圖,展示了本發(fā)明的第一示例性實(shí)施方式的物體檢測方法的處理步驟。圖8展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測裝置的配置。圖9展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖10展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖11展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖12展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖13展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖14展示了本發(fā)明的第二示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。圖15展示了本發(fā)明的第三示例性實(shí)施方式的物體檢測裝置的配置。圖16展示了本發(fā)明的第三示例性實(shí)施方式的物體檢測方法的一個(gè)處理步驟。具體實(shí)施方式以下將結(jié)合附圖詳細(xì)描述本發(fā)明的各種示例性實(shí)施方式、特征以及各方面。本發(fā)明的第一示例性實(shí)施方式的物體檢測方法是用于穩(wěn)定地檢測存在于圖像中的目標(biāo)的方法。圖像獲取單元可以利用使用照相機(jī)、視頻照相機(jī)或網(wǎng)絡(luò)照相機(jī)捕捉的圖像,或者利用預(yù)先捕捉并存儲(chǔ)的圖像。下面根據(jù)下述例子來描述本示例性實(shí)施方式:所述例子捕捉包括人的圖像,并檢測用戶希望從獲取的圖像中檢測的人。在本示例性實(shí)施方式中,檢測目標(biāo)是人,但不限于此。例如,本發(fā)明也可用于檢測動(dòng)物或植物等。圖1展示了本示例性實(shí)施方式的物體檢測裝置100的輪廓。如圖1所示,本示例性實(shí)施方式的物體檢測裝置100包括圖像獲取單元101、特征量生成單元102、第一檢測單元103、第一估計(jì)單元104、層限制單元105、第二檢測單元106、第二估計(jì)單元107以及合成單元108。圖像獲取單元101從照相機(jī)或者從預(yù)先捕捉的圖像中獲取圖像。然后獲取的圖像被發(fā)送至特征量生成單元102。特征量生成單元102通過以圖2所示的預(yù)定比例尺放大/縮小圖像獲取單元101獲取的圖像生成分層圖像201,并為每個(gè)分層圖像生成一個(gè)特征量。這里,術(shù)語“分層圖像”是指通過以預(yù)定比例尺放大/縮小圖像生成的圖像。生成的特征量可以是梯度方向直方圖(HOG)特征量、類哈爾(Haar-like)特征量、色彩特征量或者通過將上述特征量合成而生成的圖像。生成的層特征量被輸入至第一檢測單元103和層限制單元105。第一檢測單元103執(zhí)行對每個(gè)分層圖像201的特征量進(jìn)行檢測處理,所述特征量201由特征量生成單元102生成。如圖3所示,在本示例性實(shí)施方式中,第一檢測單元103基于分層圖像302的特征量檢測人的頭部周圍區(qū)域,所述分層圖像302是分層圖像201的其中之一。這里所說的術(shù)語“頭部周圍區(qū)域”用于表示不僅包括人的頭部、甚至還包括肩膀的區(qū)域。檢測目標(biāo)不限于人的頭部周圍區(qū)域,也可以是胳膊、軀干、腿等。另外,在本示例性實(shí)施方式中,檢測處理是在單個(gè)圖像層上執(zhí)行的,但是也可以在更多或者所有分層圖像上執(zhí)行。作為檢測物體的方法,可利用已知的技術(shù)執(zhí)行檢測處理,例如《HOG+超向量機(jī)》(SuperVectorMachine,SVM)(引用文獻(xiàn):《人體檢測的梯度方向直方圖(HistogramsofOrientedGradientsforHumanDetection)》,作者N.Dalal,發(fā)表于2005年的《計(jì)算機(jī)視覺與模式識別》(CVPR))、《隱式形狀模型》(ISM)(《利用隱式形狀模型分類和分割組合對象(CombinedObjectCategorizationandSegmentationwithanImplicitShapeModel)》,作者B.Leibe,發(fā)表于2004年的“計(jì)算機(jī)視覺歐洲大會(huì)”(ECCV))或《隱生超向量機(jī)》(Latent-SVM)(《ObjectDetectionwithDiscriminativelyTrainedPartBasedModels》,作者P.Felzenszwalb、R.Girshick、D.McAllester、D.Ramanan,發(fā)表于電氣及電子工程師學(xué)會(huì)的《模式分析及機(jī)器智能》(PAMI),2010年第9期第32卷)。第一檢測單元103檢測分層圖像302的特征量的結(jié)果303,所述分層圖像302是分層圖像201的其中之一。另外,第一檢測單元103也可以執(zhí)行檢測處理,用于檢測由圖像獲取單元101獲取的圖像上的目標(biāo)物體的區(qū)域。在此情況下,第一檢測單元103可利用已知的技術(shù)執(zhí)行檢測處理,例如模式匹配。由第一檢測單元103檢測到的頭部周圍區(qū)域的檢測結(jié)果303被發(fā)送給第一估計(jì)單元104。第一估計(jì)單元104利用從第一檢測單元103獲取的檢測結(jié)果303估計(jì)特定部分區(qū)域。在本示例性實(shí)施方式中,第一估計(jì)單元104估計(jì)頭部區(qū)域作為特定部分區(qū)域。正如下文所述,術(shù)語“頭部區(qū)域”僅用于表示頭部,而上面描述的頭部周圍區(qū)域是指不僅包括頭部、甚至還包括肩膀的區(qū)域。在本示例性實(shí)施方式中,第一檢測單元103檢測頭部周圍區(qū)域,而第一估計(jì)單元104僅估計(jì)頭部區(qū)域。但是,不用說,如果第一檢測單元103檢測到了頭部周圍區(qū)域以外的區(qū)域,那么第一估計(jì)單元104估計(jì)的區(qū)域就不再是頭部區(qū)域了。下文將描述用于估計(jì)頭部區(qū)域的方法。作為估計(jì)頭部區(qū)域的方法,可以利用頭部周圍區(qū)域的檢測結(jié)果303的位置坐標(biāo),根據(jù)下列等式(1)計(jì)算出頭部區(qū)域:在等式(1)中,x1和y1代表檢測結(jié)果303的左上角的坐標(biāo),x2和y2代表檢測結(jié)果303的右下角的坐標(biāo)。在等式(1)中,“A”代表以矩陣形式表達(dá)的檢測結(jié)果,所述矩陣由包括從頭部到肩膀的區(qū)域的根濾波器以及多個(gè)各自代表根濾波器的一部分的部分濾波器3031-3034組成。另外,在檢測結(jié)果被轉(zhuǎn)換成矩陣形式時(shí),能夠計(jì)算出每個(gè)部分濾波器3031-3034的中心坐標(biāo)以及被檢測位置處的檢測結(jié)果303的中心坐標(biāo)之間的差值。作為差值的坐標(biāo)的橫坐標(biāo)由檢測結(jié)果303的寬度w標(biāo)準(zhǔn)化,縱坐標(biāo)由檢測結(jié)果303的高度h標(biāo)準(zhǔn)化。各個(gè)部分濾波器3031-3034的標(biāo)準(zhǔn)化后的中心坐標(biāo)x,y以矩陣形式表示(行包括一個(gè)檢測結(jié)果的每個(gè)部分濾波器的標(biāo)準(zhǔn)化后的坐標(biāo),列包括每個(gè)檢測結(jié)果)。也就是等式(1)中的“A”。在等式(1)中,“p”代表基于通過對學(xué)習(xí)數(shù)據(jù)以及頭部的實(shí)際尺寸執(zhí)行檢測處理而得到的檢測結(jié)果由用于頭部區(qū)域的尺寸的線性預(yù)測的各種系數(shù)(與標(biāo)準(zhǔn)化后的各個(gè)部分濾波器的中心坐標(biāo)相乘的一系列系數(shù))組成的矢量。術(shù)語“學(xué)習(xí)數(shù)據(jù)”是指一組圖像,每張圖像都顯示預(yù)先準(zhǔn)備的人的圖像。如圖3所示,第一估計(jì)單元104估計(jì)頭部檢測結(jié)果303中的頭部區(qū)域,然后可以獲取估計(jì)結(jié)果304。作為估計(jì)結(jié)果的頭部區(qū)域304被輸出至層限制單元105以及合成單元108?;谔卣髁可蓡卧?02生成的特征量以及由第一估計(jì)單元104估計(jì)的頭部區(qū)域304,層限制單元105判定第二檢測單元106將執(zhí)行檢測處理的層。作為判定方法,層限制單元105利用等式(2)計(jì)算所述層。圖4展示了作為檢測結(jié)果的直方圖的分布圖表405,在所述檢測結(jié)果中,關(guān)于上述學(xué)習(xí)數(shù)據(jù),橫軸對應(yīng)于第一檢測單元103的檢測結(jié)果的層,縱軸對應(yīng)于第二檢測單元106檢測到的層。另外,圖4展示了作為檢測結(jié)果的直方圖的分布圖表406,在所述檢測結(jié)果中,關(guān)于上述學(xué)習(xí)數(shù)據(jù),橫軸對應(yīng)于第一估計(jì)單元104估計(jì)的頭部區(qū)域的寬度尺寸中的線性預(yù)測估計(jì)的層,縱軸對應(yīng)于第二檢測單元106檢測到的結(jié)果的層。如圖4所示,基于頭部區(qū)域的尺寸顯示適合檢測的層的分布??梢源_定,利用頭部區(qū)域估計(jì)結(jié)果層的分布在圖表中被限制了。根據(jù)上述確定的內(nèi)容,基于從學(xué)習(xí)數(shù)據(jù)中獲取的分布圖表406,利用最小平方法能夠計(jì)算出系數(shù)coeff。在等式(2)中,“A”代表通過求學(xué)習(xí)數(shù)據(jù)中的頭部區(qū)域的尺寸的對數(shù)得到的結(jié)果組成的矩陣,“B”代表由第二檢測單元106的檢測結(jié)果中的層組成的矩陣。利用計(jì)算出的系數(shù)coeff,根據(jù)等式(3)可確定層。層=coeff1*log(寬度)+coeff2*log(高度)+coeff3(3)在等式(3)中,“寬度”代表頭部區(qū)域的寬度,“高度”代表頭部區(qū)域的高度。僅對分層圖像507的特征量執(zhí)行檢測處理,分層圖像507的特征量與從等式(3)獲得的層一致或最接近。不對層509的特征量執(zhí)行檢測處理,層509是不同于分層圖像507的層。被限制的分層圖像507被輸出至第二檢測單元106?;谔卣髁可蓡卧?02和層限制單元105,第二檢測單元106僅對被限制的分層圖像507的特征量執(zhí)行檢測處理。本示例性實(shí)施方式檢測人的整個(gè)身體。更不用說,由第二檢測單元106檢測的目標(biāo)不限于人的整個(gè)身體。作為檢測處理方法,通過滑動(dòng)模型508的窗口在各個(gè)位置處執(zhí)行檢測處理,所述模型508已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。如圖6所示,通過檢測處理獲取檢測結(jié)果610-612。獲取的檢測結(jié)果610-612被輸出至第二估計(jì)單元107。第二估計(jì)單元107估計(jì)第二檢測單元106獲取的、以矩形區(qū)域的形式表示的各個(gè)檢測結(jié)果610-612中的特定部分區(qū)域。在本示例性實(shí)施方式中,第二估計(jì)單元107估計(jì)頭部區(qū)域作為特定部分。更不用說,由第二估計(jì)單元107估計(jì)的特定部分不限于頭部區(qū)域,也可以是和第一估計(jì)單元104估計(jì)的區(qū)域相同的區(qū)域。這是因?yàn)楹铣蓡卧?08(下文將描述)能夠?qū)⒌谝还烙?jì)單元104估計(jì)的區(qū)域和第二估計(jì)單元107估計(jì)的區(qū)域合成。作為估計(jì)的方法,可以通過第一估計(jì)單元104利用等式(1)計(jì)算出特定部分區(qū)域。如圖6所示,以計(jì)算出的矩形區(qū)域表示的頭部區(qū)域620-622被輸出至合成單元108。合成單元108將第一估計(jì)單元104獲取的頭部區(qū)域203以及第二估計(jì)單元107獲取的頭部區(qū)域620-622合成,然后輸出最終的檢測結(jié)果。作為合成方法,合成單元108計(jì)算頭部區(qū)域203和各個(gè)頭部區(qū)域620-622之間的重合度,然后選擇具有最高重合度的頭部區(qū)域作為從其中檢測相同目標(biāo)的幀。如圖6所示,頭部區(qū)域203和頭部區(qū)域620具有最高重合度,因此選擇這兩個(gè)檢測結(jié)果作為一個(gè)組合,然后檢測結(jié)果610被作為最終檢測結(jié)果輸出。檢測結(jié)果611-612被判定為錯(cuò)誤檢測,因此不會(huì)被輸出。本示例性實(shí)施方式的配置方式就是這樣。下面,結(jié)合圖7所示的流程圖描述本示例性實(shí)施方式的物體檢測裝置100執(zhí)行的處理。本流程圖的程序代碼被存儲(chǔ)在未示出的存儲(chǔ)器中,例如隨機(jī)存取存儲(chǔ)器(RAM)或只讀存儲(chǔ)器(ROM),并由未示出的中央處理單元(CPU)等讀取、執(zhí)行。在步驟S100中,開始整個(gè)處理。首先,處理推進(jìn)至步驟S101,在該步驟中圖像獲取單元101從照相機(jī)或圖像文件中等獲取圖像。獲取到的圖像被發(fā)送至特征量生成單元102。然后,處理推進(jìn)至步驟S102。在步驟S102中,通過對圖像獲取單元101獲取的圖像執(zhí)行圖像放大/縮小處理,特征量生成單元102生成分層圖像201,并生成各分層圖像的特征量。生成的特征量可以是HOG特征量、類哈爾特征量或色彩特征量。作為上述處理的結(jié)果,可以獲得層特征量。生成的特征量被輸出至第一檢測單元103以及層限制單元105。然后,處理推進(jìn)至步驟S103。在步驟S103中,第一檢測單元103執(zhí)行檢測處理。第一檢測單元103對分層圖像302的特征量執(zhí)行檢測處理,所述特征量是分層圖像201的特征量之一。另外,第一檢測單元103可對分層圖像201的生成的特征量執(zhí)行檢測處理,或例如通過模式匹配對圖像獲取單元101獲取的圖像執(zhí)行檢測處理。作為檢測方法,第一檢測單元103利用已知的技術(shù),例如HOG+SVM或ISM。另外在本示例性實(shí)施方式中,第一檢測單元103檢測人的頭部區(qū)域。但是,本發(fā)明不限于此。經(jīng)過檢測處理獲得的檢測結(jié)果303被輸出至第一估計(jì)單元104。然后,處理推進(jìn)至步驟S104。在步驟S104中,判定是否可以獲得第一檢測結(jié)果。如果沒有檢測結(jié)果(在步驟S104中為“否”),那么處理結(jié)束。如果有檢測結(jié)果(在步驟S104中為“是”),那么處理推進(jìn)至步驟S105。在步驟S105中,第一估計(jì)單元104從第一檢測單元103獲取的檢測結(jié)果303中估計(jì)特定部分區(qū)域。在本示例性實(shí)施方式中,第一估計(jì)單元104估計(jì)頭部區(qū)域作為特定部分。但是在本發(fā)明中,特定部分區(qū)域不限于頭部區(qū)域。第一估計(jì)單元104利用等式(1)估計(jì)檢測結(jié)果303中的頭部區(qū)域304。完成整個(gè)頭部區(qū)域估計(jì)處理后,獲取的頭部區(qū)域304被輸出至層限制單元105和合成單元108。然后,處理推進(jìn)至步驟S106。在步驟S106中,層限制單元105限制這樣的層:在該層上,利用第一估計(jì)單元104估計(jì)的頭部區(qū)域304,第二檢測單元106將對特征量生成單元102生成的特征量執(zhí)行檢測處理。作為限制層的方法,層限制單元105利用等式(2)計(jì)算系數(shù),同時(shí)通過合成第一估計(jì)單元104和第二估計(jì)單元107獲取的結(jié)果設(shè)置最終結(jié)果,作為學(xué)習(xí)數(shù)據(jù),并根據(jù)等式(3)計(jì)算頭部區(qū)域的線性預(yù)測中的層和所述系數(shù)。這樣就有可能確定最適合于第二檢測單元106執(zhí)行檢測處理的層的特征量。如圖5所示,根據(jù)確定的層將被執(zhí)行檢測處理的分層圖像507的特征量和未被執(zhí)行檢測處理的分層圖像509的特征量分離。然后,處理推進(jìn)至步驟S107。在步驟S107中,第二檢測單元106執(zhí)行檢測處理。作為檢測方法,通過滑動(dòng)模型508的窗口在各個(gè)位置處執(zhí)行檢測處理,所述模型508已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。另外,在本示例性實(shí)施方式中,所述模型檢測人的整個(gè)身體,但本發(fā)明不限于人的整個(gè)身體。如圖6所示,經(jīng)過第二檢測單元106的檢測處理后,獲取檢測結(jié)果610-612。檢測結(jié)果610-612被輸出至第二估計(jì)單元107。然后,處理推進(jìn)至步驟S108。在步驟S108中,第二估計(jì)單元107從第二檢測單元106獲取的檢測結(jié)果610-612中的每一個(gè)估計(jì)特定部分。在本示例性實(shí)施方式中,第二估計(jì)單元107估計(jì)頭部區(qū)域作為特定部分,但是本發(fā)明不限于此。作為估計(jì)頭部區(qū)域的方法,第二估計(jì)單元107通過第一估計(jì)單元104利用等式(1)執(zhí)行估計(jì)。如圖6所示,由第二估計(jì)單元107估計(jì)的頭部區(qū)域估計(jì)結(jié)果610-612被獲取。獲取的頭部區(qū)域估計(jì)結(jié)果610-612被輸出至合成單元108。然后,處理推進(jìn)至步驟S109。在步驟S109中,合成單元108將第一估計(jì)單元104估計(jì)的頭部區(qū)域203和第二估計(jì)單元107估計(jì)的頭部區(qū)域620-622合成。作為合成處理方法,合成單元108計(jì)算頭部區(qū)域203和頭部區(qū)域620-622中的每一個(gè)之間的重合度,然后選擇具有最高重合度的合成結(jié)果作為從其中檢測相同目標(biāo)的頭部幀。如圖6所示,頭部區(qū)域203和頭部區(qū)域620具有最高重合度,因此選擇這兩個(gè)檢測幀作為一個(gè)組合,然后檢測結(jié)果610被作為最終檢測結(jié)果輸出。另外,檢測結(jié)果611-612被合成單元108作為虛假檢測處理。然后,整個(gè)處理結(jié)束。圖8展示了本發(fā)明第二示例性實(shí)施方式的物體檢測裝置800的輪廓。如圖8所示,物體檢測裝置800包括圖像獲取單元801、特征量生成單元802、具有多個(gè)檢測模型的第一檢測單元803、第一估計(jì)單元804、層限制單元805、具有多個(gè)檢測模型的第二檢測單元806、第二估計(jì)單元807以及合成單元808。圖像獲取單元801從照相機(jī)或者從預(yù)先捕捉的圖像中獲取圖像901。然后獲取的圖像901被發(fā)送至特征量生成單元802。特征量生成單元802通過以圖10所示的預(yù)定比例尺放大/縮小圖像獲取單元801獲取的圖像901生成分層圖像1002,并為分層圖像1002的每層生成一個(gè)特征量。生成的特征量可以是HOG特征量、類哈爾(Haar-like)特征量或色彩特征量。生成的層特征量被輸入至第一檢測單元803和層限制單元805。第一檢測單元803對特征量執(zhí)行檢測處理。如圖10所示,第一檢測單元803具有多個(gè)人的頭部區(qū)域作為模型,并通過滑動(dòng)每個(gè)模型的窗口在每個(gè)位置處對分層圖像1001的特征量執(zhí)行檢測處理,從而檢測目標(biāo)物體的區(qū)域。在本示例性實(shí)施方式中,第一檢測單元803檢測人的頭部周圍區(qū)域。這里所說的術(shù)語“頭部周圍區(qū)域”用于表示不僅包括人的頭部、甚至還包括肩膀的區(qū)域。檢測目標(biāo)不限于人的頭部周圍區(qū)域,也可以是胳膊、軀干、腿等。利用在第一示例性實(shí)施方式中描述的已知技術(shù)檢測頭部區(qū)域。第一檢測單元803檢測分層圖像1001的特征量中的結(jié)果1104-1106。檢測結(jié)果1104-1106被發(fā)送至第一估計(jì)單元804。第一估計(jì)單元804基于第一檢測單元803獲取的頭部周圍區(qū)域的檢測結(jié)果1104-1106估計(jì)特定部分區(qū)域。在本示例性實(shí)施方式中,第一估計(jì)單元804估計(jì)頭部區(qū)域,但本發(fā)明不限于此。作為估計(jì)頭部區(qū)域的方法,可以利用第一檢測單元803的檢測結(jié)果的位置坐標(biāo)通過以下等式(4)獲得頭部區(qū)域:在等式(4)中,x1和y1代表檢測結(jié)果的左上角的坐標(biāo),x2和y2代表檢測結(jié)果的右下角的坐標(biāo)。在等式(4)中,“A”代表矩陣,所述矩陣是基于中心坐標(biāo)和根濾波器的尺寸將單次檢測結(jié)果中的部分濾波器的左上角的坐標(biāo)和右下角的坐標(biāo)標(biāo)準(zhǔn)化處理后得到的值轉(zhuǎn)換而來的。另外,“Pm”代表從學(xué)習(xí)中獲取的系數(shù)組成的矢量(“m”代表模型的序號)。此時(shí),每個(gè)模型的“Pm”的參數(shù)是這樣計(jì)算出來的:對具有作為正確答案的頭部幀以及作為一組的第二檢測單元806的一幀的學(xué)習(xí)數(shù)據(jù)執(zhí)行最小平方法。如圖11所示,頭部區(qū)域的估計(jì)結(jié)果1114-1116被從頭部區(qū)域的檢測結(jié)果1104-1106中評估出來。頭部區(qū)域的估計(jì)結(jié)果1114-1116被輸出至層限制單元805和合成單元808。層限制單元805確定這樣的層:在該層上,根據(jù)第一估計(jì)單元804估計(jì)的頭部幀1114-1116,第二檢測單元806將對分層圖像1002的特征量執(zhí)行檢測處理。圖12展示了從合成單元808輸出的關(guān)于學(xué)習(xí)數(shù)據(jù)的最終檢測結(jié)果的分布情況,每個(gè)分布圖代表當(dāng)時(shí)的頭部區(qū)域的尺寸以及對應(yīng)于檢測到從第二檢測單元806輸出結(jié)果的特征量的層。分布圖1201代表處于直立位置的人的整個(gè)身體。分布圖1202代表處于前傾位置的人的整個(gè)身體。分布圖1203代表處于蹲坐位置的人的整個(gè)身體。如果有不同于上述方式的姿勢,不同的層適合于從頭部區(qū)域的尺寸中估計(jì)。因此,對于每個(gè)模型而言,都用最小平方法獲得系數(shù),所述系數(shù)可根據(jù)等式(5)計(jì)算出:在等式(5)中,“Am”代表通過求每個(gè)模型的學(xué)習(xí)數(shù)據(jù)中的頭部幀的尺寸的對數(shù)得到的結(jié)果組成的矩陣,“Bm”代表由第二檢測單元806對每個(gè)模型的檢測結(jié)果中的層組成的矩陣。利用計(jì)算出的系數(shù),根據(jù)等式(6)計(jì)算出會(huì)被執(zhí)行檢測處理的層。層m=coeff1m*log(寬度)+coeff2m*log(高度)+coeff3m(6)通過計(jì)算該頭部區(qū)域的系數(shù)的加權(quán)和,判定最適合將由第二檢測單元806執(zhí)行的檢測處理的層是有可能的。如圖13所示,根據(jù)確定的層1307,將被執(zhí)行檢測處理的層1307和未被執(zhí)行檢測處理的層1308分離。取決于特征量生成單元802和層限制單元805,第二檢測單元806僅對被限制的分層圖像1307執(zhí)行檢測處理。如圖13所示,作為檢測處理方法,通過滑動(dòng)每個(gè)模型1309的窗口在各個(gè)位置處執(zhí)行檢測處理,所述模型1309已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。在本示例性實(shí)施方式中,所述模型檢測人的整個(gè)身體,但是本發(fā)明不限于此。另外,在本示例性實(shí)施方式中,例如,第二檢測單元806利用某個(gè)模型檢測處于直立位置的人,而利用另一個(gè)模型檢測處于蹲坐位置的人。利用這種方式,第二檢測單元806可以利用不同的模型檢測姿勢改變的人的身體。如圖14所示,通過檢測處理,具有不同姿勢的人的整個(gè)身體的檢測結(jié)果1410-1415被獲取。獲取的檢測結(jié)果1410-1415被輸出至第二估計(jì)單元807。第二估計(jì)單元807從第二檢測單元806獲取的檢測結(jié)果1410-1415中估計(jì)特定部分區(qū)域。在本示例性實(shí)施方式中,第二估計(jì)單元807估計(jì)頭部區(qū)域,但是本發(fā)明不限于此。更不用說,由第二估計(jì)單元807估計(jì)的特定部分區(qū)域也不限于頭部區(qū)域,也可以和第一估計(jì)單元804估計(jì)的區(qū)域相同。這是因?yàn)楹铣蓡卧?08(下文描述)將第一估計(jì)單元804估計(jì)的區(qū)域和第二估計(jì)單元807估計(jì)的區(qū)域合成。作為估計(jì)方法,第二估計(jì)單元807利用等式(4)估計(jì)每個(gè)模型的頭部區(qū)域,等式(4)也被第一估計(jì)單元804使用。然后,獲取的頭部幀1420-1425被輸出至合成單元808。合成單元808以與第一示例性實(shí)施方式相似的方式將第一估計(jì)單元804的頭部區(qū)域1114-1116和第二估計(jì)單元807的頭部區(qū)域1420-1425合成。最后,在本示例性實(shí)施方式中,區(qū)域1410、1411、1412被作為最終檢測結(jié)果輸出。本示例性實(shí)施方式的配置就是這樣。圖15展示了本發(fā)明的第三示例性實(shí)施方式的物體檢測裝置1500的輪廓。如圖15所示,物體檢測裝置1500包括以下單元:圖像獲取單元801、特征量生成單元802、具有多個(gè)檢測模型的第一檢測單元803、第一估計(jì)單元804、層/范圍限制單元1505、具有多個(gè)檢測模型的第二檢測單元1506、第二估計(jì)單元807以及合成單元808。在本示例性實(shí)施方式中,在層/范圍限制單元1505限制層以及第二檢測單元1506將利用的各模型的檢測處理范圍以后,第二檢測單元1506根據(jù)所述限制執(zhí)行檢測處理。層/范圍限制單元1505判定分層圖像的特征量,在所述分層圖像上,基于從第一估計(jì)單元804獲取的頭部區(qū)域的估計(jì)尺寸和位置,對各模型執(zhí)行檢測處理。首先,層/范圍限制單元1505利用等式(6)計(jì)算層,以便計(jì)算處于直立位置的人的分層圖像1601。然后,層/范圍限制單元1505判定從頭部估計(jì)區(qū)域位置1602起的檢測處理范圍1604,以及判定模型1603的濾波器尺寸,從而允許徹底檢索包括以頭部估計(jì)區(qū)域位置1602為中心的、頭部估計(jì)區(qū)域位置1602的上、下、右、左方的模型1603的濾波器的范圍。此時(shí),檢測處理范圍1604可以作為一個(gè)區(qū)域存儲(chǔ)在存儲(chǔ)器中,或者作為地圖保存,在該地圖中檢測處理范圍1604的內(nèi)部被標(biāo)示出來。第二檢測單元1506僅利用對應(yīng)于判定的檢測處理范圍1604的模型執(zhí)行檢測處理。類似地,對于處于蹲坐位置的人,層/范圍限制單元1505關(guān)注于分層圖像1605的特征量,并判定從頭部區(qū)域1606的位置起的檢測處理范圍1608,以及判定模型1607的尺寸。對于處于前傾位置的人,層/范圍限制單元1505也關(guān)注于分層圖像1609的特征量,并判定從頭部區(qū)域1610的位置起的檢測處理范圍1612,以及判定模型1611的尺寸。根據(jù)上述配置,可以加快整個(gè)檢測處理。上文已描述了示例性實(shí)施方式的各種情況,作為第一至第三實(shí)施方式,但這是僅僅是下述配置的例子而已?;谙率雠渲玫钠渌麑?shí)施方式也在本發(fā)明的范圍內(nèi)。首先,獲取包括目標(biāo)物體的圖像(圖像獲取步驟)。然后,以多個(gè)不同的放大率放大/縮小所述圖像,以生成分層圖像(分層圖像生成步驟)。然后,基于所述分層圖像檢測目標(biāo)物體的至少一部分區(qū)域(第一檢測步驟)。然后,基于在第一檢測步驟中檢測的第一檢測區(qū)域估計(jì)第一特定部分區(qū)域(第一估計(jì)步驟)。然后,基于第一特定部分區(qū)域和預(yù)先學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù)限制分層圖像的層(層限制步驟)。然后,在層限制步驟中被限制的層的分層圖像中檢測目標(biāo)物體的至少一部分區(qū)域(第二檢測步驟)。然后,基于在第二檢測步驟中檢測的第二檢測區(qū)域估計(jì)第二特定部分區(qū)域(第二估計(jì)步驟)。然后,將在第一估計(jì)步驟中估計(jì)的估計(jì)結(jié)果和在第二估計(jì)步驟中估計(jì)的估計(jì)結(jié)果合成,以確定合成結(jié)果,作為目標(biāo)物體的特定部分區(qū)域(合成步驟)。雖然上文已詳細(xì)描述了多個(gè)示例性實(shí)施方式,但是本發(fā)明也可通過以下列形式實(shí)施,例如系統(tǒng)、裝置、方法、程序或存儲(chǔ)介質(zhì)。特別地,本發(fā)明可以應(yīng)用在由多個(gè)裝置組成的系統(tǒng)中或由單個(gè)設(shè)備組成的裝置中。本發(fā)明的各方面還可以通過系統(tǒng)或裝置的、用于讀出并執(zhí)行記錄在存儲(chǔ)介質(zhì)(例如,非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì))上的計(jì)算機(jī)可執(zhí)行指令以完成本發(fā)明中一個(gè)或多個(gè)實(shí)施方式功能的計(jì)算機(jī)來實(shí)現(xiàn);所述發(fā)明的各方面也可以通過方法來實(shí)現(xiàn),該方法的各步驟由系統(tǒng)或裝置的計(jì)算機(jī)、通過如從存儲(chǔ)介質(zhì)讀出并執(zhí)行計(jì)算機(jī)可執(zhí)行指令以完成本發(fā)明一個(gè)或多個(gè)實(shí)施方式功能來執(zhí)行。計(jì)算機(jī)可以包括中央處理單元(CPU)、微處理單元(MPU)及其他電路中的一個(gè)或多個(gè),也可以包括獨(dú)立計(jì)算機(jī)網(wǎng)絡(luò)或獨(dú)立計(jì)算機(jī)處理器網(wǎng)絡(luò)。計(jì)算機(jī)可執(zhí)行指令可以從例如網(wǎng)絡(luò)或存儲(chǔ)介質(zhì)提供給計(jì)算機(jī)。存儲(chǔ)介質(zhì)可以包括例如硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)及分布式計(jì)算系統(tǒng)存儲(chǔ)器、光盤(例如激光唱片(CD)、數(shù)字化通用光盤(DVD)或藍(lán)光光盤(BD)TM)、閃存裝置、存儲(chǔ)卡等中的一個(gè)或多個(gè)。雖然已經(jīng)結(jié)合示例性實(shí)施方式描述了本發(fā)明,應(yīng)當(dāng)認(rèn)識到,本發(fā)明并不局限于公開的示例性實(shí)施方式。下列權(quán)利要求的范圍應(yīng)當(dāng)適合最廣泛的解釋,以便囊括所有改動(dòng)、等同結(jié)構(gòu)和功能。