用于檢測場景中的感興趣的對象的系統的制作方法
【專利說明】
[0001] 政府權利
[0002] 本發明是在美國政府的REF ASPS項目(合同號為154318)下由政府支持做出的。 政府對本發明具有特定權利。
[0003] 相關申請的交叉參考
[0004] 這是于 2013 年 6 月 4 日提交的標題為 "A device for detecting pedestrians in an outdoor scene utilizing an 'Any Attention'mechanism',的美國臨時申請 No. 61/830896的非臨時專利申請。
[0005] 本發明的背景 (1)
技術領域
[0006] 本發明涉及一種檢測系統,并且更具體地,涉及一種用于在場景的圖像中檢測特 定對象的系統。 (2)
【背景技術】
[0007] 視頻系統和其它場景監測系統通常用于在特定場景中檢測和識別對象。對象識別 接收輸入圖像并輸出圖像類別,然而對象檢測(也稱為對象定位)接收輸入圖像并且輸出 在圖像中的檢測到特定對象類別的位置。例如,安全系統理想地檢測人或物體在特定視場 內的存在,并且通知相關人員該入侵。然而,如果動物(例如鹿)進入安全區域,則通知警 報將被視為假警報。如可以想到的,假警報(或誤報)趨向于使用戶不敏感并且基本上使 安全系統貶值。因此,希望具有一種可以提供快速和有效的對象檢測的系統。現有系統趨 向于在對象檢測時具有一定程度的誤差,如上所述,該誤差使對象檢測系統貶值。因此,一 直需要一種用于有效地檢測場景中的感興趣的對象的系統。
【發明內容】
[0008] 描述了一種用于檢測場景中的感興趣的對象的系統。該系統包括存儲器和一個或 更多個處理器。在存儲器上編碼有可執行指令,使得當執行指令時,所述一個或更多個處理 器執行如本文中列出的操作。例如,系統接收場景的圖像幀,并且從該圖像幀提取特征,這 些特征為描述符。描述符被量化以產生視覺詞(PH0W)特征的金字塔直方圖。實現滑動窗 口協議,以使窗口在圖像上滑動并且分析落入窗口內的PH0W特征。然后,該系統確定PH0W 特征是否表示感興趣的對象,并且如果是的話,則將窗口指定為檢測到的感興趣的對象在 圖像中的位置。
[0009] 確定PH0W特征是否表示感興趣的對象要求多個操作,諸如,將窗口細分為一組網 格(bin)。在每個網格中編譯PH0W特征的直方圖,直方圖表示在每個網格中發現的PH0W 特征的計數。通過卡方同質內核變換(Chi-Square homogeneous kernel transform)來 變換直方圖。然后,將變換后的直方圖饋送到支持向量機(SVM)分類器,以針對每個特征 生成SVM分數,該SVM分數表示圖像中的對象與目標對象的相似度。利用正切S型曲線 (sigmoid)壓縮(squash) SVM分數,使得SVM分數的范圍在-1. 0至1. 0。然后,SMV分數被 收集到分數列表中。使用非極大值抑制縮減分數列表,以生成縮減的分數列表。最后,閾值 被應用至縮減的分數列表,以消除低于預定閾值的任何分數并且生成對象分數,該對象分 數表示場景中的特定對象是感興趣的對象的可能性。
[0010] 在另一方面,被提取的特征是密集尺度不變特征變換(SIFT)描述符(DSIFT)。
[0011] 在又一方面,在提取特征時,以三個獨立尺度提取特征。
[0012] 在另一方面,量化描述符以生成PH0W特征還包括以下操作:針對每個描述符執行 KD-樹查詢以識別與描述符最相似的學習的特征,所識別的特征為PH0W特征。
[0013] 此外,在實現滑動窗口協議時,圖像幀被劃分成多個條帶,使得每個條帶內均是在 圖像幀中的該位置處能夠運行的窗口。
[0014] 此外,該系統實現顯著性掩碼,以確定所述圖像幀中的用于利用所述滑動窗口協 議進行處理的關注區域和所述圖像幀中的將被所述滑動窗口協議忽略的區域。
[0015] 最后,如上所述,本發明還包括計算機程序產品和計算機實現方法。計算機程序產 品包括存儲在非暫時性計算機可讀介質上的可由具有一個或更多個處理器的計算機執行 的計算機可讀指令,使得當執行指令時,所述一個或多個處理器執行本文中列出的操作。另 選地,該計算機實現方法包括以下動作:使計算機執行這種指令并且執行所產生的操作。
【附圖說明】
[0016] 本發明的目標、特征和優點將從結合參考以下附圖的本發明的多個方面的以下詳 細描述變得明顯,其中:
[0017] 圖1是示出根據本發明的原理的系統的組件的框圖;
[0018] 圖2是具體實現根據本發明的原理的一方面的計算機程序產品的圖解;
[0019] 圖3是示出當在自然場景中檢測到兩個人時的檢測器系統的圖像;
[0020] 圖4是示出根據本發明的原理的檢測器系統的處理流程的框圖;
[0021] 圖5是示出根據本發明的原理的同質內核變換的處理流程的框圖;
[0022] 圖6是示出根據本發明的原理的多線程處理的圖解;
[0023] 圖7是針對根據本發明的原理的多線程化的DSIFT組件的框圖;
[0024] 圖8是針對根據本發明的原理的多線程化的描述符量化組件的框圖;
[0025] 圖9是針對根據本發明的原理的多線程滑動窗口組件的框圖;以及
[0026] 圖10是示出具有顯著性掩碼的關注模型的圖解。
【具體實施方式】
[0027] 本發明涉及一種檢測系統,并且更具體地,涉及一種用于在場景的圖像中檢測特 定對象的系統。提供以下描述以使本領域普通技術人員能夠制造和使用本發明并且將其結 合到特定應用的上下文中。各種修改以及在不同應用中的各種使用對于本領域技術人員將 是顯而易見的,并且在此定義的一般原理可以被應用至大范圍的實施方式。因此,本發明不 旨在限于所提供的實施方式,而是旨在將符合與本文中公開的原理和新特征一致的最廣范 圍。
[0028] 在以下詳細描述中,闡述大量具體細節以便提供對本發明的更徹底理解。然而,對 于本領域技術人員而言明顯的是,本發明可以被實踐,而不用必須限制于這些具體細節。在 其它實例中,以框圖形式而不是詳細地示出公知結構和設備,以便避免使本發明模糊。
[0029] 讀者的注意力在于與本說明書同時提交并且與本說明書一起公開供公眾檢驗的 所有論文和文件,并且所有這樣的論文和文件的內容在此通過參考被結合。在本說明書中 公開的所有特征(包括任何所附權利要求、摘要和附圖)都可以由用于相同、等效或類似目 的的可選特征來代替,除非另外明確說明。因此,除非明確說明,否則所公開的每個特征僅 是一系列等效或類似特征的一個示例。
[0030] 此外,在不明確說明用于執行特定功能的"裝置"或用于執行特定功能的"步驟"的 權利要求中的任何元件都不被解釋為如在35U. S. C.部分112的第6段中規定的"裝置"或 "步驟"條款。具體地,在權利要求中的"步驟"或"動作"的使用在本文中不旨在援引35U. S.C. 112的第6段的規定。
[0031] 在詳細描述本發明之前,提供了本發明的多個主要方面的描述。接著,介紹給讀者 提供對本發明的一般理解。最后,提供本發明的具體細節以給出特定方面的理解。
[0032] (1)主要方面
[0033] 本發明具有三個"主要"方面。第一方面是用于在場景中檢測感興趣的對象(例 如,行人)的系統。該系統通常為計算機系統操作軟件的形式或為"硬編碼"指令集的形式。 該系統可以被結合到提供不同功能的廣泛多種設備中。第二個主要方面是通常為軟件形式 的使用數據處理系統(計算機)操作的方法。第三個主要方面是計算機程序產品。該計算 機程序產品通常表示存儲在非暫時性計算機可讀介質(諸如,光存儲設備(例如,光盤(CD) 或數字多功能光盤(DVD))、或磁存儲設備(諸如,軟盤或磁帶))中的計算機可讀指令。另 外,計算機可讀介質的非限制性示例包括硬盤、只讀存儲器(ROM)、以及閃存型存儲器。這些 方面將在下面更詳細地描述。
[0034] 在圖1中提供示出本發明的系統(即,計算機系統100)的示例的框圖。計算機系 統100被配置成執行計算、處理、操作和/或與程序或算法相關聯的功能。在一方面,本文 中論述的特定處理和步驟被實現為駐留在計算機可讀存儲器單元內并且由計算機系統100 的一個或更多個處理器執行的一系列指令(例如,軟件程序)。當被執行時,所述指令使得 計算機系統1〇〇執行特定動作,并且表現出特定行為,如本文中所述的。
[0035] 計算機系統100可以包括被配置成傳輸信息的地址/數據總線102。此外,一個或 更多個數據處理單元(諸如,處理器1〇4(或處理器))與