專利名稱:基于分布式和svm分類器的室外海量物體識別方法和系統的制作方法
技術領域:
本發明屬于移動增強現實技術領域,具體涉及一種基于分布式處理和SVM分類器的室外海量物體識別方法和系統。
背景技術:
在近幾年,將圖像內容表示為特定“視覺單詞”出現次數直方圖的Bag-of-words模型,展示了其在圖像內容分類方面的強大優勢,在通過SVM分類器進行學習,能實現高精度的圖像識別。物體識別的本質就是建立一個能夠識別出圖像中感興趣物體類別的計算系統,在現實生活中有著廣泛的應用需求,具有相當高的應用價值和研究意義。隨著互聯網的發展,人類正在步入一個信息化的社會,互聯網已經成為人類發布、獲取、交換信息的重要平臺。互聯網上信息量的指數級增長,使得如何讓用戶能夠快速準確地在海量的數據中找到其所需信息成為了一個重要的課題。近些年來,隨著數字攝影和存儲設備的進步和普及,室外的圖像數量在互聯網上的飛速增長,也已經達到成千上萬了。如 何有效的利用這些數據信息,給當前處于相同位置的用戶提供這些已有的信息,是商業界和學術界的一個重要研究方向。然而,隨著圖像庫規模的極大增長,要保證圖像搜索的實時性,相應的數據庫索引技術和圖像檢索技術也必須做相應的調整或加速。同時計算機軟、硬件技術的迅猛發展,為增強現實技術走出室內應用進而支持復雜的分析、決策和管理打下了堅實的基礎。一些移動終端設備(像PDA、智能手機等)的功能也越來越豐富,并且擁有了嵌入式操作系統、觸摸屏、GPS定位、視頻攝像頭等功能,同時也具備了較強的計算和處理能力。這些功能的集成為開發基于移動終端的增強現實系統奠定了基礎。據有關資料,截止到2010年我國移動電話用戶可達7. 4億,其中擁有智能手機的用戶占了相當的比重,智能手機作為增強現實的應用平臺將具有很大的應用潛力。3G網的逐步開通、運行,意味著移動增值業務全新時代的開始,增強現實技術和LBS相結合可以實現信息的實時交互、三維動態顯示,可使人機界面更加友好和具有智能性。基于上述分析,結合具有攝像頭的終端以及基于視覺單詞的圖像識別技術,可以將海量物體的在線識別變為可能,而且結合分布式處理技術可以大大縮短在線識別時間。
發明內容
有鑒于此,本發明提供一種基于分布式處理和SVM分類器的室外海量物體識別方案,該方案將分布式處理技術與計算機視覺技術相結合使智能終端具備大規模圖像的識別功能,實現智能終端的大規模圖像識別和檢索,進而實現移動增強現實的多種應用。而且,本發明利用GPS信息縮小數據匹配范圍,減少了數據運算量,從而進一步提高了圖像識別和檢索的速度,實現了在線實時的室外海量物體識別。該方案是這樣實現的一種基于分布式處理和SVM分類器的室外海量物體識別方法,該方法包括將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述的識別方法包括如下步驟步驟I :終端采集當前場景的待識別圖像以及GPS信息;
步驟2 :提取所述待識別圖像的局部特征,并轉化為描述符特征向量;步驟3 :將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給分布式處理系統;步驟4:分布式處理系統中設有調度處理集群、多個計算節點和所述樣本文件系統;調度處理集群接收到所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點,然后執行步驟6 ;否則,執行步驟5;所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務;步驟5 :調度處理集群為匹配任務A加載相關的詞典和SVM分類器以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點;步驟6 :每個計算節點從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群;步驟7 :調度處理集群統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。當所述區域的劃分為將室外建筑整體區劃分為互不重疊的多個小區域,每4個上下左右相鄰的小區域構成一個所述區域時,步驟5中,所述根據區域位置從樣本文件系統中篩選出與該圓形相交的區域為僅篩選出包含所述圓形的區域。本發明還提供了一種基于分布式處理和SVM分類器的室外海量物體識別系統,其特征在于,包括分布式處理系統、無線網絡和具有圖像采集和GPS定位功能的終端;分布式處理系統包括交換設備、調度處理集群、樣本文件系統和至少2個計算節點;調度處理集群通過交換設備接入無線網絡,并且與樣本文件系統、所有的計算節點連接;樣本文件系統,用于存儲詞典和SVM分類器;存儲方式為將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述終端,用于采集當前場景的待識別圖像以及GPS信息,提取所述待識別圖像 的局部特征,并轉換為描述符特征向量;將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給調度處理集群;調度處理集群,用于在接收到來自終端的所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點;否則,為匹配任務A加載相關的詞典和SVM分類器;所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務;所述為匹配任務A加載相關的詞典和SVM分類器為以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點;計算節點,用于從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群;調度處理集群進一步用于,統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。有益效果本發明基于分布式系統和SVM分類器的海量物體識別方法,使用成熟的分布式架構,實現基于視覺的增強現實,能夠使用智能設備實時獲取當前場景的視頻幀,通過對視頻幀圖像的提取局部特征,再用Bag ofword模型進行直方圖計算和SVM分類器進行分類,實時準確地找出當前場景屬于的樣本場景的哪一類,進而提供進一步的附加信息,擴展了智能終端的交互式應用,滿足了旅游、導航、交通、酒店服務等在智能終端上的擴展應用,使網絡運營商和內容提供商能夠利用其豐富的服務器資源和優越的服務器性能發展其業務。本發明在為當前任務加載詞典和分類器時,根據GPS信息判斷是否已經由類似或相同的任務,如果有,不需要再次加載,直接采用已經加載的詞典和分類器即可,節省了加載數據的時間。而且在記載詞典和分類器時,根據GPS信息只加載一定范圍內的詞典和分類器,這樣可以進一步縮小運算量。此外,重疊的分區方法可以減少載入計算節點的詞典和SVM分類器。
圖I示出了本發明的物體基于bag ofwords表示模型的視覺直方圖;圖2示出了本發明的分布式系統與SVM分類器的海量物體識別原理圖;圖3(a)示出了本發明對城市區域劃分的一種方式;
圖3(b)示出了本發明對城市區域劃分的另一種方式;圖4(a)和圖4(b)分別為本發明SVM分類器結構化存儲示意圖與非結構化存儲示意圖;圖5(a)和圖5(b)分別為本發明區域詞典結構化存儲示意圖與非結構化存儲示意圖;圖6為本發明識別系統的結構組成示意圖。
具體實施例方式下面將結合附圖對本發明的物體識別分析方法做詳細描述。首先介紹一下Bag of Words算法,也稱詞袋算法,其認為一幅圖像由若干個識別單詞組成,提取圖片中的若干描述符,經例如k-means的聚類算法對描述符進行聚類,便可以得到每個類別的聚類中心,每個聚類中心為一個單詞,所有聚類中心便成為詞典(視覺詞匯表)。根據單詞與詞典的關系生成一幅圖片的視覺單詞直方圖,如圖I所示,可以有效地實現物體的識別分類。圖2示出了本發明的基于分布式系統和暴力匹配的增強現實(AR)物體識別方法的原理圖。如圖2所示,實現該方法的系統包括分布式處理系統、無線網絡、具有圖像采集和GPS定位功能的終端。終端和分布式處理系統通過無線網絡互通。分布式處理系統具體包括交換設備(網關)、調度處理集群(Master)、多個計算節點和樣本文件系統。調度處理集群通過網關接入無線網絡,并且與樣本文件系統、所有的計算節點連接。首先,預先進行室外區域的劃分與樣本數據訓練。其中,對城市的室外建筑區域進行區域劃分的方式有兩種方式一、沒有重疊的區域劃分參見圖3 (a),將室外建筑區域劃分為互不重疊的多個區域,每個區域的長M為10公里,寬N也為10公里,那么一面積I萬平方公里的城市也頂多被劃分成100個區域。方式二、有重疊的區域劃分參見圖3(b),先將室外建筑區域劃分為互不重疊的小區域,每4個上下左右相鄰的小區域構成一個區域,從而獲得相互重疊的多個區域,完成了區域劃分。設,每個小區域的長M和寬N各為10千米,那么,一面積I萬平方公里的城市也頂多被劃分成81個區域。樣本數據訓練
針對每個區域,選取多個場景,為每個場景采集多幅圖像,圖像可以從實地拍攝,也可以從網絡中獲得;每幅圖像提取特征點并轉化為描述符,利用諸如k-means的聚類算法對一個區域內所有場景的所有描述符進行聚類,得到每個類別的聚類中心,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典,每個區域采用區域中心的GPS和四個角的GPS表示區域位置,那么每個詞典對應一組區域位置信息,從而得到了帶區域位置信息的詞典。以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器。最終,在樣本文件系統中存儲如下信息(I)各區域的帶區域位置信息的詞典;(2)每個區域中各場景的SVM分類器;存儲時,區域位置(5個GPS表示)、SVM分類器和場景信息對應存儲。
(3)當然樣本圖像也可以存儲在樣本文件系統中,存儲時,分區域存儲。基于上述系統和樣本訓練結果,識別的具體流程如下步驟I、用戶打開終端的拍攝設備,終端采集當前場景的待識別圖像;再調用終端的GPS傳感器接口,獲取當前位置的GPS信息。步驟2 :為了降低運算量,終端對采集到的待識別圖像進行降采樣處理(即降低分辨率),以降低圖像分辨率;然后再采用局部特征檢測算法(SIFT、SURF或0RB)進行特征點檢測,以提取所述場景圖像的局部特征,再用特征向量的形式表現,稱為描述符特征向量。一幅圖像可能有上百個描述符特征向量。步驟3 :將待識別圖像的GPS信息以及全部描述符特征向量以及特征向量個數打包成一個描述符文件,GPS信息和特征向量個數放在文件的開頭,特征向量個數便于接收端判斷一個描述符文件是否接收完畢。然后將描述符文件通過無線網絡發送給分布式處理系統。步驟4:分布式處理系統中的調度處理集群通過網關接收到描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點,然后執行步驟6 ;否則,執行步驟5 ;其中,所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務。當前正在處理的匹配任務可以緩存在一個調度列表中以便查詢。步驟5 :調度處理集群為匹配任務A加載相關的詞典和SVM分類器調度處理集群以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器以區域為單位分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點;其中篩選范圍可以為10米、20米、30米、40米或50米,根據區域大小確定,本實施例中選擇50米。
當按無重疊的區域劃分時,所述與圓形相交的區域包括“包含”和“相交”,即只要是與圓形有交點,就將該區域確定為與圓形相交。如果是包含只載入包含區域的一個詞典;如果是相交可能有多個相交區域的詞典載入。為了避免過多的詞典載入,在區域劃分時,最好采用正方形區域,且令四個區域構成的大正方形的邊長大于圓形的直徑,這樣保證相交時不會超過4個詞典載入。 當按有重疊的區域劃分時,如區域采用正方形區域且四個區域構成的大正方形的邊長大于圓形的直徑,則圓形必然包含于一個區域內部,那么只用進行區域包含判定,總能找到包含該圓域的區域,將該區域的詞典和分類器載入計算節點。在實際軟件計算時,為了方便計算,采用以所述圓形的直徑為邊的正方形代替圓形進行判定;當正方形存在部分角坐標點在區域包圍的范圍里面時,則判定該區域與圓形 相交;而當正方形的四個角坐標點都在同一區域包圍的范圍里面時,則判定該區域與圓形相交,且圓形完全包含于該區域內。計算公式如下設區域A 的四點的 GPS 信息為(xl,yl)、(xl+1000, yl)、(xl, yl+1000)、(xl+1000, yl+1000);查詢圖像的GPS位置信息為(cl,dl),則正方形區域為(cl-50, dl-50)、(cl+50, dl-50)、(cl-50, dl+50)、(cl+50, dl+50)。區域包含判定如公式(I)(xl ( cl-50, cl+50 ( xl+1000) Π (yl ( cl-50, cl+50 ( yl+1000) (I)區域相交判定如公式(2)[(xl 彡 cl-50 彡xl+1000) Π (yl ^ dl ^yl+1000)] U [(xl 彡 cl+50 彡xl+1000) Π (yl^dl^0^yl+1000)] U [(xl^cl^0^xl+1000) Π (yl彡dl切彡yl+1000)] U [(xl^cl^O^xl+lOOO) Π (yl彡dl+50 ( yl+1000)]步驟6 :每個計算節點從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,常分類器通過輸出分值,代表查詢圖像與分類器代表的場景的相似程度,分數越高代表相似程度越高,找出分數最高的SVM分類器;針對每個區域都執行上述統計直方圖向量求取和SVM分類器打分的操作,將各區域的匹配結果匯總到調度處理集群;步驟7 :調度處理集群統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息,該場景信息就是當前匹配任務的匹配結果。此后,終端可以顯示上述識別結果,用戶可以點擊上述分類結果,查看詳細信息。在分布式系統里面,除各個計算單元之間進行分布式計算意外,計算單元里面還可以進行并行計算。實驗測試了 1000個場景對應1000個分類器,I個詞典包含5000個詞匯,在四核的CPU2. 8G,內存為8G的機器上,圖像分辨率為320 X 240,計算直方圖向量,消耗時間為26ms左右,1000個分類器分類時間為IS。在上述流程中,涉及智能終端拍攝視頻圖像,處理并顯示來自網絡端的分布式系統服務器發送的返回結果,這些步驟在目前的智能終端上均已經廣泛實施,這些已有實施方式均可用于本發明,且本發明的視頻圖像拍攝、處理并顯示來自網絡服務器端的數據不限于現有的方式。在實際中,樣本文件系統中的詞典和SVM分類器可以采用結構化或非結構化方式存儲。 結構化存儲以記錄的方式來存儲,如圖4 Ca)所示,對于SVM分類器來說,一條記錄對應一個SVM分類器;每條記錄格式相同,包含索引ID、場景ID、CPS信息(就是5個GPS組成的區域位置)、分類器序號和SVM分類器。如圖5 (a)所示,對于詞典來說,一條記錄對應一個單詞;每條記錄格式相同,包含索引ID、區域ID、區域中心點GPS信息、區域四個角點GPS信息、單詞序號和單詞內容。對于結構化存儲,較佳的加載方式為根據索引進行快速加載,因此在每條記錄中增加了索引ID,其中索引ID的構建方式是常規技術手段,在識別前的準備階段,在樣本文 件系統中存儲索引表,該索引表記載了區域位置與記錄存儲位置的索引關系。在識別過程中,可以采用已有的數據庫技術進行快速讀取記錄并加載到計算節點中,速度較快。 非結構化存儲以文件塊的方式來存儲如圖4 (b)所示,對于SVM分類器來說,一個區域對應一個文件塊,文件塊中記載了該區域的區域位置、場景數量、每個場景的場景ID、每個場景的SVM分類器數量,以及每個SVM分類器內容。如圖5 (b)所示,對于詞典來說,可以用一個文件塊來存儲所有詞典,那么該文件塊記載了區域數量,每個區域的序號,區域中心GPS信息、四個角點GPS信息,每個區域對應詞典的單詞個數,單詞內容。非結構化存儲雖然不能建立記錄的索引,但是可以建立文件塊的索引,因此其也可以通過文件索引快速載入詞典和分類器到運算節點。由以上描述可見,本發明系統中各模塊的功能總結如下樣本文件系統,用于存儲詞典和SVM分類器;存儲方式為將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中;以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中;所述終端,用于采集當前場景的待識別圖像以及GPS信息,提取所述待識別圖像的局部特征,并轉換為描述符特征向量;將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給調度處理集群;調度處理集群,用于在接收到所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,按照前述查詢標準查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點;否則,為匹配任務A加載相關的詞典和SVM分類器;其中,為匹配任務A即待識別圖像加載相關的詞典和SVM分類器的具體方式與方法流程中的描述相同,這里不贅述。計算節點,用于從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群;調度處理集群進一 步用于,統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。優選地,終端在提取所述待識別圖像的局部特征之前,進一步對所述待識別圖像進行降采樣處理,以降低圖像分辨率。綜上所述,以上僅為本發明的較佳實施例而已,并非用于限定本發明的保護范圍。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
權利要求
1.一種基于分布式處理和SVM分類器的室外海量物體識別方法,其特征在于,該方法包括 將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中; 以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中; 所述的識別方法包括如下步驟 步驟I :終端采集當前場景的待識別圖像以及GPS信息; 步驟2 :提取所述待識別圖像的局部特征,并轉化為描述符特征向量; 步驟3 :將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給分布式處理系統; 步驟4 :分布式處理系統中設有調度處理集群、多個計算節點和所述樣本文件系統;調度處理集群接收到所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點,然后執行步驟6 ;否則,執行步驟5 ; 所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務;步驟5 :調度處理集群為匹配任務A加載相關的詞典和SVM分類器 以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點; 步驟6 :每個計算節點從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器; 將各區域的匹配結果匯總到調度處理集群; 步驟7 :調度處理集群統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。
2.如權利要求I所述的方法,其特征在于,所述區域的劃分為將室外建筑整體區劃分為互不重疊的多個小區域,每4個上下左右相鄰的小區域構成一個所述區域; 步驟5中,所述根據區域位置從樣本文件系統中篩選出與該圓形相交的區域為篩選出包含所述圓形的區域。
3.如權利要求1或2所述的方法,其特征在于,在步驟5中判斷圓形與區域的相交關系時,判斷方式為 采用以所述圓形的直徑為邊的正方形代替圓形進行判定; 當正方形存在部分角坐標點在區域包圍的范圍里面時,則判定該區域與圓形相交,但圓形至少同時與2個區域相交; 當正方形的四個角坐標點都在同一區域包圍的范圍里面時,則判定該區域與圓形相交,且圓形完全包含于該區域內。
4.如權利要求1所述的方法,其特征在于,步驟2中,在提取所述待識別圖像的局部特征之前,進一步對所述待識別圖像進行降采樣處理,以降低圖像分辨率。
5.一種基于分布式處理和SVM分類器的室外海量物體識別系統,其特征在于,包括分布式處理系統、無線網絡和具有圖像采集和GPS定位功能的終端;分布式處理系統包括交換設備、調度處理集群、樣本文件系統和至少2個計算節點;調度處理集群通過交換設備接入無線網絡,并且與樣本文件系統、所有的計算節點連接; 樣本文件系統,用于存儲詞典和SVM分類器;存儲方式為 將室外建筑整體區劃分為多個矩形的區域;針對每個區域,選取多個場景,為每個場景采集多幅圖像,從每幅圖像中提取特征點并轉化為描述符,利用聚類算法對一個區域內所有場景的所有描述符進行聚類,每個聚類中心作為一個單詞,一個區域內的所有單詞形成一個詞典;每個區域采用區域中心處GPS信息和四個角的GPS信息表示區域位置,存儲帶區域位置的詞典到樣本文件系統中; 以區域為單位,對區域內每個場景所有圖像的描述符進行訓練,形成一個支持向量機SVM分類器,一個場景對應一個分類器;將區域位置、SVM分類器和場景信息對應存儲到樣本文件系統中; 所述終端,用于采集當前場景的待識別圖像以及GPS信息,提取所述待識別圖像的局部特征,并轉換為描述符特征向量;將待識別圖像的GPS信息以及描述符特征向量打包成一個描述符文件,發送給調度處理集群; 調度處理集群,用于在接收到來自終端的所述描述符文件后,為所述終端建立一個新的匹配任務A,從該描述符文件中提取GPS信息作為匹配任務A的標識,查詢當前正在處理的匹配任務中是否存在與匹配任務A相同或相似的匹配任務,如果是,說明已經將與待識別圖像相關的詞典和SVM分類器加載到各計算節點中,則將描述符文件發送給每個計算節點;否則,為匹配任務A加載相關的詞典和SVM分類器; 所述相同或相似的匹配任務的查詢標準為如果當前正在處理的匹配任務對應的GPS信息與待識別圖像的GPS信息一致或者相差一個預設閾值,則認為存在相同的匹配任務; 所述為匹配任務A加載相關的詞典和SVM分類器為以待識別圖像的GPS信息為圓心,按照預先設定的篩選半徑確定一個圓形,根據區域位置從樣本文件系統中篩選出與該圓形相交的區域,將篩選出區域的詞典和區域內所有SVM分類器分攤加載到各個計算節點中;同時,調度處理集群還將描述符文件發送給每個計算節點; 計算節點,用于從描述符文件中解析出待匹配描述符特征向量;針對每個區域,利用距離關系查找每個待匹配描述符特征向量在詞典中對應的單詞,并對每個單詞的出現頻率進行統計,得到統計直方圖向量;再將統計直方圖向量輸入該區域對應所有SVM分類器進行打分,找出分數最高的SVM分類器;將各區域的匹配結果匯總到調度處理集群; 調度處理集群進一步用于,統計各個計算節點的匹配結果,選出打分最高的SVM分類器,輸出該SVM分類器對應的場景信息給終端。
6.如權利要求5所述的系統,其特征在于,所述終端進一步用于,在提取所述待識別圖像的局部特征之前,對所述待識別圖像進行降采樣處理。
全文摘要
本發明公開了一種基于分布式處理和SVM分類器的室外海量物體識別方案,該方案預先對城市版圖進行區域劃分,在每個區域中對各場景進行圖像采集,并訓練區域的詞典和場景的SVM分類器;識別時,終端將拍攝的圖像和當前GPS信息打包發送給調度處理集群;調度處理集群根據GPS信息判斷與待識別圖像相關的詞典和分類器是否已經加載到計算節點,如果沒有,再確定加載范圍,將范圍內的詞典和分類器分攤加載到計算節點;計算節點利用詞典得到待識別圖像的統計直方圖向量,再用SVM進行打分;所有計算節點打分最高的SVM對應的場景最后識別結果,反饋給終端。使用本發明能夠實現智能終端的大規模圖像識別和檢索,而且減少了數據運算量,提高了圖像識別和檢索的速度。
文檔編號G06K9/66GK102880879SQ201210292379
公開日2013年1月16日 申請日期2012年8月16日 優先權日2012年8月16日
發明者王涌天, 桂振文, 劉越, 陳靖 申請人:北京理工大學