對貨物進行自動分類識別的透視檢查系統和方法
【技術領域】
[0001]本發明涉及輻射透視成像集裝箱安全檢查系統,具體地,涉及集裝箱大宗貨物自動分析與智能查驗方法、集裝箱大宗貨物的自動分類與識別方法、大宗貨物掃描圖像的語義分割與歸類,并且涉及集裝箱違規夾帶貨物分析、貨物數量估計、稅額計算等智能查驗方法。
【背景技術】
[0002]智能查驗是集裝箱安檢領域發展必然趨勢,而貨物自動分類識別是智能查驗的一項重要核心內容。基于能譜分析的材料識別技術目前有X射線雙能材料識別與中子-X射線技術。雙能技術只能識別有機物、無機物、混合物與重金屬四個類別,分辨的類別比較少,中子-X射線技術能分辨較多類別,但中子發生裝置昂貴,中子射線防護困難,對有機物穿透力差,這些缺陷使其在集裝箱貨物安檢方面應用困難。
[0003]基于圖像分析的掃描圖像貨物自動分類識別技術多年來研究進展緩慢,算法功能還不能滿足客戶實際需求。造成這個問題的原因,一方面是貨物紛繁復雜,難以找到有效的特征與規律進行有效分類;另一方面掃描設備分散,各海關對掃描圖像保密,難以獲得比較全面的圖像數據用于訓練分類器;再另一方面就是基于海量數據分析的圖像分類識別對算法與計算硬件的要求都比較高,給研究工作造成一定的難度。
[0004]現在,對貨物的分類識別進行研究是必要且可行的。一方面,業界和學界也認識到了智能查驗面對的問題,比如歐盟FP7計劃中立項的XtRayner項目,是一個跨廠商智能查驗平臺。它主要的目的在于搜集并標注數據,并規劃了基礎算法方面的研究。另一方面,圖像理解與模式識別近年來的飛速發展,比較高端的適合于海量數據分類識別的算法如條件隨機場、深度學習理論逐漸成熟,使得集裝箱掃描圖像的自動分類與識別變為可行。
【發明內容】
[0005]因此,希望提供一種能夠對貨物進行自動分類識別的透視檢查系統和方法。
[0006]根據本發明的一個方面,提供了一種對貨物進行自動分類識別的透視檢查系統,所述系統包括:圖像數據獲取單元,用于使用X射線掃描裝置對集裝箱進行掃描成像,以獲取掃描圖像;圖像分割單元,用于將所述掃描圖像分割成灰度與紋理特征都相似的小區域;特征提取單元,用于對所述小區域進行特征提取;訓練單元,用于根據標注圖像生成分類器;以及分類識別單元,用于根據所提取的特征利用分類器對各個小區域進行識別,得到各個小區域屬于各類貨物的概率,并對小區域進行融合,得到大區域及其類別。
[0007]本發明提出的對貨物進行自動分類識別的透視檢查系統,能夠對集裝箱掃描圖像進行分析,根據特征相似性將圖像劃分成幾個部分,并分析每個部分對應的貨物屬于哪一類貨物。其中,利用所提取的特征來判斷掃描圖像中各個小區域屬于各類貨物的概率,然后對小區域進行融合,獲得大區域的類別,這種策略提高了貨物整體識別的效率和準確性;并且利用本發明實施例所述的配置,隨著貨物識別量的累積,能夠進一步提高貨物識別的效率和準確性。本發明根據類別信息可與報關單進行對比,從中發現違規夾帶;根據貨物類別及圖像中的面積,可以估算貨物數量;可以用估算的貨物數量與報關單進行對比,從而發現隱瞞貨物數量的瞞帶情況;還可以進一步根據貨物數量自動根據稅率進行稅額估算。
[0008]優選地,所述分類識別單元還用于對小區域進行融合,得到大區域及其類別。
[0009]優選地,所述系統還包括查驗終端;所述分類識別單元還用于估算每個類別貨物的數量,以及將結果提交給查驗終端。由此,查驗員可以根據所述結果對圖像做進一步分析,并可以與報關單進行對比,核查貨物種類、數量、稅額是否正確。
[0010]優選地,對貨物的分類識別包括訓練階段和識別階段。
[0011]訓練階段需要大量集裝箱貨物掃描圖像,量級為10萬幅以上。優選地,在訓練階段中,獲取集裝箱貨物掃描圖像后首先需要對每幅圖像進行預分割,將圖像分割成灰度與紋理特征都相似的小區域,把這些小區域叫做超像素(Superpixel),并對這些小區域進行特征提取;然后需要根據每幅圖像對應的報關單對其進行標注,即明確地標注出每個小區域屬于哪一類貨物,類別相同而且相鄰或聯通的小區域將直接融合成大區域,稱之為簇(Cluster);最后把這些大區域中各小區域的特征構成為特征簇,根據這些已知類別的特征簇訓練分類器,用于后續識別。其中,標注階段將貨物分為多少個類別,識別階段就能夠分出多少個類別。由于掃描圖像的透射性與投影性,實物的表面輪廓特征損失殆盡,給識別造成很大困難。如果分的類別太多反而會降低準確率。為使得分類結果更具實用價值,發明人根據《中華人民共和國海關進出口商品規范申報目錄》等相關規定,將貨物分為22類。
[0012]特征提取的方法,可以米用SIFT (Scale-1nvariant feature transform)、MR8 (Maximum Response Sets)等算子獲得多個特征,然后采用特征融合(Feature Fus1n)或者決策融合(Decis1n Fus1n)的方法對多個特征進行融合,獲取關鍵特征。
[0013]訓練階段,每幅圖像中每個小區域(超像素)都會包含比較多的特征,這樣訓練圖像庫就會生成一個海量特征庫。可以采用字典方法(Dict1nary Learning)來有效地組織這些特征。具體來說就是把相似的特征聚類成詞匯,眾多詞匯最終構成字典。這樣,每個小區域的特征就會轉換為一個字典中詞匯的直方圖,這個直方圖被認為是該小區域的最終特征。類別相同而且相鄰或聯通的小區域將融合成大區域(簇)后,一個大區域包含一簇直方圖特征,這一簇直方圖屬于同一類。其中,字典的形成有兩大類方法:可以是Kmeans,然后用 B0W(bag of words)描述區域;也可以用 K-SVD(K Singular Value Decomposit1n),用 sparse representat1n 描述區域。
[0014]可選地,在所述訓練階段中,通過對采集的圖像進行人工標注而獲得子類圖像數據庫。
[0015]優選地,在識別階段中,首先對集裝箱貨物進行掃描,對掃描圖像進行預分割,生成若干灰度與紋理比較一致的小區域(超像素);然后對所述小區域進行特征提取,并根據所提取的特征利用訓練所生成的分類器對各個區域進行識別,得到各小區域屬于各類貨物的概率;最后利用所述概率及相鄰小區域之間的關聯性構建概率圖模型,對小區域進行融合,得到大區域及其類別,完成貨物分類。其中,概率圖模型可以用隱馬爾可夫模型(HMM,Hide Markov Mode)、條件隨機場模型(CRF, Condit1nal Random Field)或結構輸出預測模型(SOP, Structure Output Predict1n),也可以不用構建這些復雜模型,而直接根據相似性進行融合,然后輸出一個綜合類別作為融合區域的類別。
[0016]根據本發明的另一方面,提供了一種對貨物進行自動分類識別的透視檢查方法,所述方法包括:使用X光掃描裝置對集裝箱進行掃描成像,以獲取掃描圖像;將所述掃描圖像分割成灰度與紋理特征都相似的小區域;對所述小區域進行特征提取;根據標注圖像生成分類器;以及根據所提取的特征利用分類器對各個小區域進行識別,得到各個小區域屬于各類貨物的概率,并對小區域進行融合,得到大區域及其類別。
[0017]優選地,所述方法還包括估算每個類別貨物的數量,以及將結果提交給查驗終端。
[0018]優選地,所述方法包括訓練階段和識別階段。
[0019]優選地,