圖像中的目標物的識別方法及裝置的制造方法
【技術領域】
[0001]本發明涉及計算機技術領域,尤其涉及一種圖像中的目標物的識別方法及裝置。
【背景技術】
[0002]數字圖像理解包含幾個層次,如圖像分割、邊緣檢測、圖像目標檢測和識別等。其中圖像目標檢測和識別是用來識別圖像中的人或物體,對圖像進行類別標注(如,將圖像中區域分別標注為“天空”、“海灘”、“太陽”等),其中一類最典型的問題是識別圖像中某一類型的物體,如CaltechlOl數據集即為類似的問題。圖像目標檢測和識別是計算機視覺領域的核心問題之一,也是人工智能領域的重要突破口之一。
[0003]目前的目標檢測方法多是通過固定某一類物體,通過對其形狀或邊緣(甚至bounding box)進行建模,通過掃描圖像中物體的位置并進行擬合得到。邊緣檢測可以使用Canny算子等方法獲得;形狀或邊緣建模和跟蹤可以使用Condensat1n、Kalman filter或Meanshift等方法獲得。
[0004]由于目標檢測多對于已知一類物體(如人臉、人體、某類特定物體等)進行判斷,對未知物體的理解還沒有涉及。如果新來一個目標沒有出現在需要跟蹤的對象里面,則很難進行判斷。
【發明內容】
[0005]本發明實施例提供一種圖像中的目標物的識別方法及裝置,可對未知分類的目標物進行識別。
[0006]本發明第一方面提供一種圖像中的目標物的識別方法,其可包括:
[0007]從圖像中提取特征數據,并將所述提取的特征數據轉換為統一的表達;
[0008]根據所述統一表達后的特征數據和歷史聚類結果,對圖像中的特征進行自動聚類;
[0009]對于所述自動聚類結果中包括的已知的分類,歸類為對應的已知分類,以對所述圖像中的已知目標物進行識別;
[0010]對于所述自動聚類結果中包括的未知分類,通過機器學習的方式訓練分類器,以對所述圖像中的未知目標物進行識別。
[0011]結合第一方面,在第一種可行的實施方式中,所述對于所述自動聚類結果中包括的未知分類,通過機器學習的方式訓練分類器,以對所述圖像中的未知目標物進行識別,可包括:
[0012]對于所述自動聚類結果中包括的未知的分類,進行類別標注;
[0013]通過遷移學習,對所述帶有類別標注的未知的分類訓練分類器,以對所述圖像中的未知目標物進行識別。
[0014]結合第一方面的第一種可行的實施方式,在第二種可行的實施方式中,所述進行類別標注,包括:
[0015]通過人機交互的方式,獲取用戶輸入的類別標注信息;
[0016]或者,從互聯網查找與所述未知的分類相似性達到指定要求的圖像,并通過互聯網對所述圖像的標注信息,對所述未知的分類進行類別標注。
[0017]結合第一方面的第一種可行的實施方式,在第三種可行的實施方式中,通過遷移學習,對所述帶有類別標注的未知的分類訓練分類器,以對所述圖像中的未知目標物進行識別,包括:
[0018]根據自動聚類的結果,對已有的分類器進行更新;
[0019]使用遷移學習方法和所述更新后的已有的分類器為所述帶有類別標注的未知的分類訓練分類器,以對所述圖像中的未知目標物進行識別。
[0020]結合第一方面至第一方面的第三種可行的實施方式中任一種,在第四種可行的實施方式中,所述對圖像中的特征進行自動聚類之后,還包括:
[0021 ] 根據所述自動聚類結果,更新所述歷史聚類結果。
[0022]本發明第二方面提供一種圖像處理裝置,其可包括:
[0023]特征獲取模塊,用于從圖像中提取特征數據,并將所述提取的特征數據轉換為統一的表達;
[0024]自動聚類模塊,用于根據所述特征獲取模塊統一表達后的特征數據和歷史聚類結果,對圖像中的特征進行自動聚類;
[0025]第一分類模塊,用于對于所述自動聚類結果中包括的已知的分類,歸類為對應的已知分類,以對所述圖像中的已知目標物進行識別;
[0026]第二分類模塊,用于對于所述自動聚類結果中包括的未知分類,通過機器學習的方式訓練分類器,以對所述圖像中的未知目標物進行識別。
[0027]結合第二方面,在第一種可行的實施方式中,所述第二分類模塊,包括:
[0028]標注模塊,用于對于所述自動聚類結果中包括的未知的分類,進行類別標注;
[0029]分類學習模塊,用于通過遷移學習,對所述帶有類別標注的未知的分類訓練分類器,以對所述圖像中的未知目標物進行識別。
[0030]結合第二方面的第一種可行的實施方式,在第二種可行的實施方式中,標注模塊具體用于通過人機交互的方式,獲取用戶輸入的類別標注信息;或者,從互聯網查找與所述未知的分類相似性達到指定要求的圖像,并通過互聯網對所述圖像的標注信息,對所述未知的分類進行類別標注。
[0031]結合第二方面的第一種可行的實施方式,在第三種可行的實施方式中,所述分類學習模塊具體用于根據自動聚類的結果,對已有的分類器進行更新,并使用遷移學習方法和所述更新后的已有的分類器為所述帶有類別標注的未知的分類訓練分類器,以對所述圖像中的未知目標物進行識別。
[0032]結合第二方面至第二方面的第三種可行的實施方式中任一種,在第四種可行的實施方式中,所述自動聚類模塊還用于根據所述自動聚類結果,更新所述歷史聚類結果。
[0033]由上可見,在本發明的一些可行的實施方式中,從圖像中提取特征數據,并對所述提取的特征數據進行表達處理;根據所述表達處理后的特征數據和歷史聚類結果,對圖像中的特征進行自動聚類;對于所述自動聚類結果中包括的已知的分類,歸類為對應的已知分類,以對所述圖像中的已知目標物進行識別;對于所述自動聚類結果中包括的未知分類,通過機器學習的方式訓練分類器,以對所述圖像中的未知目標物進行識別。由此,本發明實施例可在待識別的圖像中包含不屬于已有類別的目標物時,對不屬于已有類別的目標物進行學習,得到新的分類器,從而實現對未知分類的目標物進行識別。
【附圖說明】
[0034]圖1為本發明的圖像中的目標物的識別方法的一實施例的流程示意圖;
[0035]圖2為圖1中步驟S104的一實施例的流程示意圖;
[0036]圖3為本發明的圖像處理裝置的一實施例的結構組成示意圖;
[0037]圖4為本發明圖3中的第二分類模塊的一實施例的結構組成示意圖;
[0038]圖5為本發明的圖像處理裝置的另一實施例的結構組成示意圖。
【具體實施方式】
[0039]為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明作進一步的詳細描述。
[0040]圖1為本發明的圖像中的目標物的識別方法的一實施例的流程示意圖。如圖1所示,其可包括以下步驟:
[0041]S101,從圖像中提取特征數據,并將所述提取的特征數據轉換為統一的表達。
[0042]在一些可行的實施方式中,本發明實施例所述的圖像的特征數據包括但不限于:幾何特征、形狀特征、顏色特征、紋理特征等。
[0043]具體實現中,步驟SlOl中,可采用Canny算子、拉普拉斯算子或拉普拉斯高斯(Laplacian of Gassian, LOG)算子提取圖像的邊緣特征;采用奇異值分解(SingularValue Decomposit1n, SVD)算法提取圖像的紋理特征;采用方向梯度直方圖(Histogramof Oriented Gradient, HOG)描述子或尺度不變特征轉換(Scale-1nvariant FeatureTransform, SIFT)算法得到圖像的特征向量;采用主成分分析(Principal ComponentAnalysis,PCA)算法、線性判別分析(Linear Discriminant Analysis,LDA)算法或獨立成分分析(Independent components analysis, I CA)算法等提取圖像的全局或局部特征等。以達到去噪、提高識別效果的作用。例如,PCA是通過使用一個低維的特征向量來和投影矩陣來重建樣本,通過最小化重建誤差來對特征向量進行建模。同時,它是把方差大的維度留下,方差小的維度去掉。去掉方差小的維度可以幫助樣本空間減小不確定性,留下方差大的維度可以保持樣本和樣本之間的局部距離。
[0044]S102,根據所述統一表達后的特征數據和歷史聚類結果,對圖像中的