一種自動的圖片訓練樣本提取方法及系統的制作方法
【技術領域】
[0001] 本發明屬于圖像處理領域,具體設及一種自動的圖片訓練樣本提取方法及系統。
【背景技術】
[0002] 傳統的手工勞動的方式在標簽圖像方面對于大型數據集,百萬的圖像集合加上圖 片,需要一個團隊的人,花費幾周時間手動標簽運些圖像中的每一個。
[0003] 在機器學習領域,人們普遍認為提高模型預測精度的最有效的方法是提供更多 準確的,W及標簽好的樣品來進行模型訓練。例如,一個用更多精確樣品訓練出來的模型 通常比具有較少樣品訓練出來的模型更精確。該理論同樣的也適用于計算機視覺,更具體 地說,適用于作為機器學習分支的自動圖像標注。自動圖像標注是用已經訓練的模型,自 動檢測圖形的目標或場景的方法。
[0004] 一般來講,用來做圖像識別模型訓練樣本是由人標記;例如,含有狗的圖像被 貼上"狗"標簽。然而,盡管標記圖像的任務并不具有挑戰性,但是卻需要大量人力并 且費時。基于圖像認知的深度學習的最近發展,需要數W百萬計的照片培訓具有可接受的 精度自動標注系統。人工標記如此大量圖像需要的時間和成本通常被描述為實現最先進的 自動圖像標注系統的瓶頸。
[0005] 電腦感知圖像與人類不同。對于電腦,一個圖像只是1和0的集合。為了從圖像 中提取有用的信息,我們需要告訴計算機如何W-種有意義的、可重復的方式識別圖像并 從圖像中提取內容。運個重要的過程被稱為圖像特征提取。我們的方法是使用特定的預 先確定的"規則"作為數字特征向量來表示圖像。特征提取傳統"規則"是顏色、邊緣和梯 度。然而,深度學習的最新發展,如卷積神經網絡(CNN),與傳統方法相比,深度學習功能更 強大、更具描述性。
[0006] 為了解決大量圖像集合"維數的巧咒"(化rseofDimensionality),我們借鑒了 近似近鄰捜索領域方面的觀點。據證實,在很多案例中,近似近鄰方法在精確度方面跟蠻力 方法基本一樣,但在速度上是蠻力方法的多倍。有鑒于此,利用局部敏感哈希算法(Locally SensitiveHashForest)能夠減少高維圖像數據維數。
【發明內容】
[0007] 為了解決上述問題,本發明一種自動的圖片訓練樣本提取方法及系統。本發明針 對在大量的無標記的圖像用來找到訓練的圖像,本發明提出的方法能夠自動檢索任何圖像 集合中所需標記的圖像,且檢索速度快、成本效益高。
[0008] 為達到上述目的,本發明采用的技術方案是: 一種自動的圖片訓練樣本提取方法,包括W下幾個步驟: (1) 解析圖像集合中所有圖像內容,得到圖像集合的所有圖像特征; (2) 儲存所述圖像特征,建立圖像知識庫; (3) 解析由客戶端給出的目標圖像的內容,得到目標圖像特征; (4) 根據所述目標圖像特征,在圖像知識庫中尋找相似圖像; (5) 返回相似圖像至用戶數據庫。
[0009] 其中,基于圖像視覺特征利用深度學習方法提取圖像特征。深度學習方法提取圖 像特征W實現所提取圖像特征的可靠性和準確度。
[0010] 進一步的是,所述深度學習方法提取圖像特征,具體為,對于圖像集合中的每一個 圖像,提取1000個特征,并且每個特征代表一個圖像的特定方面。其中,無論圖像的大小 或內容,一個固定大小1000個數字永遠用來表示圖像,W減少運算量,提高運算速率。
[0011] 進一步的是,所述1000個特征的范圍為0到1。
[0012] 進一步的是,所述步驟(2)中圖像特征的存儲,是通過局部敏感哈希算法,將同類 型的圖像放入圖像知識庫中同一個儲存單元,運意味運只有屬于同一儲存單元的圖像才會 被檢查,W取代集合中的所有項目,W便快速訪問和比較,提高查詢效率,利用局部敏感哈 希算法來減少高維圖像數據維數,建立占用空間小的特征知識庫。
[0013] 進一步的是,使用局部敏感哈希算法,存儲每個圖像1000個數字特征向量。
[0014] 進一步的是,所述步驟(3 )具體為,根據視覺特征,解析所提供的目標圖像內容,使 用深度學習方法提取圖像特征,同圖像集合中圖像特征提取方法相同。
[0015] 進一步的是,所述步驟(4)具體為,利用余弦相似度算法尋找出相似圖像,余弦相 似度的值越大意味著兩個圖像越視覺相似,為0時,表示運兩個圖像完全不相關。
[0016] 另一方面,本發明還提供了一種自動的圖片訓練樣本提取的系統,包括: 圖像集合解析模塊:解析圖像集合所有圖像內容,得到圖像集合的所有圖像特征; 圖像知識庫:用來存儲所述的圖像集合的圖像特征,建立圖像知識庫; 目標圖像解析模塊:用于接收客戶端給出的目標圖像,并解析目標圖像,得到目標圖像 特征; 圖像查詢模塊:根據目標圖像特征,在圖像知識庫中尋找相似圖像; 圖像輸出模塊:將相似圖像返回客戶端; 其中,圖像集合解析模塊輸入端口連接外部客戶端,圖像集合解析模塊輸出端口連接 圖像知識庫輸入端口;目標圖像解析模塊輸入端口連接外部客戶端;目標圖像解析模塊輸 出端口連接至圖像查詢模塊輸入端口;圖像查詢模塊輸入端口還連接有圖像知識庫的輸出 端口,圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接,圖像輸出模塊輸出端口與 外部客戶端相連。
[0017] 采用本技術方案的有益效果:本發明所提出的一種自動的圖片訓練樣本提取方法 及系統,能夠自動檢索任何圖像集合中所需標記的圖像;在處理大量圖像時,工作效率更 高,運為確定訓練圖像提供了一個快速、高效的方式,W識別任何圖像類別的訓練圖像,本 方法基于已經提供的圖像的視覺相似性,只要幾分鐘就可W將圖像依次排列;基于與提供 的圖像視覺特征,本發明的方法可W快速找到觀察者不容易觀察到的圖像,并且運些圖像 并不必然屬于同一類別,但視覺上非常相似,靈活性較高。
【附圖說明】
[0018] 圖1為本發明的方法流程圖; 圖2為本發明的實施例中單個圖像特征提取的示意圖; 圖3為本發明的實施例中多個圖像特征提取的示意圖; 圖4為本發明的實施例中LSHF方法的示意圖; 圖5為本發明的實施例中相似圖片特征提取的示意圖圖; 圖6為本發明所述方法借助的系統結構簡圖。
【具體實施方式】
[0019] 為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明作進一 步闡述。
[0020] 參見圖1所示,一種自動的圖片訓練樣本提取方法,包括W下幾個步驟: (1)解析圖像集合中所有圖像內容,得到圖像集合的所有圖像特征。
[0021] 具體為,對于圖像集合中的每個圖像,基于圖像視覺特征,解析運些圖像,提取圖 像特征。
[0022] 實施例中,如圖2所示,使用特定的預先確定的"規則"作為數字特征向量來表示 圖像,數學上可W表示為: r= {>"K,,Kj,…,K。} 上述公式中,w表示圖像,Vi表示描述圖像的特征。
[