0023]使用深度學習方法提取圖像特征,如卷積神經網絡(CNN),通過深度學習方法提取 圖像特征W實現所提取圖像特征的可靠性和準確度。
[0024] 如圖3所示,對于圖像集合中的每一個圖像,提取1000個特性,并且每個特征代 表一個圖像的特定方面,運1000個特征的范圍為0到1。其中,無論圖像的大小或內容,一 個固定大小1000個數字永遠用來表示圖。因此,100萬行數據能代表100萬圖像的集合; 在每一行包含一個包含1000個數字特征向量。 陽02引 似儲存所述圖像特征,建立圖像知識庫。
[00%] 如圖4所示,圖像特征的儲存是通過局部敏感哈希算法(LSHF),將同類型的圖像 放入同一個儲存單元,運意味運只有屬于同一儲存單元的圖像才會被檢查,W取代集合中 的所有項目,W便快速訪問和比較,提高查詢效率。
[0027]使用W下參數建立了一個所有圖像集合的LSHF:估計器數量=100;半徑=1.0; 入選數量=100 ;鄰居數量=10 ;最低哈希匹配=5 ;截止半徑比率=0. 9。
[0028] 運一步完成后,最終的結果是我們所有的圖像,每個圖像有1000個數字特征向 量,使用LSHF存儲,LSHF方法查詢速度更快。
[0029] (3)解析由客戶端給出的目標圖像的內容,得到目標圖像特征。
[0030] 具體為,根據視覺特征,解析所提供的目標圖像內容,使用深度學習方法提取圖像 特征,同圖像集合中圖像特征提取方法相同,提取每個樣品的1000個特征。
[0031] (4)根據所述目標圖像特征,在圖像知識庫中尋找相似圖像。 陽03引如圖5所示,利用余弦相似度算法查詢出相似圖像。
[0033] 對于提供的目標圖像,利用余弦相似度算法查詢圖像集合中由1000個圖像特征 確定的每個圖像,任何數量視覺相似圖像的LSHF,由高到低排序,數學上可W表示為:
在上述公式中,X是目標圖像的特征向量,y是圖像集合中圖像的特征向量。
[0034] 經比較,余弦相似度的值越大意味著兩個圖像越視覺相似,為0時,表示運兩個圖 像完全不相關。
[0035] (5)返回相似圖像至用戶數據庫,將返回的相似圖像與數據庫中相關圖片集聯合。
[0036] 基于相同的發明構思,如圖6所示,本發明還提供了一種自動的圖片訓練樣本提 取的系統,包括: 圖像集合解析模塊:解析圖像集合所有圖像內容,得到圖像集合的所有圖像特征;圖 像知識庫:用來存儲所述圖像集合的圖像特征,建立圖像知識庫;目標圖像解析模塊:用于 接收客戶端給出的目標圖像,并解析目標圖像,得到目標圖像特征;圖像查詢模塊:根據目 標圖像特征,在圖像知識庫中尋找相似圖像;圖像輸出模塊:將相似圖像返回客戶端。
[0037] 其中,圖像集合解析模塊輸入端口連接外部客戶端,圖像集合解析模塊輸出端口 連接圖像知識庫輸入端口;目標圖像解析模塊輸入端口連接外部客戶端;目標圖像解析模 塊輸出端口連接至圖像查詢模塊輸入端口;圖像查詢模塊輸入端口還連接有圖像知識庫的 輸出端口,圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接,圖像輸出模塊輸出端 口與外部客戶端相連。
[003引W上顯示和描述了本發明的基本原理和主要特征和本發明的優點。本行業的技術 人員應該了解,本發明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本 發明的原理,在不脫離本發明精神和范圍的前提下,本發明還會有各種變化和改進,運些變 化和改進都落入要求保護的本發明范圍內。本實發明要求保護范圍由所附的權利要求書及 其等效物界定。
【主權項】
1. 一種自動的圖片訓練樣本提取方法,其特征在于,包括以下幾個步驟: (1) 解析圖像集合中所有圖像內容,得到圖像集合的所有圖像特征; (2) 儲存所述圖像特征,建立圖像知識庫; (3 )解析由客戶端給出的目標圖像的內容,得到目標圖像特征; (4) 根據所述目標圖像特征,在圖像知識庫中尋找相似圖像; (5) 返回相似圖像至用戶數據庫; 其中,基于圖像視覺特征利用深度學習方法提取圖像特征。2. 根據權利要求1所述的一種自動的圖片訓練樣本提取方法,其特征在于,所述深度 學習方法提取圖像特征,具體為,對于圖像集合中的每一個圖像,提取1000個特征,并且每 個特征代表一個圖像的特定方面。3. 根據權利要求1所述的一種自動的圖片訓練樣本提取方法,其特征在于,所述1000 個特征的范圍為〇到1。4. 根據權利要求1所述的一種自動的圖片訓練樣本提取方法,其特征在于,所述步驟 (2)中圖像特征的存儲,是通過局部敏感哈希算法,將同類型的圖像放入圖像知識庫中同一 個儲存單元。5. 根據權利要求4所述的一種自動的圖片訓練樣本提取方法,其特征在于,使用局部 敏感哈希算法,存儲每個圖像1000個數字特征向量。6. 根據權利要求1所述的一種自動的圖片訓練樣本提取方法,其特征在于,所述步驟 (3 )具體為,根據視覺特征,解析所提供的目標圖像內容,使用深度學習方法提取圖像特征。7. 根據權利要求1所述的一種自動的圖片訓練樣本提取方法,其特征在于,所述步驟 (4)具體為,利用余弦相似度算法尋找出相似圖像。8. -種自動的圖片訓練樣本提取的系統,其特征在于,包括: 圖像集合解析模塊:解析圖像集合所有圖像內容,得到圖像集合的所有圖像特征; 圖像知識庫:用來存儲所述的圖像集合的圖像特征,建立圖像知識庫; 目標圖像解析模塊:用于接收客戶端給出的目標圖像,并解析目標圖像,得到目標圖像 特征; 圖像查詢模塊:根據目標圖像特征,在圖像知識庫中尋找相似圖像; 圖像輸出模塊:將相似圖像返回客戶端用戶數據庫; 其中,圖像集合解析模塊輸入端口連接外部客戶端,圖像集合解析模塊輸出端口連接 圖像知識庫輸入端口;目標圖像解析模塊輸入端口連接外部客戶端;目標圖像解析模塊輸 出端口連接至圖像查詢模塊輸入端口;圖像查詢模塊輸入端口還連接有圖像知識庫的輸出 端口,圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接,圖像輸出模塊輸出端口與 外部客戶端相連。
【專利摘要】本發明公開了一種自動的圖片訓練樣本提取方法及系統,解析圖像集合中所有圖像內容,得到圖像集合的所有圖像特征;儲存所述圖像特征,建立圖像知識庫;解析由客戶端給出的目標圖像的內容,得到目標圖像特征;根據所述目標圖像特征,在圖像知識庫中尋找相似圖像;返回相似圖像至用戶數據庫。其中,基于圖像視覺特征利用深度學習方法提取圖像特征。本發明能夠自動檢索任何圖像集合中所需標記的圖像,能夠實現大量圖片的訓練及樣本提取,且檢索速度快、成本效益高。
【IPC分類】G06F17/30
【公開號】CN105183857
【申請號】CN201510570699
【發明人】張一文
【申請人】成都品果科技有限公司
【公開日】2015年12月23日
【申請日】2015年9月10日