一種圖像識別方法及裝置的制造方法
【專利摘要】本發明公開了一種圖像識別方法及裝置,涉及圖像處理技術領域。該方法包括:獲取品牌與品牌特征向量的對應關系;獲取待識別圖像的特征向量;將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將匹配度最高的品牌特征向量對應的品牌作為結果輸出。本發明不需要文本信息,通過圖像就可以識別商品的品牌,在文本中不包含品牌的情況下,也可以識別出商品的品牌。
【專利說明】
一種圖像識別方法及裝置
技術領域
[0001] 本發明涉及圖像處理技術領域,特別涉及一種圖像識別方法及裝置。
【背景技術】
[0002] 品牌識別是購物平臺數據挖掘中的基礎問題。傳統的思路一般專注于商品描述本 身,通過文本挖掘算法找到商品描述中的品牌詞。然而有一些購物平臺,很多賣家并未在商 品描述中填寫其品牌詞,只有圖片和很簡短的文字介紹。
[0003] 現有技術專注于文本領域,在一些購物平臺重視圖片的產品形態下,品牌識別覆 蓋率難以提升。
【發明內容】
[0004] 鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上 述問題的一種圖像識別方法及裝置。
[0005] 本發明提供一種圖像識別方法,包括:
[0006] 獲取品牌與品牌特征向量的對應關系;
[0007] 獲取待識別圖像的特征向量;
[0008] 將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將匹配度最高的品 牌特征向量對應的品牌作為結果輸出。
[0009] 在一個實施例中,所述方法還可包括:
[0010] 利用特征聚類算法確定圖像所對應的品牌、所述圖像的特征以及所述特征分別對 應的權重;
[0011] 根據所述圖像的特征和所述特征分別對應的權重組成品牌特征向量。
[0012] 在一個實施例中,所述根據所述圖像的特征和所述特征分別對應的權重組成品 牌特征向量,可包括:
[0013] 確定所述品牌中每一個商品的圖像的特征向量;
[0014] 將所述品牌中所有商品的圖像的特征向量加權相加,作為品牌特征向量。
[0015] 在一個實施例中,將所述品牌中所有商品的圖像的特征向量加權相加,作為品牌 特征向量,可包括:
[0016] 按照下列公式確定品牌特征的權重:
[0017] ffeight(feature|brand)=TF(feature|brand)*IDF(feature)
[0018] 其中Weight (feature I brand)為品牌特征的權重,feature為特征,brand為品牌, TF(feature I brand)為所述特征的TF值,IDF(feature)為所述特征的IDF值;
[0019] 其中,TF值為:
[0020] TF(feature|brand)=l+log(frequencyf,b)
[0021 ]其中,frequencyf,b表示所述特征在該品牌下出現的次數;
[0022] IDF值定義為: M
[0023] IDF(feature) = log - nf
[0024] 其中,N表示商品總數,nf表示該特征在全局出現的總次數;
[0025] 根據品牌特征和品牌特征的權重確定品牌特征向量。
[0026] 本發明還提供一種圖像識別裝置,包括:
[0027] 第一獲取模塊,用于獲取品牌與品牌特征向量的對應關系;
[0028] 第二獲取模塊,用于獲取待識別圖像的特征向量;
[0029] 輸出模塊,用于將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將 匹配度最高的品牌特征向量對應的品牌作為結果輸出。
[0030] 在一個實施例中,所述裝置還可包括:
[0031] 確定模塊,用于利用特征聚類算法確定圖像所對應的品牌、所述圖像的特征以及 所述特征分別對應的權重;
[0032] 組成模塊,用于根據所述圖像的特征和所述特征分別對應的權重組成品牌特征 向量。
[0033] 在一個實施例中,所述組成模塊,可包括:
[0034]確定子模塊,用于確定所述品牌中每一個商品的圖像的特征向量;
[0035] 組成子模塊,用于將所述品牌中所有商品的圖像的特征向量加權相加,作為品牌 特征向量。
[0036] 在一個實施例中,所述組成子模塊,可包括:
[0037] 按照下列公式確定品牌特征的權重:
[0038] ffeight(feature|brand)=TF(feature|brand)*IDF(feature)
[0039] 其中Weight (feature I brand)為品牌特征的權重,feature為特征,brand為品牌, TF(feature I brand)為所述特征的TF值,IDF(feature)為所述特征的IDF值;
[0040] 其中,TF值為:
[0041 ] TF(feature|brand) = l+log(frequencyf,b)
[0042]其中,frequencyf,b表示所述特征在該品牌下出現的次數;
[0043] IDF值定義為: N
[0044] IDF(feature) = log - Hf
[0045] 其中,N表示商品總數,nf表示該特征在全局出現的總次數;
[0046] 根據品牌特征和品牌特征的權重確定品牌特征向量。
[0047] 本發明的實施例提供的技術方案可以包括以下有益效果:
[0048] 本發明實施例的上述技術方案,通過獲取品牌與品牌特征向量的對應關系;獲取 待識別圖像的特征向量;將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將 匹配度最高的品牌特征向量對應的品牌作為結果輸出。從而不需要文本信息,通過圖像就 可以識別商品的品牌,在文本中不包含品牌的情況下,也可以識別出商品的品牌。
[0049] 本發明的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點可通過在所寫的說明 書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。
[0050] 下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。
【附圖說明】
[0051] 附圖用來提供對本發明的進一步理解,并且構成說明書的一部分,與本發明的實 施例一起用于解釋本發明,并不構成對本發明的限制。在附圖中:
[0052] 圖1為本發明實施例中一種圖像識別方法的流程圖;
[0053]圖2A為本發明實施例中另一種圖像識別方法的流程圖;
[0054]圖2B為原始sift特征示意圖;
[0055]圖2C為將原始sift特征映射到128w維的示意圖;
[0056]圖3為本發明實施例中一種圖像識別方法中步驟S15的流程圖;
[0057]圖4為本發明實施例中一種圖像識別裝置的框圖;
[0058]圖5為本發明實施例中另一種圖像識別裝置的框圖;
[0059]圖6為本發明實施例中一種圖像識別裝置中組成模塊45的框圖.
【具體實施方式】
[0060] 以下結合附圖對本發明的優選實施例進行說明,應當理解,此處所描述的優選實 施例僅用于說明和解釋本發明,并不用于限定本發明。
[0061] 圖1所示為本發明實施例中一種圖像識別方法的流程圖,如圖1所示,包括以下步 驟S11-S13:
[0062] 步驟Sll,獲取品牌與品牌特征向量的對應關系。
[0063] 步驟Sl 2,獲取待識別圖像的特征向量。
[0064] 步驟S13,將待識別圖像的特征向量和品牌特征向量進行匹配,將匹配度最高的品 牌特征向量對應的品牌作為結果輸出。
[0065] 在步驟Sll之前,先獲取一定的數據進行訓練,這些數據可以從商品的圖像以及 商品的描述信息都很完備的購物平臺獲取。比如某一惠氏品牌的商品,商品屬性頁中有對 應的品牌信息,品牌:Wyeth/惠氏。利用圖像特征提取技術,可以將圖像的特征與品牌進行 對應。
[0066] 利用大量的訓練數據,可以知道每一個品牌所對應的圖像特征以及其權重,利用 這些特征可以組成特征向量,本發明利用特征聚類技術,每一個品牌均可以得到一個128w 維的特征向量。利用上述步驟提取的品牌和品牌特征向量,可以對商品進行品牌預測:首先 提取商品對應的圖像的特征并且組成特征向量,再和品牌特征向量進行匹配,匹配度最高 的品牌作為預測結果輸出。
[0067] 本發明利用大量的數據進行訓練,然后進行品牌匹配,最后把匹配最大值作為品 牌預測值輸出。從而不需要文本信息,通過圖像就可以識別商品的品牌,在文本中不包含品 牌的情況下,也可以識別出商品的品牌。
[0068] 在一個實施例中,如圖2A所示,上述方法還可包括步驟S14-S15:
[0069] 步驟S14,利用特征聚類算法確定圖像所對應的品牌、圖像的特征以及特征分別對 應的權重。
[0070] 步驟S15,根據圖像的特征和特征分別對應的權重組成品牌特征向量。
[0071] 利用特征聚類技術,可以將特征維度控制在128w維,有效地減少計算復雜度。每一 個sift特征都可以找到其所屬類別,從而映射到128w維中得一維上。該技術利用聚類算法 在不同子空間中搜索簇群,使具有較強依賴關系(存在冗余性)的特征被劃分到同一個簇群 中,然后從每一個簇群中挑選具有代表性的子集共同構成特征子集,最終達到去除不相關 特征和冗余特征的目的。
[0072] 如圖2B所不,原始的sift(Scale_invariant feature transform,即尺度不變特 征變換)特征可以看作空間中的一個點,通過將相近的點合并,可以得到128w個類,每個類 即為一維。sift是用于圖像處理領域的一種描述。這種描述具有尺度不變性,可在圖像中檢 測出關鍵點,是一種局部特征描述子。sift特征是基于物體上的一些局部外觀的興趣點而 與影像的大小和旋轉無關。對于光線、噪聲、微視角改變的容忍度也相當高。基于這些特性, 它們是高度顯著而且相對容易擷取,在母數龐大的特征數據庫中,很容易辨識物體而且鮮 有誤認。使用sift特征描述對于部分物體遮蔽的偵測率也相當高,甚至只需要3個以上的 sift物體特征就足以計算出位置與方位。在現今的電腦硬件速度下和小型的特征數據庫條 件下,辨識速度可接近即時運算。sift特征的信息量大,適合在海量數據庫中快速準確匹 配。
[0073]本發明在sift特征基礎上進行二次處理,通過聚類技術和TF-IDF進行品牌特征向 量化。
[0074]傳統的sift特征是一個100多維的浮點數向量,平均每個圖像可以提取200個左右 的s if t特征,但是s if t向量不可相加,并不適合本發明碰到的問題。
[0075]通過聚類技術,將所有圖像提取的特征進行聚類,并且設置聚類類別總數為128 萬。這樣可以得到128w維的向量,并且這個向量是可以相加的。每一個原始sift特征都可以 映射到這128w維的其中一維上,圖2C所示為sift特征映射方法示意圖,映射方法為找到距 離最近的類。
[0076] 在一個實施例中,如圖3所示,步驟S15可以實施為如下步驟S151-S152:
[0077]步驟S151,確定品牌中每一個商品的圖像的特征向量。
[0078] 步驟Sl 52,將品牌中所有商品的圖像的特征向量加權相加,作為品牌特征向量。
[0079] 通過訓練數據,可以找到一個品牌所屬的商品列表,將品牌中所有商品的圖像的 特征向量加權相加,即可作為品牌的特征向量。加權相加是因為不同的特征會有不同的權 重,加以區分會有更好的效果。本專利采用TF-IDF技術作為特征權重,即某品牌下某特征的 權重等于該特征的TF值乘以該特征的IDF值。
[0080] 在一個實施例中,步驟S152可實施為如下方式:
[0081 ]按照下列公式確定品牌特征的權重:
[0082] ffeight(feature|brand)=TF(feature|brand)*IDF(feature)
[0083] 其中Weight (f eature I brand)為品牌特征的權重,f eature為特征,brand為品牌, TF(feature I brand)為特征的TF值,IDF(feature)為特征的IDF值;
[0084] 其中,TF值為:
[0085] TF(feature|brand)=l+log(frequencyf,b)
[0086]其中,frequencyf,b表示特征在該品牌下出現的次數;
[0087] IDF值定義為:
[0088]
[0089] 其中,N表示商品總數,nf表示該特征在全局出現的總次數;
[0090] 根據品牌特征和品牌特征的權重確定品牌特征向量。
[0091] 本發明在計算特征向量的相似度時,采用余弦來計算兩個向量的夾角,夾角越小, 表示越相似。
[0092] 基于同一發明構思,本發明實施例還提供了一種圖像識別裝置,由于該裝置所解 決問題的原理與前述圖像識別方法相似,因此該裝置的實施可以參見前述方法的實施,重 復之處不再贅述。
[0093] 圖4所示為本發明實施例中一種圖像識別裝置的框圖,如圖4所示,該裝置包括: [0094]第一獲取模塊41,用于獲取品牌與品牌特征向量的對應關系;
[0095]第二獲取模塊42,用于獲取待識別圖像的特征向量;
[0096] 輸出模塊43,用于將待識別圖像的特征向量和品牌特征向量進行匹配,將匹配度 最高的品牌特征向量對應的品牌作為結果輸出。
[0097] 本發明實施例的上述裝置,通過獲取品牌與品牌特征向量的對應關系;獲取待識 別圖像的特征向量;將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將匹配 度最高的品牌特征向量對應的品牌作為結果輸出。從而不需要文本信息,通過圖像就可以 識別商品的品牌,在文本中不包含品牌的情況下,也可以識別出商品的品牌。
[0098] 在一個實施例中,如圖5所示,上述裝置還可包括:
[0099]確定模塊44,用于利用特征聚類算法確定圖像所對應的品牌、圖像的特征以及特 征分別對應的權重;
[0100]組成模塊45,用于根據圖像的特征和特征分別對應的權重組成品牌特征向量。
[0101 ]在一個實施例中,如圖6所示,組成模塊45,可包括:
[0102] 確定子t吳塊451,用于確定品牌中每一個商品的圖像的特征向量;
[0103] 組成子模塊452,用于將品牌中所有商品的圖像的特征向量加權相加,作為品牌特 征向量。
[0104] 在一個實施例中,組成子模塊452,可包括:
[0105] 按照下列公式確定品牌特征的權重:
[0106] ffeight(feature|brand)=TF(feature|brand)*IDF(feature)
[0107] 其中Weight (feature I brand)為品牌特征的權重,feature為特征,brand為品牌, TF(feature I brand)為特征的TF值,IDF(feature)為特征的IDF值;
[0108] 其中,TF值為:
[0109] TF(feature|brand)=l+log(frequencyf,b)
[0110] 其中,frequencyf,b表示特征在該品牌下出現的次數;
[0111] IDF值定義為:
[0112]
[0113]其中,N表示商品總數,nf表示該特征在全局出現的總次數;
[0114] 根據品牌特征和品牌特征的權重確定品牌特征向量。
[0115] 本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序 產品。因此,本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實 施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機 可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形 式。
[0116] 本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程 圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一 流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程 序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以 產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于 實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝 置。
[0117] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指 令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0118] 這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計 算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或 其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0119] 顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精 神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍 之內,則本發明也意圖包含這些改動和變型在內。
【主權項】
1. 一種圖像識別方法,其特征在于,包括: 獲取品牌與品牌特征向量的對應關系; 獲取待識別圖像的特征向量; 將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將匹配度最高的品牌特 征向量對應的品牌作為結果輸出。2. 如權利要求1所述的方法,其特征在于,所述方法還包括: 利用特征聚類算法確定圖像所對應的品牌、所述圖像的特征以及所述特征分別對應的 權重; 根據所述圖像的特征和所述特征分別對應的權重組成品牌特征向量。3. 如權利要求2所述的方法,其特征在于,所述根據所述圖像的特征和所述特征分別對 應的權重組成品牌特征向量,包括: 確定所述品牌中每一個商品的圖像的特征向量; 將所述品牌中所有商品的圖像的特征向量加權相加,作為品牌特征向量。4. 如權利要求3所述的方法,其特征在于,所述將所述品牌中所有商品的圖像的特征向 量加權相加,作為品牌特征向量,包括: 按照下列公式確定品牌特征的權重: ffeight(feature|brand)=TF(feature|brand)*IDF(feature) 其中Weight (feature I brand)為品牌特征的權重,feature為特征,brand為品牌,TF (feature I brand)為所述特征的TF值,IDF(feature)為所述特征的IDF值; 其中,TF值為: TF(featureI brand) = l+log(frequencyf,b) 其中,frequencyf,b表示所述特征在該品牌下出現的次數; IDF值定義為:其中,N表示商品總數,nf表示該特征在全局出現的總次數; 根據品牌特征和品牌特征的權重確定品牌特征向量。5. -種圖像識別裝置,其特征在于,包括: 第一獲取模塊,用于獲取品牌與品牌特征向量的對應關系; 第二獲取模塊,用于獲取待識別圖像的特征向量; 輸出模塊,用于將所述待識別圖像的特征向量和所述品牌特征向量進行匹配,將匹配 度最高的品牌特征向量對應的品牌作為結果輸出。6. 如權利要求5所述的裝置,其特征在于,所述裝置還包括: 確定模塊,用于利用特征聚類算法確定圖像所對應的品牌、所述圖像的特征以及所述 特征分別對應的權重; 組成模塊,用于根據所述圖像的特征和所述特征分別對應的權重組成品牌特征向量。7. 如權利要求6所述的裝置,其特征在于,所述組成模塊,包括: 確定子模塊,用于確定所述品牌中每一個商品的圖像的特征向量; 組成子模塊,用于將所述品牌中所有商品的圖像的特征向量加權相加,作為品牌特征 向量。8.如權利要求7所述的裝置,其特征在于,所述組成子模塊,包括: 按照下列公式確定品牌特征的權重: ffeight(feature|brand)=TF(feature|brand)*IDF(feature) 其中Weight (feature I brand)為品牌特征的權重,feature為特征,brand為品牌,TF (feature I brand)為所述特征的TF值,IDF(feature)為所述特征的IDF值; 其中,TF值為: TF(featureI brand) = l+log(frequencyf,b) 其中,frequencyf,b表示所述特征在該品牌下出現的次數; IDF值定義為:其中,N表示商品總數,nf表示該特征在全局出現的總次數; 根據品牌特征和品牌特征的權重確定品牌特征向量。
【文檔編號】G06K9/62GK106056133SQ201610338118
【公開日】2016年10月26日
【申請日】2016年5月19日
【發明人】高云翔, 孟蕊
【申請人】無線生活(杭州)信息科技有限公司