基于用戶搜索意圖定位的圖像檢索方法及系統的制作方法
【技術領域】
[0001] 本發明涉及數據庫檢索領域,尤其涉及一種基于用戶搜索意圖定位的圖像檢索方 法及系統。
【背景技術】
[0002]網絡圖像的爆炸式增長,衍生了很多圖像檢索方法。例如,用戶可使用如谷歌 (Google)和必應(Bing)等搜索引擎來從互聯網上檢索圖像。
[0003]目前的圖像檢索方法主要有以下幾種:
[0004] ①基于關鍵字的檢索方法:將查詢關鍵字與圖像數據庫中存儲的描述關鍵字來進 行匹配,并返回匹配成功的圖像。這種方法廣泛應用于傳統的圖像檢索中。基于此方法的 改進有,找到查詢關鍵字的同義詞或者具有與之相關性的文本來檢索,或者為用戶提供更 加詳細的文本關鍵字的選擇項。
[0005] ②基于圖像的檢索方法:通過提取圖像的固有特征(顏色、紋理等圖像特征)來進 行檢索。當用戶上傳一張圖像后,利用基于內容的圖像檢索(CBIR,Content-basedimage retrieval,基于圖像內容的檢索--改為:基于內容的圖像檢索),圖像搜索引擎可以檢索 出與之相似的圖像。
[0006] ③基于語義的檢索方法:將圖像的本體描述作為語義標注,并將這些標注保存到 數據庫中,搜索引擎將會基于這些標注來進行圖像檢索。圖像的本體描述是指圖像作為一 個對象,其本身包含的特征和屬性。
[0007] 以上三類檢索方法分別存在以下缺陷:
[0008] 對于方法①,需要監管培訓并消耗大量的計算資源,此外,它并不能保證在圖像的 擴展列表中包含用戶的理想的關鍵字。
[0009] 對于方法②,基于內容的圖像檢索方法中,提取圖像特征需要消耗計算資源,而尋 找圖像特征提取的精確度和計算時間之間的一個平衡點尤為重要。此外,這種方法忽略了 對用戶的意圖的理解,導致無法搜索到滿足用戶意圖的相似結果。
[0010] 對于方法③,在基于語義的方法中,對圖像進行標注工作量大,同時,無法保證所 有圖像都被標注正確,此外,如果圖像被復制或移動到其它位置,重建它們的語義信息是一 個非常復雜的工作。
【發明內容】
[0011] 本發明目的在于提供一種基于用戶搜索意圖定位的圖像檢索方法及系統,以解決 網絡圖像搜索技術消耗大且不能準確貼合用戶搜索意圖的技術問題。
[0012] 為實現上述目的,本發明提供了一種基于用戶搜索意圖定位的圖像檢索方法,包 括以下步驟:
[0013] S2:根據用戶輸入的檢索關鍵字,使用任意一個圖像檢索平臺進行檢索獲取圖像 結果集;
[0014] S4 :根據圖像結果集中的圖像的文本信息,對圖像結果集中的圖像進行分類;
[0015] S6:將分類后的圖像返回給用戶,并引導用戶在分類后的圖像中選取一個類別中 的至少一個圖像;
[0016] S8 :將被選取的圖像及與被選取的圖像相關的文本信息作為檢索條件,進行二次 檢索。
[0017] 作為本發明的方法的進一步改進:
[0018] 對圖像結果集中的圖像進行分類,包括以下步驟:
[0019] S401 :根據圖像結果集中的圖像的文本信息,將每個圖像在維基百科分類索引中 所屬的二級類目作為圖像的類別;
[0020] S402:并將圖像的類別對應的所有三級類目作為類別的同義詞保存到關系型數據 庫中。
[0021] 步驟S401,包括以下步驟:
[0022] S4011 :根據圖像結果集中的圖像的文本信息,建立如下的信息矩陣:
[0023]
[0024] 其中,N表示圖像結果集中的圖像的圖像數目,L表示圖像結果集中的一張圖像, 其中0〈 =i〈 =Ν,?\表示圖像的文本信息,其中0〈 =i〈 =N,(^表示與圖像相關的類別 名,其中0〈 =i〈 =N;
[0025] S4012:根據維基百科分類索引定義分類圖G,遍歷圖像結果集中的N個圖像,將圖 像中圖像的文本信息中包含的每個詞語或短語作為一個文本結點,對于每個圖像中的每個 文本結點,如果文本結點與分類圖G中的結點相匹配,則計算該文本結點出現在圖像的文 本信息!\中的頻率,最后將出現頻率最大的文本結點所對應的分類圖G中的分類名稱作為 該圖像的分類。
[0026] 步驟S8中的與被選取的圖像相關的文本信息,包括:被選取的圖像的類別名稱、 用戶輸入的檢索關鍵字和\或HTML中的圖像描述信息。
[0027] 步驟S8中,進行二次檢索,包括以下步驟:
[0028] S801 :根據與被選取的圖像相關的文本信息的文本內容,在圖像結果集中被選取 的圖像所在的分類中進行基于文本的圖像檢索;
[0029] S802:提取被選取的圖像的視覺特征,采用感知哈希算法計算被選取的圖像以及 圖像結果集中被選取的圖像所在的分類中的圖像的圖像相似度,在圖像結果集中被選取的 圖像所在的分類中進行圖像檢索。
[0030] 步驟S802中,采用感知哈希算法計算被選取的圖像以及圖像結果集中被選取的 圖像所在的分類中的圖像的圖像相似度,包括以下步驟:
[0031] S8021 :將圖像轉化為灰度圖像,轉化公式如下:
[0032] Gray=RXO. 299+GXO. 587+BX0. 114 (1)
[0033] 其中,Gray表示灰度值,R、G和B分別表示原始像素中的紅、綠和藍的分量;
[0034] S8022 :將灰度圖像分為8X8塊,將每個塊的灰度設置為該塊的灰度平均值,使用 Gray[8, 8]矩陣來存儲每個塊的灰度值,生成一個感知哈希矩陣H[8, 8],滿足以下條件:
[0035]
⑵
[0036] 其中,avg是整張灰度圖像的灰度平均值,Gray[i,j]是圖像被劃分后,第i行、第 j列個塊的灰度值,others是指第i行、第j列個塊的灰度值小于avg時的情況,H[i,j]是 由第i行、第j列個塊的灰度值得到的感知哈希矩陣H[8, 8]的第i行、第j列個元素的值, 并滿足以下條件:
[0037]
⑶
[0038] 其中,Μ是指圖像劃分后的行數且M= 8,N是指圖像劃分后的列數且N= 8,將獲 得的64位的二進制數值作為圖像的感知哈希值;
[0039] S8023 :采用步驟S8021至步驟S8022分別提取被選取的圖像以及檢索結果所對應 的圖像的感知哈希值,采用按位異或方式計算兩張圖像的相似度,圖像H1和圖像H2的相似 度PO^HJ可以表示為位0的異或結果的百分比,公式如下:
[0040]
(4)
[0041] 其中,C。是一個計算0異或結果的函數。
[0042] 步驟S801完成后,在步驟S801所獲得的結果集中,采用步驟S802進行檢索排序, 將排序后的結果集返回給用戶。
[0043] 作為一個總的技術構思,本發明還提供了一種基于用戶搜索意圖定位的圖像檢索 系統,包括:
[0044] -次檢索模塊,用于根據用戶輸入的檢索關鍵字,使用任意一個圖像檢索平臺進 行檢索獲取圖像結果集;
[0045] 分類模塊,用于根據圖像結果集中的圖像的文本信息,對圖像結果集中的圖像進 行分類;
[0046] 用戶交互模塊,用于將分類后的圖像返回給用戶