一種基于背景知識的層次語義模型圖像檢索方法
【專利摘要】本發明公開了信息檢索技術領域中的一種基于背景知識的層次語義模型圖像檢索方法。其步驟主要包括:利用FCA方法將通用領域的背景知識構建為概念格模型;提取圖像包含顏色信息的SIFT特征來構造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯;利用Bayesian決策理論實現視覺詞匯到語義主題信息的映射,構造層次語義模型;完成基于內容的語義圖像檢索算法,輸出檢索關鍵詞;分析作為檢索屬性的搜索關鍵詞與原有形式背景屬性集的關系;利用概念格結構完成基于檢索屬性集的語義檢索。本發明通過基于背景知識的層次語義模型圖像檢索方法,能夠確保檢索結果滿足用戶的檢索要求。
【專利說明】
一種基于背景知識的層次語義模型圖像檢索方法
技術領域
[0001]本發明屬于信息檢索技術領域,涉及一種圖像檢索的方法,具體涉及一種基于背景知識的層次語義模型圖像檢索方法。
【背景技術】
[0002]隨著互聯網的快速發展,網絡的信息量越來越大,如何從海量數據中檢索到用戶真正需要的信息成為信息檢索的關鍵任務。應用廣泛的信息檢索是目前信息科學的一個研究熱點,各種方法技術不斷涌現。信息檢索的研究方法大體上可以分為基于語法的檢索和基于內容的檢索兩個方面;而現有圖像檢索技術中,由于其使用圖像紋理、顏色和形狀等低層特征作為索引來對圖像進行檢索,而圖像低層特征表達出的信息與用戶對這些特征圖像理解的含義存在不一致性,即語義鴻溝,所以檢索效果往往不能滿足用戶的需求。
[0003]如果檢索過程中能夠考慮圖像所包含的圖像高層語義信息,加入用戶對圖像內容的理解,則會是一種更貼近用戶理解的圖像檢索。然而,目前語義檢索中語義映射關系大多是通過人工標注建立,對于待檢索圖像中的語義信息難以獲得較好的映射,從而影響檢索效果的提升。
[0004]本發明結合上述【背景技術】中提到的問題以及信息檢索領域的信息發展趨勢和需求,提出一種基于背景知識的層次語義模型圖像檢索方法。本方法綜合了語法相似度和語義相似度兩方面因素,且利用詞匯樹將圖像特征與人工標注的語義特征進行關聯,以實現檢索過程中的自動語義映射;實現高層語義映射的自動修正,以獲得更好的檢索效果,得到滿足用戶的更為準確的檢索結果,減少用戶的檢索負擔。
【發明內容】
[0005]為了實現上述目的,本發明提出的技術方案是一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,包括以下步驟:
[0006]利用FCA方法將通用領域的背景知識構建為概念格模型;
[0007]提取圖像包含顏色信息的SIFT特征來構造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯;
[0008]利用Bayesian決策理論實現視覺詞匯到語義主題信息的映射,構造層次語義模型;
[0009]完成基于內容的語義圖像檢索算法,輸出檢索關鍵詞;
[0010]分析搜索關鍵詞與原有形式背景屬性集的關系;
[0011]利用概念格結構完成基于檢索屬性集的語義檢索。
[0012]進一步地,其特征包括:采用二維表表示通用領域知識的形式背景,利用FCA方法構建形式背景的概念格結構模型,得到形式背景屬性集和形式背景對象集。
[0013]進一步地,其特征包括:構建詞匯樹的方法包括:
[0014]設定聚類個數K,樹的深度P,對特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節點,并計算出每個子節點的中心向量;不斷重復直到樹的深度達到預設值P,獲得SIFT詞匯樹;其中,K取5-10的整數,P取3-6的整數。
[0015]進一步地,其特征包括:通過計算每個圖片與詞匯樹的每個葉節度的相關度,完成圖片與詞匯樹的關聯。
[0016]進一步地,其特征包括:設定圖像庫的語義主題信息集,先采用人工標注的方法將圖像庫中的圖片分類至語義主題信息集中的各語義主題信息;再利用Bayesian統計決策理論實現視覺詞匯層到語義信息層的映射。
[0017]進一步地,其特征包括:將搜索關鍵詞作為檢索屬性,分析其與原有形式背景屬性集的關系,如果所有檢索屬性屬于形式背景屬性集,則直接基于概念格模型進行語義檢索;否則,則對領域知識的形式背景進行動態重構;進一步通過相似度計算從屬性集中找出與每一個檢索屬性最為相似的對應替換屬性,更新檢索屬性集。
[0018]本發明綜合了語法相似度和語義相似度兩方面因素,且利用詞匯樹將圖像特征與人工標注的語義特征進行關聯,以實現檢索過程中的自動語義映射;實現高層語義映射的自動修正,以獲得更好的檢索效果,得到滿足用戶的更為準確的檢索結果,減少用戶的檢索負擔。
【主權項】
1.一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,包括以下步驟: 利用FCA方法將通用領域的背景知識構建為概念格模型; 提取圖像包含顏色信息的SIFT特征來構造圖像庫的特征詞匯樹,生成描述圖像視覺信息的視覺詞匯; 利用Bayesian決策理論實現視覺詞匯到語義主題信息的映射,構造層次語義模型; 完成基于內容的語義圖像檢索算法,輸出檢索關鍵詞; 分析搜索關鍵詞與原有形式背景屬性集的關系; 利用概念格結構完成基于檢索屬性集的語義檢索。2.根據權利要求1所述的一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,采用二維表表示通用領域知識的形式背景,利用FCA方法構建形式背景的概念格結構模型,得到形式背景屬性集和形式背景對象集。3.根據權利要求1所述的一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,其構建詞匯樹的方法包括: 設定聚類個數K,樹的深度P,對特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節點,并計算出每個子節點的中心向量;不斷重復直到樹的深度達到預設值P,獲得SIFT詞匯樹;其中,K取5-10的整數,P取3-6的整數。4.根據權利要求1所述的一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,通過計算每個圖片與詞匯樹的每個葉節度的相關度,完成圖片與詞匯樹的關聯。5.根據權利要求1所述的一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,設定圖像庫的語義主題信息集,先采用人工標注的方法將圖像庫中的圖片分類至語義主題信息集中的各語義主題信息;再利用Bayesian統計決策理論實現視覺詞匯層到語義信息層的映射。6.根據權利要求1所述的一種基于背景知識的層次語義模型圖像檢索方法,其特征在于,將搜索關鍵詞作為檢索屬性,分析其與原有形式背景屬性集的關系,如果所有檢索屬性屬于形式背景屬性集,則直接基于概念格模型進行語義檢索;否則,則對領域知識的形式背景進行動態重構;進一步通過相似度計算從屬性集中找出與每一個檢索屬性最為相似的對應替換屬性,更新檢索屬性集。
【文檔編號】G06F17/30GK106021251SQ201510588932
【公開日】2016年10月12日
【申請日】2015年9月16日
【發明人】張樹坤
【申請人】展視網(北京)科技有限公司