一種基于社區分析的圖像索引并行構建方法
【技術領域】
[0001]本發明涉及圖像查詢技術領域,具體地是涉及一種基于社區分析的圖像索引并行構建方法。
【背景技術】
[0002]從人類的認知角度看,人類對圖像的描述和理解主要是在語義層次上進行。而圖像的底層物理特征(如色彩、紋理、形狀、結構等)難于表達圖像高層語義內容,圖像表達的數字陣列與通常可以被人類所接受的概念化內容之間存在著語義鴻溝。如果不對原始圖像進行預處理,僅僅根據整幅圖像的底層物理特征進行檢索,圖像中將包含了大量不相關的信息。這些不相關的信息直接影響檢索的準確性,即使采用相關反饋技術也難以取得比較令人滿意的檢索結果。
[0003]因此,本發明的發明人亟需構思一種新技術以改善其問題。
【發明內容】
[0004]為了解決上述不足,本發明提供了一種基于社區分析的圖像索引并行構建方法。
[0005]為解決上述技術問題,本發明的技術方案是:
[0006]一種基于社區分析的圖像索引并行構建方法,包括如下步驟:
[0007]S1:采用并行K均值聚類算法對目標圖像實現聚類,所述目標圖像由多個視覺關鍵詞構成的特征聚類向量表示;
[0008]S2:對聚類得到的每個類分別建立索引;
[0009]S3:進行圖像查詢。
[0010]進一步地,所述步驟SI具體包括:
[0011]Sll:提取目標圖像和圖像數據庫中每幅圖像的顏色特征和紋理特征;
[0012]S12:對描述圖像內容的高維特征進行降維,得到特征子集;
[0013]S13:結合網格的樣本密度,對特征子集構成的數據集進行聚類。
[0014]進一步地,所述步驟S3具體包括:
[0015]S31:將目標圖像中提取的降維后的特征子集與所述步驟SI最終所得到的各聚類中心進行匹配,選擇最相似的索引樹;
[0016]S32:在最相似的索引樹中,根據目標圖像的所述顏色特征和紋理特征進行檢索,得到相似性匹配結果。
[0017]進一步地,所述步驟S13具體包括:
[0018]S131:將降維后的低維數據空間劃分成固定大小的網格;
[0019]S132:計算每個網格中落入的樣本數目得到每個格點的樣本密度;
[0020]S133:將格點按照其樣本密度排序;
[0021]S134:根據排序結果得到初始聚類的分類數和各分類的初始中心;
[0022]S135:用K均值方法來模擬數據點的分布,得到最終的聚類結果。
[0023]進一步地,所述步驟S12中對高維圖像特征進行降維時,選擇全局顏色矩作為表征圖像內容的特征向量。
[0024]進一步地,選擇全局顏色矩是選取顏色的一階矩、二階矩和三階矩作為表征圖像的特征向量。
[0025]采用上述技術方案,本發明至少包括如下有益效果:
[0026]本發明所述的基于社區分析的圖像索引并行構建方法,采用并行K均值聚類算法對圖像塊實現聚類,圖像采用由一系列的視覺關鍵詞構成的特征聚類向量表示,在圖像檢索時能避免線性掃描海量、高維和動態的特征數據庫。采用向量空間模型及語言模型計算每個圖像對的語義相似度,構建圖像的語義相似度社會網絡,在此基礎上,基于大規模社區分析方法構建海量圖像的語義索引。在索引構建中采用高維聚類索引空間的某些有意義的子空間計算圖像間的相似度,從而克服聚類索引“維度災難”的問題,結合圖像塊物理特征索引與圖像全局層次的語義索引,提升海量圖像檢索的速度和效果。
【附圖說明】
[0027]圖1為本發明所述的基于社區分析的圖像索引并行構建方法的流程圖。
【具體實施方式】
[0028]下面結合附圖和實施例對本發明進一步說明。
[0029]如圖1所示,為符合本發明的一種基于社區分析的圖像索引并行構建方法,包括如下步驟:
[0030]S1:采用并行K均值聚類算法對目標圖像實現聚類,所述目標圖像由多個視覺關鍵詞構成的特征聚類向量表示;
[0031]S2:對聚類得到的每個類分別建立索引;
[0032]S3:進行圖像查詢。
[0033]進一步地,所述步驟SI具體包括:
[0034]Sll:提取目標圖像和圖像數據庫中每幅圖像的顏色特征和紋理特征;
[0035]S12:對描述圖像內容的高維特征進行降維,得到特征子集;
[0036]S13:結合網格的樣本密度,對特征子集構成的數據集進行聚類。
[0037]進一步地,所述步驟S3具體包括:
[0038]S31:將目標圖像中提取的降維后的特征子集與所述步驟SI最終所得到的各聚類中心進行匹配,選擇最相似的索引樹;
[0039]S32:在最相似的索引樹中,根據目標圖像的所述顏色特征和紋理特征進行檢索,得到相似性匹配結果。
[0040]進一步地,所述步驟S13具體包括:
[0041]S131:將降維后的低維數據空間劃分成固定大小的網格;
[0042]S132:計算每個網格中落入的樣本數目得到每個格點的樣本密度;
[0043]S133:將格點按照其樣本密度排序;
[0044]S134:根據排序結果得到初始聚類的分類數和各分類的初始中心;
[0045]S135:用K均值方法來模擬數據點的分布,得到最終的聚類結果。
[0046]進一步地,所述步驟S12中對高維圖像特征進行降維時,選擇全局顏色矩作為表征圖像內容的特征向量。
[0047]進一步地,選擇全局顏色矩是選取顏色的一階矩、二階矩和三階矩作為表征圖像的特征向量。
[0048]本實施例采用并行K均值聚類算法對圖像塊實現聚類,圖像采用由一系列的視覺關鍵詞構成的特征聚類向量表示,在圖像檢索時能避免線性掃描海量、高維和動態的特征數據庫。采用向量空間模型及語言模型計算每個圖像對的語義相似度,構建圖像的語義相似度社會網絡,在此基礎上,基于大規模社區分析方法構建海量圖像的語義索引。在索引構建中采用高維聚類索引空間的某些有意義的子空間計算圖像間的相似度,從而克服聚類索弓I “維度災難”的問題,結合圖像塊物理特征索引與圖像全局層次的語義索引,提升海量圖像檢索的速度和效果。
[0049]本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本發明的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例作出另外的變更和修改。顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內,則本發明也意圖包含這些改動和變型在內。
【主權項】
1.一種基于社區分析的圖像索引并行構建方法,其特征在于,包括如下步驟: 51:采用并行K均值聚類算法對目標圖像實現聚類,所述目標圖像由多個視覺關鍵詞構成的特征聚類向量表示; 52:對聚類得到的每個類分別建立索引; 53:進行圖像查詢。
2.如權利要求1所述的基于社區分析的圖像索引并行構建方法,其特征在于,所述步驟SI具體包括: 511:提取目標圖像和圖像數據庫中每幅圖像的顏色特征和紋理特征; 512:對描述圖像內容的高維特征進行降維,得到特征子集; 513:結合網格的樣本密度,對特征子集構成的數據集進行聚類。
3.如權利要求1所述的基于社區分析的圖像索引并行構建方法,其特征在于,所述步驟S3具體包括: 531:將目標圖像中提取的降維后的特征子集與所述步驟SI最終所得到的各聚類中心進行匹配,選擇最相似的索引樹; 532:在最相似的索引樹中,根據目標圖像的所述顏色特征和紋理特征進行檢索,得到相似性匹配結果。
4.如權利要求2或3所述的基于社區分析的圖像索引并行構建方法,其特征在于,所述步驟S13具體包括: 5131:將降維后的低維數據空間劃分成固定大小的網格; 5132:計算每個網格中落入的樣本數目得到每個格點的樣本密度; 5133:將格點按照其樣本密度排序; 5134:根據排序結果得到初始聚類的分類數和各分類的初始中心; 5135:用K均值方法來模擬數據點的分布,得到最終的聚類結果。
5.如權利要求4所述的基于社區分析的圖像索引并行構建方法,其特征在于:所述步驟S12中對高維圖像特征進行降維時,選擇全局顏色矩作為表征圖像內容的特征向量。
6.如權利要求5所述的基于社區分析的圖像索引并行構建方法,其特征在于:選擇全局顏色矩是選取顏色的一階矩、二階矩和三階矩作為表征圖像的特征向量。
【專利摘要】本發明公開了一種基于社區分析的圖像索引并行構建方法,采用并行K均值聚類算法對圖像塊實現聚類,圖像采用由一系列的視覺關鍵詞構成的特征聚類向量表示,在圖像檢索時能避免線性掃描海量、高維和動態的特征數據庫。采用向量空間模型及語言模型計算每個圖像對的語義相似度,構建圖像的語義相似度社會網絡,在此基礎上,基于大規模社區分析方法構建海量圖像的語義索引。在索引構建中采用高維聚類索引空間的某些有意義的子空間計算圖像間的相似度,從而克服聚類索引“維度災難”的問題,結合圖像塊物理特征索引與圖像全局層次的語義索引,提升海量圖像檢索的速度和效果。
【IPC分類】G06F17-30, G06K9-62
【公開號】CN104778281
【申請號】CN201510224042
【發明人】束蘭, 黃裕新
【申請人】蘇州搜客信息技術有限公司
【公開日】2015年7月15日
【申請日】2015年5月6日