一種宮廷服飾特征選擇方法及裝置的制造方法
【技術領域】
[0001] 本發明設及數據挖掘領域,特別設及一種宮廷服飾特征選擇方法及裝置。
【背景技術】
[0002] 宮廷服飾有大量的圖案存留,同時相關專家學者關于宮廷服飾著有大量專著文 獻,從歷史淵源、社會變遷、服飾內容、藝術風格、質地材料等諸多方面對宮廷服飾進行了大 量深入細致的研究工作。所W,對于宮廷服飾而言,其特征可W來自圖案,也可W來自描述 性的文字等。而且不同宮廷服飾之間存在各種各樣的聯系,如宮廷服飾的圖案不同標識著 不同的身份,材質不同標識等級不同等。
[0003] 從宮廷服飾中能夠得到大量的特征,需要從大量的服飾特征中選擇出最能代表宮 廷服飾的特征,W便相關人員進行研究和使用。
[0004] 現有的特征選擇技術有先驗(Apriori)算法及其系列改進算法,大致過程為在待 選特征集合中,將高詞頻或統計度量的特征作為特征輸出,但由于宮廷服侍的樣本具有非 獨立分布的特點,已致該現有技術應用在宮廷服侍特征選擇時,會出現選擇特征不能充分 反映宮廷服飾對象的情況。
【發明內容】
[0005] 本發明實施例公開了一種宮廷服飾特征選擇方法,能夠從大量的服飾特征中選擇 出最能代表宮廷服飾的特征。
[0006] 為達到上述目的,本發明實施例公開了一種宮廷服飾特征選擇方法,應用于電子 設備,所述方法包括步驟:
[0007] 確定預設的宮廷服飾池中每件宮廷服飾的待選特征量;
[000引將所述每件宮廷服飾作為節點,W該服飾具有的待選特征量為對應節點的度,任 意宮廷服飾間每具有一個相同的待選特征量,則在對應的節點間生成一條連線,得到宮廷 服飾網絡;
[0009] 將所述宮廷服飾網絡中的各個節點按節點的度進行合并,得到合并后網絡;
[0010] 計算所述合并后網絡中每一個節點到包括自身在內的每個節點的一次轉移概率, 得到轉移概率矩陣;
[OOW 計算所述轉移概率矩陣的k次幕,其中k取值為從2開始、依次加1的整數,直到得到 的所述轉移概率矩陣的k次幕中的所有非對角線元素小于預設的第一闊值,取所述轉移概 率矩陣的k-1次幕作為第一矩陣;
[0012] 確定所述合并后網絡中每個節點的初始分布概率,得到初始分布概率向量;
[0013] 將所述初始分布概率向量乘W所述第一矩陣,得到合并后網絡每個節點的轉移分 布概率;
[0014] 將合并后網絡中每組具有連接關系的一對節點間轉移概率至少有一個大于第一 闊值、且該對節點轉移分布概率均大于第二闊值的節點的集合確定為最大關聯集,得到多 個最大關聯集;
[0015] 將每個所述最大關聯集中的每個節點的轉移分布概率相加作為對應最大關聯集 的系數,獲得每個最大關聯集中節點共有的特征量,并統計該特征量在該最大關聯集所有 節點中出現的次數,并用該次數乘W所述最大關聯集的系數,得到對應的加權值;
[0016] 將所述加權值從大到小進行排序,取排序在前預設數量個的加權值所對應的特征 量,作為結果特征量。
[0017] 較佳的,所述確定預設的宮廷服飾池中每件宮廷服飾的待選特征量,包括:
[0018] 針對所述預設的宮廷服飾池中保存有所述每件宮廷服飾,若本地保存有該宮廷服 飾對應的描述文本,則利用自然語言處理工具獲取該宮廷服飾對應的描述文本的分詞標 注,W所述分詞標注作為該宮廷服飾的待選特征;若本地保存有該宮廷服飾對應的圖像,貝U 利用圖像處理工具,獲得該宮廷服飾對應的圖像的紋理、背景色或對比度,作為該宮廷服飾 的待選特征量。
[0019] 較佳的,所述計算所述合并后網絡中每一個節點到包括自身在內的每個節點的一 次轉移概率,得到轉移概率矩陣,包括:
[0020] 針對所述合并后網絡中每一個節點,將該節點作為出發節點,定義所述出發節點 到自身的轉移概率為0,定義所述出發節點到特定其它節點的連線數占所述出發節點自身 總連線數的比值作為所述出發節點到該特定其它節點的轉移概率,得到轉移概率矩陣。
[0021] 較佳的,所述確定所述合并后網絡中每個節點的初始分布概率,得到初始分布概 率向量,包括:
[0022] 確定所述合并后網絡中每一個節點在合并前的節點數;
[0023] W所述合并后網絡中每一節點合并前的節點數占所述宮廷服飾網絡中總節點數 的比值,作為該節點的初始分布概率,將得到的所述合并后網絡中每個節點的初始分布概 率組合成所述初始分布概率向量。
[0024] 較佳的,所述將合并后網絡中每組具有連接關系的一對節點間轉移概率至少有一 個大于第一闊值、且該對節點轉移分布概率均大于第二闊值的節點的集合確定為最大關聯 集,得到多個最大關聯集,包括:
[0025] 針對所述合并后網絡中的每一個節點,將該節點作為主連節點,將與該主連節點 連接的其它節點作為被連節點,針對每一個被連節點,判斷所述主連節點轉移到該被連節 點的轉移概率、或該被連接節點轉移到所述主連節點的轉移概率是否至少有一個大于第一 闊值;若是,則判斷所述主連節點和被連節點的轉移分布概率是否都大于所述第二闊值;若 是,則將所述主連節點和被連節點確定為具有關聯通路;
[0026] 將任意兩節點間都具有關聯通路的節點取出,得到多個最大關聯集。
[0027] 本發明實施例還公開了一種宮廷服飾特征選擇裝置,應用于電子設備,所述裝置 包括:
[0028] 特征量確定模塊,用于確定預設的宮廷服飾池中每件宮廷服飾的待選特征量;
[0029] 服飾網絡模塊,用于將所述每件宮廷服飾作為節點,W該服飾具有的待選特征量 為對應節點的度,任意宮廷服飾間每具有一個相同的待選特征量,則在對應的節點間生成 一條連線,得到宮廷服飾網絡;
[0030] 合并模塊,用于將所述宮廷服飾網絡中的各個節點按節點的度進行合并,得到合 并后網絡;
[0031] 轉移概率矩陣生成模塊,用于計算所述合并后網絡中每一個節點到包括自身在內 的每個節點的一次轉移概率,得到轉移概率矩陣;
[0032] 第一矩陣生成模塊,用于計算所述轉移概率矩陣的k次幕,其中k取值為從2開始、 依次加1的整數,直到得到的所述轉移概率矩陣的k次幕中的所有非對角線元素小于預設的 第一闊值,取所述轉移概率矩陣的k-1次幕作為第一矩陣;
[0033] 初始分布概率向量生成模塊,用于確定所述合并后網絡中每個節點的初始分布概 率,得到初始分布概率向量;
[0034] 轉移分布概率確定模塊,用于將所述初始分布概率向量乘W所述第一矩陣,得到 合并后網絡每個節點的轉移分布概率;
[0035] 最大關聯集確定模塊,用于將合并后網絡中每組具有連接關系的一對節點間轉移 概率至少有一個大于第一闊值、且該對節點轉移分布概率均大于第二闊值的節點的集合確 定為最大關聯集,得到多個最大關聯集;
[0036] 加權模塊,用于將每個所述最大關聯集中的每個節點的轉移分布概率相加作為對 應最大關聯集的系數,獲得每個最大關聯集中節點共有的特征量,并統計該特征量在該最 大關聯集所有節點中出現的次數,并用該次數乘W所述最大關聯集的系數,得到對應的加 權值;
[0037] 結果確定模塊,用于將所述加權值從大到小進行排序,取排序在前預設數量個的 加權值所對應的特征量,作為結果特征量。
[0038] 較佳的,所述特征量確定模塊,具體用于:
[0039] 針對所述預設的宮廷服飾池中保存有所述每件宮廷服飾,若本地保存有該宮廷服 飾對應的描述文本,則利用自然語言處理工具獲取該宮廷服飾對應的描述文本的分詞標 注,W所述分詞標注作為該宮廷服飾的待選特征;若本地保存有該宮廷服飾對應的圖像,貝U 利用圖像處理工具,獲得該宮廷服飾對應的圖像的紋理、背景色