樹的虛擬節點獨立出來,使得兩個服務的節 點能夠直接建立在公共虛擬節點之上,如此循環,直到所有的節點之間沒有相同的語義因 子,最終構建成空間信息服務的語義距離樹。
[0030] 優選地,所述語義距離樹相似度計算為:通過語義距離樹,來計算服務模型之間的 語義距離,然后通過語義距離與相似度之間的計算公式(1),計算出空間信息服務概念格內 涵之間的相似度,
【主權項】
1. 一種基于概念格的異構空間信息服務分類的語義匹配方法,包括如下步驟: 步驟一、從空間信息服務的描述原始信息中,提取空間信息服務的分類相關信息; 步驟二、根據步驟一中提取的空間信息服務的分類信息,追蹤到其采用的服務分類體 系,并從中提取與該服務相關的語義因子; 步驟三、根據提取的語義因子與空間信息服務的語義關聯關系,建立空間信息服務分 類模型; 步驟四、從空間信息服務的描述信息和所對應分類體系的描述信息中,提取與服務類 型相關的特征屬性,形成與服務類型相關的特征屬性集; 步驟五、將步驟三的空間信息服務分類模型與步驟四的服務類型相關的特征屬性集分 別作為概念格的內涵和外延,構建空間信息服務分類的概念格,形成相應的服務概念格S =(U,D),S表示服務概念格,U表示服務的內涵,D則表示服務的外延; 步驟六、對概念格的內涵部分與指定分類體系中的各個類型概念格的內涵部分進行融 合匹配,根據從服務分類體系中獲取的服務分類模型的原子屬性,構建服務語義因子的形 式化背景矩陣,形成空間信息服務語義信息的形式化知識表達; 步驟七、根據所述形式化概念背景矩陣,通過將有效的服務語義因子進行重新排列和 組合,并排除一些不可能作為服務模型的節點,融合并生成新的服務語義模型; 步驟八、根據步驟七融合生成的服務語義模型之間的語義因子關系,構建服務模型的 語義距離樹; 步驟九.分別計算語義距離樹相似度及特征屬性集的集合相似度,通過統一的服務概 念格計算方法,計算得到服務概念格之間的相似度,最終實現異構空間信息服務分類的語 義匹配。
2. 根據權利要求1所述的語義匹配方法,其特征在于: 在步驟一中,所述分類相關信息為服務分類類別、分類體系的名稱和分類體系URL地 址。
3. 根據權利要求1所述的語義匹配方法,其特征在于: 在步驟二中,提取語義因子的方法為: 若兩個原子服務概念之間是無交集關系,則二者同時成為服務概念語義因子; 若兩個原子服務概念之間是包含關系,則子概念直接成為服務概念語義因子,同時創 建一個新的服務概念語義因子,其范圍為子概念相對于父概念的補集; 若兩個原子服務概念之間是等價關系,則將二者融合為一個服務概念語義因子; 若兩個原子服務概念之間是交叉關系,則可以分為三個服務概念語義因子,一個為兩 個服務概念之間的交集,另外兩個為兩個原子服務概念的相互補集。
4. 根據權利要求1所述的,其特征在于: 在步驟三中,所述服務分類模型能夠以樹狀的形狀表型出來,其根節點的類別是一個 涵蓋待分類的所有服務的總分類類型,葉子節點則是分類體系中不可再分的原子分類,其 它節點是根據某種分類標準對根節點細分類型。
5. 根據權利要求1所述的語義匹配方法,其特征在于: 在步驟四中,所述與服務類型相關的特征屬性包括: 功能分類信息相關的服務概念屬性:指的是能夠代表服務功能特征的屬性信息; 依賴于IO參數類型的屬性,指的是以空間數據為核心來定義描述服務模型所需要的 IO相關屬性,包括數據、空間、時間、幾何、屬性、單位和數據質量; 與IO參數類型相關的屬性,指的是描述空間數據的輔助性概念,包括角度、文本、單位 和查詢方式。
6. 根據權利要求1所述的語義匹配方法,其特征在于: 在步驟八中,建立語義距離樹的方法為:首先將語義因子獨立出來,然后根據每個空間 信息服務包含語義因子的情況進行逐聚類,如果兩個服務的語義因子具有共同的部分,則 將共同的部分作為一個語義距離樹的虛擬節點獨立出來,使得兩個服務的節點能夠直接建 立在公共虛擬節點之上,如此循環,直到所有的節點之間沒有相同的語義因子,最終構建成 空間信息服務的語義距離樹。
7. 根據權利要求1所述的語義匹配方法,其特征在于: 所述語義距離樹相似度計算為:通過語義距離樹,來計算服務模型之間的語義距離,然 后通過語義距離與相似度之間的計算公式(1),計算出空間信息服務概念格內涵之間的相 似度,
其中,h (U)表示服務分類的語義距離樹中層次的深度值,屯和d 2是兩個進行相似度計 算的服務到它們最近公共祖先的語義距離; 特征屬性集的集合相似度計算為:參見公式(2),通過將兩個屬性集交集中屬性的數 量除以它們中最大一個集合的屬性數量,實現空間信息服務概念格外延之間的相似度計 算;
式中D1H D2表示特征屬性集合之間的交集,MaxOD11,|D2|)表示最大的一個集合中屬 性的數量; 服務概念格之間的相似度計算為:通過公式(3)計算得到 Sim(S1, S2) = α · SimOJ1, U2) + β · Sim(D1, D2) 公式(3) 其中,Sin^S1, S2)表示兩個不同服務51與S2的相似度,α、β作為內涵與外延的權值, SinKD1, D2)表示特征屬性集合D1J2之間的相似度,也就是服務概念格外延D ^仏之間的相 似度,SinKU1, U2)則表示語義距離樹相似度,也就是服務概念格內涵仏與U 2的語義相似度。
8. 根據權利要求1-7中任意一項所述的語義匹配方法, 在異構空間信息服務分類的匹配結果后,結合服務注冊中心中目錄服務的語義層次關 系,能夠有效提尚最優服務遍歷和選擇的效率, 具體的服務遍歷的方法為,根據匹配服務的分類信息,首先通過與分類體系中的大類 進行匹配;然后根據匹配成功與否,選擇進入該類別下的子類別進行匹配,或者直接略過該 類別,進行下一個大類匹配,并在與大類中的子類型匹配過程中,同樣采用先與父節點匹配 的方法,根據匹配成果與否,選擇是否進入子類節點的匹配,如此循環,直到匹配成果,否則 為匹配失敗。
【專利摘要】一種基于概念格的異構空間信息服務分類的語義匹配方法,首先利用概念格理論與分析方法,對多種異構的空間信息服務分類進行語義因子提取,然后從服務分類模型中獲取的服務分類特征屬性,并構建服務分類語義概念格,再基于概念格的空間信息服務分類相似度計算,最終實現異構空間信息服務分類的語義匹配。本發明針對跨不同注冊中心的異構空間信息服務共享存在的問題,充分利用分類體系中語義關系進行服務遍歷和選擇,實現跨多個注冊中心的空間信息服務分類語義匹配,有效提高服務檢索效率,促進空間信息服務的發展。有效克服異構空間信息服務分類的語義匹配技術難點。
【IPC分類】G06F17-27, G06F17-30
【公開號】CN104765763
【申請號】CN201510050509
【發明人】羅安, 劉紀平, 張福浩, 王勇
【申請人】中國測繪科學研究院
【公開日】2015年7月8日
【申請日】2015年2月2日