一種基于概念格的異構空間信息服務分類的語義匹配方法
【技術領域】
[0001] 本發明屬于空間信息服務語義技術領域,特別的,涉及了一種新型的異構空間信 息服務分類的語義匹配方法。
【背景技術】
[0002] 隨著語義網技術的發展,大量空間信息資源和空間數據處理功能都以服務的形式 提供給用戶。面對數量如此龐大的互聯網信息資源,用戶如何快速發現自己所需要的空間 信息服務,是空間信息服務領域亟待解決的問題。空間信息服務分類的語義匹配則是解決 這一問題的首當其出、至關重要的一步。
[0003] 圍繞這一問題,國內學者開展了相關研宄,并已經取得了一定的進展。從服務的角 度提出功能的分類,可以追溯到TsouMing-HsIang提出的面向任務的分布式地理信息服務 組件分類方式,它將GIS任務分為六大類。為了將服務分類與用戶需求的匹配聯系起來,張 霞首次將用戶分類和服務分類聯系起來。詹勤通過分析遙感信息服務的領域特征及其概念 的時間名詞特點,結合框架語義學理論,提出了基于事件框架提取遙感信息服務概念的語 義特征,并在此基礎上利用形式概念分析構建遙感信息服務分類本體。
[0004] 目前空間信息服務分類匹配,大多數是要求請求服務具有統一的規范服務分類語 義描述,并且要求服務發布者和請求者在對服務分類進行描述時都必須采用同一種空間信 息服務分類體系,同時還要建立在他們對服務的分類認識完全相同的條件下,這樣描述的 服務分類才能進行有效的語義匹配。這些都是一種假設,這種假設在現實中是無法滿足的, 其原因如下:其一,服務請求者并不一定都是行業用戶,隨著空間信息服務的越來越普及, 普通老百姓已經開始成為空間信息服務的對象,而他們對空間信息服務的分類一無所知, 就不可能在請求服務時對服務的類型進行有效地描述;其二,空間信息服務的分類體系多 種多樣,為了促進了空間信息服務進一步共享和互操作,各種標準化組織,如國際標準化組 織(ISO)、開放地理空間信息聯盟(OpenGeospatialConsortium,0GC)和其他標準化組織, 都針對空間信息服務的應用和實現,提出了相關的空間信息服務分類規范。這些空間信息 服務分類體系各有優缺點,并且現階段也還不存在一種被行業人士完全認可并適合服務發 現匹配和互操作的空間信息服務分類體系。
[0005] 因此,可以說現階段空間信息服務分類的語義匹配,受到服務分類所采用分類體 系的限制,只能對采用相同分類體系的空間信息服務進行語義匹配,無法實現不同分類體 系的異構空間信息服務分類匹配。從而使得各個組織或研宄機構在利用互聯網上的空間信 息服務時,不能直接利用互聯網上已有的語義描述空間信息服務,需要使用自己的服務分 類標準/體系對服務信息重新進行語義描述,并將其注冊到自己構建的空間信息服務注冊 中心。
【發明內容】
[0006] 針對上述問題,本發明將語義異構互操作中的概念格引入到空間信息服務領域, 提出了一種基于概念格的異構空間信息服務分類語義融合與匹配方法,利用構造服務概念 格的方式來計算服務之間的語義相似度,有效解決采用不同分類體系描述的請求空間信息 服務和廣告服務來之間的語義匹配,并通過注冊中心目錄服務的語義層次關系來提高最優 服務遍歷和選擇效率。
[0007] 為達此目的,本發明采用以下技術方案:
[0008] 一種基于概念格的異構空間信息服務分類的語義匹配方法,包括如下步驟:
[0009] 步驟一、從空間信息服務的描述原始信息中,提取空間信息服務的分類相關信 息;
[0010] 步驟二、根據步驟一中提取的空間信息服務的分類信息,追蹤到其采用的服務分 類體系,并從中提取與該服務相關的語義因子;
[0011] 步驟三、根據提取的語義因子與空間信息服務的語義關聯關系,建立空間信息服 務分類模型;
[0012] 步驟四、從空間信息服務的描述信息和所對應分類體系的描述信息中,提取與服 務類型相關的特征屬性,形成與服務類型相關的特征屬性集;
[0013] 步驟五、將步驟三的空間信息服務分類模型與步驟四的服務類型相關的特征屬性 集分別作為概念格的內涵和外延,構建空間信息服務分類的概念格,形成相應的服務概念 格S= (U,D),S表示服務概念格,U表示服務的內涵,D則表示服務的外延;
[0014] 步驟六、對概念格的內涵部分與指定分類體系中的各個類型概念格的內涵部分進 行融合匹配,根據從服務分類體系中獲取的服務分類模型的原子屬性,構建服務語義因子 的形式化背景矩陣,形成空間信息服務語義信息的形式化知識表達;
[0015] 步驟七、根據所述形式化概念背景矩陣,通過將有效的服務語義因子進行重新排 列和組合,并排除一些不可能作為服務模型的節點,融合并生成新的服務語義模型;
[0016] 步驟八、根據步驟七融合生成的服務語義模型之間的語義因子關系,構建服務模 型的語義距離樹;
[0017] 步驟九.分別計算語義距離樹相似度及特征屬性集的集合相似度,通過統一的服 務概念格計算方法,計算得到服務概念格之間的相似度,最終實現異構空間信息服務分類 的語義匹配。
[0018] 優選地,在步驟一中,所述分類相關信息為服務分類類別、分類體系的名稱和分類 體系URL地址。
[0019] 優選地,在步驟二中,提取語義因子的方法為:
[0020] 若兩個原子服務概念之間是無交集關系,則二者同時成為服務概念語義因子;
[0021] 若兩個原子服務概念之間是包含關系,則子概念直接成為服務概念語義因子,同 時創建一個新的服務概念語義因子,其范圍為子概念相對于父概念的補集;
[0022] 若兩個原子服務概念之間是等價關系,則將二者融合為一個服務概念語義因子;
[0023] 若兩個原子服務概念之間是交叉關系,則可以分為三個服務概念語義因子,一個 為兩個服務概念之間的交集,另外兩個為兩個原子服務概念的相互補集。
[0024] 優選地,在步驟三中,所述服務分類模型能夠以樹狀的形狀表型出來,其根節點的 類別是一個涵蓋待分類的所有服務的總分類類型,葉子節點則是分類體系中不可再分的原 子分類,其它節點是根據某種分類標準對根節點細分類型。
[0025] 優選地,在步驟四中,所述與服務類型相關的特征屬性包括:
[0026] 功能分類信息相關的服務概念屬性:指的是能夠代表服務功能特征的屬性信息;
[0027] 依賴于IO參數類型的屬性,指的是以空間數據為核心來定義描述服務模型所需 要的IO相關屬性,包括數據、空間、時間、幾何、屬性、單位和數據質量;
[0028] 與IO參數類型相關的屬性,指的是描述空間數據的輔助性概念,包括角度、文本、 單位和查詢方式。
[0029] 優選地,在步驟八中,建立語義距離樹的方法為:首先將語義因子獨立出來,然后 根據每個空間信息服務包含語義因子的情況進行逐聚類,如果兩個服務的語義因子具有共 同的部分,則將共同的部分作為一個語義距離