土地利用空間數據處理中基于地理本體的屬性匹配方法
【技術領域】
[0001] 本發明涉及土地利用空間數據處理中的同名實體屬性匹配方法,具體是一種土地 利用空間數據處理中基于地理本體的屬性匹配方法。
【背景技術】
[0002] 在土地利用空間數據處理中,同名實體的屬性匹配是一道十分重要的環節。在現 有技術條件下,同名實體的屬性匹配普遍采用字符串匹配方法。字符串匹配方法是指從文 本中找出給定字符串的一個或所有出現的位置,然后通過簡單的疊加查詢到包含部分關鍵 字符串的文檔。實踐表明,字符串匹配方法由于自身原理所限,存在如下問題:其一,字符串 匹配方法無法理解推理出查詢的語義,由此容易造成匹配錯誤。其二,字符串匹配方法無法 滿足不同應用系統之間互操作的需求,由此導致適用范圍受限。本發明是一種全新的同名 實體屬性匹配方法,以改進現有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限 的問題。
【發明內容】
[0003] 本發明為了解決現有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限的 問題,提供了一種土地利用空間數據處理中基于地理本體的屬性匹配方法。
[0004] 本發明是采用如下技術方案實現的:土地利用空間數據處理中基于地理本體的屬 性匹配方法,該方法是采用如下步驟實現的:
[0005] 1)構建地理本體;所述地理本體包括本體類庫、本體關系庫、知識庫;具體構建步 驟包括:
[0006] 1. 1)構建本體類庫;所述本體類庫包括土地分類、行政區劃、空間坐標系、要素類 型;具體構建步驟包括:
[0007] 1. 1. 1)構建土地分類;
[0008] 1. 1. 2)構建行政區劃;
[0009] 1. 1. 3)構建空間坐標系;
[0010] 1. 1. 4)構建要素類型;
[0011] 1. 2)構建本體關系庫:所述本體關系庫包括對象關系庫、數值關系庫;具體構建 步驟包括:
[0012] 1. 2. 1)構建對象關系庫;
[0013] 1. 2. 2)構建數值關系庫;
[0014] 1.3)構建知識庫;
[0015] 2)實體屬性匹配;具體匹配步驟包括:
[0016] 2. 1)將空間數據導入地理本體;
[0017] 2. 2)首先,對空間數據中的兩要素的各個數字型屬性進行相似度計算;具體計算 公式如下:
[0019] 式⑴中:D為兩要素的同一個數字型屬性的相似度;Ap A2分別為兩要素的同一 個數字型屬性的取值;
[0020] 然后,對兩要素的各個數字型屬性的相似度進行加權,并將加權值與閾值進行比 較;若加權值小于閾值,則結束匹配;若加權值大于閾值,則采用向量來表示空間數據中的 兩要素的各個字符型屬性,并對空間數據中的兩要素的各個字符型屬性進行相似度計算; 具體表示公式和計算公式如下:
[0021] Aj= (w 1; 1, w2, 1, . . . , wn, 1) (2);
[0022] A2=(w1; 2, w2, 2, . . . , wn, 2) (3);
[0024] 式(2)_⑷中:Ap A2分別為兩要素的同一個字符型屬性的向量表不;w p w2,…, wn分別為獨立的詞組;cos 0為兩要素的同一個字符型屬性的相似度;A i *A2為兩要素的同 一個字符型屬性的向量表示的點乘;| |Al| |、| |A2| |分別為兩要素的同一個字符型屬性的 向量表示的模;
[0025] 最后,對兩要素的各個字符型屬性的相似度進行加權,并將加權值與閾值進行比 較;若加權值小于閾值,則結束匹配;若加權值大于閾值,則將兩要素判定為同一實體,由 此完成實體屬性匹配。
[0026] 與現有同名實體屬性匹配方法相比,本發明所述的土地利用空間數據處理中基于 地理本體的屬性匹配方法通過將本體技術引入到同名實體的屬性匹配中,一方面實現了理 解推理出查詢的語義,由此有效防止了匹配錯誤,另一方面滿足了不同應用系統之間互操 作的需求,由此使得適用范圍不再受限。
[0027] 本發明有效解決了現有同名實體屬性匹配方法容易造成匹配錯誤、適用范圍受限 的問題,適用于土地利用空間數據處理。
【附圖說明】
[0028] 圖1是本發明的步驟1. 1)的示意圖。
[0029] 圖2是本發明的步驟1. 1. 1)的示意圖。
[0030] 圖3是本發明的步驟1. 2. 1)的示意圖。
[0031] 圖4是本發明的步驟2)的示意圖。
【具體實施方式】
[0032] 土地利用空間數據處理中基于地理本體的屬性匹配方法,該方法是采用如下步驟 實現的:
[0033] 1)構建地理本體;所述地理本體包括本體類庫、本體關系庫、知識庫;具體構建步 驟包括:
[0034] 1. 1)構建本體類庫;所述本體類庫包括土地分類、行政區劃、空間坐標系、要素類 型;具體構建步驟包括:
[0035] 1. 1. 1)構建土地分類;
[0036] 1. 1. 2)構建行政區劃;
[0037] 1. 1. 3)構建空間坐標系;
[0038] 1. 1. 4)構建要素類型;
[0039] 1. 2)構建本體關系庫:所述本體關系庫包括對象關系庫、數值關系庫;具體構建 步驟包括:
[0040] 1. 2. 1)構建對象關系庫;
[0041] 1. 2. 2)構建數值關系庫;
[0042] 1. 3)構建知識庫;
[0043] 2)實體屬性匹配;具體匹配步驟包括:
[0044] 2. 1)將空間數據導入地理本體;
[0045] 2. 2)首先,對空間數據中的兩要素的各個數字型屬性進行相似度計算;具體計算 公式如下:
[0047] 式⑴中:D為兩要素的同一個數字型屬性的相似度;Ap A2分別為兩要素的同一 個數字型屬性的取值;
[0048] 然后,對兩要素的各個數字型屬性的相似度進行加權,并將加權值與閾值進行比 較;若加權值小于閾值,則結束匹配;若加權值大于閾值,則采用向量來表示空間數據中的 兩要素的各個字符型屬性,并對空間數據中的兩要素的各個字符型屬性進行相似度計算; 具體表示公式和計算公式如下:
[0049] Aj= (w 1; 1, w2, 1, . . . , wn, 1) (2);
[0050] A2=(w1; 2, w2, 2, . . . , wn, 2) (3);
[0052] 式(2)_⑷中:Ap A2分別為兩要素的同一個字符型屬性的向量表不;w p w2,…, wn分別為獨立的詞組;cos 0為兩要素的同一個字符型屬性的相似度;A i *A2為兩要素的同 一個字符型屬性的向量表示的點乘;| |Al| |、| |A2| |分別為兩要素的同一個字符型屬性的 向量表示的模;
[0053] 最后,對兩要素的各個字符型屬性的相似度進行加權,并將加權值與閾值進行比 較;若加權值小于閾值,則結束匹配;若