一種基于互聯網的共享數據查詢方法
【專利摘要】本發明涉及一種基于互聯網的共享數據查詢方法,其特征在于,步驟如下:(1)導航代理創建數據集導航的基礎圖;(2)用戶向導航代理輸入路徑表達式;(3)導航代理根據路徑表達式,迭代的進行轉移、跳轉、尋找等操作;(4)導航代理將獲得的互聯數據結果輸出給用戶。本方法實現了基于互聯數據的半自動化的語義導航,并為查詢提供了良好的導航能力。用戶可以通過給定路徑表達式來約束導航的規則和過程。通過導航可以查詢獲得用戶想要的互聯數據集,并能做一些推理工作,為互聯數據的查詢和推理提供了一種新的方法。
【專利說明】一種基于互聯網的共享數據查詢方法
【技術領域】[0001]本發明涉及信息檢索領域,尤其涉及一種基于互聯網的共享數據查詢方法。
【背景技術】[0002]互聯數據由大量的互聯RDF (資源描述框架)圖組成。互聯數據有四個規則:(I)用URI作為事物的名字;(2)使用HTTP URI ; (3)在RDF中提供有用的信息;⑷可以包括到其他URI的RDF鏈接。互聯數據被看做是互聯網上的一個開放的分布式的數據庫。互聯數據可以用RDF數據集來表示,RDF數據集是一個RDF命名圖的集合。RDF圖既可以表示成RDF三元組(S,ρ,ο)的集合,又可以表示成帶標簽的有向圖[0003]
【權利要求】
1.一種基于互聯網的共享數據查詢方法,其特征在于,步驟如下: (1)導航代理創建數據集導航的基礎圖; (2)用戶向導航代理輸入路徑表達式; (3)導航代理根據路徑表達式,迭代的進行轉移、跳轉、尋找等操作,具體包括: 第一步:對所述查詢計劃進行分割,得到由各數據節點分別執行的切片; 第二步:各數據節點分別進行切片處理,得到各數據節點的哈希連接; 第三步:各數據節點通過聚合匯總數據流動操作,在控制節點進行哈希聚合,得到查詢結果集; 在所述第二步中,各數據節點的切片處理包括以下步驟: 步驟I) 一個數據節點掃描第一表,得到第一哈希表,然后掃描; 第二表,與第一哈希表進行哈希連接,得到第一數據集; 步驟2)另一個數據節點掃描第三表,得到第三哈希表,然后掃描第四表,與第三哈希表進行哈希連接,得到第二數據集; 步驟3)所述另一個數據節點基于所述第一數據集和所述第二數據集進行哈希連接; 在所述第二步中,各數據節點的切片處理包括以下步驟: 步驟11) 一個數據節點掃描第一表,得到第一哈希表,然后掃描第二表,與第一哈希表進行哈希連接,得到第一數據集,并將第二表通過廣播數據流動操作或者重新分布數據流動操作,發送給其他數據節點; 步驟12)另一個數據節點掃描第三表,基于接收到的所述第二表和掃描的第三表,得到第三哈希表,然后掃描第四表,與第三哈希表進行哈希連接,得到第二數據集; 步驟13)所述另一個數據節點基于所述第一數據集和所述第二數據集進行哈希連接; (4)導航代理將獲得的互聯數據結果輸出給用戶。
2.根據權利要求1所述的基于互聯網的共享數據查詢方法,其特征在于:所述的導航代理為編程語言架構的數據管理服務器。
【文檔編號】G06F17/30GK103605655SQ201310459747
【公開日】2014年2月26日 申請日期:2013年9月29日 優先權日:2013年9月29日
【發明者】王萌, 唐新來, 李健軍 申請人:柳州市宏億科技有限公司