專利名稱:基于Web Service組合的問答服務構建方法
技術領域:
本發明屬于軟件工程技術領域,特別涉及一種基于Web Service組合的問 答服務構建方法。
背景技術:
自1966年Jaseph實現了第一個問答系統Eliza以來,人們就一直在探索能 夠讓機器幫助回答人所需信息的技術。目前的問答系統根據采用的技術方法主 要分為以下三類
(1) 基于關鍵字的問答系統
這類系統以知道、愛問、奇虎等為代表,利用IR領域中成熟的關鍵字及其 相關技術,抽取網頁中與用戶問題相近的內容間接回答;或者靠群體力量構建 問答知識庫,通過FAQ技術尋找最匹配的問題答案。很多學者圍繞此類系統展 開研究并取得一定進展,如通過構建詞-句語義空間,提出基于潛在語義分析 的問答匹配度方法;抽取問題特征集、答句特征集和組合特征集作為分類特征, 結合最大熵模型和支持向量機實現答案自動分類;將詞語概念描述分解為屬性 和語義角色兩部分,通過加權計算詞語相似度;基于關鍵字重疊率、密度、信 息檢索反饋、回答頻率等6種特征,研究跨語言的問答排序問題。
(2) 基于自然語言的問答系統
從1991年Loebner獎設立以來,許多基于自然語言的聊天式問答系統相繼 問世,如支持知識庫擴展的Alice,提供在線語音問答的Talk-Bot,提供跨語言問答的Jabberwock,能夠自我學習的Niall,以及08年的最佳得主艾爾博特等。 這些系統以模式匹配相關方法為核心,通過用戶問題理解、用戶問題學習、答 案合理性分析等技術,實現問題的巧妙回答。此外,有專家提出通過人機對話, 挖掘用戶情緒,自適應地調整網頁中的音視頻內容作為回答,延伸了問答系統 的應用外延。
(3)基于語義網的問答系統
04年McGui皿ess指出了語義網對于問答系統發展的推動作用,尤其是本體 的引入,提高了問題的理解、答案的分析、知識庫的構建等環節語義描述的精 確性,以及問答系統的智能性。陸汝鈐院士主持開發的"Pangu"將自然語言理解 與語義網相結合,是問答領域的典型代表;中科院開發的"知網",提供了一個龐 大的知識庫,為大型智能問答系統的實現奠定了基礎;還有專家提出通過構建 用戶profile,并結合本體,實現了移動平臺上的個性化問答系統。值得一提的是, 己出現一種發展趨勢,將語義Web服務應用于問答系統,針對每個用戶問題尋 找一個合適的Web服務用于回答。
以上三類系統中,第一類的特點是系統并不理解問題及答案的真正含義, 而僅提供一個異步式提問解惑的途徑,并且,它們完全依賴于預先構建的問題-答案關聯庫;第二類系統在與用戶交互過程中,側重于談話技巧和程序技巧, 而非常識,從而回避領域知識庫問題,但其返回的內容往往不是用戶所需的答 案。第三類系統通過語義網相關技術提高問答系統的語義性,并有效利用Web 服務回答問題,省去了知識庫維護的任務,但僅局限于某類應用,并沒有從軟 件構造方法學的角度給出生產這類軟件服務的通用技術手段。 發明內容本發明目的在于解決現有技術不足,提供一種能夠為每一類型問答構建共 用軟件服務的自動化方案。
為實現上述目的,本發明提供的技術方案包括以下步驟
步驟1,利用Web服務資源所含的所有Web服務在一個或以上層面的關聯情況, 確定這些Web服務兩兩之間的有向關系;
步驟2,以Web服務資源所含的每個Web服務作為節點,Web服務兩兩之間的 有向關系作為邊,構建Web服務有向關系網絡;
步驟3,從Web服務資源中選擇能夠用于回答當前用戶提問的Web服務,構成 Web服務集合,參照Web服務有向關系網絡為該Web服務集合構建服務層次化 網狀步驟4,根據服務層次化網狀圖,從Web服務集合中尋找能夠回答當前用戶提 問的若干服務流程組合策略作為備選問答方案,供用戶從中選擇最佳問答方案, 用于回答當前用戶的提問。
而且,步驟l中考察不同Web服務之間在三個層面的關聯情況,所述三個
層面如下,
語義概念層Rs,該層基于Web服務的名稱及介紹中的核心關鍵詞,通過領域本 體擴展;
接口匹配層&,該層綜合考慮Web服務的操作、輸入輸出的名稱及數據類型; 歷史關系層RH,該層分析Web服務的歷史調用日志,對曾經相互調用的Web 服務之間建立歷史關系。
而且,步驟1的具體實現方式為,根據Web服務資源中任意兩個Web服務 Si、 Sj之間的關系大小和主導調用方向確定這兩個Web服務Si、 Sj之間的有向關
9系;Web服務Sj、 Sj在接口匹配層R^和歷史關系層RH調用方向的疊加結果,決 定Web服務Si、 Sj之間的主導調用方向;Web服務資源中任意兩個Web服務的 關系大小求取方式如下,
將Web服務資源中任意兩個Web服務Si、 Sj的關系大小表示為關系值O,,
其計算公式為^ (1), i壚j,
式(1)中co,和c^是關系權重;
式(1)中、代表Web服務Si、 Sj在語義概念層Rs的無向關系值,關聯 對象為Web服務整體;、通過對Web服務中的不同核心關鍵詞計算平均概 念關系求得;
式(1)中^代表Web服務Si、 Sj在接口匹配層Rz和歷史關系層Rh的 有向關系值,所謂有向是指對Web服務調用的先后次序有要求,關聯對象為 Web服務的接口操作;5通過對Web服務中的不同Web服務接口操作對計
算累計值求得。
而且,無向關系值、計算公式為(2),
式(2)中^為常量,用以保證、大小范圍為(0,1]; 式(2)中C(a,b)為關鍵詞a和b的概念關聯總數;
式(2)中關鍵詞a和b的數量差異0(C。,CJ二^/C。2 +CA2 45|)
(3), C。為Sj的關鍵詞集合,Q則為Sj的關鍵詞集合;
式(2)中關鍵詞a和b的語義距離a",的=(4), e"6)表示
關鍵詞a和b映射到領域本體中的兩個概念可能存在的關聯規則的量化函數, 而丄。和^表示關鍵詞a和b映射到領域本體中的兩個概念在領域本體中的抽象層次;假設^對應更為抽象的抽象層次,則/Z丄J為關鍵詞a和b關聯比較 時的抽象程度函數,若關鍵詞a和b映射到領域本體中的兩個概念越抽象, 則關鍵詞a和b關聯程度越低;//Z。,Z^為抽象程度差距函數,其實際意義是 若關鍵詞a和b映射到領域本體中兩個概念抽象程度越接近,關鍵詞a和b 關聯程度越高;
有向關系值^的計算公式為;=巧.|>00 (5),
(",v)
式(5)中z^為常量,用以保證^大小范圍為(0,1]; 式(5)中K為Web服務Sj、 Sj在接口匹配層Rz可以關聯的不同Web服 務接口操作對的總量之和;
式(5)中ct(x)^〖00^ (6),調用次數p^表示當前接口操作 L1 (P < 1)
對(u, v)在歷史關系層RH存在調用日志,采用積分方式實施累加;調用次數 p<l表示當前接口操作對(u, v)在歷史關系層RH不存在調用日志,僅通過1 反映接口匹配層&當前操作對(u, v)關系的存在。 而且,步驟3的具體實現方式包括以下步驟, 步驟3.1,對當前用戶提問和Web服務資源所含Web服務的服務描述分別進行 概念實體抽取,并以本體作為概念擴展的基礎,映射出Web服務資源中與當前 用戶提問相關的所有Web服務Si,S2,…S^禾調Web服務有向關系網絡,擴展 與這N個Web服務S,,S2,.,.Sw在歷史關系層RH關系最為顯著的M個外圍服務 Sl,s2,...sM;構成當前問題相關Web服務集合(Si,S2,…SN, s,,S2,…Sm); 步驟3.2,以Web服務SbS2,…SN, SbS2,…sm作為節點,抽取此N+M個Web服 務兩兩之間的有向關系,組成一個服務關系子網;步驟3.3,針對用戶提問和Web服務Si,S2,…Sw描述中各自的概念實體,依次計 算概念集相似度并排序,選擇其中與用戶問題最相關的若干Web服務,作為起
始服務,設定所有起始服務構成起始服務列集rB;
步驟3.4,以起始服務為服務層次化網狀圖的第一層,按照服務關系子網中的節 點及有向關系,并將服務關系子網轉換成服務層次化網狀圖。
而且,在步驟4尋找服務流程組合策略時,設置閥值S,所述閥值S用于確 定每次流程下推時所能選擇的路徑;具體實現方式包括以下步驟, 步驟4.1,從服務層次化網狀圖的最高層選擇任一起始節點作為下推起點, 步驟4.2,執行下推,即根據閥值5從下推起點下推一層時所能選擇的路徑,定 位每條路徑所連接的新節點;
步驟4.3,執行回溯,即以步驟4.2中確定的新節點之一為回溯起點,向上回溯 與回溯起點連接的上層節點,逐層回溯直至最高層;
步驟4.4,檢査此時整個流程中,該回溯起點、回溯起點連接的下層節點和回溯
所涉及的所有節點是否完全包含起始服務列集rB,若是則終止該條流程,直接
作為一個服務流程組合策略;若否則選取一個步驟4.2中確定的其它新節點,返 回執行步驟4.3進行回溯;
若對步驟4.2中確定的所有新節點處理完畢,仍沒有一個流程完全包含起始 服務列集rs;將步驟4.2中確定的每個新節點作為下推起點,返回步驟4.2循環 執行下推及回溯。
而且,從尋找到的備選問答方案中選出最優問答方案,供用戶參考。 而且,根據其他用戶歷史上對同類問題已作的選擇,對備選問答方案排序, 供用戶參考。本發明為每個類型的問答設置相關的Web服務集合,從層面出發綜合計算 不同Web服務之間的關聯大小,并將兩個Web服務之間占主導地位的調用方向 視為它們的最佳調用方向,從而確定Web服務之間的有向關系;然后將每個 Web服務作為節點,不同Web服務之間的有向關系作為邊,形成一個Web服務 關系網絡。該網絡實際反映了任意兩個或多個Web服務之間調用或被調用的概 率。當確定了與當前問題相關的Web服務集合后,將服務關系網絡的相應部分 轉換成層次化網狀圖。最后在服務自動組合階段,基于該層次化網狀圖,及其 節點邊的概率值,逐層逐步地推導出能夠回答當前問題的服務流程組合策略, 每套服務流程組合策略即對應了能夠回答一類問題的問答服務軟件。本發明還 提出通過一系列規則,對這些服務流程組合策略進行排序,即這些方案均可回 答當前問題,但回答的質量較高的方案將排序較前。本發明的有益效果通過 自動Web服務組合的技術手段,生成能夠回答一類問題的問答服務軟件,從而 能夠滿足復雜的跨領域跨系統問題的回答,并且克服了傳統問答系統必須維護 一個龐大的本地知識庫的問題,具有廣泛的應用前景。
圖l是本發明實施例的服務關系子網示意圖; 圖2是本發明實施例的服務層次化網狀圖。
具體實施例方式
本發明通過動態組合Web服務,生成能夠回答與當前提問相關的一類問題 的問答服務,即為每一類問題生成一個統一的軟件(即服務),以后類似問題均 可以調用這個軟件進行回答,而不是像目前的方法,每個問題單獨去找答案。 以下結合附圖和實施例詳細說明本發明技術方案,包括有4個步驟步驟1,利用Web服務資源所含的所有Web服務在一個或以上層面的關聯情況, 確定這些Web服務兩兩之間的有向關系。
不同于目前所有的問答服務構建技術,本發明創造性的提出直接利用Web 服務資源,只需考察Web服務資源所含的所有Web服務在一個或以上層面的關 聯情況,作為提供問答服務的基礎。可以從互聯網上搜索Web服務,將所有 Web服務的集合作為Web服務資源;或者事先收集Web服務存放到專用數據庫, 以便提供Web服務資源。
本發明提出了進一步技術方案..綜合考察不同Web服務之間在三個層面的 關聯情況
語義概念層Rs,該層基于Web服務的名稱及介紹中的核心關鍵詞,通過領域本 體擴展;
接口匹配層Rp該層綜合考慮Web服務的操作、輸入輸出的名稱及數據類型; 歷史關系層RH,該層分析Web服務的歷史調用日志,對曾經相互調用的Web 服務之間建立歷史關系。
綜合考察不同Web服務之間在這三個層面的關聯情況,可以更準確的得到 這些Web服務兩兩之間的有向關系。具體實施時,考察其中一個等數目層面的 關聯情況,或者按照其它層面劃分考察關聯情況,以得到Web服務兩兩之間的 有向關系也是可行的方案。
為了方便以數據結構形式存儲所得有向關系,利于計算機進行自動處理, 本發明提出根據Web服務資源中任意兩個Web服務&、 Sj之間的關系大小和主 導調用方向確定這兩個Web服務Si、 Sj之間的有向關系。并且將Web服務資源 中任意兩個Web服務Si、 Sj的關系大小表示為關系值a^,采用量化的方式進行
14處理,能夠清晰地反映任意兩個或多個Web服務之間調用或被調用的概率。具
體方式為將Web服務資源中任意兩個Web服務Si、 Sj的關系大小表示為關系 值%,其計算公式為O,-a^+a; (1), i^j,
式(1)中0),和002是關系權重;
式(1)中、代表Web服務Si、 Sj在語義概念層Rs的無向關系值,關聯 對象為Web服務整體(即考察Web服務Si和Web服務Sj整體上的關聯),、
通過對Web服務中的不同核心關鍵詞計算平均概念關系求得;
式(1)中^代表Web服務Si、 Sj在接口匹配層R!和歷史關系層Rh的 有向關系值,所謂有向是指對Web服務調用的先后次序有要求,關聯對象為 Web服務的接口操作;5通過對Web服務中的不同Web服務接口操作對計
算累計值求得。
具體實施設計求取公式時,無向關系值 和有向關系值^;的求取應該考慮
能夠準確反映Web服務在相應層面的關系。本發明提供最佳實施例如下
無向關系值、計算公式為";^"、 (2), 式(2)中r,為常量,用以保證、大小范圍為(0,1];
式(2)中C(a,b)為關鍵詞a和b的概念關聯總數;a、 b分別對應S;和 Sj的某個關鍵詞,即兩個Web服務Si和Sj都有自己的關鍵字集合C。、 C6, 每次從集合C。 、 C6中各抽取1個進行比較;
式(2)中關鍵詞a和b的數量差異 (C。,C6) = Vc。2 +' A"g^ - 451)
(3);
式(2)中關鍵詞a和b的語義距離"a,的=^",W/"。) (4), e(。,6)表示
,2 (丄a,乙6)關鍵詞a和b映射到領域本體中的兩個概念可能存在的關聯規則的量化函數,
而4和^表示關鍵詞a和b映射到領域本體中的兩個概念在領域本體中的抽
象層次。
假設丄。對應更為抽象的抽象層次,則力(ZJ為關鍵詞a和b關聯比較時的 抽象程度函數,若關鍵詞a和b映射到領域本體中的兩個概念越抽象,則關 鍵詞a和b關聯程度越低。也就是說,所有概念可表示成一個概念樹,假設 a代表水果,b代表蘋果,則概念a更為抽象,即覆蓋面更廣,那么,我們將 概念a所在的概念層次表示為丄。,并通過函數f《U)將其計算為一個數值,量
化的表示其抽象程度,以方便和其他概念的抽象程度進行對比。
/2(1。,^為抽象程度差距函數,其實際意義是若關鍵詞a和b映射到領域 本體中兩個概念抽象程度越接近,關鍵詞a和b關聯程度越高。
有向關系值^的計算公式為^ = ^.|>00 (5),因為通過這種函數(公式5、 6)
("力
計算累計值的結果可能偏大,為了便于衡量關系大小,本發明實施例提出將累 積值結果轉換到O一之間的數。
式(5)中巧為常量,用以保證^大小范圍為(0,1];
式(5)中K為接口匹配層R可以關聯的不同Web服務接口操作對的總
式(5)中ct(x) = {〖0(P1 (6),調用次數p^表示當前接口操作 L1 (P < 1)
對(u, v)在歷史關系層RH存在調用日志,采用積分方式實施累加;調用次數 p<l表示當前接口操作對(u, v)在歷史關系層RH不存在調用日志,僅通過1 反映接口匹配層R:當前操作對(u,v)關系的存在。Web月艮務Sj、 Sj在接口匹配層R,和歷史關系層RH調用方向的疊加結果,則決定Web服務Si、 Sj之間的
主導調用方向。
步驟2,以Web服務資源所含的每個Web服務作為節點,Web服務兩兩之間的有向關系作為邊,構建Web服務有向關系網絡。
步驟3,從Web服務資源中選擇能夠用于回答當前用戶提問的Web服務,構成Web服務集合,參照Web服務有向關系網絡為該Web服務集合構建服務層次化網狀圖。
具體實施時,為了降低數據調用工作量,可以根據Web服務集合,首先從Web服務有向關系網絡提取出服務關系子網,再構建服務層次化網狀圖。實施例中,步驟3的具體實現方式包括以下步驟,
步驟3.1,對當前用戶提問和Web服務資源所含Web服務的服務描述分別進行概念實體抽取,并以本體作為概念擴展的基礎,映射出Web服務資源中與當前用戶提問相關的所有Web服務S,,S2,…Sw;利用Web服務有向關系網絡,擴展與這N個Web服務S,,S2,…Sw在歷史關系層RH關系最為顯著的M個外圍服務Sl,s2,...sM;構成當前問題相關\\^服務集合{81,82,...81^, s,,S2,…SM;h步驟3.2,以\\^3服務81,82,...8>1、31,82,...81^作為節點,抽取此N+M個Web服務兩兩之間的有向關系,組成一個服務關系子網;
步驟3.3,針對用戶提問和Web服務S',S2,…SN描述中各自的概念實體,依次計算概念集相似度并排序,選擇其中與用戶問題最相關的若干Web服務,作為起
始服務,設定所有起始服務構成起始服務列集rB;
步驟3.4,以起始服務為服務層次化網狀圖的第一層,按照服務關系子網中的節點及有向關系,并將服務關系子網轉換成服務層次化網狀圖。參見附圖1,本發明實施例的一個服務關系子網中的節點包括前N個服務
A、 B、 C、 D、 E、 G、 K、 H,和擴展的M個服務F、 J、 I、 P,從中選擇服務A、B為起始服務。附圖2中過濾了服務P,將剩下的服務整理成了四層,其中有向關系方向參見圖屮箭頭,關系值附在箭頭上,都在0 1之間。轉換后得到的服務層次化網狀圖參見附圖2,第一層包括的起始服務為A、 B,逐層存在調用關系。
步驟3.1可以參考一個可擴展的概念關系知識庫實現,將對當前用戶提問和Web服務資源所含Web服務的服務描述分別對照概念關系知識庫進行實體抽取后,可以方便地實現映射,并以本體作為概念擴展的基礎。計算概念集相似度可以采用現有技術,例如TD-IDF方法;選擇其中與用戶問題最相關的若干Web服務時,可以通過預先設定閥值自動選擇,或者呈現排序給用戶自行指定。步驟4,根據服務層次化網狀圖,從Web服務集合中尋找能夠回答當前用戶提問的若干服務流程組合策略作為備選問答方案,供用戶從中選擇最佳問答方案,用于回答當前用戶的提問。
為了能夠高效準確的從Web服務集合中尋找能夠回答當前用戶提問的服務流程組合策略,本發明提出可以通過循環下推、回溯方式實現。往往能夠從Web服務集合中尋找到一個以上能夠回答當前用戶提問的不同服務流程組合策略,共同作為備選問答方案,用戶可以從中擇一作為答案。具體實現方式為,在步驟4尋找服務流程組合策略時,設置閥值5,所述閥值5用于確定每次流程下推
時所能選擇的路徑;尋找按以下步驟實現,
步驟4.1,從服務層次化網狀圖的最高層選擇任一起始節點作為下推起點。
為了能夠全面地找到所有能夠當前用戶提問的不同服務流程組合策略,可以采用輪序方式對每個起始節點都執行這些步驟。
步驟4.2,執行下推,即根據閥值S從下推起點下推一層時所能選擇的路徑,定位每條路徑所連接的新節點;
假設下層節點有5個,則有5條路徑,但路徑上的關聯值僅有3個大于S,則下推一層時所能選擇的路徑僅有3條,新節點為3個。具體實施時,閥值5可以根據對答案的精確性要求設置。
步驟4.3,執行回溯,即以步驟4.2中確定的新節點之一為回溯起點,向上回溯與回溯起點連接的上層節點,逐層回溯直至最高層;
步驟4.4,檢查此時整個流程中是否完全包含起始服務列集rB,若是則終止該條
流程,直接作為一個服務流程組合策略;若否則選取一個步驟4.2中確定的其它新節點,返回執行步驟4.3進行回溯。
假設步驟4.2中確立了3個新節點,先選擇一個為回溯起點進行回溯, 一直到最高層的根節點處,判斷當前整個流程(包括有該回溯起點、回溯起點連接的下層節點和回溯所涉及的所有節點)中是否完全包含rB,。包含了就中止該流程,否則再選擇第2個新節點回溯起點進行回溯,以此類推。為了避免重復,回溯時注意避開該新節點上一層的下推起點。
若對步驟4.2中確定的所有新節點處理完畢,仍沒有一個流程完全包含起始服務列集rB;將步驟4.2中確定的每個新節點做為下推起點,返回步驟4.2循環執行下推及回溯。不斷下推尋找新節點,回溯進行檢查,直到找到一個流程中完全包含起始服務列集rB,或者下推至服務層次化網狀圖的最低層仍沒有找到。
也就是說,規定所找到的服務流程組合策略必須完全包含起始服務列集rB,含
有最符合當前用戶提問需求的Web服務。具體實施時,還可以采用其它方式實現尋找服務流程組合策略,只需把握下推回溯原則即可。例如首先判斷第一層的所有起始服務到第二層的所有關聯值是否大于閥值5,從中篩選出有關聯值大于閥值5的起始服務,再繼續逐層進行下推回溯處理。
向用戶提供備選問答方案時,還可以從尋找到的備選問答方案中選出最優問答方案供用戶選擇時參考。具體實施時可以按照以下規則對步驟4中獲得的若干組合方案進行過濾,從層數相同的方案中選出最優的
① 層數相同方案中關系值Oij之和最大;
② 層數相同方案中服務質量QOS之和最高;
③ 層數相同方案中節點服務價格之和最低。以上規則可由用戶選擇部分考慮或全部考慮,并可動態調整每條規則的權重。
每次用戶選擇答案后,都可以根據用戶選擇對備選問答方案重新排序,主要供下次其它用戶選擇時參考。具體實施時,可以采取用戶決策與層次判斷相結合的答案排序方式,即先根據歷史用戶答案選擇結果的統計進行排序,當用戶選擇數量相同時,則根據層次越多服務信息涉及面越廣,提供的答案準確性越高原則,進行排序。用戶選擇方案進行問題回答,并可參與評價問題的好壞,從而間接判斷了方案的優劣,為后期該問題的排序貢獻一定知識。
權利要求
1. 基于Web服務組合的問答服務構建方法,用于從Web服務資源中提供當前用戶提問的答案,其特征在于包括以下步驟步驟1,利用Web服務資源所含的所有Web服務在一個或以上層面的關聯情況,確定這些Web服務兩兩之間的有向關系;步驟2,以Web服務資源所含的每個Web服務作為節點,Web服務兩兩之間的有向關系作為邊,構建Web服務有向關系網絡;步驟3,從Web服務資源中選擇能夠用于回答當前用戶提問的Web服務,構成Web服務集合,參照Web服務有向關系網絡為該Web服務集合構建服務層次化網狀圖;步驟4,根據服務層次化網狀圖,從Web服務集合中尋找能夠回答當前用戶提問的若干服務流程組合策略作為備選問答方案,供用戶從中選擇最佳問答方案,用于回答當前用戶的提問。
2. 如權利要求1所述的問答服務構建方法,其特征在于步驟1中綜合考察不同Web服務之間在三個層面的關聯情況,所述三個層面如下,語義概念層Rs,該層基于Web服務的名稱及介紹中的核心關鍵詞,通過領域本體擴展;接口匹配層Rp該層綜合考慮Web服務的操作、輸入輸出的名稱及數據類型;歷史關系層RH,該層分析Web服務的歷史調用日志,對曾經相互調用的Web服務之間建立歷史關系。
3. 如權利要求2所述的問答服務構建方法,其特征在于步驟l的具體實現方式為,根據Web服務資源中任意兩個Web服務Si、 Sj之間的關系大小和主導調用方向確定這兩個Web服務Si、 Sj之間的有向關系;Web服務Si、 Sj在接口匹配層Rt和歷史關系層RH調用方向的疊加結果,決定Web服務Si、 Sj之間的主導調用方向;Web服務資源中任意兩個Web服務的關系大小求取方式如下,將Web服務資源中任意兩個Web服務Sj、 Sj的關系大小表示為關系值^ ,其計算公式為Oy =6^,+^^ (1), i#j,式(1)中co,和co;是關系權重;式(1)中、代表Web服務Si、 Sj在語義概念層Rs的無向關系值,關聯對象為Web服務整體;、通過對Web服務中的不同核心關鍵詞計算平均概念關系求得;式(1)中5代表Web服務Si、 Sj在接口匹配層R!和歷史關系層Rh的有向關系值,所謂有向是指對Web服務調用的先后次序有要求,關聯對象為Web服務的接口操作;^通過對Web服務中的不同Web服務接口操作對計算累計值求得。
4.如權利要求3所述的問答服務構建方法,其特征在于無向關系值、計算公式為<formula>formula see original document page 3</formula>(2),<formula>formula see original document page 3</formula>式(2)中巧為常量,用以保證、大小范圍為(0,1〗;式(2)中C(a,b)為關鍵詞a和b的概念關聯總數;式(2)中關鍵詞a和b的數量差異<formula>formula see original document page 3</formula>(3), C。為Sj的關鍵詞集合,^則為Sj的關鍵詞集合;式(2)中關鍵詞a和b的語義距離<formula>formula see original document page 3</formula>表示關鍵詞a和b映射到領域本體中的兩個概念可能存在的關聯規則的量化函數,而丄。和丄,表示關鍵詞a和b映射到領域本體中的兩個概念在領域本體中的抽象層次;假設丄。對應更為抽象的抽象層次,則力^g為關鍵詞a和b關聯比較時的抽象程度函數,若關鍵詞a和b映射到領域本體中的兩個概念越抽象,則關鍵詞a和b關聯程度越低;力fl。,iW為抽象程度差距函數,其實際意義是若關鍵詞a和b映射到領域本體中兩個概念抽象程度越接近,關鍵詞a和b關聯程度越高;有向關系值5的計算公式為^^rrlXx) (5),式(5)中^為常量,用以保證^大小范圍為(0,1];式(5)中K為Web服務Sj、 Sj在接口匹配層&可以關聯的不同Web服務接口操作對的總量之和;式(5)中cr(x)-化《V^0^1) (6),調用次數p^1表示當前接口操作l1 (P < 1)對(u, v)在歷史關系層RH存在調用日志,采用積分方式實施累加;調用次數p<l表示當前接口操作對(u, v)在歷史關系層RH不存在調用日志,僅通過1反映接口匹配層&當前操作對(u, v)關系的存在。
5.如權利要求3或4所述的問答服務構建方法,其特征在于步驟3的具體實現方式包括以下步驟,步驟3.1,對當前用戶提問和Web服務資源所含Web服務的服務描述分別進行概念實體抽取,并以本體作為概念擴展的基礎,映射出Web服務資源中與當前用戶提問相關的所有Web服務S^2,…Sw;利用Web服務有向關系網絡,擴展與這N個Web服務SbS2,…SN在歷史關系層RH關系最為顯著的M個外圍服務Sl,s2,...sM;構成當前問題相關Web服務集合d,S2,…SN, Sl,s2,...sM};步驟3.2,以Web服務ShS2,…SN, Si,S2,…SM作為節點,抽取此N+M個Web服務兩兩之間的有向關系,組成一個服務關系子網;步驟3.3,針對用戶提問和Web服務S1,S2,...SN描述中各自的概念實體,依次計算概念集相似度并排序,選擇其中與用戶問題最相關的若干Web服務,作為起始服務,設定所有起始服務構成起始服務列集rB;步驟3.4,以起始服務為服務層次化網狀圖的第一層,按照服務關系子網中的節點及有向關系,并將服務關系子網轉換成服務層次化網狀圖。
6.如權利要求5所述的問答服務構建方法,其特征在于在步驟4尋找服務流程組合策略時,設置閥值S,所述閥值5用于確定每次流程下推時所能選擇的路徑;具體實現方式包括以下步驟,步驟4.1,從服務層次化網狀圖的最高層選擇任一起始節點作為下推起點,步驟4.2,執行下推,即根據閥值S從下推起點下推一層時所能選擇的路徑,定位每條路徑所連接的新節點;步驟4.3,執行回溯,即以步驟4.2中確定的新節點之一為回溯起點,向上回溯與回溯起點連接的上層節點,逐層回溯直至最高層;步驟4.4,檢査此時整個流程中,該回溯起點、回溯起點連接的下層節點和回溯所涉及的所有節點是否完全包含起始服務列集rB,若是則終止該條流程,直接作為一個服務流程組合策略;若否則選取一個步驟4.2中確定的其它新節點,返回執行步驟4.3進行回溯;若對步驟4.2中確定的所有新節點處理完畢,仍沒有一個流程完全包含起始服務列集rs;將步驟4.2中確定的每個新節點作為下推起點,返回步驟4.2循環執行下推及回溯。
7. 如權利要求6所述的問答服務構建方法,其特征在于從尋找到的備選問答方案中選出最優問答方案,供用戶參考。
8. 如權利要求6所述的問答服務構建方法,其特征在于而且,根據其他用戶歷史上對同類問題已作的選擇,對備選問答方案排序,供用戶參考。
全文摘要
本發明提供一種基于Web服務組合的問答服務構建方法,用于從Web服務資源中提供當前用戶提問的答案,其特征在于包括以下步驟利用Web服務資源所含的所有Web服務在一個或以上層面的關聯情況,確定這些Web服務兩兩之間的有向關系;構建Web服務有向關系網絡;從Web服務資源中選擇能夠用于回答當前用戶提問的Web服務,構建服務層次化網狀圖;根據服務層次化網狀圖,從Web服務集合中尋找能夠回答當前用戶提問的若干服務流程組合策略作為備選問答方案,供用戶從中選擇最佳問答方案,用于回答當前用戶的提問。本發明能夠通過自動Web服務組合的技術手段,生成能夠回答一類問題的問答服務軟件,從而能夠滿足復雜的跨領域跨系統問題的回答。
文檔編號H04L12/18GK101465749SQ200810237468
公開日2009年6月24日 申請日期2008年12月29日 優先權日2008年12月29日
發明者承 曾, 歐偉杰 申請人:武漢大學