提供同義詞的上下文驗證的方法和系統的制作方法
【技術領域】
[0001] 此發明一般涉及本體驅動的自然語言處理(NLP),以及更具體地涉及在本體驅動 的NLP中提供同義詞的上下文驗證。
【背景技術】
[0002] 自然語言文本中的常見問題是欠規范(under-specification)。例如,當人們同另 一個人說話時,存在一個允許理解特定語境單詞和短語的共享語境。當用戶與專家系統交 互時,也期望有共享語境。但是,因為欠規范和缺乏共享語境,對計算機來說理解語言有時 候很困難。
[0003] 目前,NLP可以被用于實現先進的在線問題應答服務。NLP提供嘗試理解和識別語 言的句法結構的技術。例如,NLP已經被用于識別提交的句子中一個或多個術語的詞類(the parts of speech),以支持將句子用作對數據的自然語言查詢。但是,即使數據是高度組織 的,使用NLP對數據進行解析和處理查詢可能由于關鍵詞中的歧義而遭受性能問題。
[0004] 本體驅動的NLP解析自然語言文本并且將其變換為它的意思表示,所述表示是圍 繞事件和它的參與者來組織的。查詢可以接著被匹配到在文本中生成(surface)的預期的 任何置換的意思表示。但是,這些變換也可能遭受欠規范,其中必須假定恰當語境以理解聲 明或者查詢。關于假定語境的這種歧義有時導致不準確和不期望的結果。
【發明內容】
[0005] 通常,在此描述的實施例提供用于在本體驅動的NLP中驗證同義詞的方案。具體 地,提供方案用于接收包含令牌的用戶輸入、把用戶輸入組織成語義模型,所述語義模型包 含其中每個都含有所述令牌的相關置換集合的類的集合、將令牌指定為相關置換集合中的 一個置換的同義詞、用對應于相關置換集合中的所述一個置換的類的集合中的一個類來注 釋所述令牌、以及通過確定將令牌指定為相關置換集合中的所述一個置換的同義詞的準確 性來驗證所述令牌的注釋。在一種實施例中,通過量化所述令牌和同樣在用戶輸入內的 上下文令牌之間的線性距離,以及將所述線性距離與預定的線性距離限制比較來確定準確 性。
[0006] 本發明的一個方面包括一種用于在本體驅動的自然語言處理中提供同義詞的上 下文驗證的方法,所述方法包括計算機實現的以下步驟:接收包含令牌的用戶輸入、把用戶 輸入組織成語義模型,所述語義模型包含其中每個都含有所述令牌的相關置換集合的類的 集合、將令牌指定為相關置換集合中的一個置換的同義詞、用對應于相關置換集合中的所 述一個置換的類的集合中的一個類來注釋所述令牌、以及通過確定將令牌指定為相關置換 集合中的所述一個置換的同義詞的準確性來驗證所述令牌的注釋。
[0007] 本發明的另一個方面包括一種用于在本體驅動的自然語言處理中提供同義詞的 上下文驗證的系統,所述系統包括:包含指令的存儲器介質;耦接到存儲器介質的總線;以 及通過總線耦接到NLP引擎的處理器,當處理器執行指令時使得系統:接收包含令牌的用 戶輸入、把用戶輸入組織成語義模型,所述語義模型包含其中每個都含有所述令牌的相關 置換集合的類的集合、將令牌指定為相關置換集合中的一個置換的同義詞、用對應于相關 置換集合中的所述一個置換的類的集合中的一個類來注釋所述令牌、以及通過確定將令牌 指定為相關置換集合中的所述一個置換的同義詞的準確性來驗證所述令牌的注釋。
[0008] 本發明的再一個方面提供一種存儲有計算機指令的計算機可讀存儲設備,當指令 被執行時使得計算機系統能夠在本體驅動的自然語言處理中提供同義詞的上下文驗證,所 述計算機指令包括:接收包含令牌的用戶輸入、把用戶輸入組織成語義模型,所述語義模型 包含其中每個都含有所述令牌的相關置換集合的類的集合、將令牌指定為相關置換集合中 的一個置換的同義詞、用對應于相關置換集合中的所述一個置換的類的集合中的一個類來 注釋所述令牌、以及通過確定將令牌指定為相關置換集合中的所述一個置換的同義詞的準 確性來驗證所述令牌的注釋。
【附圖說明】
[0009] 圖1示出了根據說明性實施例的示例性計算環境的原理圖;
[0010] 圖2示出了根據說明性實施例的示例性NLP引擎以及其實現的原理圖;
[0011] 圖3示出了根據說明性實施例的包含一個或多個令牌的示例性用戶輸入的集合;
[0012] 圖4示出了根據說明性實施例的語義模型;
[0013] 圖5示出了根據說明性實施例的重新組織的語義模型;以及
[0014] 圖6示出了根據說明性實施例的用于在本體驅動的自然語言處理中提供同義詞 的上下文驗證的處理流程。
[0015] 所述附圖不必是按比例的。所述附圖僅僅是代表,并不旨在描繪本發明的具體參 數。所述附圖旨在僅描述本發明的典型實施例,并且因此不應當被認為限制于范圍。在所 述附圖中,相似的附圖標記代表相似的元件。
【具體實施方式】
[0016] 參考其中示出示例性實施例的附圖,本發明在此會被更詳細地描述。本公開可以 以多種不同形式實現并且不應該被解釋為限制到在這里提出的示例性實施例。相反,提供 這些示例性實施例以便本公開會變得徹底和完整并且會完全將本公開內容傳達給本領域 技術人員。在說明書,可以省略公知的特征和技術的細節,以避免不必要地模糊所提出的實 施例。貫穿本說明書提及的"一個實施例" "某一實施例"或者類似語言意指結合所述實施 例描述的特定特征、結構或者特性被包括在本發明的至少一個實施例中。因此,貫穿此說明 書出現的短語"在一個實施例中""在某一實施例中"以及類似語言可以但不是必須全部參 考同樣的實施例。
[0017] 此外,在此使用的術語僅用作描述特定實施例的目的并且不旨在被限制于此公 開。如在此使用的,單數形式"一""一個"以及"這個"旨在也包括復數形式,除非上下文另 外清晰指出。此外,術語"一""一個"等的使用不表示數量的限制,而是指示存在至少一個 所述的參考項目。將要進一步理解,當在本說明書中使用時,術語"包含"或者"包括"詳細 說明了所述特征、區域、完整部分(interger)、步驟、操作、元件、和/或組件的存在,但是不 排除存在或者添加一個或多個其他特征、區域、完整部分、步驟、操作、元件、組件、和/或其 的聚合。
[0018] 除非另外明確聲明,可以認識到諸如"處理"、"計算"、"確定"、"評價"、或類似的術 語涉及計算機或計算系統、或類似電子數據中心設備的動作和/或過程,此動作把表示為 計算系統的寄存器和/或存儲器內的物理量(例如電子)的數據操縱和/或轉換為其他類 似的表示為計算系統的存儲器、寄存器或其他此類信息存儲、傳遞或預覽設備內的物理量。 所述實施例不限于此上下文。
[0019] 如在本申請中使用的,在此使用的單詞"示例性"意指充當例子、實例、或說明。在 此描述為"示例性"的任何方面或設計不必被解釋為優選于或者優于其他方面或設計。相 反,使用單詞"示例性"旨在以簡要方式表達概念。
[0020] 如以上提及的,在此描述的實施例提供一種用于在本體驅動的NLP中驗證同義詞 的方案。具體地,提供方案