一種基于語義分析的知識推送系統及方法
【專利摘要】本發明公開了一種基于語義分析的知識推送系統,包括知識捕獲模塊、知識推送模塊、知識采集模塊和知識庫;通過知識采集模塊錄入知識的基本信息、進行知識上傳、對上傳的知識進行主題計算獲得該知識對應的主題,并將上傳的知識和該知識對應的基本信息、主題存入知識庫;其中主題計算采用基于潛在語義分析的算法進行處理;知識捕獲模塊每隔一段時間調用一次設計系統的接口函數從而捕獲設計場景信息,并將捕獲的設計場景信息發送至知識推送模塊;知識推送模塊根據捕獲的設計場景信息按知識的類別將相應的知識推送至設計系統。本發明能夠自動準確捕獲用戶設計場景下的實際需求,并可以獲得更加準確、符合設計人員需求的知識資源,節省了大量搜索知識的時間。
【專利說明】一種基于語義分析的知識推送系統及方法
【技術領域】
[0001]本發明涉及一種基于語義分析的知識推送系統及方法。
【背景技術】
[0002]傳統的通過搜索技術獲取知識的方式不能滿足用戶在缺乏關鍵詞情況時的知識需求,且搜索方式獲取的知識內容準確性低,知識之間缺乏關聯關系,設計人員甚至不希望在執行任務時花費大量的時間在搜索上,而希望在需要相關知識時,系統能夠“雪中送炭”。知識推送系統的出現使得知識的獲取方式由“搜索”變為“推送”,解決了該問題。
[0003]目前的知識推送系統一般是基于設計人員自定義關鍵詞的方式進行知識推送,不能對設計人員的真實需求做出準確的判斷,導致推送的知識難以符合設計人員的需求。另夕卜,在獲取設計人員需求之后,獲取知識的方式一般采用關鍵詞出現的頻率決定搜索結果的排序,獲取方式過于單一。
【發明內容】
[0004]本發明所要解決的技術問題是:提供一種基于語義分析的知識推送系統及方法,能夠自動準確捕獲用戶設計場景下的實際需求,并可以獲得更加準確、具有關聯關系、符合設計人員需求的知識資源,節省了大量搜索知識的時間,提高了工作效率。
[0005]本發明技術方案如下:
[0006]一種基于語義分析的知識推送系統,包括知識捕獲模塊、知識推送模塊、知識采集模塊和知識庫;在設計系統中封裝用于捕獲設計場景信息的接口函數;
[0007]通過知識采集模塊錄入知識的基本信息、進行知識上傳、對上傳的知識進行主題計算獲得該知識對應的主題,并將上傳的知識和該知識對應的基本信息、主題存入知識庫;其中主題計算采用基于潛在語義分析的算法進行處理;所述知識的基本信息包括知識資源名稱、所屬知識的類別、創建人和創建時間;
[0008]知識捕獲模塊每隔一段時間調用一次所述接口函數從而捕獲設計場景信息,并將捕獲的設計場景信息發送至知識推送模塊;
[0009]知識推送模塊對捕獲的設計場景信息進行分詞形成特征詞集合;計算特征詞集合中每個特征詞在設計場景信息中的權重形成權重集合;遍歷知識庫中所有的知識,使用特征詞集合與知識庫中的每個知識的主題進行匹配計算,統計特征詞集合的每個特征詞的匹配次數獲得匹配次數集合;將匹配次數集合與權重集合中的對應元素相乘后求和獲得該知識的主題與特征詞集合的匹配度;對知識庫中的所有知識按知識的類別進行匹配度排序獲得排序后的結果;將排序后的結果按知識的類別推送至設計系統。
[0010]所述知識的類別包括設計規范、最佳實踐、經驗技巧和故障案例。
[0011]所述設計場景信息包括具體參數信息、任務信息、模型信息和文檔信息;所述任務信息包括任務名稱、任務描述和任務所屬專業名稱;所述文檔信息為文檔的關鍵詞;所述模型信息包括模型名稱、類別名稱以及模型打開工具名稱。[0012]一種基于語義分析的知識推送方法,包括如下步驟:
[0013]錄入知識的基本信息、進行知識上傳、對上傳的知識進行主題計算獲得該知識對應的主題,并將上傳的知識和該知識對應的基本信息、主題存入知識庫;其中主題計算采用基于潛在語義分析的算法進行處理;所述知識的基本信息包括知識資源名稱、所屬知識的類別、創建人和創建時間;
[0014]每隔一段時間調用一次設計系統中的接口函數從而捕獲設計場景信息;
[0015]對捕獲的設計場景信息進行分詞形成特征詞集合;計算特征詞集合中每個特征詞在設計場景信息中的權重形成權重集合;遍歷知識庫中所有的知識,使用特征詞集合與知識庫中的每個知識的主題進行匹配計算,統計特征詞集合的每個特征詞的匹配次數獲得匹配次數集合;將匹配次數集合與權重集合中的對應元素相乘后求和獲得該知識的主題與特征詞集合的匹配度;對知識庫中的所有知識按知識的類別進行匹配度排序獲得排序后的結果;將排序后的結果按知識的類別推送至設計系統。
[0016]本發明與現有技術相比具有如下有益效果:
[0017](I)本發明通過知識捕獲模塊自動捕獲用戶設計場景下的實際需求,解決了現有知識推送系統獲取設計人員需求的不準確性問題。
[0018](2)采用基于潛在語義分析技術的知識采集技術,實際上對上傳的知識資源做了“降噪”處理,使得主題更加清晰、準確,提高了知識推送時捕獲信息與知識資源匹配的精確度,使得推送的知識資源與設計人員的需求更加吻合。
[0019](3)通過知識捕獲信息與知識資源主題進行匹配計算,與傳統的全文匹配計算相比,大大提升了計算速度。
[0020](4)采用推送技術節省了設計人員搜索知識時花費的大量時間,提高了工作效率。采用推送技術使得知識管理系統與企業業務系統相互融合,解決了一般知識管理系統訪問量低的問題,大大提高了知識資源的使用率。
【專利附圖】
【附圖說明】
[0021]圖1為本發明系統的總體結構圖;
[0022]圖2為本發明中知識捕獲模塊的算法流程圖;
[0023]圖3為本發明中知識推送模塊的算法流程圖;
[0024]圖4為本發明中知識采集模塊中主題計算的算法流程圖。
【具體實施方式】
[0025]如圖1所示,本發明的系統包括知識捕獲模塊、知識推送模塊、知識采集模塊和知識庫。
[0026]1、知識捕獲,主要通過軟件集成技術實現對設計人員的設計場景信息進行捕獲,獲取設計人員設計場景的具體任務信息、模型信息、文檔信息、參數信息,然后將捕獲的信息發送給知識推送模塊。
[0027]如圖1所示,在業務系統或者設計系統的設計場景中包括任務(例如任務1、任務2和任務3)、模型(例如設計模型、有限元模型)、文檔(例如分析報告)和參數(例如指標參數
1、指標參數2和指標參數3)。知識捕獲模塊的知識捕獲方式主要包括任務提取、模型提取、文檔提取和參數提取四種方式,四種知識捕獲方式使用的軟件集成技術主要通過web服務技術實現,具體在業務系統或者設計系統中封裝上述四種捕獲方式所需的接口函數,并對外開放,知識推送模塊每隔一段時間會調用一次接口函數,來獲取設計人員的設計場景信息,并將捕獲的設計場景信息發送至知識推送模塊。四種獲取方式的算法執行流程如圖2所示。
[0028]( I)任務提取,一般設計人員的任務通過設計系統進行發放和審核,其主要實現機制一般基于工作流技術實現,任務提取主要通過軟件集成技術根據當前設計人員的用戶名,在工作流中獲取當前用戶正在執行的任務信息,獲取的任務信息包括任務名稱、任務描述、任務所屬專業名稱,然后將獲取的信息發送至知識推送模塊。例如,通過捕獲某結構模態分析任務信息,可以知道該任務的結構件名稱信息及載荷特性專業信息。
[0029](2)模型提取,設計人員操作的模型一般作為任務附件進行管理,通過軟件集成技術獲取任務的附件名稱,再對交付物本身進行格式判別,根據文件格式可以從系統配置信息中獲取設計人員當前操作的模型名稱、類別名稱以及模型打開工具名稱,然后將獲取的信息發送至知識推送模塊。
[0030](3)文檔提取,設計人員查看和編寫的文檔一般作為任務附件進行管理,同樣通過軟件集成技術獲取任務附件,經過格式判別后獲取文檔的名稱信息,并在后臺打開該文檔對該文檔做分詞、濾詞、頻率統計處理,獲取該文檔的關鍵詞,然后將獲取的信息發送至知識推送模塊。
[0031](4)參數提取,參數是任務的指標信息包括輸入參數和輸出參數,可以通過軟件集成技術獲取參數的名稱,然后將獲取的信息發送至知識推送模塊。
[0032]2、知識推送,知識推送模塊在獲取設計人員需求信息后,對信息進行分詞、權重計算,然后與知識庫中經過知識采集處理的知識資源信息進行匹配計算,對匹配結果進行分類、排序后推送至設計人員桌面,詳細執行過程如圖3所示。
[0033](I)對從知識捕獲模塊獲得的設計場景信息進行分詞形成特征詞集合G= Ig1, g2, g3.? ? gn};
[0034](2)計算每個特征詞在設計場景信息中的權重形成權重集合Q=Iq1, q2, q3.? ? qj ;
[0035](3)遍歷知識庫中所有的知識資源,該類知識資源在進行知識采集時是經過主題計算處理的;
[0036](4)使用特征詞集合G與知識庫中的知識主題進行匹配計算,統計每一個特征詞的匹配次數形成匹配次數集合M=Im1, m2, m3...mn},M與權重Q的乘積和形成匹配度P,
【權利要求】
1.一種基于語義分析的知識推送系統,其特征在于,包括知識捕獲模塊、知識推送模塊、知識采集模塊和知識庫;在設計系統中封裝用于捕獲設計場景信息的接口函數; 通過知識采集模塊錄入知識的基本信息、進行知識上傳、對上傳的知識進行主題計算獲得該知識對應的主題,并將上傳的知識和該知識對應的基本信息、主題存入知識庫;其中主題計算采用基于潛在語義分析的算法進行處理;所述知識的基本信息包括知識資源名稱、所屬知識的類別、創建人和創建時間; 知識捕獲模塊每隔一段時間調用一次所述接口函數從而捕獲設計場景信息,并將捕獲的設計場景信息發送至知識推送模塊; 知識推送模塊對捕獲的設計場景信息進行分詞形成特征詞集合;計算特征詞集合中每個特征詞在設計場景信息中的權重形成權重集合;遍歷知識庫中所有的知識,使用特征詞集合與知識庫中的每個知識的主題進行匹配計算,統計特征詞集合的每個特征詞的匹配次數獲得匹配次數集合合;將匹配次數集合與權重集合中的對應元素相乘后求和獲得該知識的主題與特征詞集合的匹配度;對知識庫中的所有知識按知識的類別進行匹配度排序獲得排序后的結果;將排序后的結果按知識的類別推送至設計系統。
2.如權利要求1所述的知識推送系統,其特征在于:所述知識的類別包括設計規范、最佳實踐、經驗技巧和故障案例。
3.如權利要求1所述的知識推送系統,其特征在于:所述設計場景信息包括具體參數信息、任務信息、模型信息和文檔信息;所述任務信息包括任務名稱、任務描述和任務所屬專業名稱;所述文檔信息為文檔的關鍵詞;所述模型信息包括模型名稱、類別名稱以及模型打開工具名稱。
4.一種基于語義分析的知識推送方法,其特征在于,包括如下步驟: 錄入知識的基本信息、進行知識上傳、對上傳的知識進行主題計算獲得該知識對應的主題,并將上傳的知識和該知識對應的基本信息、主題存入知識庫;其中主題計算采用基于潛在語義分析的算法進行處理;所述知識的基本信息包括知識資源名稱、所屬知識的類別、創建人和創建時間; 每隔一段時間調用一次設計系統中的接口函數從而捕獲設計場景信息; 對捕獲的設計場景信息進行分詞形成特征詞集合;計算特征詞集合中每個特征詞在設計場景信息中的權重形成權重集合;遍歷知識庫中所有的知識,使用特征詞集合與知識庫中的每個知識的主題進行匹配計算,統計特征詞集合的每個特征詞的匹配次數獲得匹配次數集合;將匹配次數集合與權重集合中的對應元素相乘后求和獲得該知識的主題與特征詞集合的匹配度;對知識庫中的所有知識按知識的類別進行匹配度排序獲得排序后的結果;將排序后的結果按知識的類別推送至設計系統。
5.如權利要求4所述的知識推送方法,其特征在于:所述知識的類別包括設計規范、最佳實踐、經驗技巧和故障案例。
6.如權利要求4所述的知識推送方法,其特征在于:所述設計場景信息包括具體參數信息、任務信息、模型信息和文檔信息。
【文檔編號】G06F17/30GK103593336SQ201310526924
【公開日】2014年2月19日 申請日期:2013年10月30日 優先權日:2013年10月30日
【發明者】褚厚斌, 杜俊鵬, 王立偉, 賈倩, 畢經元, 章樂平, 王長慶, 楊玉堃, 侯雄, 許怡婷, 章雯, 楊秋皓, 張巍 申請人:中國運載火箭技術研究院