一種文獻檢索及分析系統的制作方法
【技術領域】
[0001]本發明涉及信息檢索領域,具體涉及一種文獻檢索及分析系統。
【背景技術】
[0002]隨著信息技術的迅速發展,電子文件由于其形式多樣、容量大、體積小且便于信息共享和易于復制的優點而正在取代部分傳統紙質出版物。隨之而來的電子文獻檢索已經成為信息獲取的較為有效的途徑。
[0003]現今存在的電子文獻檢索方法通常是以統計詞頻的方式為基礎實現的,這類方法都是機械式的進行統計和匹配,忽視了詞語本身在語義上的實際意義和詞語之間在語義上的關聯性,檢索效果并不理想。
[0004]同時各企業為了避免在技術推廣應用方面出現不必要的專利糾紛,在進行市場評估時都會進行相應的風險分析。目前,這種方式主要是靠人工進行,即通過人工方式對企業競爭對手在有關國家或地區的專利申請、分析有關專利申請的保護范圍進行分析。與企業相關的專利文獻數量可能非常龐大,同時在對專利文獻進行分析時需要依賴人員的專業知識及工作經驗,人工成本較高,對專利風險評估是較為不利的。
【發明內容】
[0005]本發明的目的在于克服上述現有技術存在的技術缺陷,提供一種新的文獻檢索及分析系統。
[0006]本發明的目的是通過以下技術方案實現的:
一方面,本發明提供了一種文獻檢索及分析系統,包括:
基本檢索模塊,用于根據所述搜索請求在結構化數據庫中進行搜索;
拓展檢索模塊,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索;
多數據源集成檢索模塊,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能;
檢索結果處理模塊,用于對上述模塊檢索到的專利信息根據相關度進行抽取,獲得特定技術領域術語集;
語義庫建設模塊,利用檢索結果處理模塊得到的特定技術領域的術語集并結合關聯分析、專家評估等步驟,構建特定技術領域語義庫,實現對專利的智能檢索功能;
數據挖掘和自然語言處理模塊,用于對檢索到的專利信息數據的深入挖掘和自然語言的進一步處理;
專利信息智能分析結果可視化技術研究模塊,用于對檢索到的專利信息數據進行智能分析與可視化研究;
用戶管理模塊,用于將上述分析得到的數據匯總到用戶管理模塊進行總體管理,并根據用戶需求進行最終端等輸出。
[0007]所述多數據源集成檢索模塊包括多技術領域專業詞庫的詞典型搜索和以語義分析為核心的語義網文檔搜索兩種檢索策略;
所述語義庫建設模塊還包括相關度選擇模塊,用于選擇檢索處理模塊得到的特定技術領域術語集中的語義相關的詞條,構建特定技術領域語義庫;
所述用戶管理模塊得到的文獻檢索分析匯總結果,能夠根據用戶需求選擇在計算器終端進行顯示或從終端進行最后的結果輸出。
[0008]所述文獻檢索及分析系統中,以數據采集及加工為基礎,從年份、申請人、發明人、關鍵詞等多個專利著錄項的角度出發,對專利數據進行統計、關聯等分析,同時結合可視化技術對分析結果予以展示;可視化作為專利分析的一種手段,將數據挖掘、知識發現等技術綜合運用到整個系統中;并且將信息對象進行綜合、抽象、概念化、知識化、從而更方便簡潔地實現可視化,并進一步發現專利之間地關系以及專利作者的信息等。
[0009]與現有技術相比,本發明的優點在于:實現了對專利信息的智能檢索,并在此基礎上對專利數據進行統計、關聯等分析,同時結合可視化技術,對分析結果進行可視化展示。
【附圖說明】
[0010]圖1位本發明文獻檢索及分析系統示意圖。
【具體實施方式】
[0011]為了使本發明的目的、技術方案及優點更加清楚明白,以下結合具體實施例對本發明進一步詳細說明。應當理解,此處所描述的【具體實施方式】僅僅用以解釋本發明,但并不用于限定本發明。
[0012]圖1位本發明文獻檢索及分析系統一個實施例示意圖,如圖1所示,文獻檢索及分析系統包括:
基本檢索模塊101,用于根據所述搜索請求在結構化數據庫中進行搜索。
[0013]拓展檢索模塊102,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索。
[0014]多數據源集成檢索模塊103,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能。
[0015]檢索結果處理模塊104,用于對專利信息進行抽取,獲得特定技術領域術語集。
[0016]語義庫建設模塊105,利用檢索結果處理模塊得到的術語集并結合關聯分析、專家評估等步驟,構建特定技術領域語義庫。
[0017]數據挖掘和自然語言處理模塊106,用于數據的深入挖掘和自然語言的進一步處理。
[0018]專利信息智能分析結果可視化技術研究模塊107,用于對檢索到的專利信息數據進行智能分析與可視化研究。
[0019]用戶管理模塊108,用于將上述分析得到的數據匯總到用戶管理模塊,最終完成對所需文獻的檢索及分析匯總,并根據用戶需求進行最終的輸出。
[0020]基于本發明上述實施例提供的文獻檢索及分析系統,以國內外專利數據庫技術為核心,通過構建特定技術領域語義庫,綜合運用以多技術領域專業詞庫為核心詞典型搜索與語義分析為核心的與以往文檔搜索兩種檢索策略,實現對專利數據倉庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能,結合自然語言處理技術,實現對專利信息的智能檢索;通過對檢索的專利數據進行統計、關聯分析,完成對專利信息的分析研究,結合可視化技術對分析結果進行可視化展示。
[0021]本發明的描述是為了示例和描述起見而給出的,并不是無遺漏的或者將本發明限于所公開的形式。其中很多修改和變化對于本領域的普通技術人員而言是顯然的。選擇和描述實施例是為了更好地說明本發明的原理和實際應用,并且使本領域的普通技術人員能夠理解本發明從而設計適于特定用途的帶有各種修改的各種實施例。
【主權項】
1.一種文獻檢索及分析系統,包括:基本檢索模塊、拓展檢索模塊、多數據源集成檢索模塊、檢索結果處理模塊、語義庫建設模塊、數據挖掘和自然語言處理模塊、專利信息智能分析結果可視化技術研究模塊、用戶管理模塊; 所述基本檢索模塊,用于根據所述搜索請求在結構化數據庫中進行搜索; 所述拓展檢索模塊,用于根據所述請求結合自然語言處理技術在數據庫中進行搜索; 所述多數據源集成檢索模塊,用于對專利數據庫的多數據源整合以及用戶的跨庫檢索和多庫檢索等功能; 所述檢索結果處理模塊,用于對上述模塊檢索到的專利信息根據相關度進行抽取,獲得特定技術領域術語集; 所述語義庫建設模塊,利用檢索結果處理模塊得到的特定技術領域的術語集并結合關聯分析、專家評估等步驟,構建特定技術領域語義庫,實現對專利的智能檢索功能; 所述數據挖掘和自然語言處理模塊,用于對檢索到的專利信息數據的深入挖掘和自然語言的進一步處理; 所述專利信息智能分析結果可視化技術研究模塊,用于對檢索到的專利信息數據進行智能分析與可視化研究; 所述用戶管理子模塊,用于將上述分析得到的數據匯總到用戶管理模塊進行總體管理,并根據用戶需求進行最終輸出。2.根據權利要求1所述的一種文獻檢索及分析系統,其特征在于, 所述多數據源集成檢索模塊包括多技術領域專業詞庫的詞典型搜索和以語義分析為核心的語義網文檔搜索兩種檢索策略。3.根據權利要求1所述的一種文獻檢索及分析系統,其特征在于,所述語義庫建設模塊還包括相關度選擇模塊,用于選擇檢索處理模塊得到的特定技術領域術語集中的語義相關的詞條,構建特定技術領域語義庫。4.根據權利要求1所述的一種文獻檢索及分析系統,其特征在于,所述專利信息智能分析結果可視化技術研究模塊,將專利信息進行綜合、抽象、概念化、知識化,并自動化生成專利化分析的可視化圖譜,得到最后的可視化的專利分析結果。5.根據權利要求1所述的一種文獻檢索及分析系統,其特征在于, 所述用戶管理模塊得到的文獻檢索分析匯總結果,能夠根據用戶需求選擇在計算器終端進行顯示或從終端進行最后的結果輸出。
【專利摘要】本發明提供一種文獻檢索及分析系統,包括:基本檢索模塊、拓展檢索模塊、多數據源集成檢索模塊、檢索結果處理模塊、語義庫建設模塊、數據挖掘和自然語言處理模塊、專利信息智能分析結果可視化技術研究模塊、用戶管理模塊;該文獻檢索及分析系統以數據采集及加工為基礎,從年份、申請人、發明人、關鍵詞等多個專利著錄項的角度出發,對專利數據進行統計、關聯等分析,同時結合可視化技術對分析結果予以展示,并進一步發現專利之間地關系以及專利作者的信息等。與現有技術相比,本發明的優點在于:實現了對專利信息的智能檢索,并在此基礎上對專利數據進行統計、關聯等分析,同時結合可視化技術,對分析結果進行可視化展示。
【IPC分類】G06F17/30
【公開號】CN105354325
【申請號】CN201510804564
【發明人】劉延淮, 孫瑞陽
【申請人】上海熠派信息科技有限公司
【公開日】2016年2月24日
【申請日】2015年11月20日