數字圖書館資源統一檢索系統的制作方法
【技術領域】
[0001]本發明涉及數字檢索技術領域,尤其涉及數字圖書館資源統一檢索系統。
【背景技術】
[0002]今年來,學術文獻、信息資料等數字化資源增長迅速,據統計,很多機構的電子資源擁有量已達TB數量級。所以,用戶面對的最主要問題已經不是資源量的匱乏,而是如何高效利用這些資源的問題。這就需要整合多種類型的資源,進而在此基礎上位讀者提供更為優質的服務。
[0003]現在,很多機構的自有資源由于沒有得到很好的整合和管理,造成查找不便、利用率低的局面,多年積累的寶貴資料無人使用。
[0004]同時,在多個數據庫中分別搜索資料、跟蹤文獻,已經變成一件非常繁瑣的事情。例如:一名科研人員為了能夠查全某課題相關的資料或者及時跟蹤本學科的最新進展,可能要查閱十余個數據庫,浪費了很多時間和精力,而且容易漏查。
[0005]在這種情況下,一個統一的整合和檢索平臺就變得十分重要!
【發明內容】
[0006]為解決上述技術問題,本發明的目的是提供一種數字圖書館資源統一檢索系統。
[0007]本發明的目的通過以下的技術方案來實現:
[0008]數字圖書館資源統一檢索系統,包括:統一檢索模塊和聯邦檢索模塊,所述統一檢索模塊設置有自建資源整合平臺SDIP ;所述聯邦檢索模塊設置有資源整合平臺;所述
[0009]自建資源整合平臺SDIP,用于對自建資源進行格式轉化、建立KBase數據庫、建立相似索引、建立分類和分組與數據庫的發布和維護;
[0010]資源整合平臺,用于對外購資源通過開放協議接口和數據庫訪問接口進行整合,并對外購資源進行虛擬檢索。
[0011]與現有技術相比,本發明的一個或多個實施例可以具有如下優點:
[0012]可以同時整合并搜索CNKI資源、單位自建資源、單位外購資源和互聯網資源,實現所有資源的一站式搜索、發現、定位。
[0013]本管理平臺可以與CNKI數字圖書館、數字化學習研宄平臺等結合,提供多種個性化服務。
【附圖說明】
[0014]圖1是數字圖書館資源統一檢索系統結構示意圖;
[0015]圖2是自建資源整合平臺SDIP操作流程圖。
【具體實施方式】
[0016]為使本發明的目的、技術方案和優點更加清楚,下面將結合實施例及附圖對本發明作進一步詳細的描述。
[0017]如圖1所示,為數字圖書館資源統一檢索系統結構,包括:統一檢索模塊和聯邦檢索模塊,所述統一檢索模塊設置有自建資源整合平臺SDIP ;所述聯邦檢索模塊設置有資源整合平臺;所述
[0018]自建資源整合平臺SDIP,用于對自建資源進行格式轉化、建立KBase數據庫、建立相似索引、建立分類和分組與數據庫的發布和維護;
[0019]資源整合平臺,用于對外購資源通過開放協議接口和數據庫訪問接口進行整合,并對外購資源進行虛擬檢索。
[0020]SDIP整合工具基本操作流程為:格式化轉化、建立KBase數據庫、建立相似索引、建立分類和分組、發布數據庫。各個步驟說明如下:
[0021]格式轉化:把各類格式的數據庫文件進行標準化,統一轉化為REC格式。
[0022]建立KBase數據庫:選擇數據庫在KBase表中的映射字段、選擇保存位置等。
[0023]建立相似索引:選擇參與相似度計算的字段及權重等。
[0024]建立分類和分組:為記錄選擇所屬的導航分類和分組篩選項。
[0025]發布數據庫:設置KBase表、檢索字段、概覽字段、排序字段、發布路徑等,并最終發布出來。
[0026]SDIP操作流程圖2所示,判斷操作類型;該操作類型包括發布新庫、維護已有庫和I才[!手艮^;;
[0027]發布新庫包括,將自建數據庫轉換為REC格式文件,用REC文件創建KBase表,并建立相似索引和分類,然后設置、發布;所述建立分類包括智能分類和指定分類;
[0028]維護已有庫包括:追加數據、刪除數據、備份數據庫、還原數據庫和數據庫系統表維護,在追加數據時則進行身份驗證、選擇更新方式,該更新方式包括追加、覆蓋和差異追加,然后建立映射關系,并進行更新。
[0029]本實施例針對不同的資源種類采用不同的整合技術,能整合的資源類型:
[0030]CNKI資源,包括CNKI出版的各類刊物庫。
[0031]單位自建資源,單位自建數據庫、特色庫等(支持Excel、txt、SqlServer、Mysql、Dbase、FoxPro、Access等多種格式)。包括在單位日常工作中產生、積累下來的已成庫的數據資源,如:內刊、技術資料(技術標準、設計圖紙等)、剪輯的文獻、科研成果、本單位的博碩士學位論文、教材參考資料、原生文獻、期刊導航數據等。單位自有軟件系統中的數據庫資源,如本單位開發的資料管理系統。
[0032]外鏈庫(異構庫)資源,單位購買的其它數據庫廠商的鏡像數據庫資源和外網數據庫資源;其它數據庫廠商的外網數據庫資源。如IEL(美國電子與電氣工程師協會、英國電氣工程師協會)期刊全文數據庫、IEEE/IEE標準與會議全文數據庫等。
[0033]互聯網資源,互聯網上免費使用的各類可檢索的資源,如百度搜索等;CNKI從互聯網上搜集的行業戰略信息庫資源。
[0034]針對各類資源的特點,本平臺提出了多種技術解決方案,在保證資源高效穩定利用的同時,保障資源可擴展、可定制接入。
[0035]對于CNKI資源,提供包庫和鏡像兩種服務方式,用戶可以訪問CNKI網站使用,也可以將數據安裝在用戶本地,兩種方式用戶可以按需購買,并與其他資源進行統一的整合和檢索。
[0036]對于單位自建資源,提供了自建資源數據倉儲整合工具(Self Built DatabaseIntegrated Platform,簡稱SDIP),將用戶的自建資源發布成高質量的數據庫。
[0037]對于異構庫資源和互聯網資源,提供了開放協議方式、數據庫接口方式和WebHttp方式三級整合方式,這三級資源整合構成了 CNKI的外購資源聯邦檢索整合模塊(FSP)。
[0038]其中,開放協議整合方式,用于整合支持OpenURL、Z39.50協議的數據庫資源。支持的資源類型為用戶購買的其它數據庫廠商的鏡像數據庫資源。
[0