專利名稱:一種基于網絡的計算機信息檢索系統與方法
技術領域:
本發明涉及一種電子數據處理的方法與系統,尤其涉及一種基于網絡對目 標計算機存貯的數據進行檢索處理的方法與系統。
背景技術:
隨著以計算機、網絡技術為代表的現代信息技術的飛速發展,存貯在計算 機中各種電子數據對于人們生活、工作越來越重要。人們常常需要檢索大量的 電子數據,特別是及時收集、分析、確認、保護、提取、歸檔計算機系統的各 類電子數據,已經成為計算機安全事件應急響應、打擊計算機犯罪、打擊涉及 計算機電子證據犯罪活動中最亟待解決的技術難題。
現有的計算機取證技術要求經過專業的技術人員到達現場,操作、檢査目
標計算機系統,拆卸機箱并取出存貯介質,利用硬盤復制機等專用設備復制存 貯介質以達到保全原始證據的目的,然后再利用取證系統分析計算機系統和復 制的存貯介質。上述過程中,為了得到最終的取證分析結論,必須要進行到達 現場、復雜的拆卸、長時間的復制工作,耗時長并且復雜。此外,安裝取證系 統的搡作系統在加載存貯介質上的文件系統時,往往會主動寫入部分信息,從 而導致存貯介質上的原始信息遭到破壞。部分別有用心的犯罪分子,甚至可以 利用操作系統內部的漏洞,使操作系統在加載時破壞敏感證據。采用取證系統 直接分析復制后的存貯介質,雖然可以避免存貯介質本身遭到破壞,但同樣會 破壞經轉儲后的數據,從而導致無法分析出關鍵的原始數據。
綜上所述,現有的計算機檢索、取證系統存在如下不足之處為了得到最 終的取證分析結論,必須要進行到達現場、復雜的拆卸、長時間的復制工作, 耗時長并且復雜,尤其在需要對遠程多臺計算機同時進行信息檢索時,效率更 低;對涉及犯罪的計算機電子證據的取證對技術人員的要求很高,需要全面的 計算機軟硬件知識,就司法人員現有的技術狀況來看,難以普及計算機電子證 據取證技術,不利于打擊涉及計算機電子證據犯罪活動;無論是從目標計算機
自身操作系統啟動檢索,還是取出目標計算機存貯介質復制后檢索,都有可能 破壞敏感證據,導致無法分析出關鍵的原始數據,嚴重影響分析取得電子證據
的真實性、合法性、關聯性以及證明力;檢索、取證功能薄弱、種類單一,只能完成對純文本關鍵字、文件名稱為目標的檢索,缺少對圖片、文件內容、電話 號碼、信用卡號碼、郵件地址、網絡地址、身份證號碼等多種特定信息檢索的 功能。
發明內容
本發明的目的在于克服上述不足,提供一種基于網絡對目標計算機存貯的 數據進行檢索處理的方法與系統。
本發明的技術方案如下 一種基于網絡的計算機信息檢索系統,包括主控 計算機、目標計算機、連接主控計算機與目標計算機的網絡,所述主控計算機 存有檢索程序和檢索目標的配置信息,并用于存貯檢索結果。
系統還包括存有用于啟動目標計算機的啟動程序的裝置,所述裝置為主控 計算機或者移動存儲裝置。
所述目標計算機與主控計算機處于同一局域網絡環境,并且目標計算機可 以為多臺。
所述主控計算機可以實時查看目標計算機檢索狀態信息。 所述目標計算機有網絡啟動功能的網卡。
所述檢索程序由用戶監控界面模塊、檢索調度模塊、通信模塊、進程管理 模塊、檢索任務分配模塊、索引生成模塊、檢索功能模塊、檢索服務模塊抅成。
所述用戶監控界面模塊運行時,顯示當前檢索狀態的信息,包括檢索任務 信息、當前檢索進度、檢索結果、磁盤狀態;用于用戶輸入控制信息和檢索任 務信息。
所述檢索調度模塊運行時,讀取并分析檢索目標配置信息,分析目標計算 機存儲設備的待檢索文件的索引,根據待檢索文件索引調度檢索任務,把檢索 狀態信息發送給所述用戶監控界面模塊,把檢索結果信息發送給所述檢索服務 模塊中的曰志子模塊,以生成檢索曰志。
所述通信模塊運行時,流轉發送各模塊之間控制及數據信息。 所述進程管理模塊運行時,負責啟動和關閉其他各模塊的運行。 所述檢索任務分配模塊運行時,根據檢索任務調度不同的檢索功能模塊處理。
所述索引生成模塊運行時,根據檢索目標配置信息生成目標計算機存儲設 備上待檢索文件的索引。
所述檢索服務模塊包括壓縮服務、郵件服務、日志服務、OFFICE文檔處理 以及PDF文檔處理子模塊。所述檢索功能模塊運行時,具有圖片、文字、文件內容匹配檢索功能。 所述檢索程序依據所述檢索目標的配置信息對所述目標計算機存儲信息進
行檢索。
一種基于網絡的計算機信息檢索方法,包括以下步驟在主控計算機上通 過配置程序生成檢索目標配置信息;目標計算機獲取啟動程序,并啟動本機; 目標計算機啟動后,通過網絡從主控計算機獲取檢索程序;在目標計算機上啟 動檢索程序;目標計算機通過網絡從主控計算機獲取檢索目標配置信息;在目 標計算機運行檢索程序,進行目標計算機信息檢索。
所述目標計算機通過網絡從主控計算機獲取啟動程序。 所述目標計算機也可以通過移動存儲裝置獲取啟動程序。
所述的目標計算機把檢索狀態信息實時的通過網絡傳輸至主控計算機。 所述主控計算機可以實時查看目標計算機檢索狀態信息。 所述檢索程序由用戶監控界面模塊、檢索調度模塊、通信模塊、進程管理
模塊、檢索任務分配模塊、索引生成模塊、檢索功能模塊、檢索服務模塊構成。 所述用戶監控界面模塊運行時,顯示當前檢索狀態的信息,包括案件信息、
當前檢索進度、檢索結果、磁盤狀態;用于用戶輸入控制信息和檢索描述信息。 所述檢索調度模塊運行時,讀取并分析檢索目標配置信息,分析目標計算
機存儲設備的待檢索文件的索引,根據待檢索文件索引調度檢索任務,把檢索
狀態信息發送給所述用戶監控界面模塊,把檢索結果信息發送給所述檢索服務
模塊中的日志子模塊,以生成檢索曰志。
所述通信模塊運行時,流轉發送各模塊之間控制及數據信息。 所述進程管理模塊運行時,負責啟動和關閉其他各模塊的運行。 所述檢索任務分配模塊運行時,根據檢索任務調度不同的檢索功能模塊處理。
所述索引生成模塊運行時,根據檢索目標配置信息生成目標計算機存儲設 備上待檢索文件的索引。
所述檢索服務模塊包括壓縮服務、郵件服務、日志服務、OFFICE文檔處理、 PDF文檔處理子模塊。
所述檢索功能模塊運行時,具有圖片、文字、文件內容匹配檢索功能。 所述用戶監控界面模塊運行時,包括如下步驟在目標計算機或通過網絡 在其他計算機上顯示監控界面,等待消息;判斷接收到的消息是否是用戶輸入 命令,如果是,繼續判斷該消息是否為退出命令,如果是,則退出;如果否,則把該消息發給通信模塊,繼續等待消息;如果接收的不是用戶輸入命令,則
繼續判斷是否為檢索結東消息,如果是,則結束;如果否,則把接收到的信息 顯示到用戶界面上,然后繼續等待消息。
所述檢索調度模塊運行時,包括如下步驟從移動存儲設備中獲取檢索目
標配置信息,把檢索目標配置信息發送給通信模塊;接收從通信模塊發送過來 的索引數據,從索引數據中讀取需要檢索的文件信息,分析索引數據,判斷索 引數據是否分析結束,如果是,則發送結束消息到用戶界面監控模塊,然后結 束;如果否,根據檢索的條件把待檢索文件發送到通信模塊;從通信模塊接收 檢索結果信息,并將日志信息發送到通信模塊,再把曰志和其他信息發送到用 戶界面監控模塊;再返回從索引數據中讀取需要檢索的文件信息。
所述通信模塊運行時,包括如下步驟等待并接收數據;判斷該數據是否 為退出通信模塊的命令,如果是,則退出;如果不是,繼續判斷該數據是否為 命令消息,如果是,則將該數據轉發給檢索調度模塊,然后繼續等待接收數據; 如果否,則檢測該數據是否為檢索調度模塊發來的數據,如果是,則轉發給進 程管理模塊,然后繼續等待接收數據;如果否,則判斷該數據是否為進程管理 模塊返回的數據,如果是,則把數據轉發給檢索調度模塊,然后繼續等待接收 數據;如果否,則寫錯誤曰志,然后繼續等待接收數據。
所述進程管理模塊運行時,包括如下步驟分別啟動用戶監控界面模塊程
序、檢索調度模塊程序、通信模塊程序、索引生成模塊程序、檢索服務模塊程
序、檢索任務分配模塊程序;開始接收通信模塊發來的數據;判斷該數據是否 為退出進程管理模塊的命令,如果是,則退出進程管理模塊;如果不是,則進 一步判斷該數據為何種服務類型,如果為索引生成服務類型,則生成待檢索文 件索引;如果為檢索服務類型,則執行特定的檢索服務,如壓縮服務,郵件服 務,日志服務,OFFICE文檔處理,PDF文檔處理;如果為檢索功能服務類型, 則檢索目標數據,如文字、圖片和文件內容;以上三種服務執行完畢,把結果
返回給通信模塊,并重新開始接收通信模塊發來的數據。
所述索引生成模塊運行時,包括如下步驟從進程管理模塊獲取檢索目標 配置信息,讀取目標存儲設備中的文件列表信息,根據檢索目標配置信息篩選
文件,生成待檢索文件索引;判斷是否設置了優先搜索的路徑,如果是,調整 待檢索文件索引,將包含在優先路徑中的文件放置在索引前部,保存待檢索文 件索引;如果否,直接保存待檢索文件索;把結果返回給進程管理模塊。
所述檢索功能模塊進行圖片檢索時,包括如下步驟從進程管理模塊獲取檢索目標配置信息,判斷是否為模糊檢索,如果是,則使用圖片模糊匹配算法
計算出匹配度,然后將檢索結果返回進程管理模塊;如果否,則使用圖片精確
匹配算法檢索,再將檢索結果返回進程管理模塊。
所述模糊檢索支持多種困像格式,包括gif、 jpeg、 png、 xpm、 tga、 tiff、 證、svg。
所述檢索功能模塊進行文件內容匹配檢索時,包括如下步驟從進程管理 模塊獲取檢索目標配置信息,計算匹配文件大小,第一次判斷是否校驗成功, 若否,則將檢索結果返回進程管理模塊;若是,則計算匹配文件md5校驗和, 再判斷是否校驗成功,若否,則將檢索結果返回進程管理模塊;若是,則計算
匹配文件sha256校驗和,第三次判斷是否校驗成功,若否,則將檢索結果返回
進程管理模塊;若是,也將檢索結果返回進程管理模塊。
所述檢索功能模塊進行文字檢索時,包括如下步驟從進程管理模塊獲取 檢索目標配置信息,判斷是否為關鍵字檢索,若是,則在文件中檢索關鍵字, 再將檢索結果返回進程管理模塊;若否,則利用posix正則表達式規則進行檢
索,再將檢索結果返回進程管理模塊。
所述利用posix正則表達式規則進行檢索,支持特定格式如電郵地址、信
用卡號碼的搜索。
本發明對于目標計算機的硬盤內容具備非破壞性;支持辦公套件文檔、電
子表格、郵件、網頁、即時通信記錄、文本的搜索;可以搜索已刪除文件,并
可以恢復;支持按照優先級排序進行快速搜索;支持搜索非圖片文件中的圖片 信息;支持搜索壓縮文件;支持光盤鏡像文件搜索;能同時支持搜索簡體中文
與繁體中文的各種編碼,包括gb2312、 gbk、 gb18030、 big5、 big5-hkscs、 utf-16、 utf-8,無論文件內容是用以上哪種編碼、只要匹配檢索關鍵字中漢字的文件均 能被檢索出來;支持對windows系統中縮略圖數據的搜索。
本發明與現有技術相比具有的有益效果是為了得到最終的取證分析結論, 沒有復雜的拆卸、長時間的復制工作,實現快速搜索、非現場取證,耗時短并 且過程簡單,尤其在需要對遠程多臺計算機同時進行信息檢索時,效率更高, 有利于計算機犯罪的打擊;對涉及犯罪的計算機電子證據的取證對技術人員的 要求低,甚至不需要計算機軟硬件知識,就司法人員現有的技術狀況來看,有 利于普及計算機電子證據取證技術,有利于打擊涉及計算機電子證據犯罪活動; 不從目標計算機的操作系統啟動,檢索程序不在目標計算機安裝,對目標計算 機的存貯介質不會有任何修改,不會破壞敏感證據而導致無法分析出關鍵的原
12始數據,確保分析取得電子證據的真實性、合法性、關聯性以及證明力;檢索、 取證功能強大,具有圖片、文字、文件內容匹配檢索功能,支持辦公套件文檔、 電子表格、郵件、網頁、即時通信記錄、文本的搜索。可以搜索已刪除文件, 并可以恢復。支持按照優先級排序進行快速搜索。支持搜索非圖片文件中的圖 片信息。支持搜索壓縮文件。支持光盤鏡像文件搜索。支持電話號碼、信用卡 號碼、郵件地址、網絡地址、身份證號碼等多種特定信息檢索。
圖l為本發明結構示意圖2為檢索程序模塊圖3為檢索程序流程圖4為用戶監控模塊流程圖5為檢索調度模塊流程圖6為通信模塊流程圖7為進程管理模塊流程圖8為索引生成模塊流程圖9為關鍵字搜索模塊流程圖IO為圖片搜索模塊流程圖11為文件內容精確檢索模塊流程圖。
具體實施例方式
下面結合附圖和具體實施方式
對本發明作詳細描述。
如圖1所示, 一種基于網絡的計算機信息檢索系統,包括主控計算機104, 目標計算機IOI、 102、 103,連接主控計算機104與目標計算機101、 102、 103 的計算機網絡105,所述主控計算機104存有檢索程序和檢索目標的配置信息, 并用于存貯檢索結果。
目標計算機101、 102、 103具有網絡啟動功能的網卡時,主控計算機104 存有用于啟動目標計算機101、 102、 103的啟動程序,否則用移動存儲裝置存 貯用于啟動目標計算機IOI、 102、 103的啟動程序。
主控計算機104可以實時查看目標計算機101、 102、 103的檢索狀態信息。
一種基于網絡的計算機信息檢索方法,包括以下步驟在主控計算機104 上通過配置程序生成檢索目標配置信息;目標計算機101、 102、 103獲取啟動
13程序,并啟動本機;目標計算機IOI、 102、 103啟動后,通過網絡105從主控 計算機104獲取檢索程序;在目標計算機IOI、 102、 103上啟動檢索程序;目 標計算機IOI、 102、 103通過網絡105從主控計算機104獲取檢索目標配置信 息;在目標計算機IOI、 102、 103運行檢索程序,進行目標計算機信息檢索。 目標計算機IOI、 102、 103通過網絡105從主控計算機104獲取啟動程序,
也可以通過移動存儲裝置獲取啟動程序。目標計算機把檢索狀態信息實時的通 過網絡傳輸至主控計算機,主控計算機可以實時查看目標計算機檢索狀態信息。 如圖2所示,檢索程序由用戶監控界面模塊、檢索調度模塊、通信模塊、 進程管理模塊、檢索任務分配模塊、索引生成模塊、檢索功能模塊、檢索服務 模塊構成。
如圖3所示,檢索程序按如下流程運行在步驟S301,流程開始;在步驟 S302,使用主控計算機或者移動存儲裝置載有的啟動程序啟動目標計算機;在 步驟S303,啟動進程管理模塊;在步驟S304,開始檢索存貯于目標計算機中的 數據;在步驟S305,檢索完成,生成檢索報告;在步驟S306,流程結東。
下面具體描述檢索程序的各功能模塊運行流程。
如圖4所示,用戶監控界面模塊運行時,包括如下流程在步驟S401,流 程開始;在步驟S402,在目標計算機或通過網絡在其他計算機上顯示監控界面; 在步驟S403,等待消息;在步驟S404,判斷接收到的消息是否是用戶輸入命令, 如用戶輸入控制信息、檢索描述信息;如果是,進入步驟S406,如果否,進入 步驟S405。
在步驟S406,繼續判斷該消息是否為退出命令,如果是,進入步驟S409, 流程結束;如果否,進入步驟S408,則把該消息發給通信模塊,進一步流程如 圖6所示;然后返回步驟S403,繼續等待消息。
在步驟S405,繼續判斷是否為檢索結東消息,如果是,進入步驟S409,流 程結東;如果否,進入步驟S407,把接收到的信息顯示到用戶界面上,顯示當前 檢索狀態的信息,包括案件信息、當前檢索進度、檢索結果、磁盤狀態;然后 返回步驟S403,繼續等待消息。
如圖5所示,檢索調度模塊運行時,包括如下流程在步驟S501,流程開 始;在步驟S502,從移動存儲設備中獲取檢索目標配置信息;在步驟S503,把 檢索目標配置信息發送給通信模塊,進一步流程如圖6所示;在步驟S504,接 收從通信模塊發送過來的索引數據;在步驟S505,從索引數據中讀取需要檢索 的文件信息;在步驟S506,分析索引數據;在步驟507,判斷索引數據是否分析結東,如果是,則進入步驟S509,如果否,進入步驟S508。
在步驟S509,發送結東消息到用戶界面監控模塊,進一步流程,如圖4所 示;然后進入步驟S513,流程結束。
在步驟S508,根據檢索的條件,把待檢索文件發送到通信模塊,進一步流 程如圖6所示;在步驟S510,從通信模塊接收檢索結果信息;在步驟S511,將 日志信息發送到通信模塊,進一步流程,如圖6所示;在步驟S512,再把曰志 和其他信息發送到用戶界面監控模塊,進一步流程,如圖4所示;然后返回步 驟S505,繼續從索引數據中讀取需要檢索的文件信息。
檢索調度模塊讀取并分析檢索目標配置信息,分析目標計算機存儲設備的 待檢索文件的索引,根據待檢索文件索引調度檢索任務,把檢索狀態信息發送 給所述用戶監控界面模塊,把檢索結果信息發送給所述檢索服務模塊中的曰志 子模塊,以生成檢索曰志。
如圖6所示,通信模塊運行時,流轉發送各模塊之間控制及數據信息,包 括如下流程在步驟S601,流程開始;在步驟S602,等待并接收數據;在步驟 S603,判斷該數據是否為退出通信模塊的命令,如果是,則進入步驟S605,流 程結東;如果否,進入步驟S604。
在步驟S604,繼續判斷該數據是否為命令消息,如果是,則進入步驟S606, 如果否,進入步驟S607。
在步驟S606,將該數據轉發給檢索調度模塊,進一步流程,如圖5所示; 然后返回步驟S602,繼續等待接收數據;在步驟S607,判斷該數據是否為檢索 調度模塊發來的數據,如果是,進入步驟S608,如果否,進入步驟S609。
在步驟S608,將該數據轉發給進程管理模塊,進一步流程,如圖7所示; 然后返回步驟S602,繼續等待接收數據;在步驟S609,判斷該數據是否為進程 管理模塊返回的數據,如果是,進入步驟S606,如果否,進入步驟S610。
在步驟S606,把數據轉發給檢索調度模塊,然后返回步驟S602,繼續等待 接收數據;在步驟S610,則寫錯誤曰志,然后返回步驟S602,繼續等待接收數 據。
如圖7所示,進程管理模塊運行時,負責啟動和關閉其他各模塊的運行, 包括如下流程在步驟S701,流程開始;在步驟S702,啟動用戶監控界面模塊; 在步驟S703,啟動檢索調度模塊;在步驟S704,啟動通信模塊;在步驟S705, 啟動索引生成模塊;在步驟S706,啟動檢索服務模塊;在步驟S707,啟動檢索 任務分配模塊,根據檢索任務調度不同的檢索功能模塊處理;在步驟S708,開
15始接收通信模塊發來的數據;在步驟S710,判斷該數據是否為退出進程管理模
塊的命令,如果是,進入步驟S709,流程結東;如果否,進入步驟S711。
在步驟S711,判斷該數據為何種服務類型,如果為索引生成服務類型,則 進入步驟S712,生成待檢索文件索引;如果為檢索服務類型,則進入步驟S713, 執行特定的檢索服務,如壓縮服務,郵件服務,曰志服務,OFFICE文檔處理, PDF文檔處理;如果為檢索功能服務類型,則進入步驟S714,檢索目標數據, 如文字、圖片和文件內容,支持辦公套件文檔、電子表格、郵件、網頁、即時 通信記錄、文本的搜索,可以搜索已刪除文件,并可以恢復,支持搜索非圖片 文件中的圖片信息,支持按照優先級排序進行快速搜索,支持搜索非圖片文件 中的圖片信息,支持搜索壓縮文件,支持光盤鏡像文件搜索,支持對windows 系統中縮略圖數據的搜索;以上步驟S712、步驟S713、步驟S714執行完畢, 各自進入步驟S715,把執行結果返回給通信模塊,進一步流程,如圖6所示; 然后返回步驟S708,重新開始接收通信模塊發來的數據。
如圖8所示,索引生成模塊運行時,包括如下流程在步驟S801,流程開 始;在步驟S802,從進程管理模塊獲取檢索目標配置信息;在步驟S803,讀取 目標存儲設備中的文件列表信息;在步驟S804,根據檢索目標配置信息篩選文 件,生成待檢索文件索引;在步驟S805,判斷是否設置了優先搜索的路徑,如 果是,進入步驟S806;如果否,進入步驟S807。
在步驟S806,調整待檢索文件索引,將包含在優先路徑中的文件放置在索 引前部;然后進入步驟S807。
在步驟S807,保存待檢索文件索引;在步驟S808,把待檢索文件索引返回 給進程管理模塊,進一步流程,如圖7所示;在步驟S809,流程結東。
如圖9所示,檢索功能模塊進行文字檢索時,包括如下流程在步驟S901, 流程開始;在步驟S902,從進程管理模塊獲取檢索目標配置信息;在步驟S903 判斷是否為關鍵字檢索,若是,則進入步驟S904,在文件中檢索關鍵字;若否, 則進入在步驟S905,利用POSIX正則表達式規則進行檢索,支持電話號碼、信 用卡號碼、郵件地址、網絡地址、身份證號碼等多種特定信息的檢索;以上步 驟S904、 S905執行完畢,各自進入步驟S906,將檢索結果返回進程管理模塊, 進一步流程,如圖7所示;在步驟S907,流程結束。
如圖IO所示,檢索功能模塊進行圖片檢索時,包括如下流程在步驟SIOOI, 流程開始;在步驟S1002,從進程管理模塊獲取檢索目標配置信息;在步驟S1003, 判斷是否為模糊檢索,支持多種圖像格式,包括GIF.、 JPEG、 PNG、 XPM、 TGA、TIFF、 BMP、 SVG;如果是,則進入步驟S1005,使用gqview、 imgseek、 findimagedupes、 gnuift等工具提供的圖片模糊匹配算法計算出匹配度;如果 否,則進入步驟S1004,使用md5、 sha256校驗和以及文件大小等要素進行圖片 精確匹配檢索;以上步驟S1004、 S1005執行完畢,各自進入步驟S1006,將檢 索結果返回進程管理模塊,進一步流程,如圖7所示;在步驟S1007,流程結東。
如圖ll所示,檢索功能模塊進行文件內容匹配檢索時,包括如下流程在 步驟SllOl,流程開始;在步驟S1102,從進程管理模塊獲取檢索目標配置信息; 在步驟S1103,計算匹配文件大小;在步驟S1104,判斷是否校驗成功,若否, 則進入在步驟S1109;若是,進入步驟S1105。
在步驟S1105,計算匹配文件MD5校驗和;在步驟S1106,判斷是否校驗成 功,若否則進入在步驟S1109;若是,進入步驟S1107。
在步驟S1107;計算匹配文件SHA256校驗和;在步驟S1108,判斷是否校 驗成功,若否,則進入在步驟S1109;若是,也進入步驟S1109。
在步驟S1109,將檢索結果返回進程管理模塊,進一步流程,如圖7所示; 在步驟SlllO,流程結束。
除上述實施例外,本發明還可以有其他實施方式,凡釆用等同替換或等效 變換形成的技術方案,均落在本發明要求的保護范圍之內。
權利要求
1. 一種基于網絡的計算機信息檢索系統,包括主控計算機、目標計算機、連接主控計算機與目標計算機的網絡,其特征在于所述主控計算機存有檢索程序和檢索目標的配置信息,并用于存貯檢索結果;系統還包括存有用于啟動目標計算機的啟動程序的裝置。
2. 根據權利要求l所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述裝置為主控計算機。
3. 根據權利要求1所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述裝置為移動存儲裝置。
4. 根據權利要求l所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述目標計算機與主控計算機處于同一局域網絡環境,并且目標計算機可以為念厶 夕口 。
5. 根據權利要求l所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述主控計算機可以實時查看目標計算機檢索狀態信息。
6. 根據權利要求l所述的一種基于網絡的計算機信息檢索系統,其特征在于目 標計算機有網絡啟動功能的網卡。
7. 根據權利要求1所述的--種基于網絡的計算機信息檢索系統,其特征在于所 述檢索程序由用戶監控界面模塊、檢索調度模塊、通信模塊、進程管理模塊、 檢索任務分配模塊、索引生成模塊、檢索功能模塊、檢索服務模塊構成。
8. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述用戶監控界面模塊運行時,顯示當前檢索狀態的信息,包括檢索任務信息、 當前檢索進度、檢索結果、磁盤狀態;用于用戶輸入控制信息和檢索任務信 息。
9. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述檢索調度模塊運行時,讀取并分析檢索目標配置信息,分析目標計算機存 儲設備的待檢索文件的索引,根據待檢索文件索引調度檢索任務,把檢索狀 態信息發送給所述用戶監控界面模塊,把檢索結果信息發送給所述檢索服務 模塊中的日志子模塊,以生成檢索曰志。
10. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述通信模塊運行時,流轉發送各模塊之間控制及數據信息。
11. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述進程管理模塊運行時,負責啟動和關閉其他各模塊的運行。
12. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述檢索任務分配模塊運行時,根據檢索任務調度不同的檢索功能模塊處理。
13.根據權利要求7所述的 一種基于網絡的計算機信息檢索系統,其特征在于所 述索引生成模塊運行時,根據檢索目標配置信息生成目標計算機存儲設備上 待檢索文件的索引。
14. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述檢索服務模塊包括壓縮服務、郵件服務、日志服務、OFFICE文檔處理以及 PDF文檔處理子模塊。
15. 根據權利要求7所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述檢索功能模塊運行時,具有圖片、文字、文件內容匹配檢索功能。
16. 根據權利要求l所述的一種基于網絡的計算機信息檢索系統,其特征在于所 述檢索程序依據所述檢索目標的配置信息對所述目標計算機存儲信息進行 檢索。
17. —種基于網絡的計算機信息檢索方法,包括以下步驟在主控計算機上通過 配置程序生成檢索目標配置信息;目標計算機獲取啟動程序,并啟動本析,; 目標計算機啟動后,通過網絡從主控計算機獲取檢索程序;在目標計算機上 啟動檢索程序;目標計算機通過網絡從主控計算機獲取檢索目標配置信息; 在目標計算機運行檢索程序,進行目標計算機信息檢索。
18.根據權利要求n所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述目標計算機通過網絡從主控計算機獲取啟動程序。
19. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述目標計算機通過移動存儲裝置獲取啟動程序。
20. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述的目標計算機把檢索狀態信息實時的通過網絡傳輸至主控計算機。
21. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述主控計算機可以實時查看目標計算機檢索狀態信息。
22. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索程序由用戶監控界面模塊、檢索調度模塊、通信模塊、進程管理模 塊、檢索任務分配模塊、索引生成模塊、檢索功能模塊、檢索服務模塊構成。
23. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述用戶監控界面模塊運行時,顯示當前檢索狀態的信息,包括案件信息、 當前檢索進度、檢索結果、磁盤狀態;用于用戶輸入控制信息和檢索描述信 息。
24. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索調度模塊運行時,讀取并分析檢索目標配置信息,分析目標計算機 存儲設備的待檢索文件的索引,根據待檢索文件索引調度檢索任務,把檢索 狀態信息發送給所述用戶監控界面模塊,把檢索結果信息發送給所述檢索服 務模塊中的日志子模塊,以生成檢索曰志。
25. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述通信模塊運行時,流轉發送各模塊之間控制及數據信息。
26. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述進程管理模塊運行時,負責啟動和關閉其他各模塊的運行。
27. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索任務分配模塊運行時,根據檢索任務調度不同的檢索功能模塊處 理。
28. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述索引生成模塊運行時,根據檢索目標配置信息生成目標計算機存儲設備 上待檢索文件的索引。
29. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索服務模塊包括壓縮服務、郵件服務、日志服務、OFFICE文檔處理、 PDF文檔處理子模塊。
30. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索功能模塊運行時,具有圖片、文字、文件內容匹配檢索功能。
31. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述用戶監控界面模塊運行時,包括如下步驟在目標計算機或通過網絡在 其他計算機上顯示監控界面,等待消息;判斷接收到的消息是否是用戶輸入 命令,如果是,繼續判斷該消息是否為退出命令,如果是,則退出;如果否,則把該消息發給通信模塊,繼續等待消息;如果接收的不是用戶輸入命令, 則繼續判斷是否為檢索結東消息,如果是,則結東;如果否,則把接收到的 信息顯示到用戶界面上,然后繼續等待消息。
32. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索調度模塊運行時,包括如下步驟從移動存儲設備中獲取檢索目標 配置信息,把檢索目標配置信息發送給通信模塊;接收從通信模塊發送過來 的索引數據,從索引數據中讀取需要檢索的文件信息,分析索引數據,判斷 索引數據是否分析結束,如果是,則發送結束消息到用戶界面監控模塊,然 后結束;如果否,根據檢索的條件把待檢索文件發送到通信模塊;從通信模 塊接收檢索結果信息,并將日志信息發送到通信模塊,再把曰志和其他信息 發送到用戶界面監控模塊;再返回從索引數據中讀取需要檢索的文件信息。
33. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述通信模塊運行時,包括如下步驟等待并接收數據;判斷該數據是否為 退出通信模塊的命令,如果是,則退出;如果不是,繼續判斷該數據是否為 命令消息,如果是,則將該數據轉發給檢索調度模塊,然后繼續等待接收數 據;如果否,則檢測該數據是否為檢索調度模塊發來的數據,如果是,則轉 發給進程管理模塊,然后繼續等待接收數據;如果否,則判斷該數據是否為 進程管理模塊返回的數據,如果是,則把數據轉發給檢索調度模塊,然后繼 續等待接收數據;如果否,則寫錯誤曰志,然后繼續等待接收數據。
34. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述進程管理模塊運行時,包括如下步驟分別啟動用戶監控界面模塊程序、 檢索調度模塊程序、通信模塊程序、索引生成模塊程序、檢索服務模塊程序、 檢索任務分配模塊程序;開始接收通信模塊發來的數據;判斷該數據是否為 退出進程管理模塊的命令,如果是,則退出進程管理模塊;如果不是,則進 一步判斷該數據為何種服務類型,如果為索引生成服務類型,則生成待檢索 文件索引;如果為檢索服務類型,則執行特定的檢索服務,如壓縮服務,郵件服務,日志服務,OFFICE文檔處理,PDF文檔處理;如果為檢索功能服務 類型,則檢索目標數據,如文字、圖片和文件內容;以上三種服務執行完畢,把結果返回給通信模塊,并重新開始接收通信模塊發來的數據。
35. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述索引生成模塊運行時,包括如下步驟從進程管理模塊獲取檢索目標配 置信息,讀取目標存儲設備中的文件列表信息,根據檢索目標配置信息篩選 文件,生成待檢索文件索引;判斷是否設置了優先搜索的路徑,如果是,調 整待檢索文件索引,將包含在優先路徑中的文件放置在索引前部,保存待檢索文件索引;如果否,直接保存待檢索文件索;把結果返回給進程管理模塊。
36. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索功能模塊進行圖片檢索時,包括如下步驟從進程管理模塊獲取檢 索目標配置信息,判斷是否為模糊檢索,如果是,則使用圖片模糊匹配算法 計算出匹配度,然后將檢索結果返回進程管理模塊;如果否,則使用圖片精 確匹配算法檢索,再將檢索結果返回進程管理模塊。
37. 根據權利要求36所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述模糊檢索支持多種圖像格式,包括GIF、 JPEG、 PNG、 XPM、 TGA、 TIFF、 BMP、 SVG。
38. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索功能模塊進行文件內容匹配檢索時,包括如下步驟從進程管理模 塊獲取檢索目標配置信息,計算匹配文件大小,第一次判斷是否校驗成功, 若否,則將檢索結果返回進程管理模塊;若是,則計算匹配文件MD5校驗和, 再判斷是否校驗成功,若否,則將檢索結果返回進程管理模塊;若是,則計 算匹配文件SHA256校驗和,第三次判斷是否校驗成功,若否,則將檢索結果返回進程管理模塊;若是,也將檢索結果返回進程管理模塊。
39. 根據權利要求22所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述檢索功能模塊進行文字檢索時,包括如下步驟從進程管理模塊獲取檢 索目標配置信息,判斷是否為關鍵字檢索,若是,則在文件中檢索關鍵字, 再將檢索結果返回進程管理模塊;若否,則利用POSIX正則表達式規則進行 檢索,再將檢索結果返回進程管理模塊。
40. 根據權利要求39所述的一種基于網絡的計算機信息檢索方法,其特征在于 所述利用POSIX正則表達式規則進行檢索,支持特定格式如電郵地址、信用 卡號碼的搜索。
41. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 對于目標計算機的硬盤內容具備非破壞性。
42. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持辦公套件文檔、電子表格、郵件、網頁、即時通信記錄、文本的搜索。
43. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 可以搜索已刪除文件,并可以恢復。
44. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持按照優先級排序進行快速搜索。
45. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持搜索非圖片文件中的圖片信息。
46. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持搜索壓縮文件。
47. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持光盤鏡像文件搜索。
48. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 能同時支持搜索簡體中文與繁體中文的各種編碼,包括GB2312、 GBK、 GB18030、 BIG5、 BIG5-HKSCS、 UTF-16、 UTF-8,無論文件內容是用以上哪種 編碼、只要匹配檢索關鍵字中漢字的文件均能被檢索出來。
49. 根據權利要求17所述的一種基于網絡的計算機信息檢索方法,其特征在于 支持對windows系統中縮略圖數據的搜索。
全文摘要
本發明公開了一種基于網絡的計算機信息檢索系統,包括主控計算機、目標計算機、連接主控計算機與目標計算機的網絡,所述主控計算機存有檢索程序和檢索目標的配置信息,并用于存貯檢索結果。一種基于網絡的計算機信息檢索方法,包括以下步驟在主控計算機上通過配置程序生成檢索目標配置信息;目標計算機獲取啟動程序,并啟動本機;目標計算機啟動后,通過網絡從主控計算機獲取檢索程序;在目標計算機上啟動檢索程序;目標計算機通過網絡從主控計算機獲取檢索目標配置信息;在目標計算機運行檢索程序,進行目標計算機信息檢索。
文檔編號G06F17/30GK101520790SQ20081019623
公開日2009年9月2日 申請日期2008年8月29日 優先權日2008年8月29日
發明者鐘臻智, 黃彥邦 申請人:南京新華科技發展有限公司