網頁信息自動錄入方法及系統的制作方法
【技術領域】
[0001] 本發明涉及信息處理領域,特別是涉及一種網頁信息自動錄入方法及系統。
【背景技術】
[0002] 名詞解釋: TextBox:文本框; RadioBox:單選框; ComboBox:選擇框。
[0003] 隨著信息管理軟件逐步由傳統的C/S結構向B/S結構轉變,越來越多的信息錄入都 在網頁上實現,這種方式的轉變一方面極大減輕了軟件實施方的安裝、維護工作量,同時在 一定程度也降低了對客戶端的設備要求,但像其他任何事物一樣,有利必然有弊,其最大的 不足在于客戶端信息錄入方面與傳統C/S結構軟件相比,一是在便利化、人機友好性方面有 所欠缺;最主要的是,這種B/S結構應用軟件,其數據庫非常集中,應用規模廣,數據庫位于 最核心服務后臺,一般不可能向客戶端開放任何數據接口,客戶端也無從窺探后臺數據接 口,這樣就造成客戶端只有通過客戶端網頁唯一媒介向后臺錄入數據。而現實情況是,在客 戶端往往已存在這樣或那樣的信息系統和本地數據庫,有諸多現成的信息可供錄入。目前 的網頁信息錄入方式需要手動將各種本地信息庫進行錄入,無法自動錄入各種本地信息, 操作較為繁瑣,工作效率低下,而且由于需要大量的人為輸入操作,導致數據出錯的概率增 大,最后導致錄入的準確率較低。
【發明內容】
[0004] 為了解決上述的技術問題,本發明的目的是提供網頁信息自動錄入方法。本發明 的另一目的是提供網頁信息自動錄入系統 本發明解決其技術問題所采用的技術方案是: 網頁信息自動錄入方法,包括: 51、 將目標網頁按照網頁文檔結構生成XML文檔; 52、 將XML文檔轉換成對應的數據表,并響應于用戶的輸入信息,將數據表與本地信息 庫進行映射后,生成映射字典庫; 53、 提取本地信息庫的數據信息并根據映射字典庫的映射關系,將數據信息中的數據 內容自動錄入到目標網頁中; 54、 判斷本地信息庫是否錄入完畢,若是,則自動提交到遠程后臺。
[0005] 進一步,所述步驟S1,包括: 511、 將目標網頁按照網頁文檔分層進行剝離、解析后,形成XML標準文檔格式; 512、 對目標網頁的信息內容進行遍歷樹掃描后,獲取對應信息填充到上述XML標準文 檔格式中,生成XML文檔。
[0006] 進一步,所述XML標準文檔格式包括文檔名稱、網頁層名稱、信息單元識別符、信息 單元結構類型以及信息單元數據類型。
[0007] 進一步,所述步驟S2,包括: 521、 將XML文檔轉換成對應的數據表; 522、 響應于用戶的輸入信息,將數據表的網頁信息單元識別符與本地信息庫的本地信 息單元名稱進行映射配對后,生成映射字典庫。
[0008] 進一步,所述步驟S22,其具體為: 分別列表顯示數據表的網頁信息單元識別符以及本地信息庫的本地信息單元名稱,并 響應于用戶在兩個列表上的點擊操作信息,將網頁信息單元識別符與本地信息單元名稱進 行映射配對后,生成映射字典庫。
[0009] 進一步,所述步驟S3,包括: 531、 逐條提取本地信息庫中的數據信息; 532、 根據映射字典庫的映射關系進行匹配處理,獲取與該數據信息對應的網頁信息的 數據格式; 533、 根據獲取的網頁信息的數據格式,將數據信息中的數據內容自動錄入到目標網頁 中。
[0010]進一步,所述步驟S33,其具體為: 判斷獲取的網頁信息的數據格式是否為文本框格式,若是,則將數據信息中的數據內 容賦值到目標網頁的對應文本框中,反之,若判斷獲取的網頁信息的數據格式為選擇框格 式,則計算出數據信息中的數據內容在該選擇框中的排序,并將輸入光標移動到目標網頁 的對應選擇框后,根據該排序模擬移動選擇框的列表項,最后定格在與該數據內容匹配的 選項后,選擇該選項。
[0011] 本發明解決其技術問題所采用的另一技術方案是: 網頁信息自動錄入系統,包括: 網頁提取模塊,用于將目標網頁按照網頁文檔結構生成XML文檔; 映射模塊,用于將XML文檔轉換成對應的數據表,并響應于用戶的輸入信息,將數據表 與本地信息庫進行映射后,生成映射字典庫; 自動錄入模塊,用于提取本地信息庫的數據信息并根據映射字典庫的映射關系,將數 據信息中的數據內容自動錄入到目標網頁中; 自動提交模塊,用于判斷本地信息庫是否錄入完畢,若是,則自動提交到遠程后臺。
[0012] 進一步,所述網頁提取模塊包括: 第一子模塊,用于將目標網頁按照網頁文檔分層進行剝離、解析后,形成XML標準文檔 格式; 第二子模塊,用于對目標網頁的信息內容進行遍歷樹掃描后,獲取對應信息填充到上 述XML標準文檔格式中,生成XML文檔。
[0013] 進一步,所述映射模塊包括: 第三子模塊,用于將XML文檔轉換成對應的數據表; 第四子模塊,用于響應于用戶的輸入信息,將數據表的網頁信息單元識別符與本地信 息庫的本地信息單元名稱進行映射配對后,生成映射字典庫。
[0014] 進一步,所述自動錄入模塊,包括: 第五子模塊,用于逐條提取本地信息庫中的數據信息; 第六子模塊,用于根據映射字典庫的映射關系進行匹配處理,獲取與該數據信息對應 的網頁信息的數據格式; 第七子模塊,用于根據獲取的網頁信息的數據格式,將數據信息中的數據內容自動錄 入到目標網頁中。
[0015] 本發明的有益效果是:本發明的網頁信息自動錄入方法,包括:將目標網頁按照網 頁文檔結構生成XML文檔;將XML文檔轉換成對應的數據表,并響應于用戶的輸入信息,將數 據表與本地信息庫進行映射后,生成映射字典庫;提取本地信息庫的數據信息并根據映射 字典庫的映射關系,將數據信息中的數據內容自動錄入到目標網頁中;判斷本地信息庫是 否錄入完畢,若是,則自動提交到遠程后臺。本方法可以將本地信息庫的數據信息自動錄入 到目標網頁并提交到遠程后臺,適用范圍廣、兼容性強、簡單高效率且錄入準確率高。
[0016] 本發明的另一有益效果是:網頁信息自動錄入系統,包括:網頁提取模塊,用于將 目標網頁按照網頁文檔結構生成XML文檔;映射模塊,用于將XML文檔轉換成對應的數據表, 并響應于用戶的輸入信息,將數據表與本地信息庫進行映射后,生成映射字典庫;自動錄入 模塊,用于提取本地信息庫的數據信息并根據映射字典庫的映射關系,將數據信息中的數 據內容自動錄入到目標網頁中;自動提交模塊,用于判斷本地信息庫是否錄入完畢,若是, 則自動提交到遠程后臺。本系統可以將本地信息庫的數據信息自動錄入到目標網頁并提交 到遠程后臺,適用范圍廣、兼容性強、簡單高效率且錄入準確率高。。
【附圖說明】
[0017]下面結合附圖和實施例對本發明作進一步說明。
[0018] 圖1是本發明的網頁信息自動錄入方法的流程圖。
【具體實施方式】
[0019] 參照圖1,本發明提供了 一種網頁信息自動錄入方法,包括: 51、 將目標網頁按照網頁文檔結構生成XML文檔; 52、 將XML文檔轉換成對應的數據表,并響應于用戶的輸入信息,將數據表與本地信息 庫進行映射后,生成映射字典庫; 53、 提取本地信息庫的數據信息并根據映射字典庫的映射關系,將數據信息中的數據 內容自動錄入到目標網頁中; 54、 判斷本地信息庫是否錄入完畢,若是,則自動提交到遠程后臺。
[0020] 進一步作為優選的實施方式,所述步驟S1,包括: 511、 將目標網頁按照網頁文檔分層進行剝離、解析后,形成XML標準文檔格式; 512、 對目