防止網頁文本信息被自動抓取的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種防止網頁文本信息被自動抓取的方法和系統(tǒng),方法包括:頁面圖形控件向轉換服務器發(fā)送轉換請求;轉換服務器解密密文信息,得到解密后的信息,判斷解密后的信息是否為標識信息,如果是,則從數據庫中提取標識信息所對應的網頁展示明文信息,如果不是,則將解密后的信息直接作為網頁展示明文信息;將得到的網頁展示明文信息繪制為圖片格式網頁信息,再寫入Http輸出流中;將Http輸出流發(fā)送給頁面圖形控件;頁面圖形控件解析Http輸出流,獲得圖片格式網頁信息,然后以圖片格式顯示所述網頁信息。以圖片格式展示網站所發(fā)布的信息,從而達到防止網站所發(fā)布的信息被自動抓取的效果。
【專利說明】防止網頁文本信息被自動抓取的方法和系統(tǒng)
【技術領域】
[0001] 本發(fā)明屬于信息處理【技術領域】,具體涉及一種防止網頁文本信息被自動抓取的方 法和系統(tǒng)。
【背景技術】
[0002] 在當前網絡信息時代,用戶常常向特定網站的網頁發(fā)布文本格式信息,例如:證件 號碼、手機號、商品價格等?,F有技術中,出現了網絡蜘蛛或類似的網頁信息自動抓取工具, 通過該種工具,能夠自動獲取網頁中展示的文本格式信息。
[0003] 但是,以商品價格為例,當網站A發(fā)布商品A的價格后,其他網站通過自動抓取工 具進行全網抓取,從而抓取到眾多網站所發(fā)布的商品A價格,然后對商品A價格進行比對, 制定商品A經營策略,從而不利于網站A。
[0004] 因此,如何有效保護用戶在網站所發(fā)布的信息,防止其被網頁信息自動抓取工具 所抓取到,具有重要意義。
【發(fā)明內容】
[0005] 針對現有技術存在的缺陷,本發(fā)明提供一種防止網頁文本信息被自動抓取的方法 和系統(tǒng),以圖片格式展示網站所發(fā)布的信息,從而達到防止網站所發(fā)布的信息被自動抓取 的效果。
[0006] 本發(fā)明采用的技術方案如下:
[0007] 本發(fā)明提供一種防止網頁文本信息被自動抓取的方法,包括以下步驟:
[0008] Sl,web服務器從數據庫中讀取待處理明文信息;其中,所述待處理明文信息包括 網頁展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展示明文 信息為文本形式;
[0009] S2,所述web服務器加密所述待處理明文信息,得到密文信息;
[0010] S3,所述web服務器生成頁面圖形控件需要的轉換服務器請求地址,然后將所述 轉換服務器請求地址發(fā)送給所述頁面圖形控件;其中,所述轉換服務器請求地址還攜帶所 述密文信息;
[0011] S4,基于所述轉換服務器請求地址,所述頁面圖形控件向所述轉換服務器發(fā)送轉 換請求;其中,所述轉換請求攜帶所述密文信息;
[0012] S5,所述轉換服務器解密所述密文信息,得到解密后的信息;
[0013] S6,所述轉換服務器判斷所述解密后的信息是否為標識信息,如果是,則從所述數 據庫中提取所述標識信息所對應的網頁展示明文信息,然后執(zhí)行S7 ;如果不是,則將解密 后的信息直接作為網頁展示明文信息,然后執(zhí)行S7 ;
[0014] S7,所述轉換服務器將S6得到的所述網頁展示明文信息繪制為圖片格式網頁信 息,再將所述圖片格式網頁信息寫入Http輸出流中;
[0015] S8,所述轉換服務器將已寫入圖片格式網頁信息的Http輸出流發(fā)送給所述頁面 圖形控件;
[0016] S9,所述頁面圖形控件解析所述已寫入圖片格式網頁信息的Http輸出流,獲得圖 片格式網頁信息,然后以圖片格式顯示所述網頁信息。
[0017] 優(yōu)選的,S2具體為:
[0018] 所述web服務器使用DES算法加密所述待處理明文信息,得到密文信息。
[0019] 優(yōu)選的,S9中,所述頁面圖形控件以圖片格式顯示所述網頁信息具體為:
[0020] 所述頁面圖形控件預先定義需要顯示的圖片的屬性;然后基于所述圖片的屬性, 以圖片格式顯示所述網頁信息。
[0021] 優(yōu)選的,所述圖片的屬性包括圖片的長度信息、圖片的寬度信息、圖片的分辨率信 息、圖片中字符顯示的位置信息、圖片中字符顏色信息、圖片中字符字體信息和圖片中字符 大小信息中的一種或幾種。
[0022] 本發(fā)明還提供一種防止網頁文本信息被自動抓取的系統(tǒng),包括:web服務器、頁面 圖形控件和轉換服務器;
[0023] 所述web服務器用于:從數據庫中讀取待處理明文信息;其中,所述待處理明文信 息包括網頁展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展 示明文信息為文本形式;加密所述待處理明文信息,得到密文信息;生成頁面圖形控件需 要的轉換服務器請求地址,然后將所述轉換服務器請求地址發(fā)送給所述頁面圖形控件;其 中,所述轉換服務器請求地址還攜帶所述密文信息;
[0024] 所述頁面圖形控件用于:接收所述web服務器發(fā)送的轉換服務器請求地址,基于 所述轉換服務器請求地址,向所述轉換服務器發(fā)送轉換請求;其中,所述轉換請求攜帶所述 密文信息;
[0025] 所述轉換服務器用于:接收所述頁面圖形控件發(fā)送的轉換請求,解密所述密文信 息,得到解密后的信息;判斷所述解密后的信息是否為標識信息,如果是,則從所述數據庫 中提取所述標識信息所對應的網頁展示明文信息,如果不是,則將解密后的信息直接作為 網頁展示明文信息;然后,將得到的網頁展示明文信息繪制為圖片格式網頁信息,再將所述 圖片格式網頁信息寫入Http輸出流中,將已寫入圖片格式網頁信息的Http輸出流發(fā)送給 所述頁面圖形控件;
[0026] 所述頁面圖形控件還用于:接收所述轉換服務器發(fā)送的Http輸出流,解析所述已 寫入圖片格式網頁信息的Http輸出流,獲得圖片格式網頁信息,然后以圖片格式顯示所述 網頁信息。
[0027] 本發(fā)明的有益效果如下:
[0028] 本發(fā)明提供一種防止網頁文本信息被自動抓取的方法和系統(tǒng),以圖片格式展示網 站所發(fā)布的信息,既能達到防止網站所發(fā)布的信息被自動抓取的效果;還具有安全、高效、 簡潔、易用的優(yōu)點。
【專利附圖】
【附圖說明】
[0029] 圖1為本發(fā)明提供的防止網頁文本信息被自動抓取的方法流程示意圖;
[0030] 圖2為本發(fā)明提供的防止網頁文本信息被自動抓取的系統(tǒng)結構示意圖。
【具體實施方式】
[0031] 以下結合附圖對本發(fā)明進行詳細說明:
[0032] 如圖1所示,本發(fā)明提供一種防止網頁文本信息被自動抓取的方法,包括以下步 驟:
[0033] Sl,web服務器從數據庫中讀取待處理明文信息;其中,所述待處理明文信息包括 網頁展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展示明文 信息為文本形式;
[0034] S2,所述web服務器加密所述待處理明文信息,得到密文信息;
[0035] 本發(fā)明對具體的加密算法并不限制,可以為DES算法。通過對待處理明文信息進 行加密,可以提高web服務器到轉換服務器之間信息傳輸的安全性。
[0036] S3,所述web服務器生成頁面圖形控件需要的轉換服務器請求地址,然后將所述 轉換服務器請求地址發(fā)送給所述頁面圖形控件;其中,所述轉換服務器請求地址還攜帶所 述密文信息;
[0037] S4,基于所述轉換服務器請求地址,所述頁面圖形控件向所述轉換服務器發(fā)送轉 換請求;其中,所述轉換請求攜帶所述密文信息;
[0038] S5,所述轉換服務器解密所述密文信息,得到解密后的信息;
[0039] S6,所述轉換服務器判斷所述解密后的信息是否為標識信息,如果是,則從所述數 據庫中提取所述標識信息所對應的網頁展示明文信息,然后執(zhí)行S7 ;如果不是,則將解密 后的信息直接作為網頁展示明文信息,然后執(zhí)行S7 ;
[0040] S7,所述轉換服務器將S6得到的所述網頁展示明文信息繪制為圖片格式網頁信 息,再將所述圖片格式網頁信息寫入Http輸出流中;
[0041] 需要強調的是,本步驟中,將圖片格式網頁信息以流的形式寫入Http輸出流中, 因此,轉換服務器向頁面圖形控件返回的為數據流,而不是圖片格式,由于流小于圖片的大 小,因此,可以提高數據傳輸的速度;另外,以流的方式傳輸,不容易被黑客破解,從而提高 數據傳輸的安全性。
[0042] S8,所述轉換服務器將已寫入圖片格式網頁信息的Http輸出流發(fā)送給所述頁面 圖形控件;
[0043] S9,所述頁面圖形控件解析所述已寫入圖片格式網頁信息的Http輸出流,獲得圖 片格式網頁信息,然后以圖片格式顯示所述網頁信息。
[0044] 具體的,頁面圖形控件預先定義需要顯示的圖片的屬性;然后基于所述圖片的屬 性,以圖片格式顯示所述網頁信息。其中,圖片的屬性包括圖片的長度信息、圖片的寬度信 息、圖片的分辨率信息、圖片中字符顯示的位置信息、圖片中字符顏色信息、圖片中字符字 體信息和圖片中字符大小信息中的一種或幾種。
[0045] 如圖2所示,本發(fā)明還提供一種防止網頁文本信息被自動抓取的系統(tǒng),包括:web 服務器、頁面圖形控件和轉換服務器;
[0046] 所述web服務器用于:從數據庫中讀取待處理明文信息;其中,所述待處理明文信 息包括網頁展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展 示明文信息為文本形式;加密所述待處理明文信息,得到密文信息;生成頁面圖形控件需 要的轉換服務器請求地址,然后將所述轉換服務器請求地址發(fā)送給所述頁面圖形控件;其 中,所述轉換服務器請求地址還攜帶所述密文信息;
[0047] 所述頁面圖形控件用于:接收所述web服務器發(fā)送的轉換服務器請求地址,基于 所述轉換服務器請求地址,向所述轉換服務器發(fā)送轉換請求;其中,所述轉換請求攜帶所述 密文信息;
[0048] 所述轉換服務器用于:接收所述頁面圖形控件發(fā)送的轉換請求,解密所述密文信 息,得到解密后的信息;判斷所述解密后的信息是否為標識信息,如果是,則從所述數據庫 中提取所述標識信息所對應的網頁展示明文信息,如果不是,則將解密后的信息直接作為 網頁展示明文信息;然后,將得到的網頁展示明文信息繪制為圖片格式網頁信息,再將所述 圖片格式網頁信息寫入Http輸出流中,將已寫入圖片格式網頁信息的Http輸出流發(fā)送給 所述頁面圖形控件;
[0049] 所述頁面圖形控件還用于:接收所述轉換服務器發(fā)送的Http輸出流,解析所述已 寫入圖片格式網頁信息的Http輸出流,獲得圖片格式網頁信息,然后以圖片格式顯示所述 網頁信息。
[0050] 綜上所述,本發(fā)明提供的防止網頁文本信息被自動抓取的方法和系統(tǒng),以圖片格 式展示網站所發(fā)布的信息,既能達到防止網站所發(fā)布的信息被自動抓取的效果;還具有安 全、高效、簡潔、易用的優(yōu)點。
[0051] 以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本【技術領域】的普通技術人 員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視本發(fā)明的保護范圍。
【權利要求】
1. 一種防止網頁文本信息被自動抓取的方法,其特征在于,包括以下步驟: Sl,web服務器從數據庫中讀取待處理明文信息;其中,所述待處理明文信息包括網頁 展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展示明文信息 為文本形式; 52, 所述web服務器加密所述待處理明文信息,得到密文信息; 53, 所述web服務器生成頁面圖形控件需要的轉換服務器請求地址,然后將所述轉換 服務器請求地址發(fā)送給所述頁面圖形控件;其中,所述轉換服務器請求地址還攜帶所述密 文信息; 54, 基于所述轉換服務器請求地址,所述頁面圖形控件向所述轉換服務器發(fā)送轉換請 求;其中,所述轉換請求攜帶所述密文信息; 55, 所述轉換服務器解密所述密文信息,得到解密后的信息; 56, 所述轉換服務器判斷所述解密后的信息是否為標識信息,如果是,則從所述數據庫 中提取所述標識信息所對應的網頁展示明文信息,然后執(zhí)行S7 ;如果不是,則將解密后的 信息直接作為網頁展示明文信息,然后執(zhí)行S7 ; 57, 所述轉換服務器將S6得到的所述網頁展示明文信息繪制為圖片格式網頁信息,再 將所述圖片格式網頁信息寫入Http輸出流中; 58, 所述轉換服務器將已寫入圖片格式網頁信息的Http輸出流發(fā)送給所述頁面圖形 控件; 59, 所述頁面圖形控件解析所述已寫入圖片格式網頁信息的Http輸出流,獲得圖片格 式網頁信息,然后以圖片格式顯示所述網頁信息。
2. 根據權利要求1所述的防止網頁文本信息被自動抓取的方法,其特征在于,S2具體 為: 所述web服務器使用DES算法加密所述待處理明文信息,得到密文信息。
3. 根據權利要求1所述的防止網頁文本信息被自動抓取的方法,其特征在于,S9中,所 述頁面圖形控件以圖片格式顯示所述網頁信息具體為: 所述頁面圖形控件預先定義需要顯示的圖片的屬性;然后基于所述圖片的屬性,以圖 片格式顯示所述網頁信息。
4. 根據權利要求3所述的防止網頁文本信息被自動抓取的方法,其特征在于,所述圖 片的屬性包括圖片的長度信息、圖片的寬度信息、圖片的分辨率信息、圖片中字符顯示的位 置信息、圖片中字符顏色信息、圖片中字符字體信息和圖片中字符大小信息中的一種或幾 種。
5. -種防止網頁文本信息被自動抓取的系統(tǒng),其特征在于,包括:web服務器、頁面圖 形控件和轉換服務器; 所述web服務器用于:從數據庫中讀取待處理明文信息;其中,所述待處理明文信息包 括網頁展示明文信息或與所述網頁展示明文信息對應的標識信息;其中,所述網頁展示明 文信息為文本形式;加密所述待處理明文信息,得到密文信息;生成頁面圖形控件需要的 轉換服務器請求地址,然后將所述轉換服務器請求地址發(fā)送給所述頁面圖形控件;其中,所 述轉換服務器請求地址還攜帶所述密文信息; 所述頁面圖形控件用于:接收所述web服務器發(fā)送的轉換服務器請求地址,基于所述 轉換服務器請求地址,向所述轉換服務器發(fā)送轉換請求;其中,所述轉換請求攜帶所述密文 信息; 所述轉換服務器用于:接收所述頁面圖形控件發(fā)送的轉換請求,解密所述密文信息,得 到解密后的信息;判斷所述解密后的信息是否為標識信息,如果是,則從所述數據庫中提取 所述標識信息所對應的網頁展示明文信息,如果不是,則將解密后的信息直接作為網頁展 示明文信息;然后,將得到的網頁展示明文信息繪制為圖片格式網頁信息,再將所述圖片格 式網頁信息寫入Http輸出流中,將已寫入圖片格式網頁信息的Http輸出流發(fā)送給所述頁 面圖形控件; 所述頁面圖形控件還用于:接收所述轉換服務器發(fā)送的Http輸出流,解析所述已寫入 圖片格式網頁信息的Http輸出流,獲得圖片格式網頁信息,然后以圖片格式顯示所述網頁 信息。
【文檔編號】G06F17/30GK104217136SQ201310220475
【公開日】2014年12月17日 申請日期:2013年6月5日 優(yōu)先權日:2013年6月5日
【發(fā)明者】韓華 申請人:北京齊爾布萊特科技有限公司