網站安全性的檢測方法和系統的制作方法
【專利摘要】一種網站安全性的檢測方法,截獲用戶訪問網站的訪問請求,并獲取訪問請求中包含的訪問地址。對訪問地址對應的頁面進行解析,得到訪問地址對應的頁面的標題標簽。在預設數據庫中查找與標題標簽對應的頁面地址,預設數據庫中預先儲有經過認證的網站的標題標簽及對應的頁面地址。若查找到的頁面地址與訪問地址一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。因此,即使某釣魚網站第一次出現,只需在預設數據庫中查找到與標題標簽對應的網頁地址,并與將該釣魚網站實際的頁面地址與進行比對即可。檢測不用依賴黑名單,從而大大提高了檢測網站安全性的時效性。此外,本發明還提供一種網站安全性的檢測系統。
【專利說明】網站安全性的檢測方法和系統
【技術領域】
[0001]本發明涉及網絡安全技術,特別是涉及一種網站安全性的檢測方法及系統。
【背景技術】
[0002]網絡釣魚主要是指利用互聯網進行的一種欺詐行為,它通過誘騙用戶提供某種個人賬戶和密碼等,獲得用戶的某種身份信息,進而竊取用戶的個人財產。而犯罪分子用于進行網絡釣魚的網絡平臺則被稱為釣魚網站。
[0003]傳統的反釣魚軟件一般是通過建立已知的釣魚網站的網址黑名單數據庫,當用戶訪問網址時,判斷網址是否為黑名單數據庫中的網址,如果是則告知用戶該網站為釣魚網站,警告用戶不要使用或者直接屏蔽。
[0004]然而,傳統的反釣魚軟件能否準確檢測出釣魚網站很大程度依賴其數據庫的完備性。每天都有可能出現新的釣魚網站,而傳統反釣魚軟件的數據庫不能立即將新增釣魚網站錄入,只有當用戶向反釣魚軟件舉報該釣魚網站后,其黑名單數據庫中才有可能錄入該釣魚網站的網址。因此,傳統的反釣魚軟件不能檢測出新增的釣魚網站,時效性較差。
【發明內容】
[0005]基于此,有必要針對傳統反釣魚軟件時效性差的問題,提供一種時效性較高的網站安全性的檢測方法和系統。
[0006]一種網站安全性的檢測方法,包括以下步驟:
[0007]截獲用戶訪問網站的訪問請求,并獲取所述訪問請求中包含的訪問地址;
[0008]對所述訪問地址對應的頁面進行解析,得到所述訪問地址對應的頁面的標題標簽;
[0009]在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址;
[0010]將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。
[0011]在其中一個實施例中,所述預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
[0012]在其中一個實施例中,在所述在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先對應存儲有經過認證的網站的標題標簽及對應的頁面地址的步驟之后,所述方法還包括:
[0013]若在所述預設數據庫中未查找到與所述標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
[0014]在其中一個實施例中,在所述將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全,否則,判定用戶所訪問的網站為釣魚網站的步驟之后,所述方法還包括:[0015]根據對用戶所訪問網站的判定結果,顯示提示。
[0016]在其中一個實施例中,在所述將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全,否則,判定用戶所訪問的網站為釣魚網站的步驟之后,所述方法還包括:
[0017]若用戶所訪問的網站被判定為釣魚網站,則屏蔽對所述網站的訪問請求。
[0018]此外,還提供一種網站安全性的檢測系統,包括:
[0019]監聽模塊,用于截獲用戶訪問網站的訪問請求,并獲取所述訪問請求中包含的訪問地址;
[0020]解析模塊,用于對所述訪問地址對應的頁面進行解析,得到所述訪問地址對應的頁面的標題標簽;
[0021]查找模塊,用于在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址;
[0022]判定模塊,用于將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。
[0023]在其中一個實施例中,所述預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
[0024]在其中一個實施例中,所述判定模塊還用于若所述查找模塊在所述預設數據庫中未查找到與所述標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
[0025]在其中一個實施例中,還包括:
[0026]提示模塊,用于根據對用戶所訪問網站的判定結果,顯示提示。
[0027]在其中一個實施例中,還包括:
[0028]攔截模塊,用于若用戶所訪問的網站被判定為釣魚網站,則屏蔽對所述網站的訪問請求。
[0029]上述網站安全性的檢測方法和系統,截獲用戶訪問網站的訪問請求,并獲取訪問請求中包含的訪問地址。對訪問地址對應的頁面進行解析,得到訪問地址對應的頁面的標題標簽。進一步的,在預設數據庫中查找與標題標簽對應的頁面地址,預設數據庫中預先儲有經過認證的網站的標題標簽及對應的頁面地址。將查找到的頁面地址與訪問地址進行對t匕,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。網站的標題標簽與頁面地址是一一對應的關系,預設數據庫中存儲的頁面地址為網站的真實地址。而釣魚網站為了達到欺騙用戶的目的,其標題標簽一般與正規網站相同,但頁面地址不同。因此,即使某個釣魚網站第一次出現,只需先查找到與標題標簽對應的網頁地址即真實地址,再將該釣魚網站實際的頁面地址與真實地址進行比對,則可檢測出該釣魚網站。檢測不用依賴黑名單,從而大大提高了檢測網站安全性的時效性。
【專利附圖】
【附圖說明】
[0030]圖1為一個實施例中網站安全性的檢測方法的流程圖;
[0031]圖2為一個實施例中網站安全性的檢測系統的模塊圖。
【具體實施方式】[0032]如圖1所示,在一個實施例中,一種網站安全性的檢測方法,包括步驟:
[0033]步驟S110,截獲用戶訪問網站的訪問請求,并獲取訪問請求中包含的訪問地址。
[0034]具體的,釣魚網站一般偽裝成正規網站以騙取用戶訪問,進而誘導用戶泄露賬戶信息等。釣魚網站一般會在其他網頁頁面上、彈出窗口上設置超鏈接或者通過搜索引擎搜索并在其搜索頁面上顯示釣魚網站的超鏈接。其中,為達到欺騙用戶的目的,釣魚網站的超鏈接對應著正規網站的名稱或logo (標識)。例如,某釣魚網站A試圖偽裝成***銀行來騙取用戶的賬號密碼,則該釣魚網站的超鏈接一般對應著“***銀行”字樣或是該銀行的logo。
[0035]在一個實例中,用戶一般可通過在瀏覽器地址欄中輸入網址而產生訪問請求或點擊超鏈接而產生訪問請求。由于正規網站的網址都是公開的,故通過直接輸入網址而產生的訪問請求一般不會訪問到釣魚網站。因此,只截獲用戶通過點擊超鏈接所產生的訪問請求。進一步的,提取訪問請求中包含的訪問地址,即超連接對應的網頁地址。
[0036]步驟S120,對訪問地址對應的頁面進行解析,得到訪問地址對應的頁面的標題標簽。
[0037]釣魚網站為了獲得較大被訪問的可能,一般希望能被搜索引擎命中,并將其鏈接顯示在搜索頁面上。網站的標題標簽即title值,在頁面的Head標簽內被用來定義頁面文檔的標題。搜索引擎的爬蟲一般根據網站的標題標簽(title值)進行爬取,若網站的標題標簽與搜索關鍵字匹配,則為命中記錄。因此,釣魚網站為了獲得較大的命中概率以及迷惑用戶,其標題標簽也一般需與正規網站相同。以上述釣魚網站A為例,假設***銀行的標題標簽為“***銀行”,則該釣魚網站的標題標簽也為“***銀行”。
[0038]具體的,可先根據獲取的訪問地址拉取對應的頁面內容,頁面內容中包含網站的標題標簽。進一步的,通過java、JavaScript、C、C++等語言編寫的腳本解析拉取的頁面內容,獲得訪問地址對應的頁面的標題標簽。
[0039]步驟S130,在預設數據庫中查找與標題標簽對應的頁面地址,預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址。
[0040]經過備案的正規網站的標題標簽是唯一的,并與其域名(即頁面地址)一一對應。在預設數據庫中,網站的標題標簽與頁面地址對應存儲。其中,預設數據庫中的頁面地址經過審查和認證,為預設數據庫中標題標簽所對應的網站的真實地址。以上述***銀行為例,若該銀行的頁面地址為“穩.bank, com”,則在預設數據庫中,與標題標簽“***銀行”對應存儲的頁面地址為“www.bank, com”。
[0041]具體的,以解析得到的標題標簽為主鍵在預設數據庫中查詢,得到匹配的記錄,進而獲取與標題標簽對應的頁面地址。例如,解析得到的標題標簽為“***銀行”,則查詢得到的頁面地址為“www.bank, com”。
[0042]在一個實施例中,預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
[0043]在中國境內,正規注冊的網站都需要通過中國互聯網絡信息中心審核并在工信部IP/域名信息備案系統中進行備案。因此,中國互聯網絡信息中心和工信部IP/域名信息備案系統的數據庫最新、最全面。
[0044]進一步的,預設數據庫與中國互聯網絡信息中心和工信部IP/域名信息備案系統的數據庫實時共享數據,以使預設數據庫中的數據最新、最全面,從而在檢測時能更準確。具體的,可利用包括使用觸發器、閃回、⑶C (Change Data Capture變化數據捕獲)等數據增量獲取的方式實現數據的實時共享。
[0045]步驟S140,將查找到的頁面地址與訪問地址進行對比,判斷兩者是否一致,若是,則執行步驟S150,否則,執行步驟S160。
[0046]步驟S150,判定用戶所訪問的網站為安全網站。
[0047]步驟S160,判定用戶所訪問的網站為釣魚網站。
[0048]具體的,將查詢得到的頁面地址與訪問請求中包含的訪問地址進行比對,若兩者一致,則表示用戶訪問請求中包含的訪問地址經過權威機構,如中國互聯網絡信息中心和工信部IP/域名信息備案系統認證,為正規網站的頁面地址,用戶所訪問的網站為安全網站。若兩者不一致,則表示用戶訪問請求中包含的訪問地址不是標題標簽所對應的正規網站的頁面地址,有人假冒正規網站,因此判斷用戶所訪問的網站為釣魚網站。
[0049]例如,用戶所訪問的網站的標題標簽為“***銀行”,通過在預設數據庫中查詢,獲得對應的頁面地址為“WWW.bank, com”。若用戶訪問請求中包含的訪問地址為“www.bank,com”,則表示用戶訪問的網站是***銀行的正規網站。若用戶訪問請求中包含的訪問地址不為“WWW.bank, com”,則表示有人冒充***銀行,用戶訪問的網站是釣魚網站。
[0050]在一個實施例中,在上述步驟S130之后,上述網站安全性的檢測方法還包括:若在預設數據庫中未查找到與標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
[0051]具體的,可能由于預設數據庫的數據更新存在延時,而導致新注冊的網站的標題標簽以及頁面地址未對應存儲于預設數據庫中。此外,還有可能由于用戶訪問的網站是未通過備案的非正規網站,從而導致在預設數據庫中無法查找到對應的頁面地址。網站的安全性無法確定,因此,判定網站的安全性為未知。
[0052]在一個實施例中,在上述步驟S150和S160之后,上述網站安全性的檢測方法還包括:根據對用戶所訪問網站的判定結果,顯示提示。
[0053]具體的,可在用戶訪問網站之前在瀏覽器窗口中彈出對話框,提示將要訪問網站的安全性。
[0054]在一個實施例中,在上述步驟S150和S160之后,上述網站安全性的檢測方法還包括:若用戶所訪問的網站被判定為釣魚網站,則屏蔽對網站的訪問請求。
[0055]具體的,對于判斷為釣魚網站的網站,則可直接攔截,并向用戶發出警報。而判斷為安全的網站,則允許正常訪問。
[0056]如圖2所示,在一個實施例中,一種網站安全性的檢測的系統包括監聽模塊110、解析模塊120、查找模塊130和判定模塊140。其中:
[0057]監聽模塊110用于截獲用戶訪問網站的訪問請求,并獲取訪問請求中包含的訪問地址。
[0058]具體的,釣魚網站一般偽裝成正規網站以騙取用戶訪問,進而誘導用戶泄露賬戶信息等。釣魚網站一般會在其他網頁頁面上、彈出窗口上設置超鏈接或者通過搜索引擎搜索并在其搜索頁面上顯示釣魚網站的超鏈接。其中,為達到欺騙用戶的目的,釣魚網站的超鏈接對應著正規網站的名稱或logo (標識)。例如,某釣魚網站A試圖偽裝成***銀行來騙取用戶的賬號密碼,則該釣魚網站的超鏈接一般對應著“***銀行”字樣或是該銀行的logo。
[0059]在一個實例中,用戶一般可通過在瀏覽器地址欄中輸入網址而產生訪問請求或點擊超鏈接而產生訪問請求。由于正規網站的網址都是公開的,故通過直接輸入網址而產生的訪問請求一般不會訪問到釣魚網站。因此,監聽模塊110只截獲用戶通過點擊超鏈接所產生的訪問請求。進一步的,監聽模塊110提取訪問請求中包含的訪問地址,即超連接對應的網頁地址。
[0060]解析模塊120用于對訪問地址對應的頁面進行解析,得到訪問地址對應的頁面的標題標簽。
[0061]釣魚網站為了獲得較大被訪問的可能,一般希望能被搜索引擎命中,并將其鏈接顯示在搜索頁面上。網站的標題標簽即title值,在頁面的Head標簽內被用來定義頁面文檔的標題。搜索引擎的爬蟲一般根據網站的標題標簽(title值)進行爬取,若網站的標題標簽與搜索關鍵字匹配,則為命中記錄。因此,釣魚網站為了獲得較大的命中概率以及迷惑用戶,其標題標簽也一般需與正規網站相同。以上述釣魚網站A為例,假設***銀行的標題標簽為“***銀行”,則該釣魚網站的標題標簽也為“***銀行”。
[0062]具體的,解析模塊120可先根據獲取的訪問地址拉取對應的頁面內容,頁面內容中包含網站的標題標簽。進一步的,解析模塊120通過java、JavaScript、C、C++等語言編寫的腳本解析拉取的頁面內容,獲得訪問地址對應的頁面的標題標簽。
[0063]查找模塊130用于在預設數據庫中查找與標題標簽對應的頁面地址,預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址。
[0064]經過備案的正規網站的標題標簽是唯一的,并與其域名(即頁面地址)一一對應。在預設數據庫中,網站的標題標簽與頁面地址對應存儲。其中,預設數據庫中的頁面地址經過的審查和認證,為預設數據庫中標題標簽所對應的網站的真實地址。以上述***銀行為例,若該銀行的頁面地址為“WWW.bank, com, ”則在預設數據庫中,與標題標簽“***銀行”對應存儲的頁面地址為“www.bank, com”。
[0065]具體的,查找模塊130以解析得到的標題標簽為主鍵在預設數據庫中查詢,得到匹配的記錄,進而獲取與標題標簽對應的頁面地址。例如,解析得到的標題標簽為“***銀行”,則查找模塊130查詢得到的頁面地址為“穩.bank, com”。
[0066]在一個實施例中,預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
[0067]在中國境內,正規注冊的網站都需要通過中國互聯網絡信息中心審核并在工信部IP/域名信息備案系統中進行備案。因此,中國互聯網絡信息中心和工信部IP/域名信息備案系統的數據庫最新、最全面。
[0068]進一步的,預設數據庫與中國互聯網絡信息中心和工信部IP/域名信息備案系統的數據庫實時共享數據,以使預設數據庫中的數據最新、最全面,從而在檢測時能更準確。具體的,可利用包括使用觸發器、閃回、⑶C (Change Data Capture變化數據捕獲)等數據增量獲取的方式實現數據的實時共享。
[0069]判定模塊140用于將查找到的頁面地址與訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。[0070]具體的,判定模塊140將查詢得到的頁面地址與訪問請求中包含的訪問地址進行比對,若兩者一致,則表示用戶訪問請求中包含的訪問地址經過權威機構,如中國互聯網絡信息中心和工信部IP/域名信息備案系統認證,為正規網站的頁面地址,判定模塊140判定用戶所訪問的網站為安全網站。若兩者不一致,則表示用戶訪問請求中包含的訪問地址不是標題標簽所對應的正規網站的頁面地址,有人假冒正規網站,因此判定模塊140判斷用戶所訪問的網站為釣魚網站。
[0071]例如,用戶所訪問的網站的標題標簽為“***銀行”,通過在預設數據庫中查詢,獲得對應的頁面地址為“WWW.bank, com”。若用戶訪問請求中包含的訪問地址為“www.bank,com”,則判定模塊140判定用戶訪問的網站是***銀行的正規網站。若用戶訪問請求中包含的訪問地址不為“WWW.bank, com”,則表示有人冒充***銀行,判定模塊140判定用戶訪問的網站是釣魚網站。
[0072]在一個實施例中,判定模塊140還用于若查找模塊130在預設數據庫中未查找到與標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
[0073]具體的,可能由于預設數據庫的數據更新存在延時,而導致新注冊的網站的標題標簽以及頁面地址未對應存儲于預設數據庫中。此外,還有可能由于用戶訪問的網站是未通過備案的非正規網站,從而導致查找模塊130在預設數據庫中無法查找到對應的頁面地址。網站的安全性無法確定,因此,判定模塊140判定網站的安全性為未知。
[0074]在一個實施例中,上述網站安全性的檢測系統還包括提示模塊(圖中未示出),提示模塊用于根據對用戶所訪問網站的判定結果,顯示提示。
[0075]具體的,提示模塊可在用戶訪問網站之前在瀏覽器窗口中彈出對話框,提示將要訪問網站的安全性。
[0076]在一個實施例中,上述網站安全性的檢測系統還包括攔截模塊(圖中未示出),攔截模塊用于若用戶所訪問的網站被判定為釣魚網站,則屏蔽對網站的訪問請求。
[0077]具體的,對于判斷為釣魚網站的網站,攔截模塊則直接攔截,并向用戶發出警報。而判斷為安全的網站,攔截模塊則允許正常訪問。
[0078]上述網站安全性的檢測方法和系統,由于網站的標題標簽與頁面地址是一一對應的關系,預設數據庫中存儲的頁面地址為網站的真實地址。而釣魚網站為了達到欺騙用戶的目的,其標題標簽一般與正規網站相同,但頁面地址不同。因此,即使某個釣魚網站第一次出現,只需先查找到與標題標簽對應的網頁地址即真實地址,再將該釣魚網站實際的頁面地址與真實地址進行比對,則可檢測出該釣魚網站。檢測不用依賴黑名單,從而大大提高了檢測網站安全性的時效性。
[0079]以上所述實施例僅表達了本發明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進,這些都屬于本發明的保護范圍。因此,本發明專利的保護范圍應以所附權利要求為準。
【權利要求】
1.一種網站安全性的檢測方法,包括以下步驟: 截獲用戶訪問網站的訪問請求,并獲取所述訪問請求中包含的訪問地址; 對所述訪問地址對應的頁面進行解析,得到所述訪問地址對應的頁面的標題標簽; 在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址; 將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。
2.根據權利要求1所述的網站安全性的檢測方法,其特征在于,所述預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
3.根據權利要求1所述的網站安全性的檢測方法,其特征在于,在所述在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先對應存儲有經過認證的網站的標題標簽及對應的頁面地址的步驟之后,所述方法還包括: 若在所述預設數據庫中未查找到與所述標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
4.根據權利要求f3任一項所述的網站安全性的檢測方法,其特征在于,在所述將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全,否則,判定用戶所訪問的網站為釣魚網站的步驟之后,所述方法還包括: 根據對用戶所訪問網站的判定結果,顯示提示。
5.根據權利要求f3任 一項所述的網站安全性的檢測方法,其特征在于,在所述將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全,否則,判定用戶所訪問的網站為釣魚網站的步驟之后,所述方法還包括: 若用戶所訪問的網站被判定為釣魚網站,則屏蔽對所述網站的訪問請求。
6.一種網站安全性的檢測系統,其特征在于,包括: 監聽模塊,用于截獲用戶訪問網站的訪問請求,并獲取所述訪問請求中包含的訪問地址; 解析模塊,用于對所述訪問地址對應的頁面進行解析,得到所述訪問地址對應的頁面的標題標簽; 查找模塊,用于在預設數據庫中查找與所述標題標簽對應的頁面地址,所述預設數據庫中預先存儲有經過認證的網站的標題標簽及對應的頁面地址; 判定模塊,用于將查找到的頁面地址與所述訪問地址進行對比,若兩者一致,則判定用戶所訪問的網站為安全網站,否則,判定用戶所訪問的網站為釣魚網站。
7.根據權利要求6所述的網站安全性的檢測系統,其特征在于,所述預設數據庫與中國互聯網絡信息中心以及工信部IP/域名信息備案系統中的至少一個實時共享數據。
8.根據權利要求6所述的網站安全性的檢測系統,其特征在于,所述判定模塊還用于若所述查找模塊在所述預設數據庫中未查找到與所述標題標簽對應的頁面地址,則判定用戶所訪問網站為未知網站。
9.根據權利要求61任一項所述的網站安全性的檢測系統,其特征在于,還包括: 提示模塊,用于根據對用戶所訪問網站的判定結果,顯示提示。
10.根據權利要求61任一項所述的網站安全性的檢測系統,其特征在于,還包括:攔截模塊,用于若用戶 所訪問的網站被判定為釣魚網站,則屏蔽對所述網站的訪問請求。
【文檔編號】H04L29/06GK103856437SQ201210495224
【公開日】2014年6月11日 申請日期:2012年11月28日 優先權日:2012年11月28日
【發明者】張偉, 陳增群 申請人:深圳市金蝶中間件有限公司