一種提取網頁數據的方法和Web爬蟲系統的制作方法

            文檔序號:6610074閱讀:282來源:國知局
            專利名稱:一種提取網頁數據的方法和Web爬蟲系統的制作方法
            技術領域
            本發(fā)明一般涉及數據分析,更具體的說,涉及利用Web爬蟲(Crawler)從網頁中提取數據的方法與系統。
            背景技術
            隨著計算機和互聯網技術的發(fā)展,搜索引擎已經成為Web客戶機(例如,計算機)的使用者獲取信息的重要方式。一般,用戶通過向搜索引擎提供其感興趣的關鍵字,由搜索引擎根據用戶提供的關鍵字生成頁面,來幫助用戶發(fā)現和訪問新的“統一資源地址”(URL)。為了達成這一目標,搜索引擎通過索引器檢索事先建立好的索引數據結構生成提供給用戶的關鍵字結果頁面,并使用Web爬蟲(或稱之為“蜘蛛”、“機器人”)定期的訪問通過URL定位的網頁資源,提取出其中的文本信息和其他相關網頁屬性,并存儲該信息以使得索引器可以處理被檢索的數據。前述的索引器讀取這些文檔,并根據每個文檔所包含的這些關鍵字和該文檔的其他屬性來創(chuàng)建有優(yōu)先級的索引。不同的搜索引擎通常使用專用算法來建立索引,以便于查詢返回有意義的結果。
            因此,Web爬蟲對于搜索引擎的操作而已至關重要。但是,現有的Web爬蟲僅能提取出Web頁面中的純文字信息,這種技術限制導致了很多搜索引擎優(yōu)化(SEO)技巧的產生,例如在網頁中嵌入瀏覽者不可見的文本,或者根據爬蟲提供的身份標識(UserAgent),進行特殊處理,典型的,當對方網站發(fā)現是搜索引擎爬蟲時,提供一種頁面數據,發(fā)現是一般的瀏覽器訪問時,提供一套頁面;此外,由于將網頁整體作為一整體文本文件,在處理過程中丟失了網頁元素位置信息所隱含的語義信息,導致在搜索過程中很難提取出有語義信息的數據項。以一個工作相關的垂直搜索網站,地點是其搜索內容中重要的維度,而傳統的爬蟲只能將網頁作為一個文本文件,導致很難將工作地點的信息與其他網頁中出現的表示地點的名詞用普遍適用的方法分離;額外的,隨著Web技術的發(fā)展,以AJAX(Asynchronous JavaScript+XML)為代表的腳本動態(tài)網頁技術得到了越來越多的廣泛的應用。AJAX技術通過JavaScript腳本在Web客戶端的Web頁面處理部件(一般稱之為“瀏覽器”)中執(zhí)行,在腳本中通過操作“文檔對象模型”DOM以實現動態(tài)修改網頁內容的效果?,F有的爬蟲無法獲取由腳本動態(tài)生成的網頁內容。
            由此可見,提供一種通用的支持AJAX技術的提取網頁數據的方法和Web爬蟲系統對于改進搜索引擎的用戶體驗,提高搜索引擎的查全率有幫助。

            發(fā)明內容
            本發(fā)明的目的,在于為搜索引擎系統或其他由Web頁面提取需求的系統,提供通用的數據提取方法,用于解決現有Web爬蟲系統無法抓取以AJAX為代表的使用腳本生成網頁內容的網頁。同時,本發(fā)明公開的方法和系統還可以用于數據標引,這項技術主要應用在為某些特定Web內容提供的搜索引擎,例如用于檢索工作職位信息的搜索引擎等。
            為提供對本發(fā)明的一些方面的基本理解,下文呈現了本發(fā)明的簡化的描述。此描述不是本發(fā)明的廣泛的縱覽。它并不意在識別本發(fā)明的關鍵/緊要的部分或勾畫出本發(fā)明的范圍。它唯一的目的是用簡化的形式來呈現本發(fā)明的一些概念,作為以后提出的更加詳細的說明的序言。
            本發(fā)明一般涉及數據分析,更具體的說,涉及用于可處理DOM模型和腳本的Web爬蟲來從聯網系統提取數據的方法和系統。
            本發(fā)明所述其特征在于,包括兩大部件,其中第一部件,用于向第二部件提供數據提取任務,并接收第二部件的數據提取任務的執(zhí)行結果;第二部件,用于與網頁服務器通信,獲取網頁數據,并通過操作DOM模型提取數據,并對提取到的數據項進行描述,將所屬的提取到的數據與對其的描述發(fā)送給第一部件。
            本發(fā)明中的第二部件包括用于解析網頁文件的解析器101、用于構造網頁DOM(文檔對象模型)的構造器102、用于執(zhí)行網頁中包含腳本的執(zhí)行裝置103、用于執(zhí)行數據提取代碼的執(zhí)行裝置104,以及用于存儲提取出的數據的裝置105;本發(fā)明中的第二部件可以是瀏覽器。
            本發(fā)明所述的數據提取方法還包括通過特定的URL(統一資源地址,下同)發(fā)現前述URL適用的數據提取代碼。在本發(fā)明的一個實施例中,前述的數據提取代碼在網頁源文件中指明;在本發(fā)明的另一個實施例中,前述數據提取代碼通過公開其適用于何種類型的URL的正則表達式,通過前述的正則表達式的匹配結果確定前述URL適用的數據提取代碼。
            本發(fā)明所述的Web爬蟲系統包括爬行任務控制裝置201、數據存儲裝置202、URL處理裝置203、采用本發(fā)明所述方法的網頁數據提取裝置204,以及為前述提取裝置204與爬行任務控制裝置201之間提供數據交換服務的其他裝置205;
            在本發(fā)明的一個實施例中,爬行任務控制裝置201向網頁數據提取裝置204發(fā)送爬行任務,爬行任務中,一般包括任務的目標URL 251、相對目標URL的引用URL(ReferURL)202,訪問目標URL需要用到的Post數據203,數據存儲裝置中已知的已被提取過的網頁數據的Hash值204、數據存儲裝置中已知的已被提取過的網頁數據的獲取時間205。其中,屬性203、204、205,可以為空,即不包括在爬行任務中。
            網頁數據提取裝置收到爬行任務后,通過任務指明的參數,獲取對應網頁的HTML代碼,并用本發(fā)明所述的數據提取方法提取數據;當提取到的數據與爬行任務中聲明的數據存儲裝置中儲的數據不符時,將新的數據反饋給爬行任務控制裝置201進行后續(xù)處理。前述的數據包括普通文本數據和通過本發(fā)明所述的數據提取方法發(fā)現的新的網絡URL地址。
            本發(fā)明的有益效果在于,通過應用本發(fā)明所描述的方法和系統,可以有效地解決Web爬蟲系統無法提取腳本動態(tài)生成的網頁數據的問題;可以為垂直搜索引擎提供通用的數據標引框架,有效的降低垂直搜索引擎開發(fā)定向爬蟲的研發(fā)成本。


            為了實現前述目標和有關的目標,這里連同下文和附圖來描述本發(fā)明的某些說明性的方面。但是,這些方面只表現出可以使用本發(fā)明的原理的各種方法的一些方法,并且,本發(fā)明意在包括所有這類方面及其相等物。
            圖1A為根據本發(fā)明的某個方面的Web爬蟲系統的一個實施例圖1B為根據本發(fā)明的某個方面的應用了消息中間件的Web爬蟲系統的一個實施例圖2A為根據本發(fā)明的某個方面的數據分析系統的客戶機的模塊原理2B為根據本發(fā)明的某個方面的數據分析系統的基于瀏覽器的客戶機一個實施例圖2C為根據本發(fā)明的某個方面的數據分析系統的一個實施例圖2D為根據本發(fā)明的某個方面的數據分析系統的提供了腳本同步功能的一個實施例圖2E為適用于本發(fā)明所述方法的一種網頁的代碼示例圖3A為根據本發(fā)明的某個方面在客戶端提取網頁數據的一種基于XPATH的流程的說明圖3B為根據本發(fā)明的某個方面在客戶端提取網頁數據的一種流程的說明圖4A是根據本發(fā)明的某個方面實現的一種Web爬蟲系統的處理流程的說明圖4B是根據本發(fā)明的某個方面實現的一種Web爬蟲系統的含有子任務的處理流程的說明具體實施方式
            下面根據附圖和實施例來描述本發(fā)明。在下文中,處于解釋的目的陳述了眾多特殊的細節(jié),以提供對本發(fā)明的徹底的理解。但是,本發(fā)明可以在沒有這些特殊細節(jié)的條件下加以實踐。在其他實施例中,用框圖形式表現了公知的結構和設備以促進對本發(fā)明的理解。
            在本申請中,術語“部件”意在指計算機相關的實體一硬件、硬件和軟件的組合、軟件或執(zhí)行中的軟件。例如,部件包括但不限于在處理器上運行的進程、處理器、對象、可執(zhí)行項、執(zhí)行線程、程序和/或計算機。例如,在服務器上運行的程序和該服務器都可以是計算機部件。一個或多個部件可能駐留在執(zhí)行進程和/或線程內,并且,部件可能定位在一臺計算機上并/或分布在兩臺或更多臺計算機之間。
            本發(fā)明提供了從網頁中提取數據的方法以及相應的使用本方法的Web爬蟲系統,本發(fā)明所述的方法和系統在相關專業(yè)技術領域,往往也被稱作“數據標引”。傳統的Web爬蟲所具有的某些缺點通過本發(fā)明得到了緩和。
            在圖1A中,展示了根據本發(fā)明的某個方面的Web爬蟲系統100的實施例。在本發(fā)明的這個實施例中,數據分析系統100由編號從1到N的客戶機102-105(其中,N表示1到無窮大的任何數字)通訊系統108,爬蟲控制服務器110、搜索服務器111和網頁服務器112組成??蛻魴C102-105為供爬蟲控制服務器調度的一組“分布式資源”。它們一般用于執(zhí)行爬蟲控制服務器派發(fā)的任務,發(fā)現新的URL、報告網頁的更改、以及根據任務提取出的網頁數據或其他類似數據,并將所述的數據通過通信系統108提供給爬蟲控制服務器110。通信系統108可以是互聯網或局域網(內部網絡)或其他類似物構成,它提供了一種訪問方法。它也允許客戶機102-105與爬蟲控制服務器110,和/或客戶機102-105之間通信,用于搜集提取網頁信息。本質上,Web爬蟲的功能被分布在爬蟲控制服務器110以及客戶機102-105之中。爬蟲控制服務器110利用客戶機來從網頁服務器112那里獲得信息,客戶機102根據從爬蟲控制服務器獲取到的任務對網頁進行加工處理,比將處理后的結果反饋給爬蟲控制器110,以便于將獲得到的信息提供給搜索服務器111進行進一步處理。本發(fā)明提供了搜索引擎可以從中利用數據的更富有語義信息的數據集。
            在圖1B中,展示了根據本發(fā)明的某個方面的Web爬蟲系統100的實施例的某種改進形態(tài)。在本發(fā)明的這個實施例中,通信系統108由消息中間件服務器120以及互聯網或局域網(內部網絡)或其他類似物構成??蛻魴C102-105之間以及客戶機102-105與爬蟲控制服務器110之間,通過消息中間件服務器120通信。在更進一步的具體實施例中,消息中間件服務器為支持XMPP(Extensible Messaging and Presence Protocol)協議的即時通信服務器;在本領域有經驗的工程師應該很容易想到用采取其他協議的服務器替換XMPP消息中間件服務器,如采用JMS(Java Message Service)規(guī)范的服務器,騰訊公司提供的QQ服務器,微軟公司提供的MSN服務器等。
            在本發(fā)明的一個實施例中,客戶機102-105與爬蟲控制器110之間采用urlencode過的JSON(JavaScript Object Notation)字符串作為消息正文,通過XMPP協議傳遞。包括爬行任務、爬行任務的反饋、數據提取腳本的同步等。
            在圖2A中,展示了根據本發(fā)明的某個方面的數據分析系統200的實施例。在本發(fā)明的這個實施例中,數據分析系統200由爬蟲控制服務器210、客戶機202、網頁服務器220構成。其中,客戶機202代表一臺或多臺執(zhí)行相似任務的計算機或計算機部件,客戶機202由網絡訪問部件202.0、HTML分析部件202.1、DOM(文檔對象模型,簡稱DOM,下同)構造部件202.2、腳本執(zhí)行部件202.3和任務執(zhí)行部件202.4構成,其中,從網頁服務器220獲取的網頁腳本可以通過腳本執(zhí)行部件202.3執(zhí)行,訪問并/或修改由DOM構造部件202.2構造的DOM。在進一步的實施例中,客戶機202還包括頁面布局引擎202.5、顯示渲染引擎202.6,在圖2B所示的實施例中,有此種實施例的進一步說明??蛻魴C202獲得數據提取任務后,啟動數據提取流程??蛻魴C202獲得數據提取任務的方式有多種,其中包括客戶機202主動向爬蟲控制器210查詢、申請新任務,爬蟲控制器210主動向客戶機202派發(fā)任務,根據某種規(guī)則自動在客戶機202上生成新任務。其中所述的根據某種規(guī)則自動在客戶機202生成新的任務多用于一個邏輯的數據項(數據單元)其數據分布在多個網頁,在圖2C所示的實施例中有此種情況的進一步說明??蛻魴C202獲得數據提取任務后,向所屬任務中指明的網頁服務器220發(fā)出請求所屬任務中指明網頁資源的HTTP請求,收到所屬的網頁服務器220返回的數據后,進入數據提取部分??蛻魴C202通過網絡訪問部件202.0收到網頁服務器220返回的數據后,通過HTML分析部件202.1將數據中的HTML標記識別出來,并通過與DOM構造部件202.2互動,構造與服務器220返回數據向對應的DOM模型(在開源瀏覽器Firefox中,有htmlparser與dom構造器如何互動產生DOM模型的源碼,在此不做贅述),并通過腳本執(zhí)行部件202.3執(zhí)行服務器220返回數據中嵌入和/或引用的腳本,用以獲得被腳本修改過的DOM模型,根據任務信息確定并獲取相應的數據提取代碼并通過任務執(zhí)行部件202.4執(zhí)行,已完成數據提取。
            前述的數據提取任務一般包括以下內容要訪問的目標URL、該目標URL的引用URL(ReferURL,定義在HTTP規(guī)范中),更進一步的還可以包括要提交到目標URL的Post數據、訪問目標URL的HTTP方法(主要有GET、POST等)、訪問目標URL需要提供的Cookie(一種用于標示用戶身份的標示,一般為純文本,定義在HTTP規(guī)范中)和/或該任務相應的數據提取代碼或能夠唯一標識對應代碼的數據(如代碼的MD5值等)在一個具體實施例中,任務執(zhí)行部件202.4與腳本執(zhí)行部件202.3為同一部件,客戶機202通過稱之為“腳本注入”的技術將任務相應的數據提取代碼(一般為JavaScript)交由腳本執(zhí)行部件202.3執(zhí)行。在公開技術Firefox插件GreaseMonkey中,對此項技術進行了實現,在此不做贅述。
            在一個具體實施例中,前述的任務代碼執(zhí)行部件202.4與腳本執(zhí)行部件202.3不是同一計算機組件,執(zhí)行部件202.4為可以訪問文檔對象模型(DOM)的不同于網頁腳本執(zhí)行引擎的其他組件,例如Python等。
            在一個具體實施例中,任務執(zhí)行部件還包括用于存儲提取出的網頁數據的存儲部件202.4.1和/或用于向爬蟲控制器210反饋數據的部件202.4.2。數據提取腳本在執(zhí)行過程中,將抽取到的數據存儲到數據存儲部件202.4.1中,并通過反饋數據部件202.4.2向爬蟲控制器反饋任務執(zhí)行結果。在進一步的實施例中,反饋數據部件202.4.2通過消息中間件服務器的客戶端反饋數據,并通過數據提取腳本激發(fā);在進一步的實施例中,反饋數據部件202.4.2當數據提取腳本執(zhí)行完畢后,將數據存儲部件202.4.1中存儲的數據和/或數據提取腳本執(zhí)行的結果反饋給派發(fā)任務的爬蟲控制器。
            在一個具體實施例中,客戶202獲得的數據提取任務中包含當前服務器前次記錄的任務中指明的URL上包含的數據的記錄時間,根據HTTP協議的規(guī)范,客戶機可以構造出特殊的HTTP請求,以減小網絡開銷。當對方服務器反饋數據未更新的HTTP響應時,向發(fā)送前述數據提取任務爬蟲控制器210報告數據未更新,否則,則將從網頁中提取到的數據(包括新發(fā)現的URL/爬行任務)反饋給爬蟲控制器210;在進一步的實施例中,客戶機202獲得的數據提取任務中當前服務器前次記錄的任務中指明的URL上包含的數據的某種唯一標識(如MD5等),客戶機202將其從網頁中提取的數據進行計算,比較與服務器端的數據是否相同,如相同,則反饋給爬蟲控制器210數據未更新;如不同,則將從網頁中提取到的數據(包括新發(fā)現的URL/爬行任務)反饋給爬蟲控制器210。
            在一個具體實施例中,爬蟲控制器收到了客戶機202反饋的數據,將其中從網頁中提取的文本或圖像數據存儲在存儲部件上(一般為計算機外存,如硬盤),以供搜索引擎構建索引,將其中的URL信息放入待抓取URL列表中。當URL信息不在待抓取列表中時,則將其加入;當URL信息以存在與待抓取列表中時,則提升其評分等級,以使得其被爬蟲控制器更頻繁的派發(fā)以獲取更新。此處提供該實施例,僅僅描述了一種可行的如何處理新發(fā)現的URL的方法,任何公知的基于URL的網頁數據獲取調度方法都被應用于本發(fā)明。
            在圖2B中,展示了根據本發(fā)明的某個方面的數據分析系統200的實施例的某種改進形態(tài)。在本發(fā)明的這個實施例中,客戶機202由網絡訪問部件202.0、HTML分析部件202.1、DOM(文檔對象模型,簡稱DOM,下同)構造部件202.2、腳本執(zhí)行部件202.3、任務執(zhí)行部件202.4、頁面布局引擎202.5和顯示渲染引擎202.6構成,其中,從網頁服務器220獲取的網頁腳本可以通過腳本執(zhí)行部件202.3執(zhí)行,訪問并/或修改由DOM構造部件202.2構造的DOM。在技術實現上,頁面布局引擎202.5于顯示渲染引擎202.6可以是同一部件,本技術領域中有經驗的工程師很容易想到通過移除顯示渲染引擎或更進一步的移除或簡化頁面布局部件202.5以達到加快頁面分析速度的目的。在本發(fā)明的一個實施例中,顯示渲染引擎為空服務組件,即雖然提供了相應的顯示渲染接口,但并不實際在客戶機的顯示設備(如果存在)上繪制圖像。
            相關領域的專業(yè)技術人員將包括網絡訪問部件202.0、HTML分析部件202.1、DOM構造部件202.2、腳本執(zhí)行部件202.3、頁面布局引擎202.5和顯示渲染引擎202.6的復合裝置稱為“瀏覽器渲染引擎”,例如Mozilla.org的Gecko引擎、微軟公司的MSHTML引擎、蘋果公司的WebKit引擎等。顯而易見的,本發(fā)明的某個具體實施例可以是任務執(zhí)行部件202.4與“瀏覽器渲染引擎”或“瀏覽器”復合(下文中,為便于說明,如不做特別說明使用術語“瀏覽器”用于不做區(qū)別的代表“瀏覽器渲染引擎”或“瀏覽器”。本發(fā)明的具體實施例中,采用日常人們?yōu)g覽網頁的“瀏覽器”與僅采用“瀏覽器渲染引擎”,對實施本發(fā)明所示出的方法與系統沒有能夠產生新穎性和創(chuàng)造性的區(qū)別),以完成數據抽取工作并與爬蟲控制器210等其他部件配合構成Web爬蟲系統。
            在圖2C中,展示了根據本發(fā)明的某個方面的數據分析系統200的實施例的某種改進形態(tài)。在本發(fā)明的這個實施例中,任務執(zhí)行部件202.4提供接口,執(zhí)行任務指明的數據提取代碼,數據提取代碼將執(zhí)行過程中需要進一步爬行的網頁URL連同要訪問前述URL所必須的其他附屬數據存儲在數據存儲部件202.4.1,任務執(zhí)行部件發(fā)現前述數據提取代碼產生了新的存儲在數據存儲部件202.4.1的新任務,則按照某種順序執(zhí)行新產生的子任務,在執(zhí)行子任務產生的數據與執(zhí)行前述數據提取代碼產生的數據混合,共同發(fā)送到爬蟲控制服務器210。
            在本發(fā)明的一個具體實施例中,數據存儲部件202.4.1通過鍵、值對存儲數據,其中,值一般用于記錄從網頁中提取的數據;鍵一般是用于描述值特性的文本值。
            在圖2D中,展示了根據本發(fā)明的某個方面的數據分析系統200的實施例的某種改進形態(tài)。在本發(fā)明的這個實施例中,客戶機202還包括腳本存儲部件202.7,該部件中存儲了爬蟲控制器提供的全部或部分適用的數據提取腳本,客戶機202與爬蟲控制器210或其他存儲了數據提取腳本的計算機部件同步數據提取腳本。任務執(zhí)行部件202.4通過客戶端202獲取到任務的目標URL,確定目標URL適用于何種數據提取腳本。腳本確定后,送入任務執(zhí)行部件202.4執(zhí)行,后續(xù)處理過程不再贅述。
            在圖2E中,展示了根據本發(fā)明的某個方面的數據分析系統的實施例。在本發(fā)明的這個實施例中,在需要進行數據提取處理的網頁中,含有如何獲取數據提取代碼的指示,在這個實施例中,使用頭元素節(jié)中Meta子元素用于描述如何獲取數據提取代碼,在本實施例中是通過給出數據提取代碼的URL實現的。
            在圖3A中,展示了根據本發(fā)明的某個方面的數據分析系統的實施例。在本發(fā)明的這個實施例中,在前述實施例中描述DOM構造部件202.2構造的DOM模型支持XPATH(XML Path Language)規(guī)范的情況下,采用XPATH作為從網頁DOM上提取數據的工具。當待提取數據的網頁的DOM模型構造好后,使用XPATH定位網頁上的元素,提取出相應的文本信息或進行其他處理。以圖3A為例,XPATH表達式//h1[@id=″idx_news″]/a/font,代表在id為idx_news的h1元素下的a元素下的font元素,可以通過訪問前述font元素的innerText、contentTex t或其他DOM屬性、子元素取得其內部的文本,在本例中為“測試新聞標題”。XPATH為W3C定義的操作DOM元素的基本方法之一,在此不做贅述。
            在本發(fā)明的一個具體實施例中,通過將生成特定網頁元素及其子元素的HTML頁面源碼提取數據??梢酝ㄟ^前述的XPATH方法或通過DOM規(guī)范中規(guī)定的方法獲得要生成HTML頁面源碼的網頁元素,通過對其DOM子元素及其屬性的遍歷,生成與前述元素等價的HTML代碼,即瀏覽器可以通過所述的代碼重新生成屬性、子元素一樣的DOM元素。將網頁元素轉換為HTML的方法在開源的Firefox插件view_source_chart中有具體實現,在此不再贅述??梢酝ㄟ^對生成的HTML代碼進行字符串匹配提取文本信息。在一個實施例中,字符串匹配的方法是順序或倒序查找;在一個實施例中,字符串匹配的方法是正則表達式。顯然的,當前述用于生成HTML頁面源碼的網頁元素為網頁根元素時,本實施例所述的數據提取方法將退化為直接匹配網頁源碼。
            在圖3B中,展示了根據本發(fā)明的某個方面的數據分析系統的實施例。在本發(fā)明的這個實施例中,先通過前述由實施例中示出的方法將網頁元素A轉化為相應的源碼,通過在源碼中進行字符串匹配,得到網頁元素B對應的源碼,通過網頁元素B,獲得確定網頁元素C,訪問網頁元素C的DOM屬性,完成數據提取。本實施例一般用于自根元素的XPATH表達式經常變化,無法準確獲取相應的頁面元素。
            鑒于以上所示和所描述的這些示范系統,將參考圖4A-4B中的流程圖來更好的理解可以根據本發(fā)明來加以實施的方法。處于簡單解釋的目的,這些方法被表現和描述為一系列方框,但需要注意,本發(fā)明并沒有受到這些方框順序的限制,因為根據本發(fā)明,一些方框可能按與這里所示和所描述的順序不同的順序發(fā)生并/或與其他方框并發(fā)的發(fā)生。而且,可能并不是要求所有被展示的方框根據本發(fā)明來實施這些方法。
            參考圖4A,展示了根據本發(fā)明的某個方面的數據處理分析系統的方法400的流程圖。401客戶端從爬蟲控制器獲得任務,任務中一般包括目標URL、目標URL的引用URL、Post數據等,客戶端根據任務的描述的目標URL,402向網頁服務器發(fā)送HTTP請求,所述的請求中可以包含If-Not-Modified信息,用于指明服務器端已有的數據時間。網頁服務器將前述請求的Web頁面返回給客戶端,或返回HTTP協議中定義的其他狀態(tài)??蛻舳丝赡軣o法與網頁服務器建立連接,在此種情況下,應向爬蟲控制器報告錯誤,目標服務器器不可達。
            當403網頁服務器返回網頁數據給客戶端,客戶端根據任務信息,確定要執(zhí)行的腳本,在一個實施例中,通過匹配腳本附帶的URL模式信息與目前URL進行正則式匹配確定該URL應適用的腳本。通過前述的“腳本注入”技術,404將數據提取腳本注入網頁,405執(zhí)行數據提取腳本進行數據提取。提取的數據包括附加了額外描述性屬性的文本信息和前述網頁中引用的URL。前述的任務中可能包含服務器端已知的數據信息或數據信息的特征值(如MD5),客戶端將新提取的數據與服務器端已知的數據信息或數據信息的特征值進行比對406。當數據或特征值不一致時,407將新提取的數據反饋回服務器端;當數據或特征值一致時,通知服務器端數據無變化。
            參考圖4B,展示了根據本發(fā)明的某個方面的數據處理分析系統的方法450的流程圖。451客戶端從爬蟲控制器獲得任務,任務中一般包括目標URL、目標URL的引用URL、Post數據等,客戶端根據任務的描述的目標URL,452向網頁服務器發(fā)送HTTP請求,所述的請求中可以包含If-Not-Modified信息,用于指明服務器端已有的數據時間。453網頁服務器將前述請求的Web頁面返回給客戶端,或返回HTTP協議中定義的其他狀態(tài)??蛻舳丝赡軣o法與網頁服務器建立連接,在此種情況下,應向爬蟲控制器報告錯誤,目標服務器器不可達。
            當網頁服務器返回網頁數據給客戶端,客戶端根據任務信息,確定要執(zhí)行的腳本,在一個實施例中,通過匹配腳本附帶的URL模式信息與目前URL進行正則式匹配確定該URL應適用的腳本。通過前述的“腳本注入”技術,454將數據提取腳本注入網頁,455執(zhí)行數據提取腳本進行數據提取。提取的數據包括附加了額外描述性屬性的文本信息和前述網頁中引用的URL。執(zhí)行數據提取腳本后,459檢查數據提取腳本是否產生了新的數據提取任務,如果有,則458執(zhí)行子任務進行數據提取。前述的任務中可能包含服務器端已知的數據信息或數據信息的特征值(如MD5),客戶端將新提取的數據與服務器端已知的數據信息或數據信息的特征值進行比對456。當數據或特征值不一致時,457將新提取的數據反饋回服務器端;當數據或特征值一致時,通知服務器端數據無變化。
            在本發(fā)明的一個實施例中,在爬蟲控制器中,存儲一些種子URL,客戶端通過提取前述種子URL頁面上引用的新的URL,并將新發(fā)現的URL提交回爬蟲控制器。服務器端識別客戶端上報的URL,將新發(fā)現的URL放入待爬行的URL列表中。在一個實施例中,客戶端主動向爬蟲控制器發(fā)送請求,由爬蟲控制器從待爬行URL列表中取出URL構成爬行任務反饋給客戶端。
            在本發(fā)明的一個具體實施例中,爬蟲控制器可以通過將同一URL的數據采集工作復制為多個任務,交由多個數據提取客戶端進行,通過比對數據提取客戶端返回的數據,從而避免惡意的客戶端提供虛假數據。
            在本發(fā)明的一個具體實施例中,客戶端還包括用于輔助編寫數據提取腳本的開發(fā)環(huán)境。通過前述的“腳本注入”的方法,檢測在網頁上的鼠標動作,當發(fā)生單擊事件后,取得點擊事件所在的網頁元素,并根據前述的元素,生成能夠獲取到前述元素的XPATH表達式。開發(fā)者可以通過某種交換部件修改XPATH表達式,新的表達式的選取效果將實時的反應的網頁上。前述的開發(fā)環(huán)境還提供通過XPATH和該表達式能夠選取的元素類型自動生成數據提取代碼。
            以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出對于本發(fā)明技術領域的普通技術人員來說,在不脫離本發(fā)明原來的前提下,可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。
            權利要求
            1.一種網頁數據的提取方法,其特征在于第一部件,用于向第二部件提供數據提取任務,并接收第二部件的數據提取任務的執(zhí)行結果;第二部件,用于與網頁服務器通信,獲取網頁數據,并通過操作DOM模型提取數據,并對提取到的數據項進行描述,將所屬的提取到的數據與對其的描述發(fā)送給第一部件。
            2.根據權利要求1所述的網頁數據的提取方法,其特征在于第二部件中,包括用于解析網頁的解析器、用于構造DOM模型的DOM構造器、用于執(zhí)行網頁中嵌入或引用腳本的腳本解釋器以及用于從DOM模型提取數據的數據提取裝置,其中通過腳本解釋器解釋的網頁腳本可以訪問并修改由DOM構造器構造的網頁DOM模型。
            3.根據權利要求2所述的網頁數據的提取方法,其特征在于第二部件中,包括用于計算網頁各元素大小、位置的網頁布局部件。
            4.根據權利要求2所述的網頁數據的提取方法,其特征在于第二部件中,所述的從DOM模型提取數據的數據提取裝置,將用于提取數據的網頁腳本交由所述的腳本解釋器執(zhí)行。
            5.根據權利要求4所述的網頁數據的提取方法,其特征在于用于進行數據提取的網頁腳本通過所述的進行數據提取網頁指定。
            6.根據權利要求4所述的網頁數據的提取方法,其特征在于存在通過網頁URL確定數據提取腳本的部件或服務,用于進行數據提取的網頁腳本是通過將所述的進行數據提取網頁的URL傳遞給所述的用于確定數據提取腳本部件或服務確定的。
            7.根據權利要求4所述的網頁數據的提取方法,其特征在于所述的用于數據提取的網頁腳本通過XPATH定位網頁元素,通過訪問所述的網頁元素的屬性或子元素節(jié)點獲取網頁數據。
            8.根據權利要求4所述的網頁數據的提取方法,其特征在于所述的用于數據提取的網頁腳本已經取得的網頁元素,生成相對應的網頁代碼,通過正則表達式確定特定字符串的位置,并根據前述特定字符串的位置定位網頁元素。
            9.根據權利要求4所述的網頁數據的提取方法,其特征在于所述的用于數據提取的網頁腳本使用權利要求7與權利要求8描述的數據提取方法組合使用確定待提取數據的網頁元素。
            10.根據權利要求2所述的網頁數據的提取方法,其特征在于第二部件中,包括用于存儲從網頁中提取到的數據的數據存儲部件,所述的數據存儲部件中存儲的從網頁中提取的數據可以增加一個或多個用于標明其內容類型的文本;數據提取過程結束后,第二部件將提取到的數據進行處理,返回第一部件。
            11.一種Web爬蟲系統,其特征在于由向爬蟲派發(fā)Web爬行任務的爬蟲控制器,以及對Web進行數據提取的Web爬蟲構成;所述的Web爬蟲由HTML解析器、DOM模型構造器、腳本解釋器以及數據提取裝置組成;所述的爬蟲完成由爬蟲控制器提供的數據提取任務后,將任務執(zhí)行的結果返回爬蟲控制器或其他由爬蟲控制器指定的通信對方;所述的爬蟲控制器與爬蟲之間通過網絡進行數據的交換。
            12.根據權利要求11所述的WEB爬蟲系統,其特征在于所述的爬蟲與爬蟲控制器采用消息中間件,通過網絡交換數據。
            全文摘要
            本發(fā)明涉及一種利用Web爬蟲(Crawler)從網頁中提取數據的方法與系統,更進一步的,本發(fā)明示出了一種利用瀏覽器頁面布局引擎從網頁中提取數據并被搜索引擎使用的方法與系統,包括第一部件和第二部件;第一部件,用于向第二部件提供數據提取任務,并接收第二部件的數據提取任務的執(zhí)行結果;第二部件,用于與網頁服務器通信,獲取網頁數據,并通過操作DOM模型提取數據,并對提取到的數據項進行描述,將所屬的提取到的數據與對其的描述發(fā)送給第一部件。通過應用本發(fā)明所描述的方法和系統,可以有效地解決Web爬蟲系統無法提取腳本動態(tài)生成的網頁數據的問題;可以為垂直搜索引擎提供通用的數據標引框架,有效的降低垂直搜索引擎開發(fā)定向爬蟲的研發(fā)成本。
            文檔編號G06F17/30GK101089856SQ20071011932
            公開日2007年12月19日 申請日期2007年7月20日 優(yōu)先權日2007年7月20日
            發(fā)明者李沫南 申請人:李沫南
            網友詢問留言 已有0條留言
            • 還沒有人留言評論。精彩留言會獲得點贊!
            1
            婷婷六月激情在线综合激情,亚洲国产大片,久久中文字幕综合婷婷,精品久久久久久中文字幕,亚洲一区二区三区高清不卡,99国产精品热久久久久久夜夜嗨 ,欧美日韩亚洲综合在线一区二区,99国产精品电影,伊人精品线视天天综合,精品伊人久久久大香线蕉欧美
            亚洲精品1区 国产成人一级 91精品国产欧美一区二区 亚洲精品乱码久久久久久下载 国产精品久久久久久久伊一 九色国产 国产精品九九视频 伊人久久成人爱综合网 欧美日韩亚洲区久久综合 欧美日本一道免费一区三区 夜夜爽一区二区三区精品 欧美日韩高清一区二区三区 国产成人av在线 国产精品对白交换绿帽视频 国产视频亚洲 国产在线欧美精品 国产精品综合网 国产日韩精品欧美一区色 国产日韩精品欧美一区喷 欧美日韩在线观看区一二 国产区精品 欧美视频日韩视频 中文字幕天天躁日日躁狠狠躁97 视频一二三区 欧美高清在线精品一区二区不卡 国产精品揄拍一区二区久久 99久久综合狠狠综合久久aⅴ 亚洲乱码视频在线观看 日韩在线第二页 亚洲精品无码专区在线播放 成人亚洲网站www在线观看 欧美三级一区二区 99久久精品免费看国产高清 91麻豆国产在线观看 最新日韩欧美不卡一二三区 成人在线观看不卡 日韩国产在线 在线亚洲精品 亚洲午夜久久久久中文字幕 国产精品成人久久久久久久 精品国产一区二区在线观看 欧美精品国产一区二区三区 中文在线播放 亚洲第一页在线视频 国产午夜精品福利久久 九色国产 精品国产九九 国产永久视频 久久精品人人做人人综合试看 国产一区二区三区免费观看 亚洲精品国产电影 9999热视频 国产精品资源在线 麻豆久久婷婷国产综合五月 国产精品免费一级在线观看 亚洲国产一区二区三区青草影视 中文在线播放 国产成人综合在线 国产在线观看色 国产亚洲三级 国产片一区二区三区 久久99精品久久久久久牛牛影视 亚洲欧美日韩国产 四虎永久免费网站 国产一毛片 国产精品视频在 九九热在线精品 99精品福利视频 色婷婷色99国产综合精品 97成人精品视频在线播放 精品久久久久久中文字幕 亚洲欧美一区二区三区孕妇 亚洲欧美成人网 日韩高清在线二区 国产尤物在线观看 在线不卡一区二区 91网站在线看 韩国精品福利一区二区 欧美日韩国产成人精品 99热精品久久 国产精品免费视频一区 高清视频一区 精品九九久久 欧美日韩在线观看免费 91欧美激情一区二区三区成人 99福利视频 亚洲国产精品91 久热国产在线 精品久久久久久中文字幕女 国产精品久久久久久久久99热 成人自拍视频网 国产精品视频久久久久久 久久影院国产 国产玖玖在线观看 99精品在线免费 亚洲欧美一区二区三区导航 久久久久久久综合 国产欧美日韩精品高清二区综合区 国产精品视频自拍 亚洲一级片免费 久久久久久九九 国产欧美自拍视频 视频一区二区在线观看 欧美日韩一区二区三区久久 中文在线亚洲 伊人热人久久中文字幕 日韩欧美亚洲国产一区二区三区 欧美亚洲国产成人高清在线 欧美日韩国产码高清综合人成 国产性大片免费播放网站 亚洲午夜综合网 91精品久久一区二区三区 国产无套在线播放 国产精品视频网站 国产成人亚洲精品老王 91在线网站 国产视频97 欧美黑人欧美精品刺激 国产一区二区三区免费在线视频 久久久国产精品免费看 99re6久精品国产首页 久久精品91 国产成人一级 国产成人精品曰本亚洲 日本福利在线观看 伊人成综合网 久久综合一本 国产综合久久久久久 久久精品成人免费看 久久福利 91精品国产91久久久久久麻豆 亚洲精品成人在线 亚洲伊人久久精品 欧美日本二区 国产永久视频 国产一区二 一区二区福利 国产一毛片 亚洲精品1区 毛片一区二区三区 伊人久久大香线蕉综合影 国产欧美在线观看一区 亚洲国产欧洲综合997久久 国产一区二区免费视频 国产91精品对白露脸全集观看 久久亚洲国产伦理 欧美成人伊人久久综合网 亚洲性久久久影院 久久99国产精一区二区三区! 91精品国产欧美一区二区 欧美日韩亚洲区久久综合 日韩精品一二三区 久久久夜色精品国产噜噜 国产在线精品福利91香蕉 久久久久久久亚洲精品 97se色综合一区二区二区 91国语精品自产拍在线观看性色 91久久国产综合精品女同我 日韩中文字幕a 国产成人亚洲日本精品 久久国产精品-国产精品 久久国产经典视频 久久国产精品伦理 亚洲第一页在线视频 国产精品久久久久三级 日韩毛片网 久久免费高清视频 麻豆国产在线观看一区二区 91麻豆国产福利在线观看 国产成人精品男人的天堂538 一区二区三区中文字幕 免费在线视频一区 欧美日韩国产成人精品 国产综合网站 国产资源免费观看 亚洲精品亚洲人成在线播放 精品久久久久久中文字幕专区 亚洲人成人毛片无遮挡 国产一起色一起爱 国产香蕉精品视频在 九九热免费观看 日韩亚洲欧美一区 九九热精品在线观看 精品久久久久久中文字幕专区 亚洲欧美自拍偷拍 国产精品每日更新 久久久久国产一级毛片高清板 久久天天躁狠狠躁夜夜中文字幕 久久精品片 日韩在线毛片 国产成人精品本亚洲 国产成人精品一区二区三区 九九热在线观看 国产r级在线观看 国产欧美日韩精品高清二区综合区 韩国电影一区二区 国产精品毛片va一区二区三区 五月婷婷伊人网 久久一区二区三区免费 一本色道久久综合狠狠躁篇 亚洲综合色站 国产尤物在线观看 亚洲一区亚洲二区 免费在线视频一区 欧洲精品视频在线观看 日韩中文字幕a 中文字幕日本在线mv视频精品 91精品在线免费视频 精品国产免费人成在线观看 精品a级片 中文字幕日本在线mv视频精品 日韩在线精品视频 婷婷丁香色 91精品国产高清久久久久 国产成人精品日本亚洲直接 五月综合视频 欧美日韩在线亚洲国产人 精液呈暗黄色 亚洲乱码一区 久久精品中文字幕不卡一二区 亚洲天堂精品在线 激情婷婷综合 国产免费久久精品久久久 国产精品亚洲二区在线 久久免费播放视频 五月婷婷丁香综合 在线亚洲欧美日韩 久久免费精品高清麻豆 精品久久久久久中文字幕 亚洲一区网站 国产精品福利社 日韩中文字幕免费 亚洲综合丝袜 91精品在线播放 国产精品18 亚洲日日夜夜 伊人久久大香线蕉综合影 亚洲精品中文字幕乱码影院 亚洲一区二区黄色 亚洲第一页在线视频 一区二区在线观看视频 国产成人福利精品视频 亚洲高清二区 国内成人免费视频 精品亚洲性xxx久久久 国产精品合集一区二区三区 97av免费视频 国产一起色一起爱 国产区久久 国产资源免费观看 99精品视频免费 国产成人一级 国产精品九九免费视频 欧美91精品久久久久网免费 99热国产免费 久久精品色 98精品国产综合久久 久久精品播放 中文字幕视频免费 国产欧美日韩一区二区三区在线 精品久久蜜桃 国产小视频精品 一本色道久久综合狠狠躁篇 91在线免费观看 亚洲精品区 伊人成综合网 伊人热人久久中文字幕 伊人黄色片 99国产精品热久久久久久夜夜嗨 久久免费精品视频 亚洲一区二区三区高清不卡 久久久久国产一级毛片高清板 国产片一区二区三区 久久狠狠干 99久久婷婷国产综合精品电影 国产99区 国产精品成人久久久久 久久狠狠干 青青国产在线观看 亚洲高清国产拍精品影院 国产精品一区二区av 九九热在线免费视频 伊人久久国产 国产精品久久久久久久久久一区 在线观看免费视频一区 国产精品自在在线午夜区app 国产精品综合色区在线观看 国产毛片久久久久久国产毛片 97国产免费全部免费观看 国产精品每日更新 国产尤物视频在线 九九视频这里只有精品99 一本一道久久a久久精品综合 久久综合给会久久狠狠狠 国产成人精品男人的天堂538 欧美一区二区高清 毛片一区二区三区 国产欧美日韩在线观看一区二区三区 在线国产二区 欧美不卡网 91在线精品中文字幕 在线国产福利 国内精品91久久久久 91亚洲福利 日韩欧美国产中文字幕 91久久精品国产性色也91久久 亚洲性久久久影院 欧美精品1区 国产热re99久久6国产精品 九九热免费观看 国产精品欧美日韩 久久久久国产一级毛片高清板 久久国产经典视频 日韩欧美亚洲国产一区二区三区 欧美亚洲综合另类在线观看 国产精品自在在线午夜区app 97中文字幕在线观看 视频一二三区 精品国产一区在线观看 国产欧美日韩在线一区二区不卡 欧美一区二三区 伊人成人在线观看 国内精品91久久久久 97在线亚洲 国产在线不卡一区 久久久全免费全集一级全黄片 国产精品v欧美精品∨日韩 亚洲毛片网站 在线不卡一区二区 99re热在线视频 久久激情网 国产毛片一区二区三区精品 久久亚洲综合色 中文字幕视频免费 国产视频亚洲 婷婷伊人久久 国产一区二区免费播放 久久99国产精品成人欧美 99国产在线视频 国产成人免费视频精品一区二区 国产不卡一区二区三区免费视 国产码欧美日韩高清综合一区 久久精品国产主播一区二区 国产一区电影 久久精品国产夜色 国产精品国产三级国产 日韩一区二区三区在线 久久97久久97精品免视看 久久国产免费一区二区三区 伊人久久大香线蕉综合电影网 99re6久精品国产首页 久久激情网 亚洲成人高清在线 国产精品网址 国产成人精品男人的天堂538 香蕉国产综合久久猫咪 国产专区中文字幕 91麻豆精品国产高清在线 久久国产经典视频 国产精品成人va在线观看 国产精品爱啪在线线免费观看 日本精品久久久久久久久免费 亚洲综合一区二区三区 久久五月网 精品国产网红福利在线观看 久久综合亚洲伊人色 亚洲国产精品久久久久久网站 在线日韩国产 99国产精品热久久久久久夜夜嗨 国产综合精品在线 国产区福利 精品亚洲综合久久中文字幕 国产制服丝袜在线 毛片在线播放网站 在线观看免费视频一区 国产精品久久久精品三级 亚洲国产电影在线观看 最新日韩欧美不卡一二三区 狠狠综合久久综合鬼色 日本精品1在线区 国产日韩一区二区三区在线播放 欧美日韩精品在线播放 亚洲欧美日韩国产一区二区三区精品 久久综合久久网 婷婷六月激情在线综合激情 亚洲乱码一区 国产专区91 97av视频在线观看 精品久久久久久中文字幕 久久五月视频 国产成人福利精品视频 国产精品网址 中文字幕视频在线 精品一区二区三区免费视频 伊人手机在线视频 亚洲精品中文字幕乱码 国产在线视频www色 色噜噜国产精品视频一区二区 精品亚洲成a人在线观看 国产香蕉尹人综合在线 成人免费一区二区三区在线观看 国产不卡一区二区三区免费视 欧美精品久久天天躁 国产专区中文字幕 久久精品国产免费中文 久久精品国产免费一区 久久无码精品一区二区三区 国产欧美另类久久久精品免费 欧美精品久久天天躁 亚洲精品在线视频 国产视频91在线 91精品福利一区二区三区野战 日韩中文字幕免费 国产精品99一区二区三区 欧美成人高清性色生活 国产精品系列在线观看 亚洲国产福利精品一区二区 国产成人在线小视频 国产精品久久久久免费 99re热在线视频 久久久久久久综合 一区二区国产在线播放 成人国产在线视频 亚洲精品乱码久久久久 欧美日韩一区二区综合 精品久久久久免费极品大片 中文字幕视频二区 激情粉嫩精品国产尤物 国产成人精品一区二区视频 久久精品中文字幕首页 亚洲高清在线 国产精品亚洲一区二区三区 伊人久久艹 中文在线亚洲 国产精品一区二区在线播放 国产精品九九免费视频 亚洲二区在线播放 亚洲狠狠婷婷综合久久久久网站 亚洲欧美日韩网站 日韩成人精品 亚洲国产一区二区三区青草影视 91精品国产福利在线观看 国产精品久久久久久久久99热 国产一区二区精品尤物 久碰香蕉精品视频在线观看 亚洲日日夜夜 在线不卡一区二区 国产午夜亚洲精品 九九热在线视频观看这里只有精品 伊人手机在线视频 91免费国产精品 日韩欧美中字 91精品国产91久久久久 国产全黄三级播放 视频一区二区三区免费观看 国产开裆丝袜高跟在线观看 国产成人欧美 激情综合丝袜美女一区二区 国产成人亚洲综合无 欧美精品一区二区三区免费观看 欧美亚洲国产日韩 日韩亚州 国产欧美日韩精品高清二区综合区 亚洲午夜国产片在线观看 精品久久久久久中文字幕 欧美精品1区 久久伊人久久亚洲综合 亚洲欧美日韩精品 国产成人精品久久亚洲高清不卡 久久福利影视 国产精品99精品久久免费 久久久久免费精品视频 国产日产亚洲精品 亚洲国产午夜电影在线入口 精品无码一区在线观看 午夜国产精品视频 亚洲一级片免费 伊人久久大香线蕉综合影 国产精品久久影院 久碰香蕉精品视频在线观看 www.欧美精品 在线小视频国产 亚洲国产天堂久久综合图区 欧美一区二区三区不卡 日韩美女福利视频 九九精品免视频国产成人 不卡国产00高中生在线视频 亚洲第一页在线视频 欧美日韩在线播放成人 99re视频这里只有精品 国产精品91在线 精品乱码一区二区三区在线 国产区久久 91麻豆精品国产自产在线观看一区 日韩精品成人在线 九九热在线观看 国产精品久久不卡日韩美女 欧美一区二区三区综合色视频 欧美精品免费一区欧美久久优播 国产精品网址 国产专区中文字幕 国产精品欧美亚洲韩国日本久久 日韩美香港a一级毛片 久久精品123 欧美一区二区三区免费看 99r在线视频 亚洲精品国产字幕久久vr 国产综合激情在线亚洲第一页 91免费国产精品 日韩免费小视频 亚洲国产精品综合一区在线 国产亚洲第一伦理第一区 在线亚洲精品 国产精品一区二区制服丝袜 国产在线成人精品 九九精品免视频国产成人 亚洲国产网 欧美日韩亚洲一区二区三区在线观看 在线亚洲精品 欧美一区二区三区高清视频 国产成人精品男人的天堂538 欧美日韩在线观看区一二 亚洲欧美一区二区久久 久久精品中文字幕首页 日本高清www午夜视频 久久精品国产免费 久久999精品 亚洲国产精品欧美综合 88国产精品视频一区二区三区 91久久偷偷做嫩草影院免费看 国产精品夜色视频一区二区 欧美日韩导航 国产成人啪精品午夜在线播放 一区二区视频在线免费观看 99久久精品国产自免费 精液呈暗黄色 久久99国产精品 日本精品久久久久久久久免费 精品国产97在线观看 99re视频这里只有精品 国产视频91在线 999av视频 亚洲美女视频一区二区三区 久久97久久97精品免视看 亚洲国产成人久久三区 99久久亚洲国产高清观看 日韩毛片在线视频 综合激情在线 91福利一区二区在线观看 一区二区视频在线免费观看 激情粉嫩精品国产尤物 国产成人精品曰本亚洲78 国产成人精品本亚洲 国产精品成人免费视频 国产成人啪精品视频免费软件 久久精品国产亚洲妲己影院 国产精品成人久久久久久久 久久大香线蕉综合爱 欧美一区二区三区高清视频 99热国产免费 在线观看欧美国产 91精品视频在线播放 国产精品福利社 欧美精品一区二区三区免费观看 国产一区二区免费视频 国产午夜精品一区二区 精品视频在线观看97 91精品福利久久久 国产一区福利 国产综合激情在线亚洲第一页 国产精品久久久久久久久久久不卡 九色国产 在线日韩国产 黄网在线观看 亚洲一区小说区中文字幕 中文字幕丝袜 日本二区在线观看 日本国产一区在线观看 欧美日韩一区二区三区久久 欧美精品亚洲精品日韩专 国产日产亚洲精品 久久综合九色综合欧美播 亚洲国产欧美无圣光一区 欧美视频区 亚洲乱码视频在线观看 久久无码精品一区二区三区 九九热精品免费视频 久久99精品久久久久久牛牛影视 国产精品成久久久久三级 国产一区福利 午夜国产精品视频 日本二区在线观看 99久久网站 国产亚洲天堂 精品国产一区二区三区不卡 亚洲国产日韩在线一区 国产成人综合在线观看网站 久久免费高清视频 欧美在线导航 午夜精品久久久久久99热7777 欧美久久综合网 国产小视频精品 国产尤物在线观看 亚洲国产精品综合一区在线 欧美一区二区三区不卡视频 欧美黑人欧美精品刺激 日本福利在线观看 久久国产偷 国产手机精品一区二区 国产热re99久久6国产精品 国产高清啪啪 欧美亚洲国产成人高清在线 国产在线第三页 亚洲综合一区二区三区 99r在线视频 99精品久久久久久久婷婷 国产精品乱码免费一区二区 国产在线精品福利91香蕉 国产尤物视频在线 五月婷婷亚洲 中文字幕久久综合伊人 亚洲精品一级毛片 99国产精品电影 在线视频第一页 久久99国产精品成人欧美 国产白白视频在线观看2 成人精品一区二区www 亚洲成人网在线观看 麻豆91在线视频 色综合合久久天天综合绕视看 久久精品国产免费高清 国产不卡一区二区三区免费视 欧美国产中文 99精品欧美 九九在线精品 国产中文字幕在线免费观看 国产一区中文字幕在线观看 国产成人一级 国产精品一区二区制服丝袜 国产一起色一起爱 亚洲精品成人在线 亚洲欧美精品在线 国产欧美自拍视频 99精品久久久久久久婷婷 久99视频 国产热re99久久6国产精品 视频一区亚洲 国产精品视频分类 国产精品成在线观看 99re6久精品国产首页 亚洲在成人网在线看 亚洲国产日韩在线一区 久久国产三级 日韩国产欧美 欧美在线一区二区三区 国产精品美女一级在线观看 成人午夜免费福利视频 亚洲天堂精品在线 91精品国产手机 欧美日韩视频在线播放 狠狠综合久久综合鬼色 九一色视频 青青视频国产 亚洲欧美自拍一区 中文字幕天天躁日日躁狠狠躁97 日韩免费大片 996热视频 伊人成综合网 亚洲天堂欧美 日韩精品亚洲人成在线观看 久久综合给会久久狠狠狠 日韩精品亚洲人成在线观看 日韩国产欧美 亚洲成aⅴ人片在线影院八 亚洲精品1区 99久久精品免费 国产精品高清在线观看 国产精品久久久免费视频 在线亚洲欧美日韩 91在线看视频 国产精品96久久久久久久 欧美日韩国产成人精品 91在线亚洲 热久久亚洲 国产精品美女免费视频观看 日韩在线毛片 亚洲永久免费视频 九九免费在线视频 亚洲一区网站 日本高清二区视频久二区 精品国产美女福利在线 伊人久久艹 国产精品久久久久三级 欧美成人精品第一区二区三区 99久久精品国产自免费 在线观看日韩一区 国产中文字幕一区 成人免费午夜视频 欧美日韩另类在线 久久99国产精品成人欧美 色婷婷中文网 久久天天躁夜夜躁狠狠躁2020 欧美成人伊人久久综合网 国产精品福利资源在线 国产伦精品一区二区三区高清 国产精品亚洲综合色区韩国 亚洲一区欧美日韩 色综合视频 国语自产精品视频在线区 国产高清a 成人国内精品久久久久影 国产在线精品香蕉综合网一区 国产不卡在线看 国产成人精品精品欧美 国产欧美日韩综合精品一区二区三区 韩国电影一区二区 国产在线视频www色 91中文字幕在线一区 国产人成午夜免视频网站 亚洲综合一区二区三区 色综合视频一区二区观看 久久五月网 九九热精品在线观看 国产一区二区三区国产精品 99久热re在线精品996热视频 亚洲国产网 在线视频亚洲一区 日韩字幕一中文在线综合 国产高清一级毛片在线不卡 精品国产色在线 国产高清视频一区二区 精品日本久久久久久久久久 亚洲国产午夜精品乱码 成人免费国产gav视频在线 日韩欧美一区二区在线观看 欧美曰批人成在线观看 韩国电影一区二区 99re这里只有精品6 日韩精品一区二区三区视频 99re6久精品国产首页 亚洲欧美一区二区三区导航 欧美色图一区二区三区 午夜精品视频在线观看 欧美激情在线观看一区二区三区 亚洲热在线 成人国产精品一区二区网站 亚洲一级毛片在线播放 亚洲一区小说区中文字幕 亚洲午夜久久久久影院 国产自产v一区二区三区c 国产精品视频免费 久久调教视频 国产成人91激情在线播放 国产精品欧美亚洲韩国日本久久 久久亚洲日本不卡一区二区 91中文字幕网 成人国产在线视频 国产视频91在线 欧美成人精品第一区二区三区 国产精品福利在线 久久综合九色综合精品 欧美一区二区三区精品 久久国产综合尤物免费观看 久久99青青久久99久久 日韩精品免费 久久国产精品999 91亚洲视频在线观看 国产精品igao视频 色综合区 在线亚洲欧国产精品专区 国产一区二区三区在线观看视频 亚洲精品成人在线 一区二区国产在线播放 中文在线亚洲 亚洲精品第一国产综合野 国产一区二区精品久久 一区二区三区四区精品视频 99热精品久久 中文字幕视频二区 国产成人精品男人的天堂538 99精品影视 美女福利视频一区二区 久久午夜夜伦伦鲁鲁片 综合久久久久久久综合网 国产精品国产欧美综合一区 国产99视频在线观看 国产亚洲女在线精品 婷婷影院在线综合免费视频 国产亚洲3p一区二区三区 91成人爽a毛片一区二区 亚洲一区二区高清 国产欧美亚洲精品第二区首页 欧美日韩导航 亚洲高清二区 欧美激情观看一区二区久久 日韩毛片在线播放 亚洲欧美日韩高清中文在线 亚洲日本在线播放 国产精品一区二区制服丝袜 精品国产一区二区三区不卡 国产不卡在线看 国产欧美网站 四虎永久在线观看视频精品 国产黄色片在线观看 夜夜综合 一本色道久久综合狠狠躁篇 欧美亚洲综合另类在线观看 国产91在线看 伊人久久国产 欧美一区二区在线观看免费网站 国产精品久久久久三级 久久福利 日韩中文字幕a 亚洲午夜久久久久影院 91在线高清视频 国产亚洲一区二区三区啪 久久人精品 国产精品亚洲午夜一区二区三区 综合久久久久久 久久伊人一区二区三区四区 国产综合久久久久久 日韩一区精品视频在线看 国产精品日韩欧美制服 日本精品1在线区 99re视频 无码av免费一区二区三区试看 国产视频1区 日韩欧美中文字幕一区 日本高清中文字幕一区二区三区a 亚洲国产欧美无圣光一区 国产在线视频一区二区三区 欧美国产第一页 在线亚洲欧美日韩 日韩中文字幕第一页 在线不卡一区二区 伊人久久青青 国产精品一区二区在线播放 www.五月婷婷 麻豆久久婷婷国产综合五月 亚洲精品区 久久国产欧美另类久久久 99在线视频免费 伊人久久中文字幕久久cm 久久精品成人免费看 久久这里只有精品首页 88国产精品视频一区二区三区 中文字幕日本在线mv视频精品 国产在线精品成人一区二区三区 伊人精品线视天天综合 亚洲一区二区黄色 国产尤物视频在线 亚洲精品99久久久久中文字幕 国产一区二区三区免费观看 伊人久久大香线蕉综合电影网 国产成人精品区在线观看 日本精品一区二区三区视频 日韩高清在线二区 久久免费播放视频 一区二区成人国产精品 国产精品免费精品自在线观看 亚洲精品视频二区 麻豆国产精品有码在线观看 精品日本一区二区 亚洲欧洲久久 久久中文字幕综合婷婷 中文字幕视频在线 国产成人精品综合在线观看 91精品国产91久久久久福利 精液呈暗黄色 香蕉国产综合久久猫咪 国产专区精品 亚洲精品无码不卡 国产永久视频 亚洲成a人片在线播放观看国产 一区二区国产在线播放 亚洲一区二区黄色 欧美日韩在线观看视频 亚洲精品另类 久久国产综合尤物免费观看 国产一区二区三区国产精品 高清视频一区 国产精品igao视频 国产精品资源在线 久久综合精品国产一区二区三区 www.五月婷婷 精品色综合 99热国产免费 麻豆福利影院 亚洲伊人久久大香线蕉苏妲己 久久电影院久久国产 久久精品伊人 在线日韩理论午夜中文电影 亚洲国产欧洲综合997久久 伊人国产精品 久草国产精品 欧美一区精品二区三区 亚洲成人高清在线 91免费国产精品 日韩精品福利在线 国产一线在线观看 国产不卡在线看 久久99青青久久99久久 亚洲精品亚洲人成在线播放 99久久免费看国产精品 国产日本在线观看 青草国产在线视频 麻豆久久婷婷国产综合五月 国产中文字幕一区 91久久精品国产性色也91久久 国产一区a 国产欧美日韩成人 国产亚洲女在线精品 一区二区美女 中文字幕在线2021一区 在线小视频国产 久久这里只有精品首页 国产在线第三页 欧美日韩中文字幕 在线亚洲+欧美+日本专区 精品国产一区二区三区不卡 久久这里精品 欧美在线va在线播放 精液呈暗黄色 91精品国产手机 91在线免费播放 欧美视频亚洲色图 欧美国产日韩精品 日韩高清不卡在线 精品视频免费观看 欧美日韩一区二区三区四区 国产欧美亚洲精品第二区首页 亚洲韩精品欧美一区二区三区 国产精品视频免费 在线精品小视频 久久午夜夜伦伦鲁鲁片 国产无套在线播放 久热这里只精品99re8久 欧美久久久久 久久香蕉国产线看观看精品蕉 国产成人精品男人的天堂538 亚洲人成网站色7799在线观看 日韩在线第二页 一本色道久久综合狠狠躁篇 国产一区二区三区不卡在线观看 亚洲乱码在线 在线观看欧美国产 久久福利青草精品资源站免费 国产玖玖在线观看 在线亚洲精品 亚洲成aⅴ人在线观看 精品91在线 欧美一区二三区 日韩中文字幕视频在线 日本成人一区二区 日韩免费专区 国内精品在线观看视频 久久国产综合尤物免费观看 国产精品系列在线观看 一本一道久久a久久精品综合 亚洲免费播放 久久精品国产免费 久久人精品 亚洲毛片网站 亚洲成a人一区二区三区 韩国福利一区二区三区高清视频 亚洲精品天堂在线 一区二区三区中文字幕 亚洲国产色婷婷精品综合在线观看 亚洲国产成人久久笫一页 999国产视频 国产精品香港三级在线电影 欧美日韩一区二区三区四区 日韩国产欧美 国产精品99一区二区三区 午夜国产精品理论片久久影院 亚洲精品中文字幕麻豆 亚洲国产高清视频 久久免费手机视频 日韩a在线观看 五月婷婷亚洲 亚洲精品中文字幕麻豆 中文字幕丝袜 www国产精品 亚洲天堂精品在线 亚洲乱码一区 国产日韩欧美三级 久久999精品 伊人热人久久中文字幕 久热国产在线视频 国产欧美日韩在线观看一区二区三区 国产一二三区在线 日韩国产欧美 91精品国产91久久久久 亚洲一区小说区中文字幕 精品一区二区免费视频 国产精品视频免费 国产精品亚洲综合色区韩国 亚洲国产精品成人午夜在线观看 欧美国产日韩精品 中文字幕精品一区二区精品