專利名稱::一種用于識別wap網(wǎng)頁的方法、裝置和設(shè)備的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及計算機(jī)
技術(shù)領(lǐng)域:
,尤其涉及一種用于識別WAP網(wǎng)頁的方法、裝置和設(shè)備。
背景技術(shù):
:在手機(jī)瀏覽網(wǎng)頁時,由于不能預(yù)知所獲得的網(wǎng)頁是否為適合手機(jī)展現(xiàn)的WAP網(wǎng)頁,因此有可能獲得不適用于手機(jī)展示的基于WWW網(wǎng)頁,此時需要對網(wǎng)頁進(jìn)行轉(zhuǎn)碼等處理以使網(wǎng)頁可供用戶在手機(jī)上瀏覽,這種方式不但增加了網(wǎng)絡(luò)設(shè)備的負(fù)擔(dān),也降低了響應(yīng)速度,影響用戶體驗(yàn)。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種用于識別WAP網(wǎng)頁的方法、裝置和設(shè)備。根據(jù)本發(fā)明的一個方面,提供一種計算機(jī)實(shí)現(xiàn)的用于識別WAP網(wǎng)頁的方法,其中,所述方法包括以下步驟a獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息;b根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。根據(jù)本發(fā)明的另一個方面,還提供了一種用于識別WAP網(wǎng)頁的網(wǎng)頁識別裝置,其中,所述網(wǎng)頁識別裝置包括第一獲取裝置,用于獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息;第一確定裝置,用于根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。根據(jù)本發(fā)明的再一個方面,還提供了一種計算機(jī)設(shè)備,其中,該計算機(jī)設(shè)備包含所述網(wǎng)頁識別裝置與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)1)本發(fā)明對于不能直接確定是否為WAP網(wǎng)頁的待識別網(wǎng)頁,例如,Xhtml網(wǎng)頁等,通過獲取其網(wǎng)頁內(nèi)容信息進(jìn)行識別和判斷,提高了識別WAP網(wǎng)頁的準(zhǔn)確率;幻本發(fā)明通過獲得全部展現(xiàn)處理信息的評價信息,以根據(jù)評價信息來獲得更加全面客觀的評價結(jié)果,能夠獲得更加合理準(zhǔn)確的識別結(jié)果;幻本發(fā)明可先獲取部分展現(xiàn)信息進(jìn)行識別,提高了識別的效率,對于識別為非WAP網(wǎng)頁的待識別網(wǎng)頁再基于其他展現(xiàn)處理信息或全部展現(xiàn)處理信息進(jìn)行二次判斷,提高了網(wǎng)頁識別的準(zhǔn)確度。通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會變得更明顯圖1為本發(fā)明一個方面的一種計算機(jī)實(shí)現(xiàn)的用于識別WAP網(wǎng)頁的方法流程圖;圖2為本發(fā)明一個優(yōu)選實(shí)施例的用于識別WAP網(wǎng)頁的方法流程圖;圖3為本發(fā)明又一個優(yōu)選實(shí)施例的用于識別WAP網(wǎng)頁的方法流程圖;圖4為本發(fā)明一個方面的用于識別WAP網(wǎng)頁的網(wǎng)頁識別裝置的結(jié)構(gòu)示意圖;圖5為本發(fā)明一個優(yōu)選實(shí)施例的用于識別WAP網(wǎng)頁的網(wǎng)頁識別裝置的結(jié)構(gòu)示意圖;圖6為本發(fā)明又一個優(yōu)選實(shí)施例的用于識別WAP網(wǎng)頁的網(wǎng)頁識別裝置的結(jié)構(gòu)示意圖;附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。具體實(shí)施例方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。圖1示意出了本發(fā)明一個方面的一種計算機(jī)實(shí)現(xiàn)的用于識別WAP網(wǎng)頁的方法流程圖。根據(jù)本發(fā)明的方法包括步驟Sl和步驟S2。其中,根據(jù)本發(fā)明的方法可通過計算機(jī)設(shè)備中的網(wǎng)頁識別裝置來實(shí)現(xiàn),例如,通過計算機(jī)設(shè)備中諸如應(yīng)用模塊、操作系統(tǒng)、處理控制器等來實(shí)現(xiàn)。其中,所述計算機(jī)設(shè)備為一種能夠按照事先存儲的程序,自動、高速地進(jìn)行大量數(shù)值計算和各種信息處理的現(xiàn)代化智能電子設(shè)備,其硬件包括但不限于微處理器、FPGA、DSP、嵌入式設(shè)備等。優(yōu)選地,所述計算機(jī)設(shè)備可單獨(dú)運(yùn)行來實(shí)現(xiàn)本發(fā)明,也可接入網(wǎng)絡(luò)并通過與網(wǎng)絡(luò)中的其他計算機(jī)設(shè)備的交互操作來實(shí)現(xiàn)本發(fā)明。所述計算機(jī)設(shè)備包括但不限于用戶設(shè)備和網(wǎng)絡(luò)設(shè)備,其中,所述用戶設(shè)備包括但不限于電腦、智能手機(jī)、PDA等;所述網(wǎng)絡(luò)設(shè)備包括但不限于單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計算(CloudComputing)的由大量計算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計算是分布式計算的一種,由一群松散耦合的計算機(jī)集組成的一個超級虛擬計算機(jī)。其中,所述計算機(jī)設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)等。需要說明的是,所述用戶設(shè)備及網(wǎng)絡(luò)設(shè)備僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶設(shè)備、網(wǎng)絡(luò)設(shè)備或網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟Sl中,網(wǎng)頁識別裝置獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息。其中,所述網(wǎng)頁內(nèi)容信息包含所述待識別網(wǎng)頁的源代碼信息。具體地,所述網(wǎng)頁識別裝置獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息的方法包括但不限于1)網(wǎng)頁識別裝置由預(yù)存儲的待識別網(wǎng)頁庫中獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息。2)網(wǎng)頁識別裝置由網(wǎng)絡(luò)中實(shí)時獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息。例如,網(wǎng)頁識別裝置將在網(wǎng)絡(luò)中爬取所得的網(wǎng)頁作為待識別網(wǎng)頁,并獲取該待識別網(wǎng)頁的網(wǎng)頁代碼信息。在步驟S2中,網(wǎng)頁識別裝置根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。其中,所述與待識別網(wǎng)頁的展現(xiàn)相關(guān)的信息包括影響待識別網(wǎng)頁的展現(xiàn)結(jié)果的信息,例如,網(wǎng)頁內(nèi)容信息中用于確定待識別網(wǎng)頁所包含的各項(xiàng)網(wǎng)頁元素以及該各項(xiàng)網(wǎng)頁元素的樣式的內(nèi)容信息等。所述與待識別網(wǎng)頁的處理復(fù)雜度相關(guān)的信息包括網(wǎng)頁內(nèi)容信息中影響所述待識別網(wǎng)頁的解析、渲染或響應(yīng)速度的內(nèi)容信息,例如,網(wǎng)頁CSS樣式表、base元素、applet元素等。優(yōu)選地,所述展現(xiàn)處理信息包括以下至少一類信息1)所述待識別網(wǎng)頁的網(wǎng)頁元素的屬性信息,例如,map元素的圓心坐標(biāo)以及半徑信息,再例如,段落元素在網(wǎng)頁中的邊距信息等;2)所述待識別網(wǎng)頁的網(wǎng)頁元素的數(shù)量信息和/或網(wǎng)頁元素間的包含關(guān)系信息;例如,網(wǎng)頁內(nèi)容信息中frame元素的數(shù)量;又例如,網(wǎng)頁內(nèi)容信息中table元素tl包含table元素t2,并且tl與table元素t3平行;3)所述待識別網(wǎng)頁包含的文本信息中的關(guān)鍵詞信息,其中,關(guān)鍵詞信息包括但不限于關(guān)鍵詞自身以及關(guān)鍵詞的數(shù)量信息。其中,所述全部展現(xiàn)處理信息包括用于判斷所述網(wǎng)頁是否為WAP網(wǎng)頁所需的所有展現(xiàn)處理信息;所述部分展現(xiàn)處理信息為所述全部展現(xiàn)處理信息所包含的部分信息。其中,網(wǎng)頁識別裝置基于所述網(wǎng)頁內(nèi)容信息獲得全部或部分展現(xiàn)處理信息的方式包括但不限于1)網(wǎng)頁識別裝置直接由所述網(wǎng)頁內(nèi)容信息中獲取相應(yīng)的信息,以獲得全部或部分展現(xiàn)處理信息;例如,網(wǎng)頁識別裝置由網(wǎng)頁內(nèi)容信息中獲取各個網(wǎng)頁元素的寬度信息作為全部展現(xiàn)處理信息;又例如,預(yù)定全部展現(xiàn)處理信息包括a)網(wǎng)頁內(nèi)容信息中包含的預(yù)定關(guān)鍵詞及相應(yīng)的數(shù)量信息;b)網(wǎng)頁內(nèi)容信息中包含的預(yù)定元素的數(shù)量信息;并且預(yù)定部分展現(xiàn)信息僅包括預(yù)定關(guān)鍵詞及相應(yīng)的數(shù)量信息,則網(wǎng)頁識別裝置獲取網(wǎng)頁內(nèi)容信息中所包含的預(yù)定關(guān)鍵詞,并統(tǒng)計所獲得的各個預(yù)定關(guān)鍵詞的數(shù)量,以將所獲得的預(yù)定關(guān)鍵詞及其數(shù)量作為部分展現(xiàn)處理信息。2)網(wǎng)頁識別裝置基于所述網(wǎng)頁內(nèi)容信息來對所述待識別網(wǎng)頁進(jìn)行網(wǎng)頁渲染處理,以獲得所述部分或全部展現(xiàn)處理信息。具體地,網(wǎng)頁識別裝置基于所述網(wǎng)頁內(nèi)容信息來對所述待識別網(wǎng)頁執(zhí)行網(wǎng)頁渲染處理操作,并由渲染結(jié)果中獲取部分或全部展現(xiàn)處理信息;或者,網(wǎng)頁識別裝置由所述渲染結(jié)果以及網(wǎng)頁內(nèi)容信息中獲取部分或全部展現(xiàn)處理信息。例如,網(wǎng)頁內(nèi)容信息中所包含的與網(wǎng)頁元素hi的相應(yīng)的代碼信息為“<hlclass="pos”>文件頭</hl>”,則網(wǎng)頁識別裝置對網(wǎng)頁內(nèi)容信息執(zhí)行網(wǎng)頁渲染處理操作,根據(jù)網(wǎng)頁內(nèi)容信息所包含的CSS信息確定與hi相對應(yīng)的pos參數(shù)包含樣式信息“l(fā)eft100;top150;font20",由于元素hi所包含的文本“文件頭”的寬度為20X3=60個像素,則網(wǎng)頁識別裝置確定網(wǎng)頁元素hi的尺寸信息包括“距離頁面左側(cè)100像素,距離頁面頂部150像素,寬度為60像素”,并將該結(jié)果作為部分展現(xiàn)處理信息。又例如,網(wǎng)頁識別裝置由對網(wǎng)頁內(nèi)容信息的渲染結(jié)果中獲得待識別網(wǎng)頁中的各項(xiàng)網(wǎng)頁元素的尺寸信息,并將尺寸信息以及預(yù)先由網(wǎng)頁內(nèi)容信息中獲取的frame元素的數(shù)量信息,作為全部展現(xiàn)處理信息。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。其中,網(wǎng)頁識別裝置根據(jù)全部或部分展現(xiàn)處理信息來判斷待識別網(wǎng)頁是否為WAP網(wǎng)頁的實(shí)現(xiàn)方式將在后續(xù)實(shí)施例中予以詳述,在此不予贅述。作為本發(fā)明的優(yōu)選實(shí)施例之一,根據(jù)本實(shí)施例的方法,在步驟Sl之后還包括步驟S4(圖未示)、步驟S5(圖未示)以及步驟S6(圖未示)。在步驟S4中,網(wǎng)頁識別裝置由所述網(wǎng)頁內(nèi)容信息中獲取用于直接確定待識別網(wǎng)頁是否為WAP網(wǎng)頁的代碼語言相關(guān)信息。優(yōu)選地,所述代碼語言相關(guān)信息包括但不限于以下至少一項(xiàng)信息1)所述待識別網(wǎng)頁的代碼語言類型標(biāo)簽,例如,無線標(biāo)記語言類型的標(biāo)簽<wml>,又例如,超文本標(biāo)記語言類型的標(biāo)簽<html>等;2)制訂或發(fā)布所述待識別網(wǎng)頁所采用的代碼語言和/或代碼語言相關(guān)協(xié)議的機(jī)構(gòu)信息,例如,定義WAP2.0協(xié)議標(biāo)準(zhǔn)的wapforum,Openmobileal1iance等機(jī)構(gòu)名稱,又例如,開發(fā)WML的Openwave等公司名稱;3)所述待識別網(wǎng)頁所采用的代碼語言的版本信息,例如,xhtml的子集版本“xhtmlbasic”,又例如,xhtml的移動版本“xhtmlMP”或“xhtml-mobile”等。接著,在步驟S5中,網(wǎng)頁識別裝置判斷所述代碼語言相關(guān)信息是否包含預(yù)定類型信息。其中,所述預(yù)定類型信息包括適用于WAP網(wǎng)頁的代碼語言相關(guān)信息,優(yōu)選地,所述預(yù)定類型信息包括1)WAP網(wǎng)頁代碼語言類型標(biāo)簽;2)制訂或維護(hù)WAP協(xié)議及相應(yīng)的代碼語言的機(jī)構(gòu)信息;3)與WAP協(xié)議相關(guān)的代碼語言的版本信息。例如,網(wǎng)頁識別裝置在步驟S4中獲得機(jī)構(gòu)名稱“IETF”,預(yù)定類型信息中包括機(jī)構(gòu)信息“wapforum、Openmobilealliance”,則網(wǎng)頁識別裝置在步驟S5中判斷所獲得的機(jī)構(gòu)名稱中不包含預(yù)定類型信息。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何判斷所述代碼語言相關(guān)信息是否包含預(yù)定類型信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。接著,在步驟S6中,當(dāng)在步驟S5中判斷所述代碼語言相關(guān)信息不包含預(yù)定類型信息時,網(wǎng)頁識別裝置執(zhí)行步驟S2。其中,所述步驟S2已在前述實(shí)施例中予以詳述,并以引用的方式包含于此,不再贅述。優(yōu)選地,當(dāng)網(wǎng)頁識別裝置在步驟S5中判斷所述代碼語言相關(guān)信息包含預(yù)定類型信息時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。例如,網(wǎng)頁識別裝置在步驟S4中獲得待識別網(wǎng)頁的代碼語言的版本信息“xhtmlmobile”以及代碼語言類型標(biāo)簽“<html>”,其中,預(yù)定類型信息中包含與WAP協(xié)議相關(guān)的版本信息“xhtmlbasic","xhtmlMP","xhtmlmobile”以及WAP網(wǎng)頁代碼語言類型標(biāo)簽"<wml>",則網(wǎng)頁識別裝置在步驟S5中判斷步驟S4中所獲得的代碼語言版本信息中包含與WAP協(xié)議相關(guān)的代碼語言的版本信息“xhtmlmobile”,則網(wǎng)頁識別裝置確定待識別網(wǎng)頁為WAP網(wǎng)頁。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何當(dāng)判斷所述代碼語言相關(guān)信息包含預(yù)定類型信息時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。作為本發(fā)明的優(yōu)選實(shí)施例之一,根據(jù)本實(shí)施例的方法還包括步驟S7(圖未示)。在步驟S7中,當(dāng)確定待識別網(wǎng)頁為WAP網(wǎng)頁時,網(wǎng)頁識別裝置對該待識別網(wǎng)頁執(zhí)行相應(yīng)操作。具體地,所述網(wǎng)頁識別裝置對該待識別網(wǎng)頁執(zhí)行相應(yīng)操作的方式包括但不限于1)網(wǎng)頁識別裝置將所述待識別網(wǎng)頁標(biāo)記為WAP網(wǎng)頁。例如,對于由待識別網(wǎng)頁庫中獲得的待識別網(wǎng)頁,網(wǎng)頁識別裝置將該待識別網(wǎng)頁標(biāo)記為WAP網(wǎng)頁;又例如,網(wǎng)頁識別裝置建立并保存該待識別網(wǎng)頁與標(biāo)記“WAP網(wǎng)頁”間的對應(yīng)關(guān)系。2)網(wǎng)頁識別裝置將所述待識別網(wǎng)頁或其對應(yīng)的資源候選項(xiàng)提供給用戶設(shè)備。其中,所述資源候選項(xiàng)包括用于獲取該待識別網(wǎng)頁的鏈接地址信息和/或所述待識別網(wǎng)頁的介紹信息。例如,網(wǎng)頁識別裝置直接將確定為WAP網(wǎng)頁的待識別網(wǎng)頁提供給用戶設(shè)備;又例如,網(wǎng)頁識別裝置將確定為WAP網(wǎng)頁的待識別網(wǎng)頁的摘要信息提供給用戶設(shè)備;再例如,網(wǎng)頁識別裝置將確定為WAP網(wǎng)頁的待識別網(wǎng)頁的鏈接地址信息及摘要信息提供給用戶設(shè)備。3)網(wǎng)頁識別裝置對該待識別網(wǎng)頁執(zhí)行的相應(yīng)操作包括前述實(shí)現(xiàn)方式1)和實(shí)現(xiàn)方式2),并且,所述實(shí)現(xiàn)方式1)與實(shí)現(xiàn)方式2)的執(zhí)行并無先后順序。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何當(dāng)確定所述待識別網(wǎng)頁為WAP網(wǎng)頁時,網(wǎng)頁識別裝置對該待識別網(wǎng)頁執(zhí)行相應(yīng)操作的實(shí)現(xiàn)方式,例如,采用確定為WAP網(wǎng)頁的待識別網(wǎng)頁來建立/更新WAP網(wǎng)頁數(shù)據(jù)庫的方式等,均應(yīng)包含在本發(fā)明的范圍內(nèi)。優(yōu)選地,當(dāng)所述相應(yīng)操作包括將所述待識別網(wǎng)頁或其對應(yīng)的資源候選項(xiàng)提供給用戶設(shè)備時,根據(jù)本實(shí)施例的方法還包括步驟S8(圖未示)、步驟S9(圖未示)以及步驟S10(圖未示)。在步驟S8中,網(wǎng)頁識別裝置獲取來自用戶設(shè)備的網(wǎng)頁搜索請求。接著,在步驟S9中,網(wǎng)頁識別裝置基于所述網(wǎng)頁搜索請求,獲取多個網(wǎng)頁。接著,在步驟SlO中,網(wǎng)頁識別裝置將所獲取的多個網(wǎng)頁中的每個網(wǎng)頁作為所述待識別網(wǎng)頁,以對每個待識別網(wǎng)頁執(zhí)行所述步驟Sl和步驟S2,并對至少一個判斷為WAP網(wǎng)頁的待識別網(wǎng)頁執(zhí)行所述步驟S7。例如,網(wǎng)頁識別裝置在步驟S8中獲得來自用戶設(shè)備的網(wǎng)頁搜索請求queryl,并在步驟S9中根據(jù)所述queryl獲得多個與queryl相應(yīng)的網(wǎng)頁,則網(wǎng)頁識別裝置將所述多個與queryl相應(yīng)的網(wǎng)頁中的每個網(wǎng)頁作為待識別網(wǎng)頁,并執(zhí)行步驟Sl和步驟S2,以確定待識別網(wǎng)頁是否為WAP網(wǎng)頁。并當(dāng)多個與queryl相應(yīng)的網(wǎng)頁中的每個網(wǎng)頁均執(zhí)行步驟Sl和步驟S2之后,將在步驟S2中確定為WAP網(wǎng)頁的至少一個待識別網(wǎng)頁的鏈接地址信息提供給用戶設(shè)備。根據(jù)本發(fā)明的方法,對于不能直接確定是否為WAP網(wǎng)頁的待識別網(wǎng)頁,例如,xhtml網(wǎng)頁等,通過獲取其網(wǎng)頁內(nèi)容信息進(jìn)行識別和判斷,提高了識別WAP網(wǎng)頁的準(zhǔn)確率。圖2示意出了本發(fā)明一個優(yōu)選實(shí)施例的用于識別WAP網(wǎng)頁的方法流程圖。根據(jù)本實(shí)施例的方法包括步驟Sl和步驟S2。其中,所述步驟S2進(jìn)一步包括步驟S211、步驟S212以及步驟S213。步驟Sl已在參照圖1所示的實(shí)施例中予以詳述,并以引用的方式包含于此,不再贅述。在步驟S211中,網(wǎng)頁識別裝置基于所述網(wǎng)頁內(nèi)容信息來獲取全部展現(xiàn)處理信息。其中,所述展現(xiàn)處理信息已在參照圖1所示實(shí)施例的步驟S2中予以詳述,并以引用的方式包含于此,不再贅述。其中,所述網(wǎng)頁識別裝置基于預(yù)定獲取信息來獲取全部展現(xiàn)處理信息。其中,所述預(yù)定獲取信息包括但不限于以下至少一項(xiàng)信息1)預(yù)定的展現(xiàn)處理信息類型;2)預(yù)定的展現(xiàn)處理信息獲取范圍,例如,預(yù)定獲取范圍為包含于起始標(biāo)簽“〈body〉”和結(jié)束標(biāo)簽“〈/body〉”之間的網(wǎng)頁代碼;又例如,預(yù)定獲取范圍包括預(yù)定元素集合{Frame、IFrame,Area}中各個網(wǎng)頁元素的網(wǎng)頁代碼;又例如,預(yù)定獲取范圍包括待識別網(wǎng)頁所包含的文本信息等;3)預(yù)定獲取展現(xiàn)處理信息的方式,例如,預(yù)定由網(wǎng)頁內(nèi)容信息中直接獲??;又例如,預(yù)定先對網(wǎng)頁內(nèi)容信息執(zhí)行網(wǎng)頁渲染處理操作,并由渲染結(jié)果中獲取展現(xiàn)處理信息等。例如,預(yù)定的展現(xiàn)處理信息類型包括網(wǎng)頁元素的屬性信息以及網(wǎng)頁內(nèi)容信息包含的文本信息中的關(guān)鍵詞信息,則網(wǎng)頁識別裝置由網(wǎng)頁內(nèi)容信息的文本信息中查詢一個或多個預(yù)定關(guān)鍵詞,并統(tǒng)計該一個或多個預(yù)定關(guān)鍵詞的數(shù)量以獲得關(guān)鍵詞信息;并且,網(wǎng)頁識別裝置對網(wǎng)頁內(nèi)容信息執(zhí)行網(wǎng)頁渲染處理操作以獲得渲染結(jié)果,并由渲染結(jié)果中獲得網(wǎng)頁元素的屬性信息,并結(jié)合已由網(wǎng)頁內(nèi)容信息中直接提取的一個或多個網(wǎng)頁元素的屬性信息,作為待識別網(wǎng)頁中各個網(wǎng)頁元素的屬性信息。又例如,預(yù)定的展現(xiàn)處理信息獲取范圍為網(wǎng)頁內(nèi)容信息中包含于body元素的起始標(biāo)簽“〈body〉”和結(jié)束標(biāo)簽“〈/body〉”之間的展現(xiàn)處理信息,并且預(yù)定獲取展現(xiàn)處理信息的方式包括由網(wǎng)頁內(nèi)容信息中直接獲取,則網(wǎng)頁識別裝置獲取網(wǎng)頁內(nèi)容信息中位于起始標(biāo)簽“〈body〉”和結(jié)束標(biāo)簽“〈/body〉”之間的代碼信息,由該代碼信息中獲取各項(xiàng)網(wǎng)頁元素的尺寸信息、標(biāo)簽信息以及該所有內(nèi)容信息所包含的文本信息中的關(guān)鍵詞信息作為全部展現(xiàn)處理信息。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何基于所述網(wǎng)頁內(nèi)容信息來獲取全部展現(xiàn)處理信息的實(shí)現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。接著,在步驟S212中,網(wǎng)頁識別裝置根據(jù)所述全部展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息。其中,所述第一評價信息包括但不限于以下至少一項(xiàng)1)用于衡量所述待識別網(wǎng)頁與WAP網(wǎng)頁之間的總的相符程度的分?jǐn)?shù)信息/等級信息;2)用于衡量所述全部展現(xiàn)處理信息與具有WAP網(wǎng)頁特征的WAP展現(xiàn)處理信息之間相符程度的一項(xiàng)或多項(xiàng)分?jǐn)?shù)信息/等級fn息ο其中,本領(lǐng)域技術(shù)人員應(yīng)可根據(jù)實(shí)際情況和需求來確定獲取與一項(xiàng)展現(xiàn)處理信息相關(guān)的評價信息的方式,例如,基于預(yù)定的展現(xiàn)處理信息與等級信息的對應(yīng)關(guān)系來獲取該項(xiàng)展現(xiàn)處理信息所對應(yīng)的等級信息,又例如,基于預(yù)定分?jǐn)?shù)計算方式獲得該項(xiàng)展現(xiàn)處理信息所對應(yīng)的分?jǐn)?shù)信息等,在此不再贅述。具體地,所述網(wǎng)頁識別裝置根據(jù)所述全部展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息的方式包括但不限于1)網(wǎng)頁識別裝置分別獲取與所述全部展現(xiàn)處理信息中的每項(xiàng)展現(xiàn)處理信息相應(yīng)的評價信息,并基于所獲得的所有評價信息來確定第一評價信息。其中,所述基于所獲得的所有評價信息來確定第一評價信息的方式包括a)直接將所述所有評價信息作為第一評價信息;b)對所獲得的所有評價信息進(jìn)行綜合評定以獲得第一評價信息。例如,網(wǎng)頁識別裝置在步驟S211中獲得的全部展現(xiàn)處理信息如下表1所示類型所屬網(wǎng)頁元素width屬性的值div50網(wǎng)頁元素的span40width屬性信息table150table200表1其中,預(yù)定的width屬性的值與分?jǐn)?shù)信息的對應(yīng)關(guān)系如下表2所示數(shù)值分?jǐn)?shù)信息0-20021-80281-2501>250-10表2則網(wǎng)頁識別裝置確定各個網(wǎng)頁元素的width屬性的值所對應(yīng)的分?jǐn)?shù)信息如下表3所示類型所屬網(wǎng)頁元素數(shù)值分?jǐn)?shù)信息div502網(wǎng)頁元素的span150width屬性信息table1351table280-10表3則網(wǎng)頁識別裝置確定所獲得的第一評價信息包括四項(xiàng)分?jǐn)?shù)信息2、0、1、-10。又例如,網(wǎng)頁識別裝置在步驟S211中獲得的全部展現(xiàn)處理信息如下表4和表5所示,其中,下述嵌套最大層數(shù)表示該網(wǎng)頁元素所包含的同類元素的層級數(shù),例如,若frame元素的嵌套最大層數(shù)為2,則表示frame元素共有3級,其中,第一級frame元素包含第第二級frame元素,第二級frame元素包含第三級frame元素1權(quán)利要求1.一種計算機(jī)實(shí)現(xiàn)的用于識別WAP網(wǎng)頁的方法,其中,所述方法包括以下步驟a獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息;b根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟b包括以下步驟bl基于所述網(wǎng)頁內(nèi)容信息來獲取全部展現(xiàn)處理信息;根據(jù)所述全部展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息;b3判斷所述第一評價信息是否符合第一預(yù)定條件,以確定所述待識別網(wǎng)頁是否為WAP網(wǎng)頁。3.根據(jù)權(quán)利要求2所述的方法,其中,所述步驟b在所述步驟1^2之前還包括以下步驟-判斷所述全部展現(xiàn)處理信息是否符合第一預(yù)定WAP條件;其中,所述步驟包括以下步驟-當(dāng)判斷所述全部展現(xiàn)處理信息不符合第一預(yù)定WAP條件時,根據(jù)所述全部展現(xiàn)處理信息,獲取用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息。4.根據(jù)權(quán)利要求3所述的方法,其中,所述步驟b還包括以下步驟-當(dāng)所述全部展現(xiàn)處理信息符合第一預(yù)定WAP條件時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。5.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟b包括以下步驟bl’基于所述網(wǎng)頁內(nèi)容信息來獲取部分展現(xiàn)處理信息;b2’判斷所述部分展現(xiàn)處理信息是否符合第二預(yù)定WAP條件;b3’當(dāng)所述部分展現(xiàn)處理信息符合第二預(yù)定WAP條件時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。6.根據(jù)權(quán)利要求5所述的方法,其中,所述步驟b還包括以下步驟b4’當(dāng)判斷所述部分展現(xiàn)處理信息不符合第二預(yù)定WAP條件時,基于所述網(wǎng)頁內(nèi)容信息來獲取其他展現(xiàn)處理信息;b5’根據(jù)所述其他展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第二評價信息;b6’判斷所述第二評價信息是否符合第二預(yù)定條件,以確定所述待識別網(wǎng)頁是否為WAP網(wǎng)頁。7.根據(jù)權(quán)利要求6所述的方法,其中,所述步驟沾’包括以下步驟-根據(jù)所述其他展現(xiàn)處理信息以及所述部分展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第二評價信息。8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其中,所述基于網(wǎng)頁內(nèi)容信息獲得部分或全部展現(xiàn)處理信息的步驟包括-基于所述網(wǎng)頁內(nèi)容信息來對所述待識別網(wǎng)頁進(jìn)行網(wǎng)頁渲染處理,以獲得所述部分或全部展現(xiàn)處理信息。9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其中,該方法在所述步驟a之后還包括以下步驟-由所述網(wǎng)頁內(nèi)容信息中獲取用于直接確定待識別網(wǎng)頁是否為WAP網(wǎng)頁的代碼語言相關(guān)信息;-判斷所述代碼語言相關(guān)信息是否包含預(yù)定類型信息;-當(dāng)判斷所述代碼語言相關(guān)信息不包含預(yù)定類型信息時,執(zhí)行所述步驟b。10.根據(jù)權(quán)利要求9所述的方法,其中,該方法還包括以下步驟-當(dāng)判斷所述代碼語言相關(guān)信息包含預(yù)定類型信息時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。11.根據(jù)權(quán)利要求9或10所述的方法,其中,所述代碼語言相關(guān)信息包括以下至少一項(xiàng)fn息-所述待識別網(wǎng)頁的代碼語言類型標(biāo)簽;-制訂或維護(hù)所述待識別網(wǎng)頁所采用的代碼語言和/或代碼語言相關(guān)協(xié)議的機(jī)構(gòu)信息;-所述待識別網(wǎng)頁所采用的代碼語言的版本信息。12.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法,其中,該方法還包括以下步驟i當(dāng)確定所述待識別網(wǎng)頁為WAP網(wǎng)頁時,對該待識別網(wǎng)頁執(zhí)行相應(yīng)操作。13.根據(jù)權(quán)利要求12所述的方法,其中,所述相應(yīng)操作包括以下至少一項(xiàng)-將所述待識別網(wǎng)頁標(biāo)記為WAP網(wǎng)頁;-將所述待識別網(wǎng)頁或其對應(yīng)的資源候選項(xiàng)提供給用戶設(shè)備。14.根據(jù)權(quán)利要求13所述的方法,其中,所述相應(yīng)操作包括將所述待識別網(wǎng)頁或其對應(yīng)的資源候選項(xiàng)提供給用戶設(shè)備,其中,該方法還包括以下步驟-獲取來自用戶設(shè)備的網(wǎng)頁搜索請求;-基于所述網(wǎng)頁搜索請求,獲取多個網(wǎng)頁;-將所獲取的多個網(wǎng)頁中的每個網(wǎng)頁作為所述待識別網(wǎng)頁,以對每個待識別網(wǎng)頁執(zhí)行所述步驟a和b,并對至少一個判斷為WAP網(wǎng)頁的待識別網(wǎng)頁執(zhí)行所述步驟i。15.根據(jù)權(quán)利要求1至14中任一項(xiàng)所述的方法,其中,所述展現(xiàn)處理信息包括以下至少一類信息-所述待識別網(wǎng)頁的網(wǎng)頁元素的屬性信息;-所述待識別網(wǎng)頁的網(wǎng)頁元素的數(shù)量信息和/或網(wǎng)頁元素間的包含關(guān)系信息;-所述待識別網(wǎng)頁包含的文本信息中的關(guān)鍵詞信息。16.一種用于識別WAP網(wǎng)頁的網(wǎng)頁識別裝置,其中,所述網(wǎng)頁識別裝置包括第一獲取裝置,用于獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息;第一確定裝置,用于根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。17.根據(jù)權(quán)利要求16所述的網(wǎng)頁識別裝置,其中,所述第一確定裝置包括第一信息獲取裝置,用于基于所述網(wǎng)頁內(nèi)容信息來獲取全部展現(xiàn)處理信息;第一評價獲取裝置,用于根據(jù)所述全部展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息;3第一判斷裝置,用于判斷所述第一評價信息是否符合第一預(yù)定條件,以確定所述待識別網(wǎng)頁是否為WAP網(wǎng)頁。18.根據(jù)權(quán)利要求17所述的網(wǎng)頁識別裝置,其中,所述第一確定裝置還包括第二判斷裝置,用于判斷所述全部展現(xiàn)處理信息是否符合第一預(yù)定WAP條件;其中,所述第一評價獲取裝置包括第一子評價獲取裝置,用于當(dāng)判斷所述全部展現(xiàn)處理信息不符合第一預(yù)定WAP條件時,根據(jù)所述全部展現(xiàn)處理信息,獲取用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第一評價信息。19.根據(jù)權(quán)利要求18所述的網(wǎng)頁識別裝置,其中,所述第一確定裝置還包括第一子確定裝置,用于當(dāng)所述全部展現(xiàn)處理信息符合第一預(yù)定WAP條件時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。20.根據(jù)權(quán)利要求16所述的網(wǎng)頁識別裝置,其中,所述第一確定裝置包括第二信息獲取裝置,用于基于所述網(wǎng)頁內(nèi)容信息來獲取部分展現(xiàn)處理信息;第三判斷裝置,用于判斷所述部分展現(xiàn)處理信息是否符合第二預(yù)定WAP條件;第二子確定裝置,用于當(dāng)所述部分展現(xiàn)處理信息符合第二預(yù)定WAP條件時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。21.根據(jù)權(quán)利要求20所述的網(wǎng)頁識別裝置,其中,所述第一確定裝置還包括第三信息獲取裝置,用于當(dāng)判斷所述部分展現(xiàn)處理信息不符合第二預(yù)定WAP條件時,基于所述網(wǎng)頁內(nèi)容信息來獲取其他展現(xiàn)處理信息;第二評價獲取裝置,用于根據(jù)所述其他展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第二評價信息;第三子確定裝置,用于判斷所述第二評價信息是否符合第二預(yù)定條件,以確定所述待識別網(wǎng)頁是否為WAP網(wǎng)頁。22.根據(jù)權(quán)利要求21所述的網(wǎng)頁識別裝置,其中,所述第二評價獲取裝置包括第二子評價裝置,用于根據(jù)所述其他展現(xiàn)處理信息以及所述部分展現(xiàn)處理信息,獲得用于確定所述待識別網(wǎng)頁與WAP網(wǎng)頁符合度的第二評價信息。23.根據(jù)權(quán)利要求16至22中任一項(xiàng)所述的網(wǎng)頁識別裝置,其中,網(wǎng)頁識別裝置通過自身所包含的第四子確定裝置來基于所述網(wǎng)頁內(nèi)容信息獲得部分或全部展現(xiàn)處理信息所述第四子確定裝置用于基于所述網(wǎng)頁內(nèi)容信息來對所述待識別網(wǎng)頁進(jìn)行網(wǎng)頁渲染處理,以獲得所述部分或全部展現(xiàn)處理信息。24.根據(jù)權(quán)利要求16至23中任一項(xiàng)所述的網(wǎng)頁識別裝置,其中,該網(wǎng)頁識別裝置還包括第二獲取裝置,用于由所述網(wǎng)頁內(nèi)容信息中獲取用于直接確定待識別網(wǎng)頁是否為WAP網(wǎng)頁的代碼語言相關(guān)信息;第四判斷裝置,用于判斷所述代碼語言相關(guān)信息是否包含預(yù)定類型信息;確定觸發(fā)裝置,用于當(dāng)判斷所述代碼語言相關(guān)信息不包含預(yù)定類型信息時,觸發(fā)所述第一確定裝置執(zhí)行操作。25.根據(jù)權(quán)利要求M所述的網(wǎng)頁識別裝置,其中,該網(wǎng)頁識別裝置還包括第二確定裝置,用于當(dāng)判斷所述代碼語言相關(guān)信息包含預(yù)定類型信息時,確定所述待識別網(wǎng)頁為WAP網(wǎng)頁。26.根據(jù)權(quán)利要求M或25所述的網(wǎng)頁識別裝置,其中,所述代碼語言相關(guān)信息包括以下至少一項(xiàng)信息-所述待識別網(wǎng)頁的代碼語言的類型標(biāo)簽信息;-制訂或維護(hù)所述待識別網(wǎng)頁所采用的代碼語言和/或代碼語言相關(guān)協(xié)議的機(jī)構(gòu)信息;-所述待識別網(wǎng)頁所采用的代碼語言的版本信息。27.根據(jù)權(quán)利要求16至沈中任一項(xiàng)所述的網(wǎng)頁識別裝置,其中,該網(wǎng)頁識別裝置還包括執(zhí)行裝置,用于當(dāng)確定所述待識別網(wǎng)頁為WAP網(wǎng)頁時,對該待識別網(wǎng)頁執(zhí)行相應(yīng)操作。28.根據(jù)權(quán)利要求27所述的網(wǎng)頁識別裝置,其中,所述執(zhí)行裝置通過所包含的以下至少一種裝置來執(zhí)行相應(yīng)操作標(biāo)記裝置,用于將所述待識別網(wǎng)頁標(biāo)記為WAP網(wǎng)頁;提供裝置,用于將所述待識別網(wǎng)頁或其對應(yīng)的資源候選項(xiàng)提供給用戶設(shè)備。29.根據(jù)權(quán)利要求觀所述的網(wǎng)頁識別裝置,其中,所述執(zhí)行裝置包含提供裝置,其中,該網(wǎng)頁識別裝置還包括第三獲取裝置,用于獲取來自用戶設(shè)備的網(wǎng)頁搜索請求;第四獲取裝置,用于基于所述網(wǎng)頁搜索請求,來獲取多個網(wǎng)頁;識別觸發(fā)裝置,用于將所獲取的多個網(wǎng)頁中的每個網(wǎng)頁作為所述待識別網(wǎng)頁,以觸發(fā)所述第一獲取裝置和第一確定裝置對每個待識別網(wǎng)頁執(zhí)行操作,并使所述提供裝置對至少一個判斷為WAP網(wǎng)頁的待識別網(wǎng)頁執(zhí)行操作。30.根據(jù)權(quán)利要求16至四中任一項(xiàng)所述的網(wǎng)頁識別裝置,其中,所述展現(xiàn)處理信息包括以下至少一類信息-所述待識別網(wǎng)頁的網(wǎng)頁元素的屬性信息;-所述待識別網(wǎng)頁的網(wǎng)頁元素的數(shù)量信息和/或網(wǎng)頁元素間的包含關(guān)系信息;-所述待識別網(wǎng)頁包含的文本信息中的關(guān)鍵詞信息。31.一種計算機(jī)設(shè)備,其中,該計算機(jī)設(shè)備包含如權(quán)利要求16至30中至少一項(xiàng)所述的網(wǎng)頁識別裝置。全文摘要本發(fā)明的目的是提供一種用于識別WAP網(wǎng)頁的方法、裝置和設(shè)備。根據(jù)本發(fā)明的方案以下步驟獲取待識別網(wǎng)頁的網(wǎng)頁內(nèi)容信息;根據(jù)基于所述網(wǎng)頁內(nèi)容信息獲得的全部或部分展現(xiàn)處理信息來判斷所述待識別網(wǎng)頁是否為WAP網(wǎng)頁,其中,所述展現(xiàn)處理信息與所述待識別網(wǎng)頁的展現(xiàn)和/或處理復(fù)雜度相關(guān)。與現(xiàn)有技術(shù)相比,本發(fā)明通過獲取其網(wǎng)頁內(nèi)容信息進(jìn)行識別和判斷,提高了識別WAP網(wǎng)頁的準(zhǔn)確率,并通過獲得全部展現(xiàn)處理信息的評價信息,以根據(jù)評價信息來獲得更加全面客觀的評價結(jié)果,能夠獲得更加合理準(zhǔn)確的識別結(jié)果。文檔編號G06F17/30GK102306185SQ20111025328公開日2012年1月4日申請日期2011年8月30日優(yōu)先權(quán)日2011年8月30日發(fā)明者史春奇,蒲鵬申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司