一種曝光日志采集系統和方法
【技術領域】
[0001]本發明涉及到一種網頁日志采集系統和方法,更具體地涉及到一種網頁曝光日志采集系統和方法。
【背景技術】
[0002]商品的曝光日志是電子商務網站的重要運營數據,它是商品推薦效果評價,轉化率分析等工作的必不可少的基礎數據。
[0003]在現有技術中,有很多針對商品價格的數據采集方案,如申請號為200410062211.4,發明名稱為“利用網絡爬行者程序在網上進行價格收集的方法”的中國專利申請公開了一種利用網絡爬蟲程序在網上進行價格收集的方法;在申請號為201220055227.2,發明名稱為“一種戶外價格采集對比裝置”的中國專利申請公開了一種戶外價格采集對比裝置,主要用于消費者獲取商品信息并與消費數據庫數據進行對比。
[0004]但是,在現有技術中,還沒有針對商品曝光的數據進行采集的系統或方法。
【發明內容】
[0005]針對電子商務網站中對曝光日志進行采集的需要,依據本發明的一個方面,本發明提供了一種曝光日志采集系統,所述系統包括網頁前端服務器、網頁瀏覽客戶端和曝光日志采集服務器,其特征在于,
[0006]所述網頁前端服務器提供包含具有唯一標示的曝光元素的網頁和曝光數據采集工具;
[0007]所述網頁瀏覽客戶端下載所述曝光數據采集工具,當曝光元素加載成功后進行曝光數據采集,所述曝光數據采集工具從網頁提取曝光元素并向曝光日志采集服務器發送包含有所述曝光元素的唯一標示以及相關信息的曝光數據;
[0008]所述曝光日志采集服務器接收上述曝光數據,并在對該數據進行處理后寫入曝光日志。
[0009]優選地,在上述的曝光日志采集系統中,所述曝光數據采集工具被設置在網頁的特定位置啟動,所述特定位置表明所述曝光元素已經加載成功。
[0010]優選地,在上述的曝光日志采集系統中,所述曝光數據采集工具具有如下工作情旦牙、:
[0011]在曝光元素同步加載并且特定信息被成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0012]在曝光元素同步加載并且特定信息沒有成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0013]在曝光元素異步加載并且特定信息被成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0014]在曝光元素異步加載并且特定信息沒有成功展示時所述曝光數據采集工具進行曝光數據采集。
[0015]優選地,在上述的曝光日志采集系統中,所述曝光數據采集工具向曝光日志采集服務器發送的相關信息中包含訪問數據唯一標示、城市標示和cookield中的一個或多個。
[0016]優選地,在上述的曝光日志采集系統中,所述系統還包括映射服務器,當所述曝光日志采集服務器接收到cookield時,所述曝光日志采集服務器將該cookield推送給所述映射服務器進行cookield映射,然后才寫入曝光日志。
[0017]另外一個方面,本發明提供了一種使用權利要求1中所述系統進行曝光日志采集的方法,其特征在于,所述方法包括如下步驟:
[0018]所述網頁瀏覽客戶端下載曝光數據采集工具以及包含具有唯一標示的曝光元素的網頁;
[0019]在曝光元素加載成功后,啟動所述曝光數據采集工具;
[0020]所述曝光數據采集工具從網頁提取曝光元素的唯一標示以及相關信息,并組織成曝光數據;
[0021 ] 所述曝光數據采集工具將上述曝光數據發送給所述曝光日志采集服務器;
[0022]所述曝光日志采集服務器接收所述曝光數據,并且在對所述數據進行處理后寫入曝光日志。
[0023]優選地,在上述曝光日志采集方法中,所述曝光數據采集工具在頁面的特定位置啟動,所述位置表明所述曝光元素已經加載成功。
[0024]優選地,在上述曝光日志采集方法中,其特征在于,
[0025]在曝光元素同步加載并且特定信息被成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0026]在曝光元素同步加載并且特定信息沒有成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0027]在曝光元素異步加載并且特定信息被成功展示時所述曝光數據采集工具進行曝光數據采集;或
[0028]在曝光元素異步加載并且特定信息沒有成功展示時所述曝光數據采集工具進行曝光數據采集。
[0029]優選地,在上述曝光日志采集方法中,所述曝光數據采集工具向曝光日志采集服務器發送的相關信息中包含訪問數據唯一標不、城市標不和cookield中的一個或多個。
[0030]優選地,在上述曝光日志采集方法中,所述系統還包括映射服務器,當所述曝光日志采集服務器接收到cookield時,所述曝光日志采集服務器將該cookield推送給所述映射服務器進行cookield映射,然后才寫入曝光日志。
[0031]上述曝光日志采集系統和方法,可以應諸如同步加載、異步加載、展示、不展示等各種要求完成曝光日志的采集,并且能通過映射服務器的cookield映射來保護用戶的隱私。
【附圖說明】
[0032]圖1為本發明所述的曝光日志采集系統的示意圖;
[0033]圖2為本發明所述的曝光日志采集方法的執行步驟。
【具體實施方式】
[0034]下面將結合具體實施例對本發明進行詳細說明,但應該明白的是,這些實施例僅用來說明本發明,并不構成對本發明的限定。參考圖1,根據本發明的一個實施例,所述的曝光日志采集系統包括網頁前端服務器1、網頁瀏覽客戶端2和曝光日志采集服務器3。
[0035]其中,網頁前端服務器1上提供了一系列的商品展示網頁和曝光數據采集工具。其中,例如包含有某個品牌電視機的商品展示網頁,在所述網頁中包含有如下曝光元素,艮P,網頁中包含如下標簽:
[0036]<a id = "baoguang_100100123">〈/a>
[0037]其中baoguang_是曝光元素的特定前綴,100100123是該曝光元素的唯一標示。
[0038]在本實施例中曝光數據采集工具是一段javascript代碼,為了加載曝光數據采集工具,在所述網頁的開始段中包括如下script標簽:
[0039]〈script type = "text/javascripi/'src = "baoguang.js^X/script)
[0040]用于在網頁瀏覽客戶端2打開上述商品網頁時加載曝光數據采集工具。
[0041]上述javascript曝光數據采集工具baoguang.js中包括有曝光數據采集方法OnBaoguang ()。
[0042]為了在網頁瀏覽客戶端2加載上述商品展示網頁的曝光元素之后進行曝光數據采集,開發人員會在其網頁的一個特定位置調用上述工具中的曝光數據采集方法,該位置能確保曝光元素加載完成:
[0043]〈script type = //text/javascript//>OnBaoguang () </script>
[0044]該方法OnBaoguangO會對加載的網頁進行分析,獲取該網頁中的a標簽,并將符合特定格式的元素識別為曝光元素,在本實施例中,如果id是以baoguang_開頭,則被識別為曝光元素。
[0045]識別出曝光元素后,上述曝光數據采集工具提取所述曝光元素的唯一標示100100123,以及該商品相關的信息,如城市標示cityld,以及用以標定用戶的cookield等構造成一個曝光數據,即一個完整的字符串發送給曝光日志采集服務器3。
[0046]所述曝光日志采集服務器3接收上述曝光數據后,會進行相應的處理,將相應的信息寫入曝光日志。
[0047]在上述實施例中,曝光元素與網頁是同步加載的,并且只有在曝光元素與網頁同步加載時才進行曝光數據采集。
[0048]在另外一個實施例中,曝光元素與網頁是異步加載的,這種異步加載可以通過javascript的異步特性或是通過網頁加載回調來實現。并且,在該異步加載情況下,仍然進行曝光數據采集。
[0049]在其它的實施例中,是否進行曝光數據采集是與特定的網頁內容是否已經加載相聯系的。
[0050]例如,在一個實施例中,曝光數據采集僅在商品圖片被成功展示后才進行,S卩,在上述javascript曝光數據采集工具中對商