網(wǎng)絡(luò)行為日志時間校正方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)行為日志時間校正方法和裝置。
【背景技術(shù)】
[0002] 在互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,網(wǎng)絡(luò)媒體經(jīng)常需要互聯(lián)網(wǎng)數(shù)據(jù)公司使用技術(shù)手段收集用戶行 為數(shù)據(jù)。例如用戶訪問的網(wǎng)頁,用戶在該網(wǎng)頁中的行為類型,用戶訪問該網(wǎng)頁的時間等。對 這些網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行分析并分類,以日志的形式保存。通過分析這些數(shù)據(jù)不斷地改進(jìn)網(wǎng) 絡(luò)媒體的服務(wù),例如更新媒體的網(wǎng)站和軟件,或是通過這些數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)活動的監(jiān)測等。
[0003] 在這些數(shù)據(jù)中,用戶行為時間數(shù)據(jù)不同于其他行為數(shù)據(jù)。多種外界因素可導(dǎo)致行 為時間數(shù)據(jù)的采集出現(xiàn)誤差。例如,一個用戶在訪問互聯(lián)網(wǎng)的網(wǎng)頁時,不同的監(jiān)測系統(tǒng)所監(jiān) 測到的時間信息可能存在差異。系統(tǒng)產(chǎn)生的行為日志記錄的既有可能是客戶端的當(dāng)前時 間,亦有可能是服務(wù)器的當(dāng)前時間。對于互聯(lián)網(wǎng)用戶的網(wǎng)絡(luò)行為,若監(jiān)測系統(tǒng)沒有讀取客戶 端時間的權(quán)限,則此監(jiān)測系統(tǒng)無法記錄網(wǎng)絡(luò)行為發(fā)生時的客戶端時間;而如果一個監(jiān)測系 統(tǒng)無法在用戶行為發(fā)生時即時地向服務(wù)器發(fā)送日志數(shù)據(jù),而是采用延后傳輸?shù)姆绞?,則此 監(jiān)測系統(tǒng)無法記錄網(wǎng)絡(luò)行為發(fā)生時的服務(wù)器時間。一般而言,用戶客戶端的當(dāng)前時間會由 于客戶所在地域,或人為修改等原因而與服務(wù)器的當(dāng)前時間不一致。由于這個因素導(dǎo)致收 集到的行為時間數(shù)據(jù)的誤差,會嚴(yán)重影響數(shù)據(jù)分析的準(zhǔn)確度。錯誤的行為時間收集會導(dǎo)致 數(shù)據(jù)匹配不統(tǒng)一,或網(wǎng)絡(luò)行為分類錯誤,進(jìn)而誤導(dǎo)媒體進(jìn)行互聯(lián)網(wǎng)服務(wù)系統(tǒng)更新的方向,產(chǎn) 生利益損害。
[0004] 目前現(xiàn)有的時間對齊技術(shù)主要通過數(shù)據(jù)包傳輸對客戶端時間進(jìn)行校正。客戶端 發(fā)送請求從服務(wù)器端獲取服務(wù)器的當(dāng)前時間,并根據(jù)這個時間和自身的當(dāng)前時間之間的差 值,對自身的當(dāng)前時間進(jìn)行調(diào)整。通常,網(wǎng)絡(luò)行為的監(jiān)測系統(tǒng)并不具有修改客戶端時間的權(quán) 限。同時,以監(jiān)測為目的的系統(tǒng)也不應(yīng)該隨意修改客戶端時間。因此,我們急需一種技術(shù)手 段來解決在不修改客戶端時間的情況下,自動校正日志中的行為訪問時間的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供了一種網(wǎng)絡(luò)行為日志時間校正方法和裝置,解決了校正日志中的行為 訪問時間的問題。
[0006] -種網(wǎng)絡(luò)行為日志時間校正方法,包括;
[0007] 服務(wù)器采集接收到的日志數(shù)據(jù)包的時間數(shù)據(jù)信息,所述時間數(shù)據(jù)信息包括用戶行 為發(fā)生時客戶端的時間、客戶端上傳所述數(shù)據(jù)包的日志上傳時客戶端時間和服務(wù)器日志上 傳時間;
[0008] 將所述用戶行為發(fā)生時客戶端的時間轉(zhuǎn)換為用戶行為發(fā)生時服務(wù)器的時間;
[0009] 根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時間差,將所述用戶行為發(fā)生時服務(wù)器的時 間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時間。
[0010] 優(yōu)選的,所述采集服務(wù)器接收到的日志數(shù)據(jù)包的時間數(shù)據(jù)信息的步驟之前,還包 括:
[0011] 客戶端采集樣本日志數(shù)據(jù)包,所述樣本日志數(shù)據(jù)包包括用戶網(wǎng)絡(luò)活動時的用戶機(jī) ID、訪問頁面和用戶行為發(fā)生時客戶端的時間;
[0012] 所述客戶端將所述樣本日志數(shù)據(jù)包以日志數(shù)據(jù)包的形式上傳至所述服務(wù)器;
[0013] 所述服務(wù)器接收到所述日志數(shù)據(jù)包時,為所述日志數(shù)據(jù)包附上所述服務(wù)器當(dāng)前的 本地時間,作為日志上傳時服務(wù)器時間。
[0014] 優(yōu)選的,該方法還包括:
[0015] 所述服務(wù)器存儲接收到的日志數(shù)據(jù)包。
[0016] 優(yōu)選的,將所述用戶行為發(fā)生時客戶端的時間轉(zhuǎn)換為用戶行為發(fā)生時服務(wù)器的時 間包括:
[0017] 提取用戶行為發(fā)生時客戶端的時間,記做客戶端日志時間;
[0018] 提取行為日志上傳時的服務(wù)器時間,記做服務(wù)器日志上傳時間;
[0019] 提取所述行為日志上傳時客戶端的時間,記做客戶端日志上傳時間;
[0020] 根據(jù)以下表達(dá)式計算服務(wù)器日志時間:
[0021] 服務(wù)器日志時間=客戶端日志時間+服務(wù)器日志上傳時間-客戶端日志上傳時 間;
[0022] 提取所述服務(wù)器日志時間,并將所述服務(wù)器日志時間存儲于日志數(shù)據(jù)包中。
[0023] 優(yōu)選的,所述根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時間差,將所述用戶行為發(fā)生 時服務(wù)器的時間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時間包括:
[0024] 采集標(biāo)準(zhǔn)服務(wù)器及所述服務(wù)器的當(dāng)前時間,作為臨時數(shù)據(jù),存儲于日志數(shù)據(jù)包 中;
[0025]提取所述服務(wù)器日志時間;
[0026] 利用以下表達(dá)式計算日志標(biāo)準(zhǔn)時間:
[0027] 日志標(biāo)準(zhǔn)時間=服務(wù)器日志時間+標(biāo)準(zhǔn)服務(wù)器時間一服務(wù)器時間;
[0028] 提取所述日志標(biāo)準(zhǔn)時間,并將所述日志標(biāo)準(zhǔn)時間存儲于日志數(shù)據(jù)包中;
[0029] 從日志數(shù)據(jù)包中刪除標(biāo)準(zhǔn)服務(wù)器時間及存儲服務(wù)器時間。
[0030] 本發(fā)明還提供了一種網(wǎng)絡(luò)行為日志時間校正裝置,包括:
[0031] 數(shù)據(jù)信息采集模塊,用于采集接收到的日志數(shù)據(jù)包的時間數(shù)據(jù)信息,所述時間數(shù) 據(jù)信息包括用戶行為發(fā)生時客戶端的時間、客戶端上傳所述數(shù)據(jù)包的日志上傳時客戶端時 間和服務(wù)器日志上傳時間;
[0032] 第一時間轉(zhuǎn)換模塊,用于將所述用戶行為發(fā)生時客戶端的時間轉(zhuǎn)換為用戶行為發(fā) 生時服務(wù)器的時間;
[0033] 第二時間轉(zhuǎn)換模塊,用于根據(jù)服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時間差,將所述用戶行 為發(fā)生時服務(wù)器的時間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時間。
[0034] 優(yōu)選的,該裝置還包括:
[0035]日志上傳時服務(wù)器時間標(biāo)定模塊,用于在接收到客戶端上傳的日志數(shù)據(jù)包時,為 所述日志數(shù)據(jù)包附上所述服務(wù)器當(dāng)前的本地時間,作為日志上傳時服務(wù)器時間。
[0036] 優(yōu)選的,該裝置還包括:
[0037] 存儲模塊,用于存儲接收到的日志數(shù)據(jù)包。
[0038] 優(yōu)選的,所述第一時間轉(zhuǎn)換模塊包括:
[0039] 客戶端日志時間提取單元,用于提取用戶行為發(fā)生時客戶端的時間,記做客戶端 日志時間;
[0040] 服務(wù)器日志上傳時間提取單元,用于提取行為日志上傳時的服務(wù)器時間,記做服 務(wù)器日志上傳時間;
[0041] 客戶端日志上傳時間提取單元,用于提取所述行為日志上傳時客戶端的時間,記 做客戶端日志上傳時間;
[0042] 服務(wù)器日志時間計算單元,用于根據(jù)以下表達(dá)式計算服務(wù)器日志時間:
[0043] 服務(wù)器日志時間=客戶端日志時間+服務(wù)器日志上傳時間-客戶端日志上傳時 間;
[0044] 服務(wù)器日志時間存儲單元,用于提取所述服務(wù)器日志時間,并將所述服務(wù)器日志 時間存儲于日志數(shù)據(jù)包中。
[0045] 優(yōu)選的,所述第二時間轉(zhuǎn)換模塊包括:
[0046] 臨時數(shù)據(jù)采集單元,用于采集標(biāo)準(zhǔn)服務(wù)器及所述服務(wù)器的當(dāng)前時間,作為臨時數(shù) 據(jù),存儲于日志數(shù)據(jù)包中;
[0047] 服務(wù)器日志時間提取單元,用于提取所述服務(wù)器日志時間;
[0048] 日志標(biāo)準(zhǔn)時間計算單元,用于利用以下表達(dá)式計算日志標(biāo)準(zhǔn)時間:
[0049] 日志標(biāo)準(zhǔn)時間=服務(wù)器日志時間+標(biāo)準(zhǔn)服務(wù)器時間一服務(wù)器時間;
[0050] 日志標(biāo)準(zhǔn)時間提取單元,用于提取所述日志標(biāo)準(zhǔn)時間,并將所述日志標(biāo)準(zhǔn)時間存 儲于日志數(shù)據(jù)包中;
[0051] 數(shù)據(jù)清除單元,用于從日志數(shù)據(jù)包中刪除標(biāo)準(zhǔn)服務(wù)器時間及存儲服務(wù)器時間。
[0052] 本發(fā)明提供了一種網(wǎng)絡(luò)行為日志時間校正方法和裝置,服務(wù)器采集接收到的日志 數(shù)據(jù)包的時間數(shù)據(jù)信息,所述時間數(shù)據(jù)信息包括用戶行為發(fā)生時客戶端的時間、客戶端上 傳所述數(shù)據(jù)包的日志上傳時客戶端時間和服務(wù)器日志上傳時間,將所述用戶行為發(fā)生時客 戶端的時間轉(zhuǎn)換為用戶行為發(fā)生時服務(wù)器的時間,根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時 間差,將所述用戶行為發(fā)生時服務(wù)器的時間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時間,實現(xiàn)了在不修改客 戶端時間的前提下對日志中的行為訪問時間進(jìn)行校正,使得不同來源的日志數(shù)據(jù)中的時間 信息統(tǒng)一到一個標(biāo)準(zhǔn)的時間軸上,解決了校正日志中的行為訪問時間的問題。
【附圖說明】
[0053] 圖1為本發(fā)明的實施例一提供的一種網(wǎng)絡(luò)行為日志時間校正方法的流程圖;
[0054] 圖2為本發(fā)明的實施例三提供的一種網(wǎng)絡(luò)行為日志時間校正裝置的結(jié)構(gòu)示意圖;
[0055] 圖3為圖2中第一時間轉(zhuǎn)換模塊202的結(jié)構(gòu)示意圖;
[0056] 圖4為圖2中第二時間轉(zhuǎn)換模塊203的結(jié)構(gòu)示意圖。
【具體實施方式】
[0057]目前現(xiàn)有的時間對齊技術(shù)主要通過數(shù)據(jù)包傳輸對客戶端時間進(jìn)行校正。客戶端 發(fā)送請求從服務(wù)器端獲取服務(wù)器的當(dāng)前時間,并根據(jù)這個時間和自身的當(dāng)前時間之間的差 值,對自身的當(dāng)前時間進(jìn)行調(diào)整。通常,網(wǎng)絡(luò)行為的監(jiān)測系統(tǒng)并不具有修改客戶端時間的權(quán) 限。同時,以監(jiān)測為目的的系統(tǒng)也不應(yīng)該隨意修改客戶端時間。因此,我們急需一種技術(shù)手 段來解決在不修改客戶端時間的情況下,自動校正日志中的行為訪問時間的問題。
[0058] 為了解決上述問題,本發(fā)明的實施例提供了一種網(wǎng)絡(luò)行為日志時間校正方法。下 文中將結(jié)合附圖對本發(fā)明的實施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申 請中的實施例及實施例中的特征可以相互任意組合。
[0059] 本發(fā)明的實施例提供了一種網(wǎng)絡(luò)行為日志時間校正方法。首先采集樣本日志數(shù)據(jù) 包,然后統(tǒng)計所述樣本日志數(shù)據(jù)包中的時間信息,其中包括網(wǎng)絡(luò)行為發(fā)生時,用戶客戶端的 當(dāng)前時間,以及用戶行為數(shù)據(jù)上傳服務(wù)器時,攜帶的客戶端的當(dāng)前時間。通過時間差補(bǔ)償?shù)?方法,將各個數(shù)據(jù)源時間映射到統(tǒng)一的標(biāo)準(zhǔn)服務(wù)器時間軸上,從達(dá)到通過標(biāo)準(zhǔn)時間進(jìn)行不 同日志的時間對齊。
[0060] 下面結(jié)合附圖,對本發(fā)明的實施例一進(jìn)行說明。
[0061] 本發(fā)明實施例提出了一種網(wǎng)絡(luò)行為日志時間校正方法,使用該方法完成對日志時 間校正的流程如圖1所示,包括:
[0062] 步驟101、客戶端采集樣本日志數(shù)據(jù)包;
[0063] 本步驟中,采集用戶客戶端數(shù)據(jù)源的時間數(shù)據(jù)及服務(wù)器端的時間數(shù)據(jù)。
[0064] 具體的,通過在網(wǎng)絡(luò)行為發(fā)生的網(wǎng)頁中、訪問頁面中的Flash動畫、JavaScript腳 本中嵌入代碼,也可以在用戶機(jī)瀏覽器上安裝插件,亦或是在客戶端植入模塊等技術(shù)方案, 收集到用戶網(wǎng)絡(luò)活動的一組數(shù)據(jù),其中包括用戶機(jī)ID、訪問頁面、用戶行為發(fā)生時客戶端的 當(dāng)前時間等。
[0065]