一種監(jiān)測(cè)網(wǎng)絡(luò)訪問活動(dòng)的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及的是一種監(jiān)測(cè)網(wǎng)絡(luò)訪問活動(dòng)的方法和 系統(tǒng)。
【背景技術(shù)】
[0002] 在網(wǎng)絡(luò)廣告、網(wǎng)絡(luò)調(diào)查、在線投票及選舉等網(wǎng)絡(luò)活動(dòng)中,網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)起著至關(guān)重 要的作用,對(duì)網(wǎng)絡(luò)活動(dòng)數(shù)據(jù)的精確監(jiān)測(cè)和分析可有效的保證網(wǎng)絡(luò)活動(dòng)的質(zhì)量,提高調(diào)研結(jié) 果的精確度。目前常見的數(shù)據(jù)監(jiān)測(cè)指標(biāo)包括曝光數(shù)量、獨(dú)立訪問者數(shù)量、到達(dá)頻次Reach 等,而到達(dá)頻次又可細(xì)化為至少曝光1次、2次、3次、……、N次的獨(dú)立訪問者數(shù)量等。其 中,獨(dú)立訪問者數(shù)量和Reach的計(jì)算均依賴于對(duì)獨(dú)立訪問者的準(zhǔn)確識(shí)別。假設(shè)監(jiān)測(cè)到三次 曝光,其中兩次曝光被識(shí)別為同一個(gè)獨(dú)立訪問者,另外一次曝光被識(shí)別為另一個(gè)獨(dú)立訪問 者,則獨(dú)立訪問者數(shù)量為2,至少曝光1次的獨(dú)立訪問者的數(shù)量為2,至少曝光2次的獨(dú)立訪 問者的數(shù)量為1,至少曝光3次和3次以上的獨(dú)立訪問者數(shù)量均為0。
[0003] 目前,相關(guān)技術(shù)中主要利用終端cookie來識(shí)別獨(dú)立訪問者。當(dāng)用戶訪問被監(jiān)測(cè)網(wǎng) 頁時(shí),被監(jiān)測(cè)網(wǎng)頁中嵌入的代碼會(huì)要求用戶使用的瀏覽器向廣告監(jiān)測(cè)服務(wù)器發(fā)起HTTP請(qǐng) 求。廣告監(jiān)測(cè)服務(wù)器會(huì)判斷HTTP請(qǐng)求是否包含cookie,對(duì)于不包含cookie的請(qǐng)求會(huì)在用戶 終端植入cookie。然后,廣告監(jiān)測(cè)服務(wù)器會(huì)記錄這一請(qǐng)求的信息,例如cookie、用戶的IP、 時(shí)間等,即曝光數(shù)據(jù)。廣告監(jiān)測(cè)服務(wù)器可根據(jù)曝光數(shù)據(jù)中包含的cookie進(jìn)行獨(dú)立訪問者的 識(shí)別。例如,廣告監(jiān)測(cè)服務(wù)器連續(xù)兩次收到包含cookie的請(qǐng)求,并且所述兩次請(qǐng)求中包含 的cookie信息相同,則兩次請(qǐng)求會(huì)被識(shí)別為同一個(gè)獨(dú)立訪問者所發(fā)。但是,隨著大眾對(duì)隱 私問題的關(guān)注程度不斷提高,越來越多的人選擇"關(guān)閉cookie追蹤功能",因此,網(wǎng)絡(luò)監(jiān)測(cè) 系統(tǒng)監(jiān)測(cè)到的部分訪問請(qǐng)求可能不包含cookie,也就無法根據(jù)cookie識(shí)別獨(dú)立訪問者了。
[0004] 另一種識(shí)別獨(dú)立訪問者的方式是利用設(shè)備指紋。設(shè)備指紋是根據(jù)用戶上網(wǎng)設(shè)備的 信息(比如,設(shè)備的操作系統(tǒng)版本及其序列號(hào)、瀏覽器版本及其序列號(hào)、屏幕分辨率、安裝的 插件及其序列號(hào)、使用的IP地址等信息)生成的。當(dāng)用戶訪問被監(jiān)測(cè)網(wǎng)頁時(shí),被監(jiān)測(cè)網(wǎng)頁 中嵌入的代碼會(huì)要求用戶使用的瀏覽器向廣告監(jiān)測(cè)服務(wù)器發(fā)起HTTP請(qǐng)求,所述HTTP請(qǐng)求 中會(huì)包含所述設(shè)備指紋。此方法的缺陷在于:不同設(shè)備可能具有相同的指紋。例如,收集 設(shè)備信息時(shí),可能只收集到瀏覽器標(biāo)識(shí)(比如,IE)信息,而其他信息全部無法收集到,則具 有相同瀏覽器標(biāo)識(shí)的設(shè)備均具有相同的設(shè)備指紋,因此被識(shí)別為同一個(gè)獨(dú)立訪問者。實(shí)際 情況雖然可能沒有這樣簡(jiǎn)單,但是某些更復(fù)雜一點(diǎn)的特征組合也可能普遍存在于多臺(tái)設(shè)備 中,即不同設(shè)備具有相同指紋的情況相當(dāng)普遍。因此,僅僅根據(jù)設(shè)備指紋識(shí)別獨(dú)立訪問者存 在不準(zhǔn)確的情況。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問題是提供一種監(jiān)測(cè)網(wǎng)絡(luò)訪問活動(dòng)的方法和系統(tǒng),能夠提 高對(duì)網(wǎng)絡(luò)訪問行為監(jiān)測(cè)的準(zhǔn)確性。
[0006] 為了解決上述技術(shù)問題,本發(fā)明提供了一種監(jiān)測(cè)網(wǎng)絡(luò)訪問活動(dòng)的方法,包括:
[0007] 監(jiān)測(cè)訪問被監(jiān)測(cè)頁面的全部流量的曝光數(shù)據(jù),其中每一條曝光數(shù)據(jù)均攜帶獨(dú)立訪 問者的設(shè)備指紋信息;
[0008] 將所述曝光數(shù)據(jù)中,攜帶cookie的曝光數(shù)據(jù)保存在樣本集合中,其他曝光數(shù)據(jù)保 存在估算集合中,將cookie作為所述樣本集合中曝光數(shù)據(jù)的獨(dú)立訪問者標(biāo)識(shí),并根據(jù)所述 樣本集合建立設(shè)備指紋與cookie的關(guān)系模型;
[0009] 對(duì)所述估算集合中具有所述關(guān)系模型中某一設(shè)備指紋的每條曝光數(shù)據(jù),根據(jù)所述 關(guān)系模型分配一個(gè)獨(dú)立訪問者標(biāo)識(shí)。
[0010] 進(jìn)一步地,該方法還包括下述特點(diǎn):
[0011] 所述根據(jù)所述樣本集合建立設(shè)備指紋與cookie的關(guān)系模型,包括:
[0012] 根據(jù)所述樣本集合中各條曝光數(shù)據(jù)的設(shè)備指紋和cookie,為每一種設(shè)備指紋建立 一個(gè)訪問子表,在該訪問子表的每條記錄中,保存具有該設(shè)備指紋的一組曝光數(shù)據(jù)所具有 的一種cookie及該cookie在該組曝光數(shù)據(jù)中的出現(xiàn)次數(shù)。
[0013] 進(jìn)一步地,該方法還包括下述特點(diǎn):
[0014] 對(duì)所述估算集合中具有所述關(guān)系模型中某一設(shè)備指紋的每條曝光數(shù)據(jù),根據(jù)所述 關(guān)系模型分配一個(gè)獨(dú)立訪問者標(biāo)識(shí),包括:
[0015] 對(duì)所述估算集合具有所述關(guān)系模型中設(shè)備指紋Fi的M條曝光數(shù)據(jù)分為k+1組, M=kN+M',其中,N為所述樣本集合中具有設(shè)備指紋Fi的曝光數(shù)據(jù)總數(shù),k,M'為自然數(shù);
[0016] 對(duì)其中的k組曝光數(shù)據(jù),將每一組的N條曝光數(shù)據(jù)再劃分為Q個(gè)子組,每一子組對(duì) 應(yīng)設(shè)備指紋Fi的訪問子表中的一條記錄,每一子組的曝光數(shù)據(jù)條數(shù)等于對(duì)應(yīng)記錄中的出 現(xiàn)次數(shù),Q為設(shè)備指紋Fi的訪問子表中的記錄數(shù);
[0017] 對(duì)余下的M'條曝光數(shù)據(jù)組成的一組曝光數(shù)據(jù),將所述M'條曝光數(shù)據(jù)分成Q'個(gè)子 組,Q' <Q,每一子組對(duì)應(yīng)設(shè)備指紋Fi的訪問子表中的一條記錄,且至少有Q' -1個(gè)子組的 曝光數(shù)據(jù)條數(shù)等于對(duì)應(yīng)記錄中的出現(xiàn)次數(shù);
[0018] 為同一組中同一子組的曝光數(shù)據(jù)分配相同的獨(dú)立訪問者標(biāo)識(shí),為不同組或同一組 中不同子組的曝光數(shù)據(jù)分配不同的獨(dú)立訪問者標(biāo)識(shí)。
[0019] 進(jìn)一步地,該方法還包括:
[0020] 根據(jù)所述樣本集合中各條曝光數(shù)據(jù)的cookie建立訪問總表,在所述訪問總表的 每條記錄中,保存所述樣本集合中的曝光數(shù)據(jù)所具有的一種cookie及該cookie在該樣本 集合的曝光數(shù)據(jù)中的出現(xiàn)次數(shù);
[0021] 對(duì)所述估算集合中不具有所述關(guān)系模型中任一設(shè)備指紋的每條曝光數(shù)據(jù),根據(jù)所 述訪問總表分配一個(gè)獨(dú)立訪問者標(biāo)識(shí)。
[0022] 進(jìn)一步地,該方法還包括下述特點(diǎn):
[0023] 所述對(duì)所述估算集合中不具有所述關(guān)系模型中任一設(shè)備指紋的每條曝光數(shù)據(jù),根 據(jù)所述訪問總表分配一個(gè)獨(dú)立訪問者標(biāo)識(shí),包括:
[0024] 將所述估算集合中的全部M條曝光數(shù)據(jù)分為k+1組,M=kN+M',其中,N為所述樣本 集合中的曝光數(shù)據(jù)總數(shù),k,M'為自然數(shù);
[0025] 對(duì)其中的k組曝光數(shù)據(jù),將每一組的N條曝光數(shù)據(jù)再劃分為Q個(gè)子組,每一子組對(duì) 應(yīng)所述訪問總表中的一條記錄,每一子組的曝光數(shù)據(jù)條數(shù)等于對(duì)應(yīng)記錄中的出現(xiàn)次數(shù),Q為 所述混合訪問表中的記錄數(shù);
[0026] 對(duì)余下的M'條曝光數(shù)據(jù)組成的一組曝光數(shù)據(jù),將所述M'條曝光數(shù)據(jù)分成Q'個(gè)子 組,Q' <Q,每一子組對(duì)應(yīng)所述訪問總表中的一條記錄,且至少有Q' -1個(gè)子組的曝光數(shù)據(jù) 條數(shù)等于對(duì)應(yīng)記錄中的出現(xiàn)次數(shù);
[0027] 為同一組中同一子組的曝光數(shù)據(jù)分配相同的獨(dú)立訪問者標(biāo)識(shí),為不同組或同一組 中不同子組的曝光數(shù)據(jù)分配不同的獨(dú)立訪問者標(biāo)識(shí)。
[0028] 進(jìn)一步地,該方法還包括:
[0029] 根據(jù)所述樣本集合的獨(dú)立訪問者標(biāo)識(shí)以及所述估算集合的獨(dú)立訪問者標(biāo)識(shí),統(tǒng)計(jì) 所述全部流量的到達(dá)頻次。
[0030] 為了解決上述技術(shù)問題,本發(fā)明還提供了一種監(jiān)測(cè)網(wǎng)絡(luò)訪問活動(dòng)的系統(tǒng),包括:
[0031] 監(jiān)測(cè)模塊,用于監(jiān)測(cè)訪問被監(jiān)測(cè)頁面的全部流量的曝光數(shù)據(jù),其中每一條曝光數(shù) 據(jù)均攜帶獨(dú)立訪問者的設(shè)備指紋信息;
[0032] 統(tǒng)計(jì)模塊,用于將所述曝光數(shù)據(jù)中,攜帶cookie的曝光數(shù)據(jù)保存在樣本集合中, 其他曝光數(shù)據(jù)保存在估算集合中,將cookie作為所述樣本集合中曝光數(shù)據(jù)的獨(dú)立訪問者 標(biāo)識(shí),并根據(jù)所述樣本集合建立設(shè)備指紋與cookie的關(guān)系模型;
[0033] 估算模塊,用于對(duì)所述估算集合中具有所述關(guān)系模型中某一設(shè)備指紋的每條曝光 數(shù)據(jù),根據(jù)所述關(guān)系模型分配一個(gè)獨(dú)立訪問者標(biāo)識(shí)。
[0034] 進(jìn)一步地,該系統(tǒng)還包括下述特點(diǎn):
[0035] 統(tǒng)計(jì)模塊,用于根據(jù)所述樣本集合建立設(shè)備指紋與cookie的關(guān)系模型,包括:
[0036] 根據(jù)所述樣本集合中各條曝光數(shù)據(jù)的設(shè)備指紋和cookie,為每一種設(shè)備指紋建立 一個(gè)訪問子表,在該訪問子表的每條記錄中,保存具有該設(shè)備指紋的一組曝光數(shù)據(jù)所具有 的一種cookie及該cookie在該組曝光數(shù)據(jù)中的出現(xiàn)次數(shù)。
[0037] 進(jìn)一步地,該系統(tǒng)還包括下述特點(diǎn):
[0038] 估算模塊,用于對(duì)所述估算集合中具有所述關(guān)系模型中某一設(shè)備指紋的每條曝光 數(shù)據(jù),根據(jù)所述關(guān)系模型分配一個(gè)獨(dú)立訪問者標(biāo)識(shí),包括:
[0039] 對(duì)所述估算集合具有所述關(guān)系模型中設(shè)備指紋Fi的M條曝光數(shù)據(jù)分為k+1組, M=kN+M',其中,N為所述樣本集合中具有設(shè)備指紋Fi的曝光數(shù)據(jù)總數(shù),k,M'為自然數(shù);
[0040] 對(duì)其中的k組曝光數(shù)據(jù),將每