一種識別機器操作行為的方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及計算機應用技術領域,尤其涉及一種識別機器操作行為的方法及裝 置。
【背景技術】
[0002] 為了使廣告得到更加針對性的推廣效果,需要采集并分析用戶行為數據,通過采 集用戶對廣告信息的點擊量確定用戶感興趣的領域,再將該領域對應的廣告推廣給用戶。 但在采集用戶行為數據時,第三方為了獲取私利,會在用戶行為數據的基礎上添加機器行 為數據,通過模仿用戶行為對特定廣告制造點擊量,為特定廣告提高點擊量,增加廣告的推 廣率。現有技術中對采集到的用戶行為數據進行分析,判斷用戶行為數據是否為機器行為 數據。例如,以用戶行為數據為點擊量為例,當單個用戶在預設單位時間內統計的點擊量超 過預設點擊量時,現有技術則可認為該用戶的行為數據屬于機器行為數據;或者,當發現預 設時間內多個用戶訪問的廣告信息順序均相同時,現有技術則可認為這多個用戶的行為數 據屬于機器行為數據;或者,現有技術通過采集單個用戶在預設時間間隔內訪問廣告信息 的發生所在地確定該用戶的行為數據屬于機器行為數據,例如,若單個用戶在一小時內分 別在北京和上海訪問廣告信息,則認為該用戶的行為數據屬于機器行為數據。然而,上述方 法在第三方的刻意避免下,能將機器行為模仿得即為合理,導致現有技術無法有效識別出 參雜在用戶行為數據中的機器行為數據,影響了廣告的最終推廣效果。
【發明內容】
[0003] 本發明提供一種識別機器操作行為的方法及裝置,可有效識別在用戶操作行為數 據中的機器操作行為數據。
[0004] 本發明第一方面提供一種識別機器操作行為的方法,包括:
[0005] 獲取用戶操作行為數據,得到用戶發生操作行為的時間;
[0006] 根據所述用戶發生操作行為的時間生成所述用戶的時間序列;
[0007] 根據所述用戶的時間序列以及對應的用戶操作行為的統計數據識別機器操作行 為,所述機器操作行為用于模仿所述用戶發生的操作行為。
[0008] 結合本發明第一方面的實現方式,在本發明第一方面的第一種可能的實現方式 中,所述根據所述用戶的時間序列以及對應的用戶操作行為的統計數據識別機器操作行 為,包括:
[0009] 根據所述用戶的時間序列計算所述用戶發生操作行為的相鄰時間之間的時間 差;
[0010] 統計所述時間差對應的用戶發生操作行為的次數;
[0011] 根據所述時間差以及所述時間差對應的用戶發生操作行為的次數生成關系曲 線;
[0012] 獲取所述關系曲線中出現峰值的用戶發生操作行為的第一次數,根據所述第一次 數識別所述機器操作行為。
[0013] 結合本發明第一方面的第一種可能的實現方式,在本發明第一方面的第二種可能 的實現方式中,所述根據所述第一次數識別所述機器操作行為,包括:
[0014] 根據所述關系曲線以及所述第一次數確定對應的第一時間差;
[0015] 根據所述關系曲線以及所述第一時間差得到所述第一次數的理論值;
[0016] 根據所述第一次數以及所述第一次數與所述第一次數的理論值的差值計算所述 第一次數中非用戶發生操作行為的概率,所述第一次數與所述第一次數的理論值的差值為 所述非用戶發生操作行為的次數;
[0017] 若所述非用戶發生操作行為的概率大于或等于預設概率,則確定所述非用戶操作 行為為所述機器操作行為。
[0018] 結合本發明第一方面的第二種可能的實現方式,在本發明第一方面的第三種可能 的實現方式中,若所述關系曲線中出現至少兩個峰值,則確定所述非用戶操作行為為所述 機器操作行為之前,所述方法還包括:
[0019] 根據所述各個峰值的非用戶發生操作行為的概率計算第一非用戶發生操作行為 的概率,所述第一非用戶發生操作行為的概率為任意出現在所述各個峰值對應的時間差的 概率;
[0020] 所述若所述非用戶發生操作行為的概率大于或等于預設概率,則確定所述非用戶 操作行為為所述機器操作行為,包括:
[0021] 若所述第一非用戶發生操作行為的概率大于或等于所述預設概率,則確定所述第 一非用戶發生操作行為為所述機器操作行為。
[0022] 結合本發明第一方面的實現方式,在本發明第一方面的第四種可能的實現方式 中,所述根據所述用戶的時間序列以及對應的用戶操作行為的統計數據識別機器操作行 為,包括:
[0023] 根據所述用戶的時間序列計算所述用戶發生操作行為的相鄰時間之間的第二時 間差;
[0024] 根據所述第二時間差計算所述用戶的時間序列的標準差;
[0025] 若所述用戶的時間序列的標準差小于預設標準差,則確定所述用戶發生的操作行 為為所述機器操作行為。
[0026] 本發明第二方面提供一種識別機器操作行為的裝置,包括:
[0027] 獲取模塊,用于獲取用戶操作行為數據,得到用戶發生操作行為的時間;
[0028] 生成模塊,用于根據所述獲取模塊獲取的用戶發生操作行為的時間生成所述用戶 的時間序列;
[0029] 識別模塊,用于根據所述生成模塊生成的用戶的時間序列以及對應的用戶操作行 為的統計數據識別機器操作行為,所述機器操作行為用于模仿所述用戶發生的操作行為。
[0030] 結合本發明第二方面的實現方式,在本發明第二方面的第一種可能的實現方式 中,所述識別模塊包括:
[0031] 第一計算單元,用于根據所述用戶的時間序列計算所述用戶發生操作行為的相鄰 時間之間的時間差;
[0032] 統計單元,用于統計所述第一計算單元計算的時間差對應的用戶發生操作行為的 次數;
[0033] 生成單元,用于根據所述第一計算單元計算的時間差以及所述統計單元統計的所 述時間差對應的用戶發生操作行為的次數生成關系曲線;
[0034] 識別單元,用于獲取所述關系曲線中出現峰值的用戶發生操作行為的第一次數, 根據所述第一次數識別所述機器操作行為。
[0035] 結合本發明第二方面的第一種可能的實現方式,在本發明第二方面的第二種可能 的實現方式中,所述識別單元,包括:
[0036] 第一確定子單元,用于根據所述關系曲線以及所述第一次數確定對應的第一時間 差;
[0037] 得到子單元,用于根據所述關系曲線以及所述第一時間差得到所述第一次數的理 論值;
[0038] 計算子單元,用于根據所述第一次數以及所述第一次數與所述第一次數的理論值 的差值計算所述第一次數中非用戶發生操作行為的概率,所述第一次數與所述第一次數的 理論值的差值為所述非用戶發生操作行為的次數;
[0039] 第二確定子單元,用于若所述非用戶發生操作行為的概率大于或等于預設概率, 則確定所述非用戶操作行為為所述機器操作行為。
[0040] 結合本發明第二方面的第二種可能的實現方式,在本發明第二方面的第三種可能 的實現方式中,所述計算子單元,還用于根據所述各個峰值的非用戶發生操作行為的概率 計算第一非用戶發生操作行為的概率,所述第一非用戶發生操作行為的概率為任意出現在 所述各個峰值對應的時間差的概率;
[0041] 所述第二確定子單元,還用于若所述第一非用戶發生操作行為的概率大于或等于 所述預設概率,則確定所述第一非用戶發生操作行為為所述機器操作行為。
[0042] 結合本發明第二方面的實現方式,在本發明第二方面的第四種可能的實現方式 中,所述識別模塊包括:
[0043] 第二計算單元,用于根據所述用戶的時間序列計算所述用戶發生操作行為的相鄰 時間之間的第二時間差;
[0044] 所述第二計算單元,還用于根據所述第二時間差計算所述用戶的時間序列的標準 差;
[0045] 確定單元,用于若所述用戶的時間序列的標準差小于預設標準差,則確定所述用 戶發生的操作行為為所述機器操作行為。
[0046] 采用本發明,采用本發明實施例,可通過獲取用戶操作行為數據,得到用戶發生操 作行為的時間,根據所述用戶發生操作行為的時間生成所述用戶的時間序列,根據所述用 戶的時間序列以及對應的用戶操作行為的統計數據識別機器操作行為,可有效識別在用戶 操作行為數據中的機器操作行為數據,提高了數據分析的準確性,使廣告推廣更富有針對 性,加深了廣告的推廣效果。
【附圖說明】
[0047] 為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用 的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域 普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附 圖。
[0048] 圖1是本發明實施例的一種識別機器操