識別智能設備用戶的方法和裝置的制造方法
【技術領域】
[0001]本申請涉及數據處理技術領域,尤其涉及一種識別智能設備用戶的方法和裝置。
【背景技術】
[0002]用戶可以通過客戶端設備進行網絡通信,客戶端設備可以包括非智能設備和智能設備,非智能設備例如個人電腦(Personal Computer, PC),智能設備例如智能手機或者平板電腦等。由于業務需要,一些情況下需要識別用戶是智能設備用戶還是非智能設備用戶,以便進行相應的業務引導,例如,對于智能設備用戶,可以引導用戶進行話費充值或者進行短信營銷等。
[0003]相關技術中,識別智能設備用戶的方式主要是基于已有的包含智能設備型號的用戶訪問日志,根據用戶訪問日志中記錄的智能設備型號識別出智能設備用戶。
[0004]但是,當智能設備用戶沒有采用智能設備進行網絡訪問時,在用戶訪問日志中不會記錄智能設備信息,此時采用上述的方式不能識別出智能設備用戶,導致上述方式的識別效果不理想。
【發明內容】
[0005]本申請旨在至少在一定程度上解決相關技術中的技術問題之一。
[0006]為此,本申請的一個目的在于提出一種識別智能設備用戶的方法,該方法能夠提高智能設備用戶的識別效果。
[0007]本申請的另一個目的在于提出一種識別智能設備用戶裝置。
[0008]為達到上述目的,本申請第一方面實施例提出的識別智能設備用戶的方法,包括:對用戶的網絡行為數據進行提取,確定所述網絡行為數據中的特征變量;獲取第一變量值和第二變量值,所述第一變量值包括待檢測的設備用戶的所述特征變量的變量值,所述第二變量值包括預先確定的正樣本的所述特征變量的變量值;計算所述第一變量值與所述第二變量值之間的距離信息;根據所述距離信息,識別智能設備用戶。
[0009]本申請第一方面實施例提出的識別智能設備用戶的方法,通過對用戶的網絡行為數據進行提取,確定網絡行為數據中的特征變量,計算待檢測的設備用戶的特征變量的變量值,與預先確定的正樣本的特征變量的變量值之間的距離信息,根據該距離信息,識別智能設備用戶,可以實現基于用戶的網絡行為數據的智能設備用戶識別,由于本實施例不依賴用戶訪問日志中的智能設備信息,因此,當用戶訪問日志中沒有智能設備信息時,依然可以識別出智能設備用戶,從而提高識別效果。
[0010]為達到上述目的,本申請第二方面實施例提出的識別智能設備用戶的裝置,包括:確定模塊,用于對用戶的網絡行為數據進行提取,確定所述網絡行為數據中的特征變量;獲取模塊,用于獲取第一變量值和第二變量值,所述第一變量值包括待檢測的設備用戶的所述特征變量的變量值,所述第二變量值包括預先確定的正樣本的所述特征變量的變量值;計算模塊,用于計算所述第一變量值與所述第二變量值之間的距離信息;識別模塊,用于根據所述距離信息,識別智能設備用戶。
[0011]本申請第二方面實施例提出的識別智能設備用戶的裝置,通過對用戶的網絡行為數據進行提取,確定網絡行為數據中的特征變量,計算待檢測的設備用戶的特征變量的變量值,與預先確定的正樣本的特征變量的變量值之間的距離信息,根據該距離信息,識別智能設備用戶,可以實現基于用戶的網絡行為數據的智能設備用戶識別,由于本實施例不依賴用戶訪問日志中的智能設備信息,因此,當用戶訪問日志中沒有智能設備信息時,依然可以識別出智能設備用戶,從而提高識別效果。
[0012]本申請附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。
【附圖說明】
[0013]本申請上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
[0014]圖1是本申請一實施例提出的識別智能設備用戶的方法的流程示意圖;
[0015]圖2是本申請另一實施例提出的識別智能設備用戶的方法的流程示意圖;
[0016]圖3是本申請另一實施例提出的識別智能設備用戶的裝置的結構示意圖;
[0017]圖4是本申請另一實施例提出的識別智能設備用戶的裝置的結構示意圖。
【具體實施方式】
[0018]下面詳細描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。
[0019]圖1是本申請一實施例提出的識別智能設備用戶的方法的流程示意圖,該方法包括:
[0020]Sll:對用戶的網絡行為數據進行提取,確定所述網絡行為數據中的特征變量。
[0021]其中,用戶的網絡行為數據包括:網站登錄時的數據,例如,登錄時間,登錄地點等;訪問記錄數據,例如,用戶瀏覽的商品信息等;充值數據;支付行為數據;交易數據;提現數據;注冊手機號、購物行為數據等中的一項或者多項。
[0022]特征變量是從用戶的網絡行為數據中提取出的預設個數的變量,是正樣本和負樣本差異較大的變量。
[0023]具體的,所述對用戶的網絡行為數據進行提取,確定所述網絡行為數據中的特征變量,包括:
[0024]選取所述正樣本和負樣本,并獲取所述正樣本的網絡行為數據和所述負樣本的網絡行為數據,所述正樣本是已知的智能設備用戶,所述負樣本是已知的非智能設備用戶;
[0025]對所述正樣本的網絡行為數據和所述負樣本的網絡行為數據進行差異化計算,獲取所述網絡行為數據中每個變量的差異化得分;
[0026]根據所述差異化得分,確定特征變量。
[0027]其中,特征變量是正樣本和負樣本具有較大差異的變量,例如,可以按照差異化得分從大到小的順序對變量進行排序,在排序后變量中依次選擇預設個數的變量作為特征變量。
[0028]S12:獲取第一變量值和第二變量值,所述第一變量值包括待檢測的設備用戶的所述特征變量的變量值,所述第二變量值包括預先確定的正樣本的所述特征變量的變量值。
[0029]其中,從待檢測的設備用戶的用戶訪問日志中可以獲取第一變量值;
[0030]從正樣本的用戶訪問日志中可以獲取第二變量值。
[0031]具體的,對于正樣本,第二變量值可以是從確定正樣本時采用的用戶訪問日志中獲取的,例如,根據2012年初至2013年底確定出正樣本,之后可以根據正樣本在2012年初至2013年底的用戶訪問日志中獲取第二變量值,例如獲取登錄時間的登錄值等。當然,可以理解的是,由于智能設備或非智能設備在不同的時間段會具有一致的訪問行為,因此也可以根據其他時間段的用戶訪問日志獲取,例如,也可以從已經存在的2014年的用戶訪問日志中獲取,例如,智能手機在2012年初至2013年底的登錄時間通常是早上,那么該智能手機在2014年的登錄時間依然通常會是在早上。
[0032]預先確定的正樣本是指從已知的智能設備用戶中選取的預設個數的智能設備用戶,已知的智能設備用戶可以是預設時間段內的智能設備用戶,選取時可以隨機選擇。具體的,可以根據服務端預先獲取的歷史數據,確定智能設備用戶和非智能設備用戶,從所述智能設備用戶中隨機選取預設個數的用戶確定為正樣本,從所述非智能設備用戶中隨機選擇所述預設個數的用戶確定為負樣本。
[0033]以智能設備是智能手機為例,例如,根據用戶訪問日志,可以篩選出2012年初至2013年底有過智能手機訪問記錄的用戶,這些用戶是已知的智能設備用戶,之后可以從這些已知的智能設備用戶中隨機挑取50萬個用戶作為正樣本。
[0034]根據用戶訪問日志,可以篩選出2013年底之前沒有過智能手機訪問記錄的用戶,而2013年底之后有過智能手機訪問記錄的用戶,這些用戶在2013年底之間可以看作非智能設備用戶,之后可以從這些非智能設備用戶中隨機選取50萬個用戶作為負樣本。
[0035]S1