本申請涉及互聯網信息處理技術領域,尤其涉及一種識別非法用戶的方法和設備。
背景技術:
隨著科學技術的飛速發展,出現了各種各樣的資源服務平臺,例如:資源共享平臺、資源存儲平臺等。這些資源服務平臺可以根據用戶的需求為用戶分配資源,使得用戶利用獲取的資源執行各種各樣的業務,極大地方便了用戶的日常生活。
為了更好地為用戶提供資源服務,網絡服務商可以根據用戶在資源服務平臺上產生的用戶行為數據確定該用戶的資源屬性,并根據用戶的資源屬性確定為用戶分配資源的數量,這里資源的數量表征用戶能夠從資源服務平臺獲取的由用戶自由支配的資源的多少,通常情況下,用戶的資源屬性越好,網絡服務商為用戶分配的資源數量越多。
然而,在實際應用中,有些用戶為了獲取更多的資源,通過惡意手段提升用戶的資源屬性,例如:在不需要執行業務時,故意與其他用戶之間發生業務故而產生用戶行為數據,使得資源服務平臺根據產生的這些用戶行為數據增加用戶的資源屬性,這樣,用戶就能夠從資源服務平臺中獲取更多的資源。但是,這對于資源服務平臺來講,屬于一種高風險事件。
目前,為了避免這種高風險事件發生,資源服務平臺通過獲取不同用戶之間的通信內容,根據該通信內容尋找惡意提高資源屬性的非法用戶,但是,這種方式存在片面性,導致識別非法用戶的精度比較低,使得高風險事件發生的概率比較高,增加了資源服務平臺的風險。
技術實現要素:
有鑒于此,本申請實施例提供了一種識別非法用戶的方法和設備,用于解決現有技術中識別非法用戶的精度比較低的問題。
一種識別非法用戶的方法,包括:
獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,其中,所述基本信息用于表征用戶的基本屬性的信息;
根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值,其中,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息不相同的程度值;
根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。
一種識別非法用戶的設備,包括:
獲取單元,用于獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,其中,所述基本信息用于表征用戶的基本屬性的信息,N為自然數;
計算單元,用于根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值,其中,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息相異的程度值;
識別單元,用于根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。
本申請有益效果如下:
本申請實施例獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,所述基本信息用于表征用戶的基本屬性的信息,N為自然數;根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息不相同的程度值;根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。基于用戶在互聯網平臺中 注冊的基本信息,通過分析與目標用戶建立社會化關系的其他用戶的基本信息,進而確定目標用戶與其他用戶之間基本信息的差異程度,這樣能夠判斷出目標用戶與其他用戶之間是否存在不正常的業務關系,進而識別出目標用戶是否屬于非法用戶,有效提高識別非法用戶的精度,同時能夠降低高風險事件發生的概率,降低資源服務平臺的風險。
附圖說明
為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域的普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本申請實施例提供的一種識別非法用戶的方法的流程示意圖;
圖2為生成地理位置信息這一信息特征對應的信息分布圖;
圖3為本申請實施例提供的一種識別非法用戶的設備的結構示意圖。
具體實施方式
為了實現本申請的目的,本申請實施例提供了一種識別非法用戶的方法和設備,獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,所述基本信息用于表征用戶的基本屬性的信息,N為自然數;根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息不相同的程度值;根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。基于用戶在互聯網平臺中注冊的基本信息,通過分析與目標用戶建立社會化關系的其他用戶的基本信息,進而確定目標用戶與其他用戶之間基本信息的差異程度,這樣能夠判斷出目標用戶與其他用戶之間是否存在不正常的業務關系,進而識別出目標用戶是否屬于非法用戶,有效提高識別非法用戶的精度,同時能夠降低高風險事件發生的概率,降 低資源服務平臺的風險。
需要說明的是,本申請實施例中所記載的用戶的基本信息是指表征用戶的基本屬性的信息,這里的基本屬性可以是指用戶所在的地理位置信息、用戶的職業類型、用戶的學歷信息等等;還可以是指用戶的興趣愛好、用戶所畢業院校等等,這里不做具體限定。
本申請實施例中所述的非法用戶可以是指通過非法手段提高用戶資源屬性的用戶,這里的非法手段可以是指在不需要執行業務時,故意與其他用戶之間發生業務故而產生用戶行為數據,使得資源服務平臺根據產生的這些用戶行為數據增加用戶的資源屬性,也可以是通過惡意執行業務,使得資源服務平臺根據產生的這些用戶行為數據增加用戶的資源屬性,例如:用戶A為了增加資源屬性(可以是信用分),通過與用戶B的交流,與用戶B之間制造購買業務,實現用戶A資源屬性的增加等等。
下面結合說明書附圖對本申請各個實施例作進一步地詳細描述。顯然,所描述的實施例僅僅是本申請一部份實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其它實施例,都屬于本申請保護的范圍。
圖1為本申請實施例提供的一種識別非法用戶的方法的流程示意圖。所述方法可以如下所示。
步驟101:獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息。
其中,所述基本信息用于表征用戶的基本屬性的信息,N為自然數。
在步驟101中,不管是在現實生活中還是在互聯網提供的虛擬環境中,不同用戶之間建立的社會化關系還是存在一定的規律性的。俗話說:物以類聚,人以群分。那么在本申請實施例中可以基于這樣的規律判斷不同用戶之間的建立的社會化關系屬于正常的社會化關系還是異常的社會化關系。
本申請實施例中記載的與所述待處理用戶建立社會化關系的N個第一用 戶的基本信息可以預先存在在不同應用的服務器中,這樣在獲取到待處理用戶的基本信息后,可以通過待處理用戶的用戶標識從不同服務器中獲取與與所述待處理用戶建立社會化關系的N個第一用戶的用戶標識,進而根據獲取到的N個用戶的用戶標識分別查找這N個用戶的基本信息。
具體地,確定待處理用戶,獲取待處理用戶的基本信息以及與該待處理用戶建立社會化關系的多個其他用戶的基本信息,這里將其他用戶稱之為第一用戶,“多個”解釋為至少一個。
其中,本申請實施例中所記載的社會化關系可以是指同學關系(例如:包含小學、中學、大學以及研究生各個學習階段建立的同學關系);也可以是指親戚關系;還可以是指業務交互關系(例如:基于互聯網平臺產生的買賣關系;基于互聯網平臺產生的支付關系等等),這里對于社會化關系不做具體限定。
為了保證不同用戶之間信息交互的安全性,服務商需要用戶真實注冊用戶的基本信息,即用戶在使用互聯網平臺建立社會化關系之前,用戶在互聯網平臺上注冊基本信息,使得服務器獲取到的用戶的基本信息是真實的,這樣能夠后續分析的準確性。
步驟102:根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值。
其中,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息不相同的程度值。
在步驟102中,首先,在獲取到待處理用戶的基本信息時,根據所述待處理用戶的基本信息,確定所述基本信息中包含的每一種屬性信息的信息特征。
具體地,獲取待處理用戶的基本信息包含用戶所在城市、用戶的最高學歷、用戶的職業類型、用戶的興趣愛好、用戶經常訪問的網頁等等。
這里“用戶所在城市”、“用戶的最高學歷”、“用戶的職業類型”、“用戶的興趣愛好”、“用戶經常訪問的網頁”都可以分別稱為一種屬性信息,不同屬性信息對應不同的信息特征。例如:“用戶所在城市”這一屬性信息,對應的信 息特征可以是地理位置信息。
其次,針對每一種信息特征,分別執行以下操作:選擇其中一種信息特征,分別確定所述信息特征對應的所述待處理用戶的信息內容和所述信息特征對應的所述N個第一用戶的信息內容;根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值。
下面以信息特征為地理位置信息為例進行詳細說明。
假設待處理用戶所在城市為北京市,那么針對待處理用戶的地址位置信息這一信息特征對應的信息內容為北京市;分別確定獲取到的N個第一用戶的地理位置信息這一信息特征對應的信息內容,假設N為10,這10位第一用戶的地址位置信息這一信息特征對應的信息內容分別是:北京市、北京市、北京市、上海市、杭州市、蘇州市、重慶市、成都市、西安市和廣州市。
分析可以得出,與待處理用戶屬于同一個城市的用戶個數占N的30%,與待處理用戶不屬于同一個城市的用戶個數占N的70%。
此時,根據分析結果,可以計算出地理位置信息這一信息特征對應的待處理用戶的第一信息相異值。
為了準確分析出待處理用戶與N個第一用戶之間基本信息相異的程度,將為每一種信息特征設定兩個閾值:一個閾值是待處理用戶與第一用戶之間基本信息相同的最大閾值,另一個閾值是待處理用戶與第一用戶之間基本信息相同的最小閾值,這兩個閾值的設置可以通過機器學習確定,也可以通過分析大量歷史數據確定。需要說明的是,針對不同的信息特征,所設定的兩個閾值的大小可能不同。
例如:針對地理位置信息這一信息特征,假設以待處理用戶與N個第一用戶之間的屬于同一個地理位置為前提設置閾值,那么設定的最大閾值為a,可以表示與待處理用戶屬于同一個城市的用戶個數占N的最大百分數;設定的最小閾值為b,可以表示與待處理用戶屬于同一個城市的用戶個數占N的最小百 分數,那么計算出地理位置信息這一信息特征對應的待處理用戶的第一信息相異值可以表示為(30%-b)與(a-b)的商值。
假設以待處理用戶與N個第一用戶之間的不屬于同一個地理位置為前提設置閾值,那么設定的最大閾值為a,可以表示與待處理用戶不屬于同一個城市的用戶個數占N的最大百分數;設定的最小閾值為b,可以表示與待處理用戶不屬于同一個城市的用戶個數占N的最小百分數,那么計算出地理位置信息這一信息特征對應的待處理用戶的第一信息相異值可以表示為(70%-b)與(a-b)的商值。
可選地,在本申請實施例中,根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值,包括:
針對選擇的信息特征,根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,生成選擇的信息特征對應的信息分布圖;
基于所述信息分布圖,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值。
仍以上述事實為例,假設待處理用戶所在城市為北京市,那么針對待處理用戶的地址位置信息這一信息特征對應的信息內容為北京市;分別確定獲取到的N個第一用戶的地理位置信息這一信息特征對應的信息內容,假設N為10,這10位第一用戶的地址位置信息這一信息特征對應的信息內容分別是:北京市、北京市、北京市、上海市、杭州市、蘇州市、重慶市、成都市、西安市和廣州市,那么基于得到的信息內容,生成地理位置信息這一信息特征對應的信息分布圖,如圖2所示。
從圖2中可以看出,分布在北京的人數比較多,即與待處理用戶屬于同一個地理位置的用戶個數占N的百分數數值比較大。
那么基于圖2,可以采用上述方式計算得到地理位置信息這一信息特征對應的待處理用戶的第一信息相異值。
需要說明的是,假設以與待處理用戶之間產生業務關系的M個用戶為研究對象,在確定待處理用戶與這M個用戶之間的信息相異值時,也可以根據業務關系中包含的信息(例如:M個用戶所分布的城市、待處理用戶與M個用戶發生業務的次數等等)確定不同信息對應的信息特征,基于確定的信息特征分別計算所述待處理用戶的第一信息相異值,計算方式可以采用上述方式,這里不再做詳細描述。
最后,在得到每一個信息特征對應的所述待處理用戶的第一信息相異值時,根據得到的所述第一信息相異值,計算得到的所述待處理用戶的信息相異值。
具體地,確定不同信息特征對應的權重值;并根據每一種信息特征對應的權重值和所述信息特征對應的第一信息相異值,計算得到所述待處理用戶的信息相異值。
本申請實施例中所記載的不同信息特征對應的權重值,可以根據不同信息特征對信息相異值的影響程度確定,也可以根據經驗值確定,這里不做限定。
例如:通過以下方式計算得到所述待處理用戶的信息相異值:
信息相異值=∑(信息特征的權重值*該信息特征對應的第一信息相異值)。
步驟103:根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。
在步驟103中,在計算得到信息相異值時,根據所述信息相異值,確定所述待處理用戶屬于非法用戶的概率值;并在所述概率值大于設定閾值時,識別所述待處理用戶屬于非法用戶。
由于信息相異值的大小說明待處理用戶與所述N個第一用戶之間的基本信息相異的程度值,信息相異值越大,說明待處理用戶通過建立社會化關系惡意提高資源屬性的概率越高,那么當概率值大于設定閾值時,說明需要對該待處理用戶進行預防,即可識別出該待處理用戶屬于非法用戶,這樣對于該待處理用戶產生能夠導致資源屬性增加的用戶行為進行處理,以保證該待處理用戶的資源屬性比較合理,這樣后續在為該用戶分配資源時,能夠有效降低高風險 事件發生的概率,降低資源服務平臺的風險。
通過本申請實施例的方案,獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,所述基本信息用于表征用戶的基本屬性的信息,N為自然數;根據所述待處理用戶的基本信息和所述N個第一用戶的的基本信息,計算所述待處理用戶的信息相異值,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息不相同的程度值;根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。基于用戶在互聯網平臺中注冊的基本信息,通過分析與目標用戶建立社會化關系的其他用戶的基本信息,進而確定目標用戶與其他用戶之間基本信息的差異程度,這樣能夠判斷出目標用戶與其他用戶之間是否存在不正常的業務關系,進而識別出目標用戶是否屬于非法用戶,有效提高識別非法用戶的精度,同時能夠降低高風險事件發生的概率,降低資源服務平臺的風險。
圖3為本申請實施例提供的一種識別非法用戶的設備的結構示意圖。所述設備包括:獲取單元31、計算單元32和識別單元33,其中:
獲取單元31,用于獲取待處理用戶的基本信息以及與所述待處理用戶建立社會化關系的N個第一用戶的基本信息,其中,所述基本信息用于表征用戶的基本屬性的信息,N為自然數;
計算單元32,用于根據所述待處理用戶的基本信息和所述N個第一用戶的基本信息,計算所述待處理用戶的信息相異值,其中,所述信息相異值用于表征所述待處理用戶與所述N個第一用戶之間的基本信息相異的程度值;
識別單元33,用于根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶。
在本申請的另一實施例中,所述計算單元32根據所述待處理用戶的基本信息和所述N個第一用戶的的基本信息,計算所述待處理用戶的信息相異值,包括:
根據所述待處理用戶的基本信息,確定所述基本信息中包含的每一種信息 的信息特征;
針對每一種信息特征,分別執行以下操作:
選擇其中一種信息特征,分別確定所述信息特征對應的所述待處理用戶的信息內容和所述信息特征對應的所述N個第一用戶的信息內容;
根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值;
在得到每一個信息特征對應的所述待處理用戶的第一信息相異值時,根據得到的所述第一信息相異值,計算得到的所述待處理用戶的信息相異值。
在本申請的另一實施例中,所述計算單元32根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值,包括:
針對選擇的信息特征,根據所述待處理用戶的信息內容和所述N個第一用戶的信息內容,生成選擇的信息特征對應的信息分布圖;
基于所述信息分布圖,計算得到所述信息特征對應的所述待處理用戶的第一信息相異值。
在本申請的另一實施例中,所述計算單元32根據得到的所述第一信息相異值,計算得到的所述待處理用戶的信息相異值,包括:
確定不同信息特征對應的權重值;
根據每一種信息特征對應的權重值和所述信息特征對應的第一信息相異值,計算得到所述待處理用戶的信息相異值。
在本申請的另一實施例中,所述識別單元33根據所述信息相異值,識別所述待處理用戶是否屬于非法用戶,包括:
根據所述信息相異值,確定所述待處理用戶屬于非法用戶的概率值;
在所述概率值大于設定閾值時,識別所述待處理用戶屬于非法用戶。
需要說明的是,本申請實施例中所述的識別設備可以通過軟件方式實現,也可以通過硬件方式實現,例如,控制設備等,這里不做限定。
本申請實施例中所記載的識別設備基于用戶在互聯網平臺中注冊的基本信息,通過分析與目標用戶建立社會化關系的其他用戶的基本信息,進而確定目標用戶與其他用戶之間基本信息的差異程度,這樣能夠判斷出目標用戶與其他用戶之間是否存在不正常的業務關系,進而識別出目標用戶是否屬于非法用戶,有效提高識別非法用戶的精度,同時能夠降低高風險事件發生的概率,降低資源服務平臺的風險。
本領域的技術人員應明白,本申請的實施例可提供為方法、裝置(設備)、或計算機程序產品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形式。
本申請是參照根據本申請實施例的方法、裝置(設備)和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本申請的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優選實施例以及落入本申請范圍的所有變更和修改。
顯然,本領域的技術人員可以對本申請進行各種改動和變型而不脫離本申請的精神和范圍。這樣,倘若本申請的這些修改和變型屬于本申請權利要求及其等同技術的范圍之內,則本申請也意圖包含這些改動和變型在內。