301得出的至少一個(gè)上述候選號(hào)碼做進(jìn)一步的檢查,從而發(fā)現(xiàn)(識(shí)別)出惡意號(hào)碼。
[0082]其中,利用所述分類器進(jìn)行分類的參照信息包括從第一訓(xùn)練樣本中提取的第一特征量,即,所述分類器的構(gòu)造以從第一訓(xùn)練樣本中提取的第一特征量作為參考信息,所述第一訓(xùn)練樣本為預(yù)先選取的號(hào)碼的樣本。具體地,可以事先對(duì)第一訓(xùn)練樣本(由惡意號(hào)碼和非惡意號(hào)碼組成的樣本)從充值次數(shù)、支付次數(shù)、好友熱度、IP地址聚集數(shù)、IP地址跳變數(shù)、歷史黑名單、渠道等方面來(lái)實(shí)現(xiàn)第一特征量提取。
[0083]上述分類器可以通過(guò)以下步驟來(lái)構(gòu)造:第一步,選擇第一訓(xùn)練樣本;第二步,計(jì)算所述第一訓(xùn)練樣本中的訓(xùn)練節(jié)點(diǎn)所包含的熵不純度,即,計(jì)算當(dāng)前節(jié)點(diǎn)包含的所有樣本的熵不純度;第三步,根據(jù)所述熵不純度計(jì)算所述訓(xùn)練節(jié)點(diǎn)采用不同特征進(jìn)行分支操作將會(huì)得到的信息增益,即,計(jì)算采用不同特征進(jìn)行分支將會(huì)得到的信息增益;第四步,根據(jù)最大的信息增益對(duì)所述訓(xùn)練節(jié)點(diǎn)進(jìn)行分支操作,以得到下一個(gè)訓(xùn)練節(jié)點(diǎn),即,選擇具有最大增益的特征作為當(dāng)前的節(jié)點(diǎn),該特征的取值個(gè)數(shù)決定了該節(jié)點(diǎn)下的分支數(shù)目,若后續(xù)節(jié)點(diǎn)只包含一類樣本,則停止該分支的生成,該節(jié)點(diǎn)即為葉節(jié)點(diǎn)(末端節(jié)點(diǎn)),若后續(xù)節(jié)點(diǎn)仍然包含不同類樣本,則再次進(jìn)行上述第一步,直至每一個(gè)分支到達(dá)葉節(jié)點(diǎn)(末端節(jié)點(diǎn))為止。
[0084]通過(guò)上述措施,可以在識(shí)別對(duì)象具有多個(gè)特征、識(shí)別過(guò)程需要應(yīng)用多種策略時(shí)有效地提升綜合決策的效率。
[0085]此外,除了上述決策樹(shù)算法外,還可以通過(guò)隨機(jī)森林、K均值聚類、神經(jīng)網(wǎng)絡(luò)、貝葉斯決策、K近鄰、線性分類器、邏輯回歸等算法來(lái)對(duì)至少一個(gè)所述候選號(hào)碼進(jìn)行分類,并識(shí)別其中的預(yù)定類型號(hào)碼。
[0086]參考圖8,圖8為本發(fā)明的預(yù)定類型號(hào)碼識(shí)別方法的第一實(shí)施例的流程圖。本實(shí)施例的預(yù)定類型號(hào)碼識(shí)別方法通過(guò)以下步驟來(lái)實(shí)現(xiàn)本發(fā)明的技術(shù)目的:所述搜索模塊301從第一類型號(hào)碼在作業(yè)關(guān)系鏈中所對(duì)應(yīng)的節(jié)點(diǎn)開(kāi)始,以所述節(jié)點(diǎn)作為起始節(jié)點(diǎn),按照其分支的指向搜索相鄰的其它節(jié)點(diǎn)(分支節(jié)點(diǎn)),直到葉節(jié)點(diǎn)然后再回溯到所述葉節(jié)點(diǎn)的父節(jié)點(diǎn),搜索所述父節(jié)點(diǎn)相鄰的其它節(jié)點(diǎn),過(guò)程中判斷每一個(gè)所搜索到的節(jié)點(diǎn)(分支節(jié)點(diǎn))的屬性是否符合特定條件,重復(fù)執(zhí)行上述步驟,直到訪問(wèn)完所述作業(yè)關(guān)系鏈中的所有節(jié)點(diǎn)為止,以得到第一判斷結(jié)果,其中,所述作業(yè)關(guān)系鏈?zhǔn)穷A(yù)先構(gòu)造的,所述第一判斷結(jié)果包括所述作業(yè)關(guān)系鏈中每一節(jié)點(diǎn)的屬性是否符合所述特定條件的信息;所述篩選模塊302按照預(yù)先設(shè)置的篩選條件對(duì)所述第一判斷結(jié)果中符合所述特定條件的節(jié)點(diǎn)進(jìn)行篩選,以得到預(yù)定類型號(hào)碼。
[0087]具體地,所述方法包括以下步驟801、802和803。
[0088]步驟801,所述搜索模塊301從第一類型號(hào)碼在作業(yè)關(guān)系鏈中所對(duì)應(yīng)的節(jié)點(diǎn)開(kāi)始,訪問(wèn)與所述節(jié)點(diǎn)相鄰的分支節(jié)點(diǎn),并判斷所述分支節(jié)點(diǎn)(所搜索到的節(jié)點(diǎn))的屬性是否符合特定條件,其中,所述作業(yè)關(guān)系鏈?zhǔn)穷A(yù)先構(gòu)造的。
[0089]步驟802,所述搜索模塊301從所述分支節(jié)點(diǎn)開(kāi)始,重復(fù)執(zhí)行上述步驟,直到訪問(wèn)完所述作業(yè)關(guān)系鏈中的所有節(jié)點(diǎn)為止,以得到所述第一判斷結(jié)果,其中,所述第一判斷結(jié)果包括所述作業(yè)關(guān)系鏈中每一節(jié)點(diǎn)(所搜索到的節(jié)點(diǎn)/分支節(jié)點(diǎn))的屬性是否符合所述特定條件的信息;
[0090]步驟803,所述篩選模塊302按照預(yù)先設(shè)置的篩選條件對(duì)所述第一判斷結(jié)果中符合所述特定條件的節(jié)點(diǎn)進(jìn)行篩選,以得到預(yù)定類型號(hào)碼。
[0091]通過(guò)上述技術(shù)方案,本發(fā)明實(shí)施例的預(yù)定類型號(hào)碼識(shí)別方法可以實(shí)現(xiàn)自動(dòng)地識(shí)別預(yù)定類型號(hào)碼(例如,惡意號(hào)碼),有利于據(jù)此采取相關(guān)措施(例如,禁止惡意號(hào)碼登錄,進(jìn)而有效地防止侵害互聯(lián)網(wǎng)應(yīng)用的用戶的財(cái)產(chǎn)安全的行為)。
[0092]具體地,在本實(shí)施例中,所述搜索模塊301從所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)中的預(yù)選號(hào)碼開(kāi)始,對(duì)所述作業(yè)關(guān)系鏈中的節(jié)點(diǎn)進(jìn)行深度優(yōu)先遍歷,以得到所述第一判斷結(jié)果,即,從中選擇至少一個(gè)與所述預(yù)定類型號(hào)碼類似的候選號(hào)碼,即,所述搜索模塊301從所述作業(yè)關(guān)系鏈中的預(yù)選號(hào)碼開(kāi)始,對(duì)所述作業(yè)關(guān)系鏈中的所有節(jié)點(diǎn)進(jìn)行深度優(yōu)先遍歷搜索,以從中選擇至少一個(gè)符合所述特定條件的所述候選號(hào)碼。具體地,所述搜索模塊301從至少一個(gè)所述號(hào)碼所對(duì)應(yīng)的節(jié)點(diǎn)(例如,被投訴的號(hào)碼P所對(duì)應(yīng)的節(jié)點(diǎn))開(kāi)始,遍歷所述作業(yè)關(guān)系鏈中的所有節(jié)點(diǎn),以從中選擇至少一個(gè)所述候選號(hào)碼,如圖7所示。
[0093]在本實(shí)施例中,遍歷所述作業(yè)關(guān)系鏈中的所有節(jié)點(diǎn)有利于窮盡所有相關(guān)的節(jié)點(diǎn),因此能夠更加全面地,不遺漏地獲得其中的至少一個(gè)所述候選號(hào)碼。
[0094]如圖7所不,在本實(shí)施例中,所述預(yù)選號(hào)碼對(duì)應(yīng)被投訴的號(hào)碼P,所述搜索模塊301從被投訴的號(hào)碼P所對(duì)應(yīng)的節(jié)點(diǎn)開(kāi)始進(jìn)行深度優(yōu)先遍歷搜索,即,首先以該節(jié)點(diǎn)作為起始節(jié)點(diǎn),按照其分支的指向搜索相鄰的其它節(jié)點(diǎn),直到葉節(jié)點(diǎn)然后再回溯到該葉節(jié)點(diǎn)的父節(jié)點(diǎn),搜索該父節(jié)點(diǎn)相鄰的其它節(jié)點(diǎn),直到搜索完所有的分支,從而找出其中的至少一個(gè)所述候選號(hào)碼。
[0095]參考圖9,圖9為本發(fā)明的預(yù)定類型號(hào)碼識(shí)別方法的第二實(shí)施例的流程圖,本實(shí)施例與上述第一實(shí)施例相似,不同之處在于:
[0096]所述作業(yè)關(guān)系鏈?zhǔn)峭ㄟ^(guò)所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402預(yù)先構(gòu)造的。
[0097]預(yù)先構(gòu)造所述作業(yè)關(guān)系鏈包括以下步驟:
[0098]步驟901,所述獲取模塊401獲取網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)。所述獲取模塊401可以從互聯(lián)網(wǎng)應(yīng)用的服務(wù)器中獲取或接收所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)。
[0099]步驟902,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402根據(jù)所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)生成作業(yè)關(guān)系鏈數(shù)據(jù),從而利用所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)構(gòu)造所述作業(yè)關(guān)系鏈。其中,所述作業(yè)關(guān)系鏈數(shù)據(jù)為與網(wǎng)絡(luò)交互作業(yè)的作業(yè)關(guān)系鏈相關(guān)的數(shù)據(jù),所述作業(yè)關(guān)系鏈包括至少兩節(jié)點(diǎn)。所述作業(yè)關(guān)系鏈數(shù)據(jù)包括號(hào)碼數(shù)據(jù)、作業(yè)流向信息、權(quán)重信息中的至少一者。如圖6所示,所述號(hào)碼數(shù)據(jù)包括號(hào)碼A、號(hào)碼B.....號(hào)碼K等的數(shù)據(jù),所述作業(yè)流向信息包括網(wǎng)絡(luò)交互作業(yè)的主體信息、網(wǎng)絡(luò)交互作業(yè)的對(duì)象信息,所述權(quán)重信息包括網(wǎng)絡(luò)交互作業(yè)的客體所對(duì)應(yīng)的數(shù)值和單位。
[0100]所述作業(yè)關(guān)系鏈數(shù)據(jù)還可以包括作業(yè)頻率信息。所述作業(yè)頻率信息與網(wǎng)絡(luò)交互作業(yè)的次數(shù)、網(wǎng)絡(luò)交互作業(yè)的時(shí)間間隔相關(guān)。所述號(hào)碼數(shù)據(jù)中的至少一個(gè)號(hào)碼與作業(yè)關(guān)系鏈中的至少一個(gè)節(jié)點(diǎn)對(duì)應(yīng),如圖6所示,其中,所述作業(yè)關(guān)系鏈與所述作業(yè)關(guān)系鏈數(shù)據(jù)相關(guān)。
[0101]所述搜索模塊301對(duì)所述作業(yè)關(guān)系鏈中的節(jié)點(diǎn)進(jìn)行搜索,以從所述作業(yè)關(guān)系鏈數(shù)據(jù)中選擇出至少一個(gè)所述候選號(hào)碼,所述候選號(hào)碼符合特定條件,即,所述搜索模塊301從所述作業(yè)關(guān)系鏈的所述節(jié)點(diǎn)中搜索至少一個(gè)符合特定條件的所述候選號(hào)碼,其中,所述候選號(hào)碼與所述節(jié)點(diǎn)對(duì)應(yīng)。具體地,所述搜索模塊301從所述作業(yè)關(guān)系鏈數(shù)據(jù)的號(hào)碼數(shù)據(jù)中選擇作為眾多網(wǎng)絡(luò)交互作業(yè)的對(duì)象的號(hào)碼,例如,號(hào)碼E和號(hào)碼H,如圖6所示。該號(hào)碼E和號(hào)碼H作為所述候選號(hào)碼。所述特定條件可以是具有作為眾多網(wǎng)絡(luò)交互作業(yè)的對(duì)象這一特征,也可以是網(wǎng)絡(luò)交互作業(yè)的頻率較大,還可以是在所述作業(yè)關(guān)系鏈中具有較多分支。
[0102]所述篩選模塊302從至少一個(gè)所述候選號(hào)碼中識(shí)別出至少一個(gè)預(yù)定類型號(hào)碼。具體地,所述篩選模塊302對(duì)所述候選號(hào)碼進(jìn)行檢查,以從中識(shí)別出至少一個(gè)預(yù)定類型號(hào)碼。所述篩選模塊302根據(jù)每一個(gè)所述候選號(hào)碼的特征、屬性判斷所述候選號(hào)碼是否符合預(yù)定模型,若是,則將其識(shí)別為預(yù)定類型號(hào)碼,其中所述預(yù)定模型可以是具有與惡意號(hào)碼相關(guān)的特征的模型。
[0103]在本實(shí)施例中,所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)包括至少兩作業(yè)記錄。
[0104]具體地,在步驟902中,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402根據(jù)所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)中的號(hào)碼數(shù)據(jù)、作業(yè)流向信息、作業(yè)頻率信息、權(quán)重信息中的至少一者,對(duì)所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)中的所述作業(yè)記錄進(jìn)行分類整理,以得出分類整理結(jié)果。具體地,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402根據(jù)所述作業(yè)記錄中的號(hào)碼數(shù)據(jù)、作業(yè)流向信息、作業(yè)頻率信息、權(quán)重信息中的至少一者,對(duì)所述作業(yè)記錄進(jìn)行分類整理,以得出分類整理結(jié)果。如圖6所示,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402分析任意兩所述作業(yè)記錄中的號(hào)碼數(shù)據(jù)是否具有相同的號(hào)碼,若是,則將所述兩作業(yè)記錄分為具有關(guān)聯(lián)一類。若兩作業(yè)記錄中的網(wǎng)絡(luò)交互作業(yè)的主體、對(duì)象均相同,則將所述兩個(gè)作業(yè)記錄中的客體的數(shù)值相加。
[0105]所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402根據(jù)所述分類整理結(jié)果生成所述作業(yè)關(guān)系鏈數(shù)據(jù)(作業(yè)關(guān)系鏈),其中,所述號(hào)碼數(shù)據(jù)與所述節(jié)點(diǎn)對(duì)應(yīng),所述作業(yè)流向信息與所述作業(yè)關(guān)系鏈中的分支對(duì)應(yīng)。如圖6所示,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402以號(hào)碼數(shù)據(jù)中的號(hào)碼作為節(jié)點(diǎn),以網(wǎng)絡(luò)交互作業(yè)的流向作為分支,生成所述作業(yè)關(guān)系鏈數(shù)據(jù),其中,所述作業(yè)關(guān)系鏈數(shù)據(jù)所對(duì)應(yīng)的作業(yè)關(guān)系鏈包括所述節(jié)點(diǎn)和所述分支。
[0106]所述網(wǎng)絡(luò)交互作業(yè)數(shù)據(jù)中的任意一個(gè)作業(yè)記錄是相對(duì)孤立的,所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402通過(guò)將每一個(gè)相對(duì)孤立的作業(yè)記錄和其他相對(duì)孤立的作業(yè)記錄建立關(guān)聯(lián),從而構(gòu)造所述作業(yè)關(guān)系鏈。所述作業(yè)關(guān)系鏈數(shù)據(jù)生成模塊402建立所述關(guān)聯(lián)以所述作業(yè)記錄中的網(wǎng)絡(luò)交互作業(yè)的主體、對(duì)象作為依據(jù)。
[0107]在本實(shí)施例中,所述搜索模塊301判斷與所述下一級(jí)節(jié)點(diǎn)(所搜索到的節(jié)點(diǎn)/分支節(jié)點(diǎn))相關(guān)的所述作業(yè)流向信息、所述作業(yè)頻率信息、所述權(quán)重信息中的至少一者是否符合所述特定條件。
[0108]參考圖10,圖10為本發(fā)明的預(yù)定類型號(hào)碼識(shí)別方法的第三實(shí)施例的流程圖,本實(shí)施例與上述第一或第二實(shí)施例相似,不同之處在于:
[0109]所述方法還包括以下步驟:
[0110]步驟1001,所述搜索模塊301從第二類型號(hào)碼在所述作業(yè)關(guān)系鏈中所對(duì)應(yīng)的節(jié)點(diǎn)開(kāi)始,根據(jù)預(yù)定閾值判斷所述作業(yè)關(guān)系鏈中所有節(jié)點(diǎn)的屬性是否與所述預(yù)定閾值相符,以生成第二判斷結(jié)果。
[0111]其中,所述預(yù)定閾值是根據(jù)歷史預(yù)定類型號(hào)碼作為第二訓(xùn)練樣本,并對(duì)所述第二訓(xùn)練樣本的特征進(jìn)行提取得出的。
[0112]具體地,在本實(shí)施例中,所述搜索模塊301根據(jù)預(yù)定閾值,對(duì)所述作業(yè)關(guān)系鏈中的節(jié)點(diǎn)的分支數(shù)量、分支權(quán)重中的至少一者進(jìn)行篩選,以得到至少一個(gè)所述候選號(hào)碼。其中,所述預(yù)定閾值是根據(jù)歷史預(yù)定類型號(hào)碼作為第二訓(xùn)練樣本,并對(duì)所述第二訓(xùn)練樣本的特征進(jìn)行提取得出的。
[0113]所述特征閾值與從第二訓(xùn)練樣本中提取的第二特征量均值相關(guān),所述第二訓(xùn)練樣本為關(guān)于經(jīng)過(guò)識(shí)別得出的惡意號(hào)碼的樣本。所述第二特征量包括所述作業(yè)關(guān)系鏈的分支數(shù)量、累積權(quán)重、相鄰節(jié)點(diǎn)數(shù)量。
[0114]在本實(shí)施例中,所述搜索模塊301根據(jù)預(yù)定閾值對(duì)所述節(jié)點(diǎn)所進(jìn)行的篩選操作是基于惡意號(hào)碼相比非惡意號(hào)碼交易次數(shù)多、交易金額大、關(guān)聯(lián)的獨(dú)立用戶多等方面來(lái)實(shí)施的。
[0115]本實(shí)施例的預(yù)定類型號(hào)碼識(shí)別方法還包括以下步驟:
[0116]步驟1002,所述去重模塊501對(duì)所述第一判斷結(jié)果中符合所述特定條件的節(jié)點(diǎn)和所述第二判斷結(jié)果中與所述預(yù)定閾值相符的節(jié)點(diǎn)進(jìn)行去重操作,以得到去重結(jié)果。
[0117]在步驟803中,所述篩選模塊302按照預(yù)先設(shè)置的篩選條件對(duì)所述去重結(jié)果進(jìn)行篩選,以得到所述預(yù)定類型號(hào)碼。
[0118]參考圖11,圖11為本發(fā)明的預(yù)