一種用于檢測欺詐交易的方法及系統的制作方法
【技術領域】
[0001] 本發明一般地涉及交易安全技術領域,并且具體地涉及一種用于檢測欺詐交易的 方法及系統
【背景技術】
[0002] 在人們的日常生活中,每天都會發生各種各樣的商業交易,包括用戶與物品/服 務的銷售商之間的交易等等。這些交易以各種各樣的方式進行,但一般都涉及通過現金/ 貨幣、銀行卡、匯票/支票的價值交換。所有這些交易都可能存在有人從其中進行欺詐獲利 的風險。
[0003] 以傳統的銀行卡交易風險管理系統為例,通常采用規則引擎等方法來進行銀行卡 交易的欺詐偵測工作。在規則引擎方法中,需要構建規則庫,以儲存用于判斷交易是否為欺 詐的業務規則。當一條交易提交給規則引擎時,規則引擎將該交易與加載在引擎中事先設 定的業務規則進行比較以判斷該條交易是否屬于欺詐交易。
[0004] 然而,在現有技術中,業務規則通常需要由經驗豐富的業務人員對每個欺詐交易 進行規律總結來得到,一條欺詐規則往往就需要花費業務人員大量的時間,況且僅靠人工 并不能有效地總結出所有的欺詐規律。因此,完全依靠業務人員尋找欺詐規則具有很大的 局限性,效率非常低。
[0005] 通過在交易進行初期就對欺詐行為進行辨別和制止可以有力地避免產生不可挽 回的損失,而目前尚未有高效可靠的欺詐交易檢測方法及系統。
【發明內容】
[0006] 鑒于上述情況,本發明旨在提供一種易于實現并且準確有效的欺詐交易檢測方法 及系統。
[0007] 具體地,本發明提供了一種用于檢測欺詐交易的方法,所述方法包括:獲取歷史欺 詐交易記錄以及歷史正常交易記錄;基于所述欺詐交易記錄和所述正常交易記錄兩者提取 特征因子;從所述欺詐交易記錄和所述正常交易記錄生成訓練樣本集合;用所述訓練樣本 集合構建決策樹,其中以正常交易和欺詐交易兩個類別為目標因子來構建葉節點并且依據 所述特征因子來構建所述決策樹的其他節點;從所述決策樹的所有從根節點到指示欺詐交 易的葉節點的路徑提取欺詐規則;以及根據所述欺詐規則對交易數據進行欺詐檢測。
[0008] 根據本發明的一些實施例,用訓練樣本數據構建決策樹包括以下步驟:a)在所述 訓練樣本集合中計算每個特征因子相對于所述目標因子的信息增益;b)將信息增益最大 的特征因子確定為所述決策樹的根節點;c)判斷根節點的特征因子所劃分的每個子樣本 集合是否滿足預先設定的決策樹中止條件;d)在尚未滿足所述中止條件的每個子樣本集 合中分別計算每個剩余特征因子相對于所述目標因子的信息增益;e)對于尚未滿足所述 中止條件的每個子樣本集合將剩余特征因子中信息增益最大的特征因子確定為所述根節 點的子節點;f)將每個子節點作為所述根節點重復上述步驟c)_e)。
[0009] 根據本發明的一些實施例,如權利要求2所述的方法,其特征在于,在相應的樣本 集合中每個特征因子K相對于目標因子的信息增益=目標因子在該樣本集合中的 信息熵-? _特征因子G在該樣本集合中的信息熵A,其中丑y=-/VIog2丹-JM0S2 及/V分別表示正常交易及欺詐交易在所述相應的樣本集合中出現的概率;并且其中
【主權項】
1. 一種用于檢測交易欺詐的方法,其特征在于,所述方法包括: 獲取歷史欺詐交易記錄以及歷史正常交易記錄; 基于所述欺詐交易記錄和所述正常交易記錄兩者提取特征因子; 從所述欺詐交易記錄和所述正常交易記錄生成訓練樣本集合; 用所述訓練樣本集合構建決策樹,其中以正常交易和欺詐交易兩個類別為目標因子來 構建葉節點并且依據所述特征因子來構建所述決策樹的其他節點; 從所述決策樹的所有從根節點到指示欺詐交易的葉節點的路徑提取欺詐規則;以及 根據所述欺詐規則對交易數據進行欺詐檢測。
2. 如權利要求1所述的方法,其特征在于,用訓練樣本數據構建決策樹包括以下步驟: a) 在所述訓練樣本集合中計算每個特征因子相對于所述目標因子的信息增益; b) 將信息增益最大的特征因子確定為所述決策樹的根節點; c) 判斷根節點的特征因子所劃分的每個子樣本集合是否滿足預先設定的決策樹中止 條件; d) 在尚未滿足所述中止條件的每個子樣本集合中分別計算每個剩余特征因子相對于 所述目標因子的信息增益; e) 對于尚未滿足所述中止條件的每個子樣本集合將剩余特征因子中信息增益最大的 特征因子確定為所述根節點的子節點; f) 將每個子節點作為所述根節點重復上述步驟c)_e)。
3. 如權利要求2所述的方法,其特征在于,在相應的樣本集合中每個特征因子 K相對于目標因子的信息增益=目標因子在該樣本集合中的信息熵-特征因子 G在該樣本集合中的信息熵, 其中Atj=-丹log2|?r-|?Flog 2;3F, ρΓ及辦分別表示正常交易及欺詐交易在所述相 應的樣本集合中出現的概率;并且 其中
S為所述相應的樣本集合中的樣本總數,7 為在該樣本集 合中所有特征因子K取值為的樣本數,為特征因子K的每個取值在該樣本集 合中的信息熵,其中
分別 表示正常交易及欺詐交易在所述相應的樣本集合中特征因子取值為的子集中出現的概 率。
4. 如權利要求2所述的方法,其特征在于,所述預先設定的決策樹中止條件包括: i) 在子節點下沒有剩余的特征因子; ii) 在子節點下有剩余特征因子時,確定正常交易及欺詐交易在所述子樣本集合中出 現的概率并且在兩者中的較小值小于預定閾值的情況下停止決策樹在該子樣本集合中的 生長;并且 構建決策樹還包括在滿足中止生長條件i)或ii)的位置將所述概率中的較大值對應 的交易類別確定為葉節點。
5. 如權利要求1所述的方法,其特征在于,所述決策樹被構造為其中的每次分支均是 對訓練樣本集合的二元劃分。
6. 如權利要求5所述的方法,其特征在于,確定特征因子包括: 分別提取欺詐交易記錄和正常交易記錄中的字段; 從兩者的非共有字段中進行篩選出可以被用作所述特征因子的特征變量;以及 將所述特征變量中的每一個的一個或多個取值設定為特征因子。
7. 如權利要求6所述的方法,其特征在于,所述交易為通過銀行卡進行的交易,并且所 述特征變量至少包括:交易日、交易星期值、交易時間、收單機構標識碼、發卡機構標識碼、 交易類型、商戶類型、交易幣種、交易渠道、銀行卡性質。
8. 如權利要求6所述的方法,其特征在于,生成訓練樣本集合包括對所述欺詐交易記 錄和所述正常交易記錄進行預處理,其中所述預處理包括從所述欺詐交易記錄和所述正常 交易記錄中剔除不包括與所有所述特征變量相關聯的完整信息的記錄。
9. 如權利要求6所述的方法,其特征在于,生成訓練樣本集合包括對所述欺詐交易記 錄和所述正常交易記錄進行預處理,其中所述預處理包括對于連續取值的特征變量,將所 述欺詐交易記錄和所述正常交易記錄中包含的該特征變量的取值離散化。
10. 如權利要求6所述的方法,其特征在于,提取欺詐規則包括合并所述路徑上與同一 特征變量相關聯的特征因子。
11. 如權利要求1所述的方法,其特征在于,從所述欺詐交易記錄和所述正常交易記錄 生成訓練樣本集合包括從所述欺詐交易記錄和所述正常交易記錄的總量中隨機抽取預定 預定百分比的樣本作為訓練樣本集合,而將剩余部分確定為測試樣本集合,并且 在從所生成的決策樹提取欺詐規則之前用所述測試樣本集合對該決策樹進行剪枝處 理。
12. -種用于檢測交易欺詐的系統,其特征在于,所述系統包括: 數據獲取裝置,被配置用于獲取歷史欺詐交易記錄以及歷史正常交易記錄; 特征提取裝置,被配置用于基于所述欺詐交易記錄和所述正常交易記錄兩者提取特征 因子; 訓練樣本生成裝置,被配置用于從所述欺詐交易記錄和所述正常交易記錄生成訓練樣 本集合; 決策樹生成裝置,被配置用于用所述訓練樣本集合構建決策樹,其中以正常交易和欺 詐交易兩個類別為目標因子來構建葉節點并且依據所述特征因子來構建所述決策樹的其 他節點; 規則提取裝置,被配置用于從所述決策樹的所有從根節點到指示欺詐交易的葉節點的 路徑提取欺詐規則;以及 欺詐檢測裝置,被配置用于根據所述欺詐規則對交易數據進行欺詐檢測。
【專利摘要】本發明提供了一種用于檢測欺詐交易的方法,所述方法包括:獲取歷史欺詐交易記錄以及歷史正常交易記錄;基于所述欺詐交易記錄和所述正常交易記錄兩者提取特征因子;從所述欺詐交易記錄和所述正常交易記錄生成訓練樣本集合;用所述訓練樣本集合構建決策樹,其中以正常交易和欺詐交易兩個類別為目標因子來構建葉節點并且依據所述特征因子來構建所述決策樹的其他節點;從所述決策樹的所有從根節點到指示欺詐交易的葉節點的路徑提取欺詐規則;以及根據所述欺詐規則對交易數據進行欺詐檢測。另一方面,本發明還提供了一種用于執行上述方法的系統。
【IPC分類】G06Q40-02, G06Q20-40, G06F17-30
【公開號】CN104679777
【申請號】CN201310631388
【發明人】趙金濤, 邱雪濤, 楊鴻超, 王駿
【申請人】中國銀聯股份有限公司
【公開日】2015年6月3日
【申請日】2013年12月2日