一種可疑洗錢路徑偵測方法及裝置的制造方法
【專利摘要】本發明涉及金融安全技術領域,尤其涉及一種可疑洗錢路徑偵測方法及裝置,用以確定金融網站中的可疑洗錢路徑,包括:首先確定待偵測的金融網絡中的所有節點,然后從所有節點中確定出起始節點集合和終點節點集合,以及確定節點之間的邊權值,然后確定出多個最短路徑,并將信息熵總和最大的最短路徑確定為可疑洗錢路徑,因而本發明解決了基于圖熵的可疑洗錢路徑偵測中只考慮節點的拓撲結構而不考慮節點的交易金額、交易次數的問題,提高了計算節點洗錢概率的精度;其次,本發明綜合考慮了節點之間的交易頻率、交易額度,從而提高了網絡拓撲結構的準確度。
【專利說明】
一種可疑洗錢路徑偵測方法及裝置
技術領域
[0001] 本發明涉及金融安全技術領域,尤其涉及一種可疑洗錢路徑偵測方法及裝置。
【背景技術】
[0002] 在洗錢網絡中存在著關鍵的洗錢路徑,它們在整個洗錢活動中發揮重要作用,如 果關鍵洗錢路徑被去除,那么整個洗錢網絡就難以繼續進行。關鍵洗錢路徑上的賬戶,就是 關鍵的洗錢節點,它們可能是重要的洗錢犯罪人員,例如洗錢主謀,也有可能是至關重要的 中間轉移者。通過技術手段從錯綜復雜的洗錢網絡中找到關鍵洗錢路徑,對打擊洗錢行為 有重要意義。
[0003] 現有技術中主要通過構建金融交易網絡拓撲圖,該圖中包含了原始金融交易流水 中所有的交易關系和資金流向,然后人工在圖上進行資金流向分析,追蹤一筆或多筆資金 的具體流向,從而挖掘出嫌疑團伙的資金流轉關系,得到高額高嫌疑資金路徑。
[0004] 該方法主要依據人工發現的方式,追蹤資金流向,找出可以洗錢路徑,因而導致該 方法效率低下,精確度較低,并且很難發現一些隱藏較深的可疑洗錢路徑。
[0005] 綜上所述,現有技術通過人工方式偵測可疑洗錢路徑,效率低下,精確度較低,并 且很難發現一些隱藏較深的可疑洗錢路徑。
【發明內容】
[0006] 本發明提供一種可疑洗錢路徑偵測方法及裝置,用以解決現有技術中存在的通過 人工方式偵測可疑洗錢路徑時,效率低下,精確度較低,并且很難發現一些隱藏較深的可疑 洗錢路徑的技術問題。
[0007] -方面,本發明實施例提供的一種可疑洗錢路徑偵測方法,包括:
[0008] 確定待偵測的金融網絡中的所有節點,其中,一個節點為一個銀行賬號;
[0009] 針對一個節點,根據設定時長內所述節點的節點轉賬信息,確定所述節點的轉出 信息熵和轉入信息熵,以及根據設定時長內節點交易信息,確定所述節點與其他節點之間 的邊權值;
[0010] 根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節點的轉入信息 熵,確定終點節點集合;
[0011]針對起始節點集合中的一個節點和終點節點集合中的一個節點,確定兩個節點之 間的最短路徑,其中所述最短路徑表示從所述起始節點到所述終點節點的所有路徑中,邊 權值之和最小的路徑;
[0012] 針對一條最短路徑,根據該最短路徑中所有節點的轉出信息熵和轉入信息熵,確 定該最短路徑的信息熵總和;
[0013] 確定信息熵總和最大的最短路徑為可疑洗錢路徑。
[0014] 可選地,所述針對一個節點,根據設定時長內該節點的節點轉賬信息,確定該節點 的轉出信息熵和轉入信息熵,包括:
[0015]根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述 節點的平均轉入概率;
[0016]根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的 平均轉入概率確定所述節點的轉入信息熵。
[00Π ]可選地,根據下列公式確定節點i的平均轉出概率:
[0018]
[0019] 其中,尸:為所述設定時長內節點i的平均轉出概率,Pi-為在所述設定時長內的一
1-' 個單位時長內的轉出概率,L為所述設定時長, -為在所述單位 時長內節點i的節點轉賬信息中的總轉出金額,Di-為在所述單位時長內節點i的節點轉賬信 息中的總轉出次數,^-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵 測金融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總 交易次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一 節點;
[0020] 根據下列公式確定節點i的平均轉入概率:
[0021]
節點交易信息中的節點i到節點j的交易次數,Ti為所述設定時長內所述節點交易信息中的 節點i的交易次數,T偽所述設定時長內所述節點交易信息中的節點j的交易次數,Fu為所 述設定時長內所述節點交易信息中的節點i到節點j的交易金額,FiS所述設定時長內所述 節點交易信息中的節點i的交易金額,h為所述設定時長內所述節點交易信息中的節點j的 交易金額,tl,t2,t3,t4,s,m分別為設定的系數,節點i為所有節點中任一節點,節點j為除 節點i之外的任一節點。
[0032] 可選地,所述根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節點 的轉入信息熵,確定終點節點集合,包括:
[0033] 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息 熵最大的k個節點確定為起始節點集合;其中,k為正整數;
[0034] 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信 息熵最大的k'個節點確定為終點節點集合,其中,k'為正整數。
[0035] 另一方面,本發明實施例提供的一種可疑洗錢路徑偵測裝置,包括:
[0036] 節點確定單元,用于確定待偵測的金融網絡中的所有節點,其中,一個節點為一個 銀行賬號;
[0037] 節點信息確定單元,用于針對一個節點,根據設定時長內所述節點的節點轉賬信 息,確定所述節點的轉出信息熵和轉入信息熵,以及根據設定時長內節點交易信息,確定所 述節點與其他節點之間的邊權值;
[0038] 集合確定單元,用于根據所有節點的轉出信息熵,確定起始節點集合,以及根據所 有節點的轉入信息熵,確定終點節點集合;
[0039] 最短路徑確定單元,用于針對起始節點集合中的一個節點和終點節點集合中的一 個節點,確定兩個節點之間的最短路徑,其中所述最短路徑表示從所述起始節點到所述終 點節點的所有路徑中,邊權值之和最小的路徑;
[0040] 信息熵確定單元,用于針對一條最短路徑,根據該最短路徑中所有節點的轉出信 息熵和轉入信息熵,確定該最短路徑的信息熵總和;
[0041] 可疑洗錢路徑確定單元,用于確定信息熵總和最大的最短路徑為可疑洗錢路徑。
[0042] 可選地,所述節點信息確定單元,具體用于:
[0043]根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述 節點的平均轉入概率;
[0044]根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的 平均轉入概率確定所述節點的轉入信息熵。
[0045]所述節點信息確定單元,具體用于:
[0046]根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述 節點的平均轉入概率;
[0047] 根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的 平均轉入概率確定所述節點的轉入信息熵。
[0048] 可選地,所述節點信息確定單元,具體用于:
[0049 ]根據下列公式確定節點i的平均轉出概率:
[0050]
[0051] 其中,f為所述設定時長內節點i的平均轉出概率,Pi-為在所述設定時長內的一 個單位時長內的轉出概率,L為所述設定時長,
^為在所述單位 時長內節點i的節點轉賬信息中的總轉出金額,Di-為在所述單位時長內節點i的節點轉賬信 息中的總轉出次數,^-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵 測金融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總 交易次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一 節點;
[0052] 根據下列公式確定節點i的平均轉入概率:
[0053]
[0054] 其中,&為所述設定時長內節點i的平均轉入概率
P1+為在所述單位時長內節點i的轉入概率,Q1+為在所述單位時長內節點i的節點轉賬信息 中的總轉入金額,D1+為在所述單位時長內節點i的節點轉賬信息中的總轉入次數,K1+為在 所述單位時長內節點i的節點轉賬信息中的節點的入度。
[0055] 可選地,所述節點信息確定單元,具體用于:
[0056] 根據下列公式確定節點i的轉出信息熵:
[0057]
[0058]其中,出―為節點i的轉出信息熵,η為設定的系數;
[0059] 根據下列公式確定所述節點i的轉入信息熵:
[0060]
[0061]其中,H1+為所述節點i的轉入信息熵。
[0062]可選地,所述節點信息確定單元,具體用于:
[0063 ]根據下列公式確定節點i到節點j的邊權值:
[0064]
[0065] 其中,ω ij為所述設定時長內節點i至I」節點j的邊權值,Tij為所述設定時長內所述 節點交易信息中的節點i到節點j的交易次數,h為所述設定時長內所述節點交易信息中的 節點i的交易次數,T偽所述設定時長內所述節點交易信息中的節點j的交易次數,為所 述設定時長內所述節點交易信息中的節點i到節點j的交易金額,FiS所述設定時長內所述 節點交易信息中的節點i的交易金額,h為所述設定時長內所述節點交易信息中的節點j的 交易金額,tl,t2,t3,t4,s,m分別為設定的系數,節點i為所有節點中任一節點,節點j為除 節點i之外的任一節點。
[0066] 可選地,所述集合確定單元,具體用于:
[0067] 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息 熵最大的k個節點確定為起始節點集合;其中,k為正整數;
[0068] 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信 息熵最大的k'個節點確定為終點節點集合,其中,k'為正整數。
[0069] 本發明實施例提供的方法,首先確定待偵測的金融網絡中的所有節點,然后從所 有節點中確定出起始節點集合和終點節點集合,以及確定節點之間的邊權值,然后確定出 多個最短路徑,并將信息熵總和最大的最短路徑確定為可疑洗錢路徑,因而本發明解決了 基于圖熵的可疑洗錢路徑偵測中只考慮節點的拓撲結構而不考慮節點的交易金額、交易次 數的問題,提高了計算節點洗錢概率的精度;其次,本發明綜合考慮了節點之間的交易頻 率、交易額度,從而提高了網絡拓撲結構的準確度;再次,本發明中采用轉出信息熵、轉入信 息熵的方法快速鎖定了洗錢交易的起始點和終點;最后,本發明可找到連接洗錢起始點和 終點的最關鍵路徑。
【附圖說明】
[0070] 為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使 用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本 領域的普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其 他的附圖。
[0071 ]圖1為本發明實施例提供的可疑洗錢路徑偵測方法流程圖;
[0072] 圖2為本發明實施例提供的節點拓撲結構示意圖;
[0073] 圖3為本發明實施例提供的可疑洗錢路徑偵測方法詳細流程圖;
[0074] 圖4為本發明實施例提供的可疑洗錢路徑偵測裝置示意圖。
【具體實施方式】
[0075] 為了使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明作進 一步地詳細描述,顯然,所描述的實施例僅僅是本發明一部份實施例,而不是全部的實施 例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的 所有其它實施例,都屬于本發明保護的范圍。
[0076] 下面結合說明書附圖對本發明實施例作進一步詳細描述。
[0077]如圖1所示,本發明實施例提供的可疑洗錢路徑偵測方法,包括:
[0078] 步驟101、確定待偵測的金融網絡中的所有節點;
[0079] 步驟102、針對一個節點,根據設定時長內所述節點的節點轉賬信息,確定所述節 點的轉出信息熵和轉入信息熵,以及根據設定時長內節點交易信息,確定所述節點與其他 節點之間的邊權值;
[0080] 步驟103、根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節點的 轉入信息熵,確定終點節點集合;
[0081 ]步驟104、針對起始節點集合中的一個節點和終點節點集合中的一個節點,確定兩 個節點之間的最短路徑,其中所述最短路徑表示從所述起始節點到所述終點節點的所有路 徑中,邊權值之和最小的路徑;
[0082] 步驟105、針對一條最短路徑,根據該最短路徑中所有節點的轉出信息熵和轉入信 息熵,確定該最短路徑的信息熵總和;
[0083] 步驟106、確定信息熵總和最大的最短路徑為可疑洗錢路徑。
[0084] 本發明實施例中的節點指的是可用于資金轉入和資金轉出的銀行賬戶。如圖2所 示,為本發明實施例提供的節點拓撲結構示意圖,其中以總節點數為9進行舉例說明,實際 應用中,總節點數不限。節點與節點之間有連接邊,并且連接邊是有方向的,節點之間有連 接是表示節點之間有交易來往,節點之間連接邊的方向表示交易的流向,比如,節點1和節 點2,節點1到節點2的邊權值為20,節點2到節點1的邊權值為18,兩個節點之間的邊權值是 根據兩個節點在一定時長內的交易次數、交易金額等綜合因素來確定的,反映了兩個節點 間的交易是否非常頻繁,邊權值越小,說明節點間交易越頻繁。
[0085] 上述步驟101中,確定待偵測的金融網絡中的所有節點,即確定待偵測的金融網絡 中有多個節點需要被納入偵測的范圍內。
[0086] 上述步驟102中,針對每一個節點,都需要計算出節點的轉出信息熵和轉入信息 熵,以及一個節點與其他節點之間的邊權值。信息熵指的是某種特定信息的出現概率,本發 明實施例中,轉出信息熵用于表示一個節點的資金從所述節點轉出的概率大小,轉入信息 熵用于表示資金轉入所述節點的概率大小,節點之間的邊權值反映了兩個節點間的交易頻 繁程度。
[0087] 其中,一個節點的轉出信息熵和轉入信息熵是根據設定時長內該節點的節點轉賬 信息確定的,其中設定時長可以是設定的天數,比如10天,20天等,也可以是設定的小時數, 比如4小時,8小時等,具體設定時長視實際需要而定,節點轉賬信息包含節點在設定時長的 每個節點的總轉出金額,總轉入金額,總轉出次數,總轉入次數,節點的出度,節點的入度, 以及待偵測金融網絡在設定時長的總交易金額,總交易次數,總節點度。其中,一個節點的 度分為節點入度和節點出度,節點入度是指有多少個節點指向自身,參考圖2,節點2的入度 為2,因為節點3指向它,節點1也指向它,節點的出度是指該節點指向多個少個節點,參考圖 2,節點1的出度為3,因為節點3指向節點2,節點6,以及節點7。
[0088] 待偵測金融網絡在設定時長的總交易金額為設定時長內所有節點的總轉出金額 和總轉入金額之和,在設定時長的總交易次數為設定時長內所有節點的總轉出次數和總轉 入次數之和,在設定時長的總節點度為設定時長內所有節點的節點入度和節點出度之和。 例如設定時長為2天,則可進一步在設定時長內劃分單位時長,比如單位時長為1天,待偵測 金融網絡中包含3個節點A,B,C。
[0089] 第一天:節點A向節點B轉賬1000萬元,節點B向節點C轉賬500萬元;
[0090] 第二天:節點B向節點A轉賬300萬元,節點A向節點C轉賬400萬元;
[0091] 則在設定時長內(即2天內),待偵測金融網絡的總交易金額為2000萬元,總交易次 數為4次,總節點度為8。
[0092] -個節點與其他節點之間的邊權值是根據設定時長內節點交易信息確定的,其中 節點交易信息包括設定時長內節點的交易次數,節點間的交易次數,節點的交易金額,以及 節點間的交易金額,并且節點間的邊權值是有方向的,參考圖2,節點2到節點3的邊權值為 12,是根據下列信息來確定的:節點2在設定時長內的總交易金額,節點3在設定時長內的總 交易金額,節點2在設定時長內向節點3轉賬的總交易金額,節點2在設定時長內的總交易次 數,節點3在設定時長內的總交易次數,節點2在設定時長內向節點3轉賬的總交易次數;同 樣地,節點3到節點2的邊權值為8,是根據下列信息來確定的:節點3在設定時長內的總交易 金額,節點3在設定時長內的總交易金額,節點3在設定時長內向節點2轉賬的總交易金額, 節點3在設定時長內的總交易次數,節點2在設定時長內的總交易次數,節點3在設定時長內 向節點2轉賬的總交易次數。
[0093] 上述步驟103中,根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有 節點的轉入信息熵,確定終點節點集合。例如可以是將節點的轉出信息熵符合某種條件的 節點生成起始節點集合;將節點的轉入信息熵符合另外某種條件的節點生成終點節點集 合,比如,將節點的轉出信息熵最大的k'個節點作為終點節點集合。
[0094] 上述步驟104中,針對起始節點集合中的一個節點和終點節點集合中的一個節點, 確定兩個節點之間的最短路徑,其中所述最短路徑表示從所述起始節點到所述終點節點的 所有路徑中,邊權值之和最小的路徑;例如,參考圖2,起始節點集合為{1,2},終點節點集合 為{7,9},則需要四條最短路徑,分別是節點1到節點7的最短路徑,節點1到節點9的最短路 徑,節點2到節點7的最短路徑,節點2到節點9的最短路徑。
[0095] 以求節點1到節點9的最短路徑為例,從節點1到節點9的路徑有兩條,分別為:
[0096] 路徑 1:1->2->3->4->9;
[0097] 路徑 2:1->6->5->8->9;
[0098] 其中,路徑1的邊權值之和為20+12+13++17 = 62,路徑2的邊權值之和為7+15+22+ 11 = 55,因此路徑2為節點1到9的最短路徑,即節點1到9的最短路徑為1->6->5->8->9。
[0099] 此外,節點1到節點7的最短路徑為:1_>7,節點2到節點7的最短路徑為:2->1->7, 節點2到節點9的最短路徑為:2->3->4->9。
[0100] 上述步驟105中,針對一條最短路徑,根據該最短路徑中所有節點的轉出信息熵和 轉入信息熵,確定該最短路徑的信息熵總和。
[0101] 上述步驟106中,確定信息熵總和最大的最短路徑為可疑洗錢路徑。還是以上面的 例子進行說明,四條最短路徑分別為:節點1到9的最短路徑1->6->5->8->9,節點1到節點7 的最短路徑:1 _> 7,節點2到節點7的最短路徑:2-> 1 -> 7,節點2到節點9的最短路徑:2-> 3-> 4_>9,假設節點1到節點7的最短路徑的信息熵總和是最大的,則將節點1到節點7的最短路 徑確定為可疑洗錢路徑。
[0102] 本發明實施例提供的方法,首先確定待偵測的金融網絡中的所有節點,然后從所 有節點中確定出起始節點集合和終點節點集合,以及確定節點之間的邊權值,然后確定出 多個最短路徑,并將信息熵總和最大的最短路徑確定為可疑洗錢路徑,因而本發明解決了 基于圖熵的可疑洗錢路徑偵測中只考慮節點的拓撲結構而不考慮節點的交易金額、交易次 數的問題,提高了計算節點洗錢概率的精度;其次,本發明綜合考慮了節點之間的交易頻 率、交易額度,從而提高了網絡拓撲結構的準確度;再次,本發明中采用轉出信息熵、轉入信 息熵的方法快速鎖定了洗錢交易的起始點和終點;最后,本發明可找到連接洗錢起始點和 終點的最關鍵路徑。
[0103] 具體地,上述步驟10 2中,根據設定時長內該節點的節點轉賬信息,確定該節點的 轉出信息熵和轉入信息熵的方式有多種,比如可以將一個節點設定時長內的轉出概率作為 該節點的轉出信息熵,將該節點設定時長內的轉入概率作為該節點的轉入信息熵;或者是 將一個節點所有單位時長內的轉出概率中最大的一個轉出概率作為該節點的轉出信息熵, 將一個節點所有單位時長內的轉入概率中最大的一個轉入概率作為該節點的轉入信息熵。 下面給出一種本發明實施例對于確定節點轉出信息熵和轉入信息熵的方式。
[0104] 可選地,所述針對一個節點,根據設定時長內該節點的節點轉賬信息,確定該節點 的轉出信息熵和轉入信息熵,包括:
[0105] 根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述 節點的平均轉入概率;
[0106] 根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的 平均轉入概率確定所述節點的轉入信息熵。
[0107] 上述方法,其中,節點轉賬信息包含節點在設定時長的每個節點的總轉出金額,總 轉入金額,總轉出次數,總轉入次數,節點的出度,節點的入度,以及待偵測金融網絡在設定 時長的總交易金額,總交易次數,總節點度。
[0108] 該方法,首先確定一個節點在設定時長內的平均轉出概率,并根據該節點的平均 轉出概率確定該節點的轉出信息熵,以及確定一個節點在設定時長內的平均轉入概率,并 根據該節點的平均轉入概率確定該節點的轉入信息熵,設定時長可以是按天數或者是按小 時,該方法以節點的平均轉出概率和平均轉入概率為依據,來確定一個節點的轉出信息熵 和轉入信息熵,可以更加準確地反映節點拓撲網絡中,每個節點的轉入轉出概率,從而可以 有助于更加精確地偵測出可疑洗錢路徑。
[0109] 對于如何確定一個節點的平均轉出概率和平均轉入概率,以及如何根據平均轉出 概率確定轉出信息熵,根據平均轉入概率確定轉入信息熵,視需要而定。
[0110] 可選地,根據下列公式確定節點i的平均轉出概率:
[0111]
12 其中,為所述設定時長內節點i的平均轉出概率,Pi-為在所述設定時長內的一 J - 個單位時長內的轉出概率,L為所述設定時長,
9在所述單位 時長內節點i的節點轉賬信息中的總轉出金額,Di-為在所述單位時長內節點i的節點轉賬信 息中的總轉出次數,^-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵 測金融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總 交易次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一 節點; 2 根據下列公式確定節點i的平均轉入概率:
[0114]
[0115] 其中,f為所述設定時長內節點i的平均轉入概率, 1 -f P1+為在所述單位時長內節點i的轉入概率,Q1+為在所述單位時長內節點i的節點轉賬信息 中的總轉入金額,D1+為在所述單位時長內節點i的節點轉賬信息中的總轉入次數,K1+為在 所述單位時長內節點i的節點轉賬信息中的節點的入度。
[0116] 上述方法中,給出了計算節點i的平均轉出概率和平均轉入概率的具體公式,其 中,設定時長可以是天數,比如10天,單位時長可以是1天,首先根據公式計算出節點i每天 的轉出概率和轉入概率,然后計算出節點i在這10天的平均轉出概率和平均轉入概率,該方 法在計算一個節點的單位時長的轉出概率和轉入概率時,充分考慮到了該節點在單位時長 內的總轉出金額,總轉入金額,總轉出次數,總轉入次數,節點出度,節點入度以及待偵測金 融網絡在單位時長內的總交易金額,總交易次數,總節點度,從而可以更加全面準確地反映 當前金融網絡中各個節點交易的情況,有助于更加精確地偵測出可疑洗錢路徑。
[0117] 上述方法中只是給出了計算節點單位時長轉出概率和轉入概率的一種方式,實際 應用中還可以有其它方式來計算,具體視實際需要而定。
[0118] 可選地,根據下列公式確定節點i的轉出信息熵:
[0119]
[0120] 其中,為節點i的轉出信息熵,η為設定的系數;
[0121] 根據下列公式確定所述節點i的轉入信息熵:
[0122]
[0123]其中,H1+為所述節點i的轉入信息熵。
[0124]上述方法,給出了一種計算節點i的轉出信息熵和轉入信息熵的方法,其中設定的 系數η的優選取值為2,即優選地,
一個節點的 轉出信息熵和轉入信息熵體現了節點向其它節點轉賬的概率大小和其它節點向該節點轉 賬的概率大小,從而可以反映當前節點轉賬的頻繁程度。
[0125 ]可選地,根據下列公式確定節點i到節點j的邊權值:
[0126]
[0127]其中,ω ij為所述設定時長內節點i至I」節點j的邊權值,Tij為所述設定時長內所述 節點交易信息中的節點i到節點j的交易次數,h為所述設定時長內所述節點交易信息中的 節點i的交易次數,T偽所述設定時長內所述節點交易信息中的節點j的交易次數,為所 述設定時長內所述節點交易信息中的節點i到節點j的交易金額,FiS所述設定時長內所述 節點交易信息中的節點i的交易金額,h為所述設定時長內所述節點交易信息中的節點j的 交易金額,tl,t2,t3,t4,s,m分別為設定的系數,節點i為所有節點中任一節點,節點j為除 節點i之外的任一節點。
[0128] 上述方法給出了一種計算兩個節點之間的邊權值的方法,其中邊權值是有方向 的,即節點i和節點j之間包含兩個邊權值,一個是節點i到節點j的邊權值,一個節點j到節 點i的邊權值,該方法在計算兩個節點之間的邊權值時,是根據節點的交易金額,節點的交 易次數,以及兩個節點間的交易金額和兩個節點間的交易次數,因而充分考慮到了節點間 的交互信息來確定節點間的邊權值,可以更好地反映節點之間的交易頻繁程度,有助于偵 測可疑洗錢路徑。此外,公式中的參數〖142,〖3 44,8,111分別為設定的系數可以根據實際需 要而定,優選地,1:1 = 2,七2 = 2,七3 = 2,七4 = 2,8 = 2,111=1,即
[0129] 可選地,所述根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節點 的轉入信息熵,確定終點節點集合,包括:
[0130] 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息 熵最大的k個節點確定為起始節點集合;其中,k為正整數;
[0131] 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信 息熵最大的k'個節點確定為終點節點集合,其中,k'為正整數。
[0132] 上述方法,在確定出每個節點的轉出信息熵和轉入信息熵之后,將轉出信息熵最 大的k個節點確定為起始節點集合,將轉入信息熵最大的k'個節點確定為終點節點集合,該 方法給出了一種確定路徑的起始節點和終點節點的方法,由于最終確定的可疑洗錢路徑的 特征就是路徑的信息熵總和最大,因此該方法在確定路徑的起始節點和終點節點時,將轉 出信息熵最大的k個節點確定為起始節點集合,將轉入信息熵最大的k'個節點確定為終點 節點集合,有助于更加精確地確定出可疑洗錢路徑。
[0133] 上述步驟105中,假設起始節點集合中的節點數量為k,終點節點集合中的節點數 量為k',則最終至多可以確定出k*k'個最短路徑,其中,有的最短路徑是走不通的,即無法 從一個節點走到另外一個節點,例如如圖2所示,比如節點5到節點1沒有路徑可走,從而也 沒有最短路徑,此時節點5到節點1的路徑可以設置為正無窮大。
[0134]在確定出所有的最短路徑之后,計算出每個最短路徑的信息熵總和,其中一個最 短路徑的信息熵總和為該路徑中每個節點的轉出信息熵和轉入信息熵的總和。
[0135] 對于給出了一個具體的網絡節點拓撲圖,比如類似圖2所示的網絡節點拓撲圖,可 以用現有技術中的很多方法來確定出最短路徑,比如使用Dijkstra(迪杰斯特拉)算法, Floyd(弗洛伊德)算法,動態規劃算法等等,因此,對于具體如何求最短路徑,可參考現有技 術,在此不贅述。
[0136] 上述步驟106中,將所有的最短路徑中,信息熵總和最大的最短路徑確定為可疑洗 錢路徑。
[0137] 本發明實施例提供的方法,首先確定待偵測的金融網絡中的所有節點,然后從所 有節點中確定出起始節點集合和終點節點集合,以及確定節點之間的邊權值,然后確定出 多個最短路徑,并將信息熵總和最大的最短路徑確定為可疑洗錢路徑,因而本發明解決了 基于圖熵的可疑洗錢路徑偵測中只考慮節點的拓撲結構而不考慮節點的交易金額、交易次 數的問題,提高了計算節點洗錢概率的精度;其次,本發明綜合考慮了節點之間的交易頻 率、交易額度,從而提高了網絡拓撲結構的準確度;再次,本發明中采用轉出信息熵、轉入信 息熵的方法快速鎖定了洗錢交易的起始點和終點;最后,本發明可找到連接洗錢起始點和 終點的最關鍵路徑。
[0138] 下面對本發明實施例提供的可疑洗錢路徑偵測方法做詳細描述。參考圖3,為本發 明實施例提供的可疑洗錢路徑偵測方法詳細示意圖。
[0139] 設定時長為L天,單位時長為1天,節點總數量為η。
[0140] 步驟301、計算出一天內第i(i = l,2,. . .,η)個節點的總轉出金額Qi-、總轉入金額 Qi+、總轉出次數Di-、總轉入次數Di+、節點的出度Ki-、節點的入度Ki+,以及這天內整個網絡總 的交易金額Q、交易次數D、總節點度K,總連接邊數KL。
[0141] 步驟302、計算出一天內第i(i = l,2, . . .,n)個節點的轉出概_
, 轉入概2
[0142] 步驟303、計算出L天內第i(i = l ,2, . . . ,η)個節點的轉出概率的均
轉入概率的均僅
[0143] 步驟304、計算出L天內第i(i = l ,2, . . . ,η)個節點的轉出信息熵沒= -.4 lugf , 轉入信息熵//. = -f l〇g>。 1 ¥ 1 -f- &
[0144]步驟3 0 5、定義節點i和節點j之間的邊權值,也就是兩個節點之間的距離,
[0145]其中Tu為所述設定時長內所述節點交易信息中的節點i到節點j的交易次數,1\為 所述設定時長內所述節點交易信息中的節點i的交易次數,L為所述設定時長內所述節點 交易信息中的節點j的交易次數,為所述設定時長內所述節點交易信息中的節點i到節點 j的交易金額,^為所述設定時長內所述節點交易信息中的節點i的交易金額,R為所述設定 時長內所述節點交易信息中的節點j的交易金額,節點i為所有節點中任一節點,節點j為除 節點i之外的任一節點
[0146]步驟306、選取起始節點集合S:對所有的節點按照轉出信息熵Hi-的值由高到低排 序,選擇排在前k的點組成起始節點集合。
[0147]步驟307、選取終點節點集合E:對所有的節點按照轉入信息熵H1+的值由高到低排 序,選擇排在前k'的點組成終點節點集合。
[0148] 步驟308、采用Floyd算法求出連接起始節點和終點節點的路徑。
[0149] 步驟309、求出每條最短路徑上所有節點的轉出信息熵之和以及轉入信息熵之和, 通過比較不同最短路徑上信息熵總和的大小,將信息熵總和最大的最短短路確定為可疑洗 錢路徑。
[0150] 基于相同的技術構思,本發明實施例還提供一種可疑洗錢路徑偵測裝置。本發明 實施例提供的可疑洗錢路徑偵測裝置如圖4所示。
[0151] 節點確定單元401,用于確定待偵測的金融網絡中的所有節點,其中,一個節點為 一個銀行賬號;
[0152] 節點信息確定單元402,用于針對一個節點,根據設定時長內所述節點的節點轉賬 信息,確定所述節點的轉出信息熵和轉入信息熵,以及根據設定時長內節點交易信息,確定 所述節點與其他節點之間的邊權值;
[0153] 集合確定單元403,用于根據所有節點的轉出信息熵,確定起始節點集合,以及根 據所有節點的轉入信息熵,確定終點節點集合;
[0154] 最短路徑確定單元404,用于針對起始節點集合中的一個節點和終點節點集合中 的一個節點,確定兩個節點之間的最短路徑,其中所述最短路徑表示從所述起始節點到所 述終點節點的所有路徑中,邊權值之和最小的路徑;
[0155] 信息熵確定單元405,用于針對一條最短路徑,根據該最短路徑中所有節點的轉出 信息熵和轉入信息熵,確定該最短路徑的信息熵總和;
[0156] 可疑洗錢路徑確定單元406,用于確定信息熵總和最大的最短路徑為可疑洗錢路 徑。
[0157] 可選地,所述節點信息確定單元402,具體用于:
[0158] 根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述 節點的平均轉入概率;
[0159] 根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的 平均轉入概率確定所述節點的轉入信息熵。
[0160] 可選地,所述節點信息確定單元402,具體用于:
[0161] 根據下列公式確定節點i的平均轉出概率:
[0162]
[0163] 其中,聲^為所述設定時長內節點i的平均轉出概率,Pi-為在所述設定時長內的一 '2:- 個單位時長內的轉出概率,L為所述設定時長
為在所述單位 時長內節點i的節點轉賬信息中的總轉出金額,Di-為在所述單位時長內節點i的節點轉賬信 息中的總轉出次數,^-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵 測金融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總 交易次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一 節點;
[0164] 根據下列公式確定節點i的平均轉入概率:
[0165]
[祕]其中,為所述設定時長內節點i的平均轉入概率,
p1+為在所述單位時長內節點i的轉入概率,Q1+為在所述單位時長內節點i的節點轉賬信息 中的總轉入金額,D1+為在所述單位時長內節點i的節點轉賬信息中的總轉入次數,K1+為在 所述單位時長內節點i的節點轉賬信息中的節點的入度。
[0167] 可選地,所述節點信息確定單元402,具體用于:
[0168] 根據下列公式確定節點i的轉出信息熵:
[0169]
[0170] 其中,I為節點i的轉出信息熵,η為設定的系數;
[0171] 根據下列公式確定所述節點i的轉入信息熵:
[0172]
[0173]其中,H1+為所述節點i的轉入信息熵。
[0174] 可選地,所述節點信息確定單元402,具體用于:
[0175] 根據下列公式確定節點i到節點j的邊權值:
[0176]
[0177] 其中,ω ij為所述設定時長內節點i至I」節點j的邊權值,Tij為所述設定時長內所述 節點交易信息中的節點i到節點j的交易次數,h為所述設定時長內所述節點交易信息中的 節點i的交易次數,T偽所述設定時長內所述節點交易信息中的節點j的交易次數,為所 述設定時長內所述節點交易信息中的節點i到節點j的交易金額,FiS所述設定時長內所述 節點交易信息中的節點i的交易金額,h為所述設定時長內所述節點交易信息中的節點j的 交易金額,tl,t2,t3,t4,s,m分別為設定的系數,節點i為所有節點中任一節點,節點j為除 節點i之外的任一節點。
[0178] 可選地,所述集合確定單元403,具體用于:
[0179] 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息 熵最大的k個節點確定為起始節點集合;其中,k為正整數;
[0180] 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信 息熵最大的k'個節點確定為終點節點集合,其中,k'為正整數。
[0181] 本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程 圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序 指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產 生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實 現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0182] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指 令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0183] 這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計 算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或 其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0184]盡管已描述了本發明的優選實施例,但本領域內的技術人員一旦得知了基本創造 性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優 選實施例以及落入本發明范圍的所有變更和修改。
[0185]顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精 神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍 之內,則本發明也意圖包含這些改動和變型在內。
【主權項】
1. 一種可疑洗錢路徑偵測方法,其特征在于,包括: 確定待偵測的金融網絡中的所有節點,其中,一個節點為一個銀行賬號; 針對一個節點,根據設定時長內所述節點的節點轉賬信息,確定所述節點的轉出信息 熵和轉入信息熵,以及根據設定時長內節點交易信息,確定所述節點與其他節點之間的邊 權值; 根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節點的轉入信息熵,確 定終點節點集合; 針對起始節點集合中的一個節點和終點節點集合中的一個節點,確定兩個節點之間的 最短路徑,其中所述最短路徑表示從所述起始節點到所述終點節點的所有路徑中,邊權值 之和最小的路徑; 針對一條最短路徑,根據該最短路徑中所有節點的轉出信息熵和轉入信息熵,確定該 最短路徑的信息熵總和; 確定信息熵總和最大的最短路徑為可疑洗錢路徑。2. 如權利要求1所述的方法,其特征在于,所述針對一個節點,根據設定時長內該節點 的節點轉賬信息,確定該節點的轉出信息熵和轉入信息熵,包括: 根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述節點 的平均轉入概率; 根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的平均 轉入概率確定所述節點的轉入信息熵。3. 如權利要求2所述的方法,其特征在于,根據下列公式確定節點i的平均轉出概率:其中,?為所述設定時長內節點i的平均轉出概率,P 1-為在所述設定時長內的一個單 I - 位時長內的轉出概率,L為所述設定時長,,Q1-為在所述單位時長 內節點i的節點轉賬信息中的總轉出金額,D1-為在所述單位時長內節點i的節點轉賬信息中 的總轉出次數,K1-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵測金 融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總交易 次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一節點; 根據下列公式確定節點i的平均轉入概率:其中,€為所述設定時長內節點i的平均轉入概率P1+為 在所述單位時長內節點i的轉入概率,Q1+為在所述單位時長內節點i的節點轉賬信息中的總 轉入金額,D1+為在所述單位時長內節點i的節點轉賬信息中的總轉入次數,K1+為在所述單 位時長內節點i的節點轉賬信息中的節點的入度。4. 如權利要求3所述的方法,其特征在于,根據下列公式確定節點i的轉出信息熵:其中,H1-為節點i的轉出信息熵,η為設定的系數; 根據下列公式確定所述節點i的轉入信息熵:其中,H1+為所述節點i的轉入信息熵。5. 如權利要求1所述的方法,其特征在于,根據下列公式確定節點i到節點j的邊權值:其中,wij為所述設定時長內節點i到節點j的邊權值,Tij為所述設定時長內所述節點交 易信息中的節點i到節點j的交易次數,T1為所述設定時長內所述節點交易信息中的節點i 的交易次數,L為所述設定時長內所述節點交易信息中的節點j的交易次數,Flj為所述設定 時長內所述節點交易信息中的節點i到節點j的交易金額,FA所述設定時長內所述節點交 易信息中的節點i的交易金額,F j為所述設定時長內所述節點交易信息中的節點j的交易金 額,tl,12 43,14,8,111分別為設定的系數,節點;[為所有節點中任一節點,節點』_為除節點;[之 外的任一節點。6. 如權利要求1所述的方法,其特征在于,所述根據所有節點的轉出信息熵,確定起始 節點集合,以及根據所有節點的轉入信息熵,確定終點節點集合,包括: 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息熵最 大的k個節點確定為起始節點集合;其中,k為正整數; 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信息熵 最大的k'個節點確定為終點節點集合,其中,k'為正整數。7. -種可疑洗錢路徑偵測裝置,其特征在于,包括: 節點確定單元,用于確定待偵測的金融網絡中的所有節點,其中,一個節點為一個銀行 賬號; 節點信息確定單元,用于針對一個節點,根據設定時長內所述節點的節點轉賬信息,確 定所述節點的轉出信息熵和轉入信息熵,以及根據設定時長內節點交易信息,確定所述節 點與其他節點之間的邊權值; 集合確定單元,用于根據所有節點的轉出信息熵,確定起始節點集合,以及根據所有節 點的轉入信息熵,確定終點節點集合; 最短路徑確定單元,用于針對起始節點集合中的一個節點和終點節點集合中的一個節 點,確定兩個節點之間的最短路徑,其中所述最短路徑表示從所述起始節點到所述終點節 點的所有路徑中,邊權值之和最小的路徑; 信息熵確定單元,用于針對一條最短路徑,根據該最短路徑中所有節點的轉出信息熵 和轉入信息熵,確定該最短路徑的信息熵總和; 可疑洗錢路徑確定單元,用于確定信息熵總和最大的最短路徑為可疑洗錢路徑。8. 如權利要求7所述的裝置,其特征在于,所述節點信息確定單元,具體用于: 根據所述節點設定時長內的節點轉賬信息,確定所述節點的平均轉出概率和所述節點 的平均轉入概率; 根據所述節點的平均轉出概率確定所述節點的轉出信息熵,以及根據所述節點的平均 轉入概率確定所述節點的轉入信息熵。9. 如權利要求8所述的裝置,其特征在于,所述節點信息確定單元,具體用于: 根據下列公式確定節點i的平均轉出概率:其中,f為所述設定時長內節點i的平均轉出概率,P1-為在所述設定時長內的一個單 位時長內的轉出概率,L為所述設定時長,,Q1-為在所述單位時長 內節點i的節點轉賬信息中的總轉出金額,D1-為在所述單位時長內節點i的節點轉賬信息中 的總轉出次數,K1-為在所述單位時長內節點i的節點轉賬信息中的節點出度,Q為待偵測金 融網絡在所述單位時長內的總交易金額,D為待偵測金融網絡在所述單位時長內的總交易 次數,K為待偵測金融網絡在所述單位時長內的總節點度,節點i為所有節點中的任一節點; 根據下列公式確定節點i的平均轉入概率:其中,€為所述設定時長內節點i的平均轉入概率, ,P1+為 ,1 + 在所述單位時長內節點i的轉入概率,Q1+為在所述單位時長內節點i的節點轉賬信息中的總 轉入金額,D1+為在所述單位時長內節點i的節點轉賬信息中的總轉入次數,K1+為在所述單 位時長內節點i的節點轉賬信息中的節點的入度。10. 如權利要求9所述的裝置,其特征在于,所述節點信息確定單元,具體用于: 根據下列公式確定節點i的轉出信息熵:其中,H1-為節點i的轉出信息熵,η為設定的系數; 根據下列公式確定所述節點i的轉入信息熵:其中,H1+為所述節點i的轉入信息熵。11. 如權利要求7所述的裝置,其特征在于,所述節點信息確定單元,具體用于: 根據下列公式確定節點i到節點j的邊權值:其中,wij為所述設定時長內節點i到節點j的邊權值,Tij為所述設定時長內所述節點交 易信息中的節點i到節點j的交易次數,T1為所述設定時長內所述節點交易信息中的節點i 的交易次數,L為所述設定時長內所述節點交易信息中的節點j的交易次數,Flj為所述設定 時長內所述節點交易信息中的節點i到節點j的交易金額,FA所述設定時長內所述節點交 易信息中的節點i的交易金額,F j為所述設定時長內所述節點交易信息中的節點j的交易金 額,tl,12 43,14,8,111分別為設定的系數,節點;[為所有節點中任一節點,節點』_為除節點;[之 外的任一節點。12.如權利要求7所述的裝置,其特征在于,所述集合確定單元,具體用于: 根據所有節點的轉出信息熵,確定轉出信息熵最大的k個節點,并將所述轉出信息熵最 大的k個節點確定為起始節點集合;其中,k為正整數; 根據所述節點的轉入信息熵,確定轉入信息熵最大的k'個節點,并將所述轉入信息熵 最大的k'個節點確定為終點節點集合,其中,k'為正整數。
【文檔編號】H04L12/721GK105933223SQ201510947458
【公開日】2016年9月7日
【申請日】2015年12月16日
【發明人】鐘毅, 趙金濤, 邱雪濤
【申請人】中國銀聯股份有限公司