本說明書涉及機器學習,特別涉及一種資源轉移數據風險識別方法及裝置。
背景技術:
1、隨著大數據服務平臺技術的快速發展,金融交易渠道也越來越多樣化、越來越便捷。金融欺詐檢測在金融領域扮演著至關重要的角色,對銀行、金融機構、信用卡公司以及其他貸款提供者而言具有戰略性的重要性。目前欺詐檢測方法主要包括基于規則的欺詐檢測方法和基于機器學習的欺詐檢測方法。
2、基于規則的欺詐檢測方法,也被稱為傳統的金融欺詐檢測方法,是通過專家知識構建一套基于規則的檢測體系,進而評估交易是否為欺詐交易。具體而言,針對金融欺詐交易,先由金融領域專家們共同制定一套檢測規則,再通過模糊模式匹配的方法從一系列交易中篩選出某些可能存在異常的交易。該方法構建簡單,且由專家主導,準確度較高,具備一定的可解釋性。此類方法被廣泛應用于金融行業的各類欺詐檢測中。
3、基于機器學習的欺詐檢測方法,機器學習是一種通過對歷史數據的學習和分析,來自動發現數據中的模式和規律,并用于后續的預測和分類的方法。機器學習可以應用于識別可疑的交易或行為,從而提高反欺詐的效率和準確性。在機器學習方法中,常用的算法包括支持向量機、決策樹和隨機森林等。這些算法可以通過對歷史交易數據的學習和分析,來構建可疑交易檢測模型,自動識別可疑的交易。
4、然而,基于規則的欺詐檢測方法高度依賴專家經驗和專業知識,難以發現復雜隱蔽的欺詐模式。且根據欺詐方式同步演化的能力較弱,易被欺詐者識別進而改變行為以躲避檢測。同時基于人工規則定義的方式耗費人力。
5、而且,基于機器學習的欺詐檢測方法仍存在一些不足之處,傳統的機器學習技術需要大量的手工特征工程,即需要人工定義數據特征來訓練模型,這個過程十分耗時耗力。同時,由于金融欺詐行為具有隱蔽性、復雜性和多樣性,傳統的機器學習技術往往無法全面識別各種欺詐手段和模式,導致識別準確度不高,甚至會出現誤判的情況。此外,傳統的機器學習技術也不夠靈活,往往需要人工干預來更新模型,無法自動適應新的欺詐手段和模式。
6、針對上述問題,目前尚未提出有效的解決方案。
技術實現思路
1、本說明書實施例提供了一種資源轉移數據風險識別方法及裝置,以解決現有技術中交易風險識別方法不夠準確的問題。
2、本說明書實施例提供了一種資源轉移數據風險識別方法,包括:
3、接收風險檢測請求;響應于所述風險檢測請求,獲取批量資源轉移數據;
4、將所述批量資源轉移數據構建為圖結構數據;所述圖結構數據包括節點和邊,所述節點表示所述批量資源轉移數據中各資源轉移數據,所述邊表示不同資源轉移數據之間的資源轉移流;
5、將所述圖結構數據輸入目標識別模型中,得到所述批量資源轉移數據中各資源轉移數據對應的風險類別;
6、其中,所述目標識別模型中包括輸入層、特征提取層、全連接層和輸出層,所述特征提取層包括圖卷積網絡、門控循環單元和自注意力模塊,所述輸入層用于接收所述圖結構數據,所述圖卷積網絡用于從所述圖結構數據中提取空間特征;所述自注意力模塊用于基于所述空間特征自適應地計算所述圖結構數據中的各節點的特征權重;所述門控循環單元用于接收所述圖卷積網絡提取的空間特征與所述自注意力模塊計算的特征權重的乘積,并進行時序特征提取,得到所述圖結構數據的時空特征;所述門控循環單元還用于將所述時空特征傳輸給所述全連接層和輸出層進行分類,得到所述圖結構數據中各節點的風險類別。
7、在一個實施例中,所述批量資源轉移數據包括歷史時間段內的批量資源轉移數據;
8、相應的,將所述批量資源轉移數據構建為圖結構數據,包括:
9、將所述歷史時間段劃分為多個子時間段;
10、將所述多個子時間段內各子時間段內的資源轉移數據構建為所述各子時間段對應的圖結構數據;
11、相應的,將所述多個子時間段中對應的多個圖結構數據輸入至所述目標識別模型,所述目標識別模型包括多個圖卷積神經網絡和多個自注意力模塊,所述多個圖卷積神經網絡與所述多個自注意力模塊一一對應,所述多個圖卷積神經網絡與所述多個子時間段一一對應。
12、在一個實施例中,將所述批量資源轉移數據構建為鄰接矩陣形式的圖結構數據,包括:
13、計算所述批量資源轉移數據中各資源轉移數據對應的節點特征向量;
14、根據所述批量資源轉移數據中任兩個資源轉移數據之間是否存在資源轉移流,生成鄰接矩陣;
15、將所述節點特征向量作為所述圖結構數據的節點,利用所述鄰接矩陣表征所述圖結構數據的邊。
16、在一個實施例中,所述圖卷積網絡包括輸入層、隱藏層、relu激活函數和輸出層;所述輸入層用于輸出具有圖結構數據;所述隱藏層為圖卷積層,用于根據所述圖結構數據中的節點間的關系更新節點的特征;所述relu激活函數用于對所述圖結構數據中的節點進行非線性變換;所述輸出層用于輸出所述圖結構數據的空間特征。
17、在一個實施例中,所述門控循環單元包括重置門和更新門,所述重置門用于控制前一個隱狀態在當前子時間段的計算中保留的歷史信息;所述更新門用于控制當前子時間段的候選隱狀態對最終的隱狀態更新的貢獻程度;所述重置門與所述更新門用于控制當前子時間段的輸入與上一個子時間段的隱藏狀態之間的信息流。
18、在一個實施例中,所述全連接層的前向傳播公式為:
19、y=ffc(h)=σ(wfch+b)
20、其中,y=[y1,y2,…,yn]t表示批量資源轉移數據對應的風險類別矩陣;yi表示第i個資源轉移數據對應的風險類別,i=1,2,…n;n為批量資源轉移數據中資源轉移數據的數量,wfc表示全連接層的權重矩陣;b表示偏置,σ為激活函數。
21、本說明書實施例還提供了一種資源轉移數據風險識別裝置,包括:
22、接收模塊,用于接收風險檢測請求;響應于所述風險檢測請求,獲取批量資源轉移數據;
23、構建模塊,用于將所述批量資源轉移數據構建為圖結構數據;所述圖結構數據包括節點和邊,所述節點表示所述批量資源轉移數據中各資源轉移數據,所述邊表示不同資源轉移數據之間的資源轉移流;
24、識別模塊,將所述圖結構數據輸入目標識別模型中,得到所述批量資源轉移數據中各資源轉移數據對應的風險類別;
25、其中,所述目標識別模型中包括輸入層、特征提取層、全連接層和輸出層,所述特征提取層包括圖卷積網絡、門控循環單元和自注意力模塊,所述輸入層用于接收所述圖結構數據,所述圖卷積網絡用于從所述圖結構數據中提取空間特征;所述自注意力模塊用于基于所述空間特征自適應地計算所述圖結構數據中的各節點的特征權重;所述門控循環單元用于接收所述圖卷積網絡提取的空間特征與所述自注意力模塊計算的特征權重的乘積,并進行時序特征提取,得到所述圖結構數據的時空特征;所述門控循環單元還用于將所述時空特征傳輸給所述全連接層和輸出層進行分類,得到所述圖結構數據中各節點的風險類別。
26、本說明書實施例還提供一種計算機設備,包括處理器以及用于存儲處理器可執行指令的存儲器,所述處理器執行所述指令時實現上述任意實施例中所述的資源轉移數據風險識別方法的步驟。
27、本說明書實施例還提供一種計算機可讀存儲介質,其上存儲有計算機指令,所述指令被處理器執行時實現上述任意實施例中所述的資源轉移數據風險識別方法的步驟。
28、本說明書實施例還提供一種計算機程序產品,包括計算機程序/指令,所述計算機程序/指令被處理器執行時實現上述任意實施例中所述的資源轉移數據風險識別方法的步驟。
29、在本說明書實施例中,提供了一種資源轉移數據風險識別方法,可以響應于接收到的風險檢測請求,獲取批量資源轉移數據,將所述批量資源轉移數據構建為圖結構數據,圖結構數據包括節點和邊,節點表示所述批量資源轉移數據中各資源轉移數據,邊表示不同資源轉移數據之間的資源轉移流,之后,可以將所述圖結構數據輸入目標識別模型中,得到所述批量資源轉移數據中各資源轉移數據對應的風險類別。目標識別模型中包括輸入層、特征提取層、全連接層和輸出層,所述特征提取層包括圖卷積網絡、門控循環單元和自注意力模塊,所述輸入層用于接收所述圖結構數據,所述圖卷積網絡用于從所述圖結構數據中提取空間特征;所述自注意力模塊用于基于所述空間特征自適應地計算所述圖結構數據中的各節點的特征權重;所述門控循環單元用于接收所述圖卷積網絡提取的空間特征與所述自注意力模塊計算的特征權重的乘積,并進行時序特征提取,得到所述圖結構數據的時空特征;所述門控循環單元還用于將所述時空特征傳輸給所述全連接層和輸出層進行分類,得到所述圖結構數據中各節點的風險類別。通過上述方案,可以從深層學習的角度挖掘批量資源轉移數據中的時空相關性,預測資源轉移風險,彌補了傳統基于規則的方法和基于機器學習的方法無法從大規模復雜數據中挖掘深層時空特征的不足,可以實現對資源轉移風險進行有效、準確地預測,有助于強化金融機構和平臺的風控能力,有效規避風險,降低投資者損失,對維持金融秩序穩定和保障社會經濟持續發展具有重要價值。