本申請涉及模型訓練領域,尤其涉及一種用戶信用評價模型的數據處理方法和裝置。
背景技術:
1、在用戶信用評價的場景中,用戶信用與多種用戶行為有關。在基于用戶信用的消費過程中,用戶購買的消費品、貸款方式、貸款利率、分期付款、信用行為時間等多方面因素都對該用戶的信用評價造成影響。僅通過固定的規則或人為判斷的方式顯然不能滿足用戶信用評價的需求。
2、分類模型可以快速準確地實現分類處理,廣泛應用于多種場景中。而在用戶的信用評價場景中,不同分類的用戶數量相差較大,基于不平衡的數據樣本訓練得到的分類模型的分類準確性較低。
3、如何提高用戶信用評價模型的分類準確性,是本申請實施例提供的方案所要解決的技術問題。
技術實現思路
1、本申請實施例的目的是提供一種用戶信用評價模型的數據處理方法和裝置,用以提高用戶信用評價模型的分類準確性。
2、第一方面,提供了一種用戶信用評價模型的數據處理方法,包括:
3、獲取通信系統中的多個通信用戶的用戶行為樣本和對應的信用標簽,所述用戶行為樣本由通信用戶的消費行為信息生成,所述信用標簽表征對應的通信用戶在所述通信系統中所屬的信用評價分類;
4、獲取目標信用評價分類中的目標通信用戶的通信行為信息,所述目標信用評價分類為所述通信系統中的信用評價分類的少數類;
5、基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構建補充用戶樣本和對應的補充信用標簽,得到各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽,所述多個用戶樣本和對應的信用標簽用于訓練用戶信用評價模型。
6、第二方面,提供了一種用戶信用評價模型的數據處理裝置,包括:
7、第一獲取模塊,獲取通信系統中的多個通信用戶的用戶行為樣本和對應的信用標簽,所述用戶行為樣本由通信用戶的消費行為信息生成,所述信用標簽表征對應的通信用戶在所述通信系統中所屬的信用評價分類;
8、第二獲取模塊,獲取目標信用評價分類中的目標通信用戶的通信行為信息,所述目標信用評價分類為所述通信系統中的信用評價分類的少數類;
9、構建模塊,基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構建補充用戶樣本和對應的補充信用標簽,得到各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽,所述多個用戶樣本和對應的信用標簽用于訓練用戶信用評價模型。
10、第三方面,提供了一種電子設備,該電子設備包括處理器、存儲器及存儲在該存儲器上并可在該處理器上運行的計算機程序,該計算機程序被該處理器執行時實現如第一方面的方法的步驟。
11、第四方面,提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲計算機程序,該計算機程序被處理器執行時實現如第一方面的方法的步驟。
12、第五方面,提供了一種計算機程序產品,該計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,該計算機程序可操作來使計算機執行如第一方面的方法的部分或全部步驟。
13、在本申請實施例中,通過獲取通信系統中的多個通信用戶的用戶行為樣本和對應的信用標簽,用戶行為樣本由通信用戶的消費行為信息生成,信用標簽表征對應的通信用戶在通信系統中所屬的信用評價分類;獲取目標信用評價分類中的目標通信用戶的通信行為信息,目標信用評價分類為通信系統中的信用評價分類的少數類;基于目標通信用戶的用戶行為樣本和通信行為信息對目標信用評價分類構建補充用戶樣本和對應的補充信用標簽,得到各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽,其中,多個用戶樣本和對應的信用標簽用于訓練用戶信用評價模型。本方案針對于通信系統中的信用評價分類的少數類的通信用戶獲取通信行為信息,并根據少數類的用戶行為樣本和通信行為信息構建補充用戶樣本和對應的補充信用標簽,能對少數類的樣本數量實現補充。而且,補充用戶樣本是基于真實用戶的行為信息構建的,能真實體現出通信用戶的信用行為特征。各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽可以用于訓練用戶信用評價模型,從而能避免模型過擬合或欠擬合的情況,優化用戶信用評價模型的效果。
1.一種用戶信用評價模型的數據處理方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構建補充用戶樣本和對應的補充信用標簽,得到各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽,包括:
3.如權利要求2所述的方法,其特征在于,所述通信行為信息包括通信行為畫像參數;
4.如權利要求1所述的方法,其特征在于,獲取所述通信系統中的多個通信用戶的用戶行為樣本和對應的信用標簽,包括:
5.如權利要求4所述的方法,其特征在于,在對多個通信用戶的用戶行為樣本執行特征分布分析,得到所述用戶行為樣本的多維特征的分布結果之后,還包括:
6.如權利要求1所述的方法,其特征在于,在得到各信用評價分類中用戶樣本數據平衡的多個用戶樣本和對應的信用標簽之后,所述方法還包括:
7.如權利要求6所述的方法,其特征在于,所述通信行為信息包括通信行為失信頻次和通信行為失信價值。
8.一種用戶信用評價模型的數據處理裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如權利要求1至7中任一項所述的方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7中任一項所述的方法的步驟。
11.一種計算機程序產品,其特征在于,所述計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,所述計算機程序可操作來使計算機執行如權利要求1至7中任一項所述的方法的部分或全部步驟。