本發明實施例涉及數據評估技術領域,尤其涉及一種信用評估方法及裝置。
背景技術:
信用制度是銀行等機構開展個人消費信貸業務的基礎,銀行等機構通過獲取用戶的金融消費數據、網絡行為數據等預測用戶的金融信用,并定期更新該金融信用,根據金融信用為用戶提供信用業務。例如,芝麻信用通過呈現個人的信用情況,在酒店、租房、航空等場景為用戶、商戶提供信用服務。金融信用中,每個用戶就是一個具體的實體,通過該用戶在線下的金融消費數據,以及網絡行為數據(即線上數據)從而預測用戶的金融信用,通過線下與線上,實現閉環交易。
目前,一般通過金融信用來評估用戶在114分類信息網、58同城、趕集網等分類信息平臺上的信用。
然而,金融信息獲取的網絡行為數據,僅僅是用戶在一些交易平臺上的數據,只能反映用戶的金融信用,并不能反映用戶在分類信息平臺上的發帖表現等行為。
技術實現要素:
本發明提供一種信用評估方法及裝置,通過獲取用戶在分類信息平臺上的行為實現正確評估用戶在分類信息平臺上的信用的目的。
第一方面,本發明實施例提供一種信用評估方法,包括:
在第一時間段內獲取第一賬號在分類信息平臺上的行為數據;
對所述行為數據進行過濾獲取訓練樣本,并對所述行為數據進行訓練獲取行為特征;
將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用。
在一種可行的實現方式中,所述對所述行為數據進行過濾獲取訓練樣本,包括:
確定預設規則,根據所述預設規則獲取預設數量的樣本;
對所述預設數量的樣本進行驗證;
若所述預設數量的樣本中每個樣本滿足預設條件,則根據所述預設規則,過濾所述行為數據。
在一種可行的實現方式中,上述方法還包括:
確定與所述第一賬號關聯的第二賬號;
對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的訓練樣本;
將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
在一種可行的實現方式中,所述對所述行為數據進行訓練獲取行為特征,包括:
確定與所述第一賬號關聯的第二賬號;
對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的行為特征;
將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
在一種可行的實現方式中,所述在第一時間段內獲取用戶在分類信息平臺上的行為數據之前,還包括:
獲取至少一個用戶在所述分類信息平臺上的行為數據;
采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數據進行學習,生成所述分類模型。
在一種可行的實現方式中,根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用之后,還包括:
更新所述第一賬號在所述分類信息平臺上的信用。
第二方面,本發明實施例提供一種信用評估裝置,包括:
獲取模塊,用于在第一時間段內獲取第一賬號在分類信息平臺上的行為數據;
處理模塊,用于對所述行為數據進行過濾獲取訓練樣本,并對所述行為數據進行訓練獲取行為特征;
置信度確定模塊,用于將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
預測模塊,用于根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用。
在一種可行的實現方式中,所述處理模塊,具體用于確定預設規則,根據所述預設規則獲取預設數量的樣本,對所述預設數量的樣本進行驗證,若所述預設數量的樣本中每個樣本滿足預設條件,則根據所述預設規則,過濾所述行為數據。
在一種可行的實現方式中,所述處理模塊,還用于確定與所述第一賬號關聯的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的訓練樣本,將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
在一種可行的實現方式中,所述處理模塊,還用于確定與所述第一賬號關聯的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的行為特征,將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
在一種可行的實現方式中,所述處理模塊,在所述獲取模塊在第一時間段內獲取用戶在分類信息平臺上的行為數據之前,還用于獲取至少一個用戶在所述分類信息平臺上的行為數據;采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數據進行學習,生成所述分類模型。
在一種可行的實現方式中,所述處理模塊,在所述預測模塊根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用之后,還用于更新所述第一賬號在所述分類信息平臺上的信用。
本發明實施例提供的信用評估方法及裝置,在第一時間段內獲取第一賬號在分類信息平臺上的行為數據,根據該行為數據,獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內第一賬號在分類信息平臺上的置信度后,根據該置信度,預測第二時間段內,第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數據,通過對該行為數據進行分析預測未來時間段內第一賬號在分類信息平臺上的信用,實現正確評估用戶在分類信息平臺上的信用的目的。
附圖說明
為了更清楚地說明本發明方法實施例的技術方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明方法的一些實施例,對于本領域技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明信用評估方法的過程示意圖;
圖2為本發明信用評估方法實施例一的流程圖;
圖3為本發明信用評估裝置的結構示意圖。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。以下內容為結合附圖及較佳實施例,對依據本發明申請的具體實施方式、結構、特征及其功效的詳細說明。
本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”、“第三”、“第四”等(如果存在)是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換,以便這里描述的本發明的實施例例如能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
一般來說,用戶的金融信用,用于反映用戶的誠信度、償還債務的信譽等。與金融信用不同,第一賬號在分類信息平臺上的信用,用于反映該賬號為低質量賬號的概率、為違規賬號的概率或具有虛假行為的概率等。本發明實施例中,通過分析評估第一賬號在過去的一段時間,即第一時間段內的行為數據,結合通過機器學習學習得到的分類模型,預測未來時間段內,即第二時間段內第一賬號為低質量賬號的概率、為違規賬號的概率、具有虛假行為的概率。具體的,可參見圖1,圖1為本發明信用評估方法的過程示意圖。
請參照圖1,第一時間段例如為1個月,第二時間段也例如為一個月,第一時間段與第二時間段相鄰,在評分點,即第一時間端與第二時間端相交的點,分析第一賬號在第一時間段的行為數據,結合過濾規則過濾出訓練樣本,結合訓練規則訓練出行為數據,將訓練樣本和行為數據輸入至通過機器學習學習到的分類模型中,得出置信度,并根據該置信度,分析預測未來時間段內第一賬號在分類信息平臺上的信用。
另外,第二時間段結束后,可以對第二時間段的行為數據進行分析,結合過濾規則過濾出訓練樣本,結合訓練規則訓練出行為數據,將訓練樣本和行為數據輸入至通過機器學習學習到的分類模型中,得出置信度,并根據該置信度得出第一賬號在第二時間段內的實際信用,對比該信用與預測出的信用,從而對預測出的信用進行驗證。
上述是以第一時間段、第二時間段以月為單位對本發明信用評估方法進行說明的,然而,本發明并不以此為限制,在其他可行的實現方式中,第一時間段、第二時間段也可以以天為單位、以周為單位;或者,第一時間段以月為單位、第二時間段以周為單位;或者,第一時間段以周為單位、第二時間段以天為單位等。在根據置信度,預測第二時間段內第一賬號在分類信息平臺上的信用之后,還更新第一賬號在分類信息平臺上的信用,及時發現信用顯著降低的賬號并預警。
接下來,在上述圖1的基礎上,對本發明信用評估方法進行詳細說明。具體的,可參見圖2。
圖2為本發明信用評估方法的流程圖。本實施例包括:
101、在第一時間段內獲取第一賬號在分類信息平臺上的行為數據。
一般來說,不同的用戶在同一信息分類平臺上具有不同的賬號,同一個用戶在同一個信息分類平臺上甚至具有多個不同的賬號。通過賬號注冊方式,用戶在信息分類平臺上進行發帖、訪問特定信息等。與金融賬號不同的是,每個金融賬號都對應一個具體的實體,即對應一個具體的用戶,而分類信息平臺的賬號可能是隨便注冊的,因此無法對應到具體的線下實體。
本步驟中,對于一個具體分類信息平臺的一個具體賬號,即第一賬號,獲取該第一賬號在該平臺上的行為數據,如發帖數量、發帖內容等。
102、對所述行為數據進行訓練獲取訓練樣本,并對所述行為數據進行訓練獲取行為特征。
在獲取到行為數據后,對行為數據進行過濾,刪除其中的冗余數據或無用的數據等,從而獲得能夠真實反映第一賬號對應的用戶的行為的數據,將該些能夠真實反映第一賬號對應的用戶的行為的數據作為訓練樣本。同時,對行為數據進行訓練從而獲得第賬號對應的用戶的行為特征,如第一賬號是異地登錄的賬號、第一賬號是多次被投訴過的賬號等。
103、將訓練樣本與行為特征輸入分類模型,以確定第一賬號在分類信息平臺上的置信度。
本步驟中,將獲取到對訓練樣本和行為特征輸入分類模型,從而確定第一賬號在分類信息平臺上的置信度。其中,類型模型例如為對分類信息平臺歷史上存在的賬號的行為數據采用機器學習模型進行學習生成的。生成分類模型的過程中,獲取至少一個用戶在分類信息平臺上的行為數據;采用機器學習模塊對至少一個用戶在分類信息平臺上的數據進行學習,生成分類模型。該過程中,機器學習模型例如為邏輯回歸學習模型、隨機森林學習模型等,多模型之間采用加權平均獲得分類模型。
104、根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用。
在獲取到第一時間段內第一賬號在分類信息平臺上的置信度后,將該置信度線性拉伸到350~950區間并輸出,將輸出值作為第一時間段內第一賬號在分類信息平臺上的信用。然后,預測第二時間段內,第一賬號在分類信息平臺上的信用為根據置信度得出的信用。
本發明實施例提供的信用評估方法,在第一時間段內獲取第一賬號在分類信息平臺上的行為數據,根據該行為數據,獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內第一賬號在分類信息平臺上的置信度后,根據該置信度,預測第二時間段內,第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數據,通過對該行為數據進行分析預測未來時間段內第一賬號在分類信息平臺上的信用,實現正確評估用戶在分類信息平臺上的信用的目的。
可選的,上述實施例中,為獲取海量高質量訓練樣本,根據經驗等設置預設規則,根據預設規則從行為數據中提取出部分樣本,即預設數量的樣本,驗證該部分樣本是否合理,即是否滿足預設條件,若滿足,則根據預設規則,過濾行為數據以得到訓練樣本;否則,重新設置預設規則。該過程中,預設規則、預設條件以及預設數量等根據需求設置。
可選的,上述實施例中,提取出的第一賬號的行為數據有可能是有限的,對有限的行為數據進行分析,無法獲取到覆蓋全部行為的訓練樣本,進而并不能準確的預測出未來時間段內第一賬號的信用。此時,利用關系網絡挖掘與第一賬號關聯的第二賬號,對第二賬號的行為數據進行分析獲取第二賬號訓練樣本,通過第二賬號的訓練樣本擴充第一賬號的訓練樣本,保證樣本的覆蓋度。
具體的,確定與第一賬號關聯的第二賬號,對第二賬號在分類信息平臺上的行為數據進行訓練,得到第二賬號的訓練樣本,將第二賬號的訓練樣本加入至第一賬號的訓練樣本中。
可選的,上述實施例中,有些賬號活期較短,即存在的周期較短,提取出的第一賬號的行為數據有可能是有限的,對有限的行為數據進行分析,無法獲取到覆蓋全部行為的行為特征,進而不能準確的預測出未來時間段內第一賬號的信用。此時,利用關系網絡挖掘與第一賬號關聯的第二賬號,對第二賬號的行為數據進行分析獲取第二賬號的行為特征,通過第二賬號的行為特征擴充第一賬號的行為特征,保證行為特征的覆蓋度。
具體的,確定與第一賬號關聯的第二賬號;對第二賬號在分類信息平臺上的行為數據進行訓練,得到第二賬號的行為特征;將第二賬號的行為特征加入至第一賬號的行為特征中。
圖3為本發明信用評估裝置的結構示意圖,包括:
獲取模塊11,用于在第一時間段內獲取第一賬號在分類信息平臺上的行為數據;
處理模塊12,用于對所述行為數據進行過濾獲取訓練樣本,并對所述行為數據進行訓練獲取行為特征;
置信度確定模塊13,用于將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
預測模塊14,用于根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用。
本發明實施例提供的信用評估裝置,在第一時間段內獲取第一賬號在分類信息平臺上的行為數據,根據該行為數據,獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內第一賬號在分類信息平臺上的置信度后,根據該置信度,預測第二時間段內,第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數據,通過對該行為數據進行分析預測未來時間段內第一賬號在分類信息平臺上的信用,實現正確評估用戶在分類信息平臺上的信用的目的。
可選的,在本發明一實施例中,所述處理模塊12,具體用于確定預設規則,根據所述預設規則獲取預設數量的樣本,對所述預設數量的樣本進行驗證,若所述預設數量的樣本中每個樣本滿足預設條件,則根據所述預設規則,過濾所述行為數據。
可選的,在本發明一實施例中,所述處理模塊12,還用于確定與所述第一賬號關聯的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的訓練樣本,將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
可選的,在本發明一實施例中,所述處理模塊12,還用于確定與所述第一賬號關聯的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數據進行訓練,得到所述第二賬號的行為特征,將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
可選的,在本發明一實施例中,所述處理模塊12,在所述獲取模塊11在第一時間段內獲取用戶在分類信息平臺上的行為數據之前,還用于獲取至少一個用戶在所述分類信息平臺上的行為數據;采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數據進行學習,生成所述分類模型。
可選的,在本發明一實施例中,所述處理模塊12,在所述預測模塊14根據所述置信度,預測第二時間段內,所述第一賬號在所述分類信息平臺上的信用之后,還用于更新所述第一賬號在所述分類信息平臺上的信用。
本領域普通技術人員可以理解:實現上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質中。該程序在執行時,執行包括上述各方法實施例的步驟;而前述的存儲介質包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質。
最后應說明的是:以上各實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述各實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的范圍。