本發明涉及賬戶管理,具體是一種基于大數據的賬戶管理方法及系統。
背景技術:
1、隨著計算機設備的普及,每個人都可以借助計算機設備獲取到大量的便捷的服務,當然,也可以為別人提供服務,提供服務的一方往往稱為開發方。
2、開發方在對用戶提供服務時,往往需要對用戶的賬戶進行管理,賬戶管理涉及使用大數據技術和工具來收集、存儲、分析和管理大量賬戶相關的數據,對于基本信息、賬戶創建時間和賬戶狀態等靜態數據,借助數據庫存取操作即可進行管理,但是對于用戶的動態行為數據,管理過程較為復雜。如何對用戶的動態行為數據進行管理是本發明技術方案想要解決的技術問題。
技術實現思路
1、針對上述存在的問題,本發明提出一種基于大數據的賬戶管理方法及系統。
2、為實現上述目的,本發明提供如下技術方案:
3、一種基于大數據的賬戶管理方法,所述方法包括以下步驟:
4、在預處理階段統計所有賬戶行為,對賬戶行為進行編號;每一賬戶行為對應唯一且確定的編號;
5、根據用戶授予的權限實時獲取用戶的行為信息,查詢對應的編號;
6、每隔預設的時長,統計該時長內所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣;所述行為矩陣的行列位置對應歸屬地信息,每個行列位置上的值由賬戶標簽和行為信息的編號確定;
7、根據時間順序排列行為矩陣,基于行列位置上的值提取同一賬戶標簽的所有矩陣數據,對矩陣數據進行擬合,創建行為曲線;
8、基于所述行為曲線對賬戶進行分時段聚類,得到每一時段內的同類賬戶。
9、作為本發明進一步的技術方案,所述每隔預設的時長,統計該時長內所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣的步驟包括:
10、實時獲取訪問賬戶數量,根據時間軸排列賬戶數量,擬合數量變化函數;
11、對數量變化函數進行傅里葉變換,分析每一頻率分量的幅度,選取最大幅度對應的周期,作為數量變化函數的周期;
12、截取一個周期內的數量變化函數,對一個周期內的數量變化函數進行分段,確定統計節點;
13、若當前時刻達到統計節點,則統計前一時間段內的所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣。
14、作為本發明進一步的技術方案,所述若當前時刻達到統計節點,則統計前一時間段內的所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣的步驟包括:
15、獲取當前統計節點的前一統計節點,將前一統計節點至當前統計節點的時間段作為待統計時間段;
16、對待統計時間段內的任一賬戶,實時獲取行為信息,查詢其行為信息對應的編號;
17、在編號內插入賬戶標簽,作為元素值;
18、獲取賬戶的歸屬地信息,根據所述歸屬地信息確定行列位置,根據行列位置和元素值創建元素;
19、統計所有賬戶的元素,得到行為矩陣。
20、作為本發明進一步的技術方案,所述根據時間順序排列行為矩陣,基于行列位置上的值提取同一賬戶標簽的所有矩陣數據,對矩陣數據進行擬合,創建行為曲線的步驟包括:
21、根據時間順序排列行為矩陣;
22、在最底層行為矩陣中依次選取行列位置,查詢行列位置上的值中的賬戶標簽;
23、基于賬戶標簽依次在其他行為矩陣中定位元素,將定位到的元素位置及其元素值均作為矩陣數據;
24、對矩陣數據進行擬合,得到該賬戶標簽對應的行為曲線。
25、作為本發明進一步的技術方案,所述基于所述行為曲線對賬戶進行分時段聚類,得到每一時段內的同類賬戶的步驟包括:
26、對賬戶標簽進行兩兩配對,對任意兩個配對的賬戶,根據賬戶標簽讀取行為曲線;
27、將行為曲線置于相同的橫軸內,計算曲線距離;
28、根據所述曲線距離對所有賬戶進行聚類,得到當前時長內的同類賬戶。
29、作為本發明進一步的技術方案,所述行為曲線的生成過程為:
30、隨機選取四個矩陣數據,基于四個矩陣數據繪制貝塞爾曲線;其中,隨機選取的次數為預設值;
31、計算任一貝塞爾曲線與其他貝塞爾曲線的距離均值,選取距離均值的最小值對應的貝塞爾曲線,作為最終的行為曲線;
32、所述貝塞爾曲線為:
33、b(α)=(1―α)3p0+3(1―α)2αp1+3(1―α)α2p2+α3p3;其中,p0、p1、p2和p3為選取出的四個矩陣數據,α為預設的參數,α∈[0,1];
34、所述曲線距離的計算過程為:
35、式中,f(x)為基于同一坐標軸的其中一個曲線的函數表達式,g(x)為基于同一坐標軸的另一個曲線的函數表達式;x0為兩個曲線的共同左端點,x1為同一坐標軸上,橫軸距離較短的曲線的右端點。
36、本發明技術方案還提供了一種基于大數據的賬戶管理系統,所述系統包括:
37、行為編號模塊,用于在預處理階段統計所有賬戶行為,對賬戶行為進行編號;每一賬戶行為對應唯一且確定的編號;
38、編號查詢模塊,用于根據用戶授予的權限實時獲取用戶的行為信息,查詢對應的編號;
39、行為矩陣構建模塊,用于每隔預設的時長,統計該時長內所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣;所述行為矩陣的行列位置對應歸屬地信息,每個行列位置上的值由賬戶標簽和行為信息的編號確定;
40、曲線擬合模塊,用于根據時間順序排列行為矩陣,基于行列位置上的值提取同一賬戶標簽的所有矩陣數據,對矩陣數據進行擬合,創建行為曲線;
41、賬戶聚類模塊,用于基于所述行為曲線對賬戶進行分時段聚類,得到每一時段內的同類賬戶。
42、作為本發明進一步的技術方案,所述行為矩陣構建模塊包括:
43、函數擬合單元,用于實時獲取訪問賬戶數量,根據時間軸排列賬戶數量,擬合數量變化函數;
44、周期提取單元,用于對數量變化函數進行傅里葉變換,分析每一頻率分量的幅度,選取最大幅度對應的周期,作為數量變化函數的周期;
45、函數分段單元,用于截取一個周期內的數量變化函數,對一個周期內的數量變化函數進行分段,確定統計節點;
46、構建執行單元,用于若當前時刻達到統計節點,則統計前一時間段內的所有用戶的行為信息,獲取用戶的歸屬地信息,根據所述歸屬地信息構建行為矩陣。
47、作為本發明進一步的技術方案,所述曲線擬合模塊包括:
48、矩陣排列單元,用于根據時間順序排列行為矩陣;
49、標簽查詢單元,用于在最底層行為矩陣中依次選取行列位置,查詢行列位置上的值中的賬戶標簽;
50、數據定位單元,用于基于賬戶標簽依次在其他行為矩陣中定位元素,將定位到的元素位置及其元素值均作為矩陣數據;
51、擬合執行單元,用于對矩陣數據進行擬合,得到該賬戶標簽對應的行為曲線。
52、作為本發明進一步的技術方案,所述賬戶聚類模塊包括:
53、賬戶配對單元,用于對賬戶標簽進行兩兩配對,對任意兩個配對的賬戶,根據賬戶標簽讀取行為曲線;
54、距離計算單元,用于將行為曲線置于相同的橫軸內,計算曲線距離;
55、聚類執行單元,用于根據所述曲線距離對所有賬戶進行聚類,得到當前時長內的同類賬戶。
56、與現有技術相比,本發明的有益效果是:本發明以矩陣的形式統計每個時刻下所有賬戶的行為信息,以行為信息的歸屬地作為矩陣坐標,以行為信息的編號作為矩陣值,得到行為矩陣,在不同時刻的行為矩陣中選取相同賬戶的矩陣數據,連接矩陣數據并擬合出曲線,即可作為賬戶特征;進而將復雜的行為數據抽象為曲線,對曲線進行比對,將同類賬戶歸為一類,操作過程極為便捷,二次開發空間很大。