本發明涉及數據處理領域,更為具體而言,涉及一種數據特征庫建立方法和系統。
背景技術:
隨著銀行數據管理的不斷發展,銀行crm系統(對公客戶關系管理系統),在貫徹落實業務發展戰略、客戶戰略的基礎上,運用信息技術,整合客戶關系管理、經營活動管理、管理決策支持三大模塊,滿足客戶識別與評價、經營活動全過程管理與考核、管理層決策輔助支持需要,實現“以客戶驅動”為核心的業務經營管理模式。但當前的客戶關系管理系統存在幾個問題:首先,缺少管理和決策工具,缺乏對經營活動過程控制,造成管理者很多管理手段都無法應用;其次,為客戶經理提供的參考消息不足,客戶分析篩選能力不夠,對客戶產業鏈條上的商機挖掘不夠,都制約了我行業務的發展;最后,對客戶經理營銷評價“定量少”,缺乏營銷過程的數據積累,對服務團隊評價“憑感覺”等問題。
技術實現要素:
鑒于現有技術的上述缺陷,本發明實施方式提供了一種數據特征庫建立方法和系統,能夠有效解決當前客戶關系管理系統的多項管理問題。
具體地,本發明實施方式提供了一種數據特征庫建立方法,其包括:
根據對公信息項和同業經驗分析得到對公客戶的特征指標項,再根據所述特征指標項的業務含義和加工規則,對所述特征指標項進行主題和維度劃分,確定每個指標的使用需求;
根據所述每個指標的使用需求和所述加工規則,構建所述對公客戶的特征庫數據集市;
基于所述特征庫數據集市,對所述對公客戶進行分析和模型訓練,并根據所述模型訓練后的數據轉換規則和參數配置,并根據所述數據轉換規則進行模型固化和投產。
相應地,本發明實施方式還提供了一種數據特征庫建立系統,其中,所述系統包括:
特征指標分析模塊,用于根據對公信息項和同業經驗分析得到對公客戶的特征指標項,再根據所述特征指標項的業務含義和加工規則,對所述特征指標項進行主題和維度劃分,確定每個指標的使用需求;
數據集市構建模塊,用于根據所述每個指標的使用需求和所述加工規則,構建所述對公客戶的特征庫數據集市;
分析訓練模塊,用于基于所述特征庫數據集市,對所述對公客戶進行分析和模型訓練;
模型固化模塊,用于根據所述模型訓練后的數據轉換規則和參數配置,并根據所述數據轉換規則進行模型固化和投產。
通過采用本發明實施方式具有下述有益效果:實現基于客戶的針對性管理方案,提升專業化服務,以及提供更完善的數據支持。
附圖說明
圖1是根據本發明實施方式的一種數據特征庫建立方法的流程示意圖;
圖2是根據本發明實施方式中表結構示意圖;
圖3是根據本發明實施方式中寬窄表的關系圖;
圖4是根據本發明實施方式的一種數據特征庫建立系統的架構圖。
具體實施方式
為了便于理解本發明技術方案的各個方面、特征以及優點,下面結合附圖對本發明進行具體描述。應當理解,下述的各種實施方式只用于舉例說明,而非用于限制本發明的保護范圍。
首先對根據本發明可能涉及到的名稱或術語進行解釋。
etl:extract-transform-load用來描述從來源端經抽取、轉換、加載的數據處理過程;
sas:statisticsanalysissystem一個用于處理處理與統計分析的軟件。
實施例1:
圖1是根據本發明實施方式的一種數據特征庫建立方法的流程示意圖。參照圖1,具體實施例如下:
所述方法包括:
步驟s1,根據對公信息項和同業經驗分析得到對公客戶的特征指標項,再根據所述特征指標項的業務含義和加工規則,對所述特征指標項進行主題和維度劃分,確定每個指標的使用需求;
步驟s2,根據所述每個指標的使用需求和所述加工規則,構建所述對公客戶的特征庫數據集市;以及
步驟s3,基于所述特征庫數據集市,對所述對公客戶進行分析和模型訓練,并根據所述模型訓練后的數據轉換規則和參數配置,并根據所述數據轉換規則進行模型固化和投產。
本發明基于企業級數據倉庫建立特征庫,分析師能夠通過對客戶的細分與群分改善我行公司客戶基礎薄弱,推進客戶結構優化提升基于客戶細分的差別化、專業化服務;通過挖掘營銷商機庫增加商機來源渠道并提升商機獲取效率,為客戶經理提供完善的單一客戶分析數據;提升商機銷售的過程管理;為管理層決策支持提供數據分析基礎。因此,本發明通過構建對公客戶的特征庫數據集市,從而解決當前客戶關系管理系統的多項管理問題,實現基于客戶的針對性管理方案,提升專業化服務,以及提供更完善的數據支持。
實施例2:
所述步驟s1中,對所述特征指標項進行主題和維度劃分包括:對所述特征指標項進行數據大類、業務類別和信息項的多層次劃分。具體而言,以銀行數據倉庫經典十大模型主題域(團體、地域、協議、事件、產品、資產、營銷活動、渠道、財務、申請、模型)作為數據準備基礎;以推進基于細分的精細化客戶管理、推進商機與客戶重大事件全過程管理作為搭建數據集市的業務需求驅動,分析特征庫集市需要的數據項包括:
1、客戶基本信息:賬戶信息、客戶簽約信息、企業關聯關系、財務信息、交易信息、產品信息;
2、客戶特征信息:渠道交易特征、上下游特征、進出口貿易特征、利潤貢獻特征、客戶群體細分特征、現金流特。
(1)以此分析滿足客戶特征分析的數據需求業務大類:
(2)定義出數據需求業務大類后,根據需求大類分析從行內系統的取數的業務規則,進一步細化指標分類:
3、最后需求分析師
將細化后的需求指標分類中描述的各種具體信息項進行進一步的分解、衍生、迭代。
例如,將公司存量客戶基本信息的指標類別細分為客戶的組織成立日期、注冊資金、注冊地址、組織性質等;將賬戶存貸款的實時交易流水統計出以月、季、年等不同時間段的累計金額及進行分析比較等,以此確定特征庫指標項。
此時特征庫指標項已是業務需求中所需的各種基礎數據的完備的描述,且各指標項都能最精確的、無二意的描述解釋某一特定業務含義,為后續對數據的加工應用提供了穩定支持。指標項分析結果舉例如下:
實施例3:
在本發明的另一種實施方式中,所述方法除了上述處理方式外,其中,步驟s2中所述構建所述對公客戶的特征庫數據集市包括:根據后續數據挖掘場景和實際應用,所述特征數據集市采用寬窄表方式。
具體而言,客戶特征庫數據集市存放經過深度提煉加工客戶特征數據,主要是面向分析模型提供分析挖掘所需的全面客戶特征數據。按照客戶特征類別包括:存量公司客戶特征庫、潛在公司客戶特征庫、標準分析維度數據。以特征庫指標項、客戶特征類別為基礎,綜合考慮指標項實際落地維護、查詢使用、分析挖掘等場景,搭建出可物理化的概念模型。概念模型定義了每個實體表其應該包含的特征庫指標項清單、加工頻率、保存策略、各指標項數據加工路徑、實體間邏輯關系等信息。
數據加工人員收到需求分析師分析設計的特征指標項需求與概念模型,根據需求分析每個特征指標的加工數據路徑并轉換物理模型。根據概念模型定義好的實體表規則,將概念模型實際拆分或整合成可創建,可使用的物理模型,為后續數據挖掘提供了數據來源。數據集市模型有星型模型,雪花模型等。在本發明中,根據對后續數據挖掘場景的考量,以及實際使用中對效率、存儲、速度、易用程度等的綜合考慮,數據集市模型結構采用寬窄表方式。
數據集市中按數據內容分為:存量客戶特征庫、潛在客戶特征庫、客戶分析挖掘結果回寫;按指標時間統計范圍和存儲周期分為當前表、月累計表、年累計表(表結構如圖2所示)。
其中寬窄表的關系如圖3所示,其中:寬表的數據來源于窄表,是窄表數據的匯總、總結;窄表是寬表數據必要的補充。寬表:方便、迅速、易使用,但加工邏輯復雜。窄表:數據信息豐富、易加工,但數據量大、處理速度慢。寬表與窄表的選擇是效率、存儲、速度、易用程度等的綜合考慮。
在圖3中,對公客戶特征主表、對公客戶特征月累計、對公客戶特征年累計為寬表;受托支付明細、客戶和對公參與人關系、客戶和對私參與人關系、客戶簽約明細、客戶合約明細、月末合約明細、月末簽約明細、現金流月累計、資金流月累計、渠道交易月累計、持有產品盈利信息、現金流年累計、資金流年累計、渠道交易年累計為窄表。
窄表是寬表相應數據項的明細擴展與補充。例如,在對公客戶特征主表中,存在“關聯關系”的若干數據項,而寬表存放的只會是當前狀態下該對公客戶關聯的企業數量(和對公參與人關系)及法人代表信息(和對私參與人關系),若想分析挖掘此關聯企業的明細信息及法人代表的歷史變化情況,需向更細粒度的窄表鉆取分析。
實施例4:
在本發明的另一種實施方式中,所述方法除了上述處理方式外,其中,所述對所述對公客戶進行分析和模型訓練包括:利用sas工具對所述公客戶進行即席查詢和專題模型訓練。
具體而言,基于特征庫數據集市,分析師利用sas工具進行對公客戶的分析挖掘,分析挖掘應用場景可分兩大類:即席查詢、專題模型訓練。即席查詢通常是針對行領導和對公條線經營管理層提出的熱點業務問題、客戶群策略研究任務,對公客戶分析師采用量化分析的方式,基于我行真實數據,利用數據挖掘工具(如sas):1、開展即席分析活動,并利用挖掘成果撰寫專題報告,以支持管理層精細化客戶群策略制定。2、基于總結的挖掘成果構建臨時形態的營銷模型,并輸出臨時性專題營銷名單,以支持開展精準營銷。專題模型訓練包括但不僅限于:1、對公客戶分析師基于一線營銷專家訪談、分行反饋,經過一定時間的營銷經驗積淀,定期歸納典型的對公客戶營銷模式和規律,并形成專題營銷業務說明書。2、對公客戶分析師使用量化分析的方式,基于真實的客戶數據,對專題營銷活動客戶的產品覆蓋、利潤貢獻等表現進行趨勢分析,評估專題營銷的效果,定期進行模型優化,以不斷提升專題營銷的精度。
即席查詢的產出一般為撰寫分析報告,專題模型訓練產出為模型規則。以下是分別對兩種應用場景的舉例說明:
(a)情景名稱:即席分析挖掘(客戶群策略分析)
情景定義:通常是針對行領導和對公條線經營管理層提出的熱點業務問題、客戶群策略研究任務,對公客戶分析師采用量化分析的方式,基于我行真實數據,利用數據挖掘工具(如saseg),開展即席分析活動,并利用挖掘成果撰寫專題報告,以支持管理層精細化客戶群策略制定。業務流程:
step1.管理層交辦熱點業務問題或客戶群策略研究分析任務:行領導和對公條線經營管理在客戶管理和政策制定過程中,提出熱點業務問題和策略研究任務,線下或通過其他日常工作平臺下達至對公客戶分析師。產出:對公客戶群策略研究任務說明書。
step2.分析師開展分析活動:對公客戶分析師針對管理層交辦的分析任務,基于我行當前最新的真實數據,利用數據挖掘工具(如sas),分析數據表現,總結規律,并將模型產出的關鍵性圖表輸出到本地,以支撐后續的報告撰寫。產出:1、模型產出的圖表、2、即席分析模型。
step3.分析師撰寫和提交管理層報告:對公客戶分析師依據分析挖掘成果和模型輸出的圖表素材,利用ppt/word等office工具撰寫分析師報告,通過其他日常工作平臺上交至管理層。產出:分析師報告(word/ppt等形式)
(b)情景名稱:專題營銷建模
情景定義:對公客戶分析師基于一線營銷專家訪談、分行反饋,經過一定時間的營銷經驗積淀,定期歸納典型的對公客戶營銷模式和規律,并形成專題營銷業務說明書;在此基礎上,采用數據量化的方式,構建相應營銷模型,同時模型庫管理人員(技術)將固化且經過審核的模型采用一定方式(sascode或sql)部署到投產環境進行應用。業務流程如下:
step1.分析師基于一線訪談和分行反饋,總結和撰寫專題營銷業務說明書:分析師基于一線訪談結果和分行反饋,定期梳理典型的對公客戶營銷模式和規律,在本地撰寫專題營銷業務說明書(excel或ppt等格式)。產出:專題營銷業務說明書。
step2.分析師構建專題營銷模型并撰寫模型使用說明書:分析師基于專題營銷業務說明書,使用我行真實的數據和數據挖掘工具(如saseg),對營銷模型的客戶篩選規則進行分析和總結,并在sas訓練模型庫中構建基于sas的專題營銷模型,同時按照統一的模型發布流程規范,撰寫專題營銷模型使用說明書(和模型開發需求說明書),并將模型和相關提交件一并提交至建模環境下的模型庫管理工具。產出:1、專題營銷模型、2、專題營銷模型使用說明書、3、專題營銷模型開發需求說明書。
step3.模型庫管理人員對模型和使用說明書進行審核確認,并在模型庫管理工具中進行發布,形成審核通過的模型版本。針對分析師提交的專題營銷模型,按照相應的流程規范進行審核,審核通過即可發布至模型庫管理工具,形成審核通過的模型版本;審核不通過則通過線下或其他日常工作平臺向分析師提出反饋意見,并在模型庫管理工具中對該模型進行修改或刪除。產出:無。
step4.模型庫管理人員(技術)進行專題營銷模型部署和投產:
(1)專題營銷模型部署到sas投產模型庫;
(2)若sas投產模型庫采用sascode形式,則模型庫管理人員(技術)將step3提交的sascode模型部署到投產環境進行投產應用;
(3)若sas投產模型庫采用sql等其他形式,則模型庫管理人員(技術)基于stp3發布的專題營銷模型開發需求說明書,轉化成sql等形式,并部署到投產環境進行應用。產出:模型相對應的sql等。
step5.模型投產運行監控人員對模型運行情況進行監控:投產后模型管理人員(監控)對投產環境模型的運行過程,進行監控和管理。產出:投產環境模型運行報告。
實施例5:
在本發明的另一種實施方式中,所述方法除了上述處理方式外,其中,
基于所述特征庫數據集市,對所述對公客戶進行分析和模型訓練,在具體實施方式中,另外,分析師經反復訓練后模型,如要在生產環境部署該模型進一步檢驗模型效果,需經投產模型固化步驟。分析師把訓練后的模型轉換為可實施的加工規則,并提供規則所需的參數配置閥值;數據加工人員針對接收的加工需求,轉換為可落地的批處理作業,其中參數要采用可配置化方式,支持投產后修改。固化是一種將挖掘動作產生的分析挖掘類模型與事件類模型包含的詳細設計要素進一步規則優化、數據加工路徑確定為可重復實現的規則模型的過程,為后續通過技術方式(sascode或sql)將模型落地部署到投產環境進行結果產出與應用提供加工依據。其中,分析挖掘類模型包含:忠誠度-價值細分模型、自定義客戶細分模型、客戶群分布特征分析模型、產品覆蓋度與持有產品分布特征分析模型、資金鏈條上下游特征分析模型、交易行為與渠道偏好特征分析模型、現金流特征分析模型、客戶群產品持有相關聯分析模型、交易行為與持有產品關聯分析模型、利潤貢獻特征分析模型、客戶細分群體總體監控管理模型、客戶細分群體規模變動分析模型、客戶細分群體產品覆蓋度變動分析模型、客戶細分群體遷移與流失分析模型和客戶群分群體利潤貢獻變動分析模型。
事件類模型包含:營銷類事件模型,其中,ce1:結算賬戶資金大幅波動、ce2:我行進出口貿易商上下游潛在客戶的拓展、ce3:客戶辦理銀行承兌匯票收款人為潛在客戶的拓展、ce4:客戶申請受托支付、ce5:我行核心企業上下游客戶挖掘、客戶提醒類事件模型、ce6:定期存款提前支取、ce7:客戶持有理財產品到期、ce8:客戶大額資金轉出至他行同名賬戶、ce9:活躍賬戶數持續減少、ce10:賬戶使用頻率顯著下降。
詳細設計要素包含:1、模型數據輸入、輸出特征字段數據源預評估;2、相關分析設計(分析路徑/規則);3、模型輸出與其他模型或功能頁面耦合方式設計;4、模型運行方式(人工、自動調度等)。
另外,所述方法還包括:對所述模型固化后投產模型的產出結果經數據傳輸后流轉給前臺應用功能。舉例如下:
應用一:客戶忠誠度-價值細分
基于選定的某一類客戶群,按照忠誠度-價值組合維度進行分析,形成相應的客戶細分群體。在識別和挖掘高價值目標客戶群體中,形成針對目標客戶群體的戰略建議,支持決策層深入了解銀行公司客戶構成特征,為制定和完善客戶價值提升戰略支持。
應用二:公司客戶現金流特征分析
分析客戶與客戶間的資金往來交易,挖掘客戶在銀行資金流特征以及按結算產品分布的客戶資金流特征,為對公各條線營銷團隊提供目標客群在銀行的現金流特征參考和說明。
應用三:產品覆蓋度與持有產品分布
基于存量客戶分層分類模型和各細分模型輸出的各細分群體,進一步分析該群體客戶在銀行的產品分布特征,包括產品覆蓋度、持有產品類型、產品數量、產品交易頻率和金額等,以支持總、分行公司金融業務管理團隊深入了解各高價值細分群體客戶的產品需求規律,精確制定針對目標客戶細分市場的產品組合策略。
目前已經實現的投產模型5個,投產模型產出與應用關系如下表所示:
圖4是根據本發明實施方式的一種數據特征庫建立系統的架構圖,如圖所示,所述系統包括:
特征指標分析模塊100,用于根據對公信息項和同業經驗分析得到對公客戶的特征指標項,再根據所述特征指標項的業務含義和加工規則,對所述特征指標項進行主題和維度劃分,確定每個指標的使用需求;
數據集市構建模塊200,用于根據所述每個指標的使用需求和所述加工規則,構建所述對公客戶的特征庫數據集市;
分析訓練模塊300,用于基于所述特征庫數據集市,對所述對公客戶進行分析和模型訓練;
模型固化模塊400,用于根據所述模型訓練后的數據轉換規則和參數配置,并根據所述數據轉換規則進行模型固化和投產。
本發明通過構建對公客戶的特征庫數據集市,從而解決當前客戶關系管理系統的多項管理問題,實現基于客戶的針對性管理方案,提升專業化服務,以及提供更完善的數據支持。
在本發明的另一實施方式中,所述對所述特征指標項進行主題和維度劃分包括:對所述特征指標項進行數據大類、業務類別和信息項的多層次劃分。
在本發明的又一實施方式中,所述構建所述對公客戶的特征庫數據集市包括:根據后續數據挖掘場景和實際應用,所述特征數據集市采用寬窄表方式。
在本發明的再一實施方式中,所述對所述對公客戶進行分析和模型訓練包括:利用sas工具對所述公客戶進行即席查詢和專題模型訓練。
在本發明的最后一個實施方式中,所述系統還包括:模型產出模塊,用于對所述模型固化后投產模型的產出結果經數據傳輸后流轉給前臺應用功能。
需要說明的是,上述數據特征庫建立系統的各個實施方式與所述數據特征庫建立方法的對應技術內容完全一致,為了避免重復,在此不再冗述。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本發明可借助軟件結合硬件平臺的方式來實現。基于這樣的理解,本發明的技術方案對背景技術做出貢獻的全部或者部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在存儲介質中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本發明各個實施例或者實施例的某些部分所述的方法。
本領域技術人員應當理解,以上所公開的僅為本發明的實施方式而已,當然不能以此來限定本發明之權利范圍,依本發明實施方式所作的等同變化,仍屬本發明權利要求所涵蓋的范圍。