用戶行為分析的方法
【技術領域】
[0001]本發明涉及信息技術,特別涉及用戶行為分析的方法。
【背景技術】
[0002]用戶行為分析在電子商務、智能營銷等領域廣泛應用,是收集用戶的控制動作信息,分析用戶在使用資源時表現出來的規律、個性化的習慣,并生成用戶偏好信息。
[0003]智能電視的問世,改變了用戶觀看電視節目的傳統,實現讓用戶通過移動端(手機、平板等)觀看電視的功能。大數據對用戶使用移動端產生的行為屬性進行了采集和存儲,利用大數據對用戶行為進行分析,提取用戶興趣,了解其特點,一方面可以進行用戶個性化定制和推送,另一方面可以優化完善移動端APP界面組織,提升界面交互能力,使用戶操作更加簡潔。
【發明內容】
[0004]本發明要解決的技術問題是:提供一種用戶行為分析的方法,獲取用戶行為數據,并對用戶進行分析,將分析結果展示給商家。
[0005]為解決上述問題,本發明采用的技術方案是:用戶行為分析的方法,包括如下步驟:
[0006]a.采集用戶的行為數據,并上傳給數據處理系統;
[0007]b.數據處理系統對上傳的行為數據進行處理;
[0008]c.周期性地從數據處理系統中抽取數據,并存儲到數據倉庫系統;
[0009]d.依據數據倉庫系統中的存儲數據確定用戶的行為分析維度,并依據所述行為分析維度在數據庫管理系統中建立數據庫模型;
[0010]e.從數據倉庫系統中抽取出目標數據,對目標數據進行清洗和轉換,將清洗和轉換后的數據進行匯總分析,并將匯總分析后的結果數據加載到數據庫管理系統的對應數據表中;
[0011]f.將所述結果數據進行各類圖形展示。
[0012]進一步的,步驟a中所述行為數據包括用戶點播的內容及格式。
[0013]進一步的,步驟a中的行為數據以json格式上傳給數據處理系統。
[0014]進一步的,步驟d中數據倉庫系統的存儲數據包括節目類型、節目名稱、觀看記錄數、觀看人數。
[0015]進一步的,在進行抽取目標數據時,以數據上報到的時間作為分區字段抽取數據。
[0016]進一步的,步驟e中的清洗指:剔除不完整的數據、賣場機以及測試機上報的干擾數據。
[0017]本發明的有益效果是:通過定期獲取用戶行為,經過清洗、轉換、匯總分析后,最終按照預先定義好的數據庫模型把匯總分析好的結果數據加載到對應表中去,商家能夠有效精準的用戶推送,優化移動端APP界面組織,提升用戶體驗,增加移動端APP及電視的使用量。
【附圖說明】
[0018]圖1為實施例方法的流程圖
【具體實施方式】
[0019]下面結合附圖和實施例對本發明進一步說明。
[0020]用戶在點播過程中,行為數據量大,且用戶喜好電視節目具有近期有效性,如一部電影,從上映到后續一段時間內受到用戶關注度較大,我們在分析這類數據的時候不需要全量掃描所有行為數據,因此數據倉庫系統可以選用hive。hive是一種基于Hadoop的數據倉庫系統,可以將結構化的數據文件映射為一張數據庫表,并提供簡單的sql查詢功能,同時hive的分區存儲機制大大節省數據掃描分析時間。
[0021]本發明選用kafka對行為數據進行處理,kafka是一種高吞吐量的分布式發布訂閱消息系統,它可以處理消費者規模的網站中的所有動作流數據,具有如下特性通過0(1)的磁盤數據結構提供消息的持久化,這種結構對于即使數以TB的消息存儲也能夠保持長時間的穩定性能高吞吐量:即使是非常普通的硬件kafka也可以支持每秒數十萬的消息;ii1.支持通過kafka服務器和消費機集群來分區消息;iv.支持Hadoop并行數據加載。
[0022]數據庫管理系統選用mysql,mysql具有用于存儲不同數據的數據表,不同數據的數據表可以方便的存儲不同數據,且還兼具體積小、速度快、總體擁有成本低、開放源碼的特點。
[0023]如圖1所示,本發明具體實現步驟如下:
[0024]1.采集用戶點播的內容、格式等行為數據,并將行為數據以以json格式上傳給kafka ο其中,行為數據以json格式傳送到kafka進行處理,json作為一種輕量級的數據格式,具有傳輸效率高的特點。
[0025]2.kafka對行為數據進行處理;
[0026]3.每天定時地從kafka中抽取數據,并加載到hive中。
[0027]4.依據hive中的節目類型、節目名稱、觀看記錄數、觀看人數等數據,確定用戶的行為分析維度,并依據所述行為分析維度在mysql中建立數據倉庫模型。
[0028]5.從hive中抽取出目標數據,并對目標數據進行清洗、轉換。
[0029]在進行抽取目標數據時,我們可以數據上報到的時間p_log_date作為分區字段,抽取有效時間內用戶行為數據,提高數據清洗分析效率。
[0030]上述清洗指剔除不完整的數據、賣場機以及測試機上報的干擾數據,以保證最后用戶行為分析結果的準確性。清洗的具體步驟為:根據給賣場機用戶機打的標記,剔除isprototype = ' Γ or isprototype = ’ true’代表的賣場機數據;測試機可根據電視軟件版本排除,以及用IP定位,通過IP地址剔除公司(企業)內部測試機。
[0031]6.將清洗和轉換后的數據進行匯總分析,并將匯總分析后的結果數據加載到數據庫管理系統的對應數據表中。
[0032]7.對結果數據進行各類圖形展示。可直觀看出近段時間(近一個月),每個節目類型下的節目觀看排行情況,供業務查看及進行深度分析。商家根據深度分析的結果能夠有效、精準地進行用戶推送,優化移動端APP界面組織,提升用戶體驗,增加移動端APP及電視的使用量。
[0033]本發明通過對數據的精準分析,準確定位用戶喜好,方便用戶使用,提升用戶體驗,增加移動端APP及電視的使用量。
[0034]以上描述了本發明的基本原理和主要的特征,說明書的描述只是說明本發明的原理,在不脫離本發明精神和范圍的前提下,本發明還會有各種變化和改進,這些變化和改進都落入要求保護的本發明范圍內。
【主權項】
1.用戶行為分析的方法,其特征在于,包括如下步驟: a.采集用戶的行為數據,并上傳給數據處理系統; b.數據處理系統對上傳的行為數據進行處理; c.周期性地從數據處理系統中抽取數據,并存儲到數據倉庫系統; d.依據數據倉庫系統中的存儲數據確定用戶的行為分析維度,并依據所述行為分析維度在數據庫管理系統中建立數據庫模型; e.從數據倉庫系統中抽取出目標數據,對目標數據進行清洗和轉換,將清洗和轉換后的數據進行匯總分析,并將匯總分析后的結果數據加載到數據庫管理系統的對應數據表中; f.將所述結果數據進行各類圖形展示。2.根據權利要求1所述的用戶行為分析的方法,其特征在于,步驟a中所述行為數據包括用戶點播的內容及格式。3.根據權利要求1所述的用戶行為分析的方法,其特征在于,步驟a中的行為數據以json格式上傳給數據處理系統。4.根據權利要求1所述的用戶行為分析的方法,其特征在于,步驟d中數據倉庫系統的存儲數據包括節目類型、節目名稱、觀看記錄數、觀看人數。5.根據權利要求1所述的用戶行為分析的方法,其特征在于,步驟e中,在進行抽取目標數據時,以數據上報到的時間作為分區字段抽取數據。6.根據權利要求1所述的用戶行為分析的方法,其特征在于,步驟e中的清洗指:剔除不完整的數據、賣場機以及測試機上報的干擾數據。
【專利摘要】本發明涉及信息技術領域,提供一種用戶行為分析的方法,獲取用戶行為數據,并對用戶進行分析,將分析結果展示給商家。本方法包括:采集用戶的行為數據,并上傳給數據處理系統;數據處理系統對上傳的行為數據進行處理;周期性地從數據處理系統中抽取數據,并存儲到數據倉庫系統;依據數據倉庫系統中的存儲數據確定用戶的行為分析維度,并依據所述行為分析維度在數據庫管理系統中建立數據庫模型;從數據倉庫系統中抽取出目標數據,對目標數據進行清洗和轉換,將清洗和轉換后的數據進行匯總分析,并將匯總分析后的結果數據加載到數據庫管理系統的對應數據表中;將所述結果數據進行各類圖形展示。發明適用于智能電視。
【IPC分類】G06F17/30
【公開號】CN105426478
【申請號】CN201510797227
【發明人】滕娜娜, 杜科, 唐軍, 梁敏, 羅弦, 漆堯, 唐永瑞
【申請人】四川長虹電器股份有限公司
【公開日】2016年3月23日
【申請日】2015年11月18日