本技術屬于數據處理,尤其涉及一種客群篩選方法、裝置、設備及介質。
背景技術:
1、隨著移動互聯網和大數據技術的快速發展,用戶在使用終端時會產生大量的行為數據。這些數據可以形成有價值的用戶標簽,運營人員基于標簽篩選,生成特定目標客群支撐精準營銷和服務,提升客戶滿意度。其中靜態標簽相對穩定、客觀性較強,通常可以提前生成。而動態標簽通常基于用戶近期行為生成,則相對易變、主觀性較強,依賴業務人員靈活定義,難以提前生成,因此動態標簽和靜態標簽通常是分離的。
2、基于此,在客群篩選的場景下,若篩選規則涉及動態標簽和靜態標簽,也即需要通過“動態標簽+靜態標簽”組合篩選客群,由于動態標簽和靜態標簽的分離性,查詢速度較慢,客群篩選效率較低。
技術實現思路
1、本技術實施例的目的是提供一種客群篩選方法及其裝置,能夠提升客群篩選的速度和效率。
2、第一方面,本技術實施例提供一種客群篩選方法,該方法包括:獲取用戶在可視化界面配置的客群篩選規則,其中,客群篩選規則包括篩選日期范圍、從m1個動態標簽中選取的目標動態標簽及其第一標簽值、從m2個靜態標簽中選取的目標靜態標簽及其第二標簽值,m1和m2為正整數;將客群篩選規則同步至列式數據庫管理系統,并基于客群篩選規則生成可執行的查詢語句,其中,列式數據庫管理系統包括全量用戶在m1個動態標簽和m2個靜態標簽下的標簽值;通過執行查詢語句,從列式數據庫管理系統中導出多個分區表后,調用多個單指令多數據流simd指令,對多個分區表進行并行查詢,輸出每個分區表中滿足客群篩選規則的用戶標識集合;結合多個分區表的用戶標識集合,輸出全量用戶中滿足客群篩選規則的客群集合;其中,多個分區表以日期為分區鍵,每個分區表用于指示全量用戶在目標動態標簽和目標靜態標簽下的標簽值。
3、在第一方面的一些可實現方式中,在獲取用戶在可視化界面配置的客群篩選規則之前,方法還包括:通過調用redis數據庫提供的元數據管理和應用服務接口,顯示可視化界面,可視化界面包括m1個動態標簽和m2個靜態標簽;其中,redis數據庫用于存儲全量用戶在m1個動態標簽和m2個靜態標簽下的標簽位圖,標簽位圖用于指示全量用戶在同一動態標簽或者同一靜態標簽下的標簽值。
4、在第一方面的一些可實現方式中,在調用多個單指令多數據流simd指令之前,方法還包括:通過執行查詢語句,從redis數據庫存儲的所有標簽位圖中,篩選在篩選日期范圍內,全量用戶在目標動態標簽和目標靜態標簽下的標簽位圖,得到與客群篩選規則匹配的目標標簽位圖;將目標標簽位圖同步至列式數據庫管理系統,并基于篩選日期范圍,以日期為分區鍵,將目標標簽位圖導出為多個分區表;其中,每個分區表包括同一日期內全量用戶在目標動態標簽和目標靜態標簽下的標簽位圖,分區表的每一行為一個標簽位圖,分區表的每一行用于記錄全量用戶在同一目標動態標簽或者同一目標靜態標簽下的標簽值,分區表的每一列用于記錄同一用戶在目標動態標簽和目標靜態標簽下的標簽位圖。
5、在第一方面的一些可實現方式中,對多個分區表進行并行查詢,包括:對于每個分區表,對分區表中的每一列進行位圖邏輯運算,得到運算結果,列名為用戶標識;將運算結果滿足客群篩選規則的列名,寫入分區表對應的用戶標識集合。
6、在第一方面的一些可實現方式中,在獲取用戶在可視化界面配置的客群篩選規則之前,方法還包括:在從實時數倉中實時獲取到用戶行為數據的情況下,以用戶行為數據所在的用戶行為表為基表,實時關聯離線數倉中的用戶屬性表,得到組合表;將組合表同步至列式數據庫管理系統;其中,用戶行為表用于存儲全量用戶在動態標簽下的標簽值,用戶屬性表用于存儲全量用戶在靜態標簽下的標簽值。
7、在第一方面的一些可實現方式中,在將組合表同步至列式數據庫管理系統之后,方法還包括:采用bitmap技術對組合表進行壓縮處理,得到全量用戶的標簽位圖;在redis數據庫中存儲全量用戶的標簽位圖。
8、在第一方面的一些可實現方式中,輸出全量用戶中滿足客群篩選規則的客群集合,包括:從列式數據庫管理系統的組合表中查詢與用戶標識關聯的用戶行為數據和用戶屬性數據,得到客群明細數據;輸出客群明細數據。
9、在第一方面的一些可實現方式中,在輸出全量用戶中滿足客群篩選規則的客群集合之后,方法還包括:預覽客群集合對應的客群規模數;在客群規模數小于預設規模閾值的情況下,基于用戶在可視化界面的更新操作,調整客群篩選規則;將調整后的客群篩選規則同步至列式數據庫管理系統,并基于調整后的客群篩選規則生成可執行的查詢語句。
10、第二方面,本技術實施例提供一種客群篩選裝置,該裝置包括:獲取模塊,用于獲取用戶在可視化界面配置的客群篩選規則,其中,客群篩選規則包括篩選日期范圍、從m1個動態標簽中選取的目標動態標簽及其第一標簽值、從m2個靜態標簽中選取的目標靜態標簽及其第二標簽值,m1和m2為正整數;生成模塊,用于將客群篩選規則同步至列式數據庫管理系統,并基于客群篩選規則生成可執行的查詢語句,其中,列式數據庫管理系統包括全量用戶在m1個動態標簽和m2個靜態標簽下的標簽值;查詢模塊,用于通過執行查詢語句,從列式數據庫管理系統中導出多個分區表后,調用多個單指令多數據流simd指令,對多個分區表進行并行查詢,輸出每個分區表中滿足客群篩選規則的用戶標識集合;輸出模塊,用于結合多個分區表的用戶標識集合,輸出全量用戶中滿足客群篩選規則的客群集合;其中,多個分區表以日期為分區鍵,每個分區表用于指示全量用戶在目標動態標簽和目標靜態標簽下的標簽值。
11、在第二方面的一些可實現方式中,在獲取用戶在可視化界面配置的客群篩選規則之前,裝置還包括:顯示模塊,用于通過調用redis數據庫提供的元數據管理和應用服務接口,顯示可視化界面,可視化界面包括m1個動態標簽和m2個靜態標簽;其中,redis數據庫用于存儲全量用戶在m1個動態標簽和m2個靜態標簽下的標簽位圖,標簽位圖用于指示全量用戶在同一動態標簽或者同一靜態標簽下的標簽值。
12、在第二方面的一些可實現方式中,裝置還包括:篩選模塊,用于在調用多個單指令多數據流simd指令之前,通過執行查詢語句,從redis數據庫存儲的所有標簽位圖中,篩選在篩選日期范圍內,全量用戶在目標動態標簽和目標靜態標簽下的標簽位圖,得到與客群篩選規則匹配的目標標簽位圖;同步導出模塊,用于將目標標簽位圖同步至列式數據庫管理系統,并基于篩選日期范圍,以日期為分區鍵,將目標標簽位圖導出為多個分區表;其中,每個分區表包括同一日期內全量用戶在目標動態標簽和目標靜態標簽下的標簽位圖,分區表的每一行為一個標簽位圖,分區表的每一行用于記錄全量用戶在同一目標動態標簽或者同一目標靜態標簽下的標簽值,分區表的每一列用于記錄同一用戶在目標動態標簽和目標靜態標簽下的標簽位圖。
13、在第二方面的一些可實現方式中,查詢模塊具體用于:對于每個分區表,對分區表中的每一列進行位圖邏輯運算,得到運算結果,列名為用戶標識;將運算結果滿足客群篩選規則的列名,寫入分區表對應的用戶標識集合。
14、在第二方面的一些可實現方式中,裝置還包括:關聯模塊,用于在獲取用戶在可視化界面配置的客群篩選規則之前,在從實時數倉中實時獲取到用戶行為數據的情況下,以用戶行為數據所在的用戶行為表為基表,實時關聯離線數倉中的用戶屬性表,得到組合表;同步模塊,用于將組合表同步至列式數據庫管理系統;其中,用戶行為表用于存儲全量用戶在動態標簽下的標簽值,用戶屬性表用于存儲全量用戶在靜態標簽下的標簽值。
15、在第二方面的一些可實現方式中,裝置還包括:壓縮模塊,用于在將組合表同步至列式數據庫管理系統之后,采用bitmap技術對組合表進行壓縮處理,得到全量用戶的標簽位圖;存儲模塊,用于在redis數據庫中存儲全量用戶的標簽位圖。
16、在第二方面的一些可實現方式中,輸出模塊具體用于:從列式數據庫管理系統的組合表中查詢與用戶標識關聯的用戶行為數據和用戶屬性數據,得到客群明細數據;輸出客群明細數據。
17、在第二方面的一些可實現方式中,裝置還包括:預覽模塊,用于在輸出全量用戶中滿足客群篩選規則的客群集合之后,預覽客群集合對應的客群規模數;調整模塊,用于在客群規模數小于預設規模閾值的情況下,基于用戶在可視化界面的更新操作,調整客群篩選規則;生成模塊,還用于將調整后的客群篩選規則同步至列式數據庫管理系統,并基于調整后的客群篩選規則生成可執行的查詢語句。
18、第三方面,本技術實施例提供一種電子設備,包括:處理器以及存儲有計算機程序指令的存儲器;處理器執行計算機程序指令時實現如第一方面的客群篩選方法的步驟。
19、第四方面,本技術實施例提供一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序指令,計算機程序指令被處理器執行時實現如第一方面的客群篩選方法的步驟。
20、第五方面,本技術實施例提供了一種計算機程序產品,所述計算機程序產品被存儲在非易失的存儲介質中,所述計算機程序產品被至少一個處理器執行以實現如第一方面的客群篩選方法的步驟。
21、第六方面,本技術實施例提供了一種芯片,該芯片包括處理器和通信接口,通信接口和處理器耦合,處理器用于運行程序或指令,實現如第一方面的客群篩選方法的步驟。
22、本技術提供一種客群篩選方法、裝置、設備及介質,獲取用戶在可視化界面配置的篩選日期范圍、從m1個動態標簽中選取的目標動態標簽及其第一標簽值、從m2個靜態標簽中選取的目標靜態標簽及其第二標簽值,得到客群篩選規則。將客群篩選規則同步至列式數據庫管理系統,并基于客群篩選規則生成可執行的查詢語句,通過執行查詢語句,可以從列式數據庫管理系統中導出多個分區表,每個分區表用于指示全量用戶在目標動態標簽和目標靜態標簽下的標簽值。因此,通過調用多個單指令多數據流simd指令,能夠對多個分區表進行并行查詢,輸出每個分區表中滿足客群篩選規則的用戶標識集合。如此,在進行客群篩選時,運用列式數據庫管理系統強大的聚合函數和表函數進行運算操作,支持并發運算,充分發揮simd指令的并行能力,大幅縮短了計算耗時,快速響應用戶需求,標簽結果計算速度可提升至秒級,有效提升客群篩選速度和篩選效率。