本發明涉及數據業務技術領域,特別是涉及一種數據獲取方法及系統。
背景技術:
目前,不同行業的消費方(即數據獲取方),在從電信運營商側獲取交易數據,例如用戶行為特征數據時,常采用以下方式:
1、基于IMEI、IDFA、Android ID等終端標識信息
參見圖4所示,DPS(Demand-Side Platform,需求方平臺)消費方將已經獲得的目標用戶所使用的終端標識(終端設備的IMEI/IDFA/Android ID)作為輸入,輸入至電信運營商側的DMP(Data Management Platform,數據管理平臺)系統;電信運營商從其DMP系統中查詢,是否存在所述終端標識,若存在,則返回對應的用戶行為特征數據。
2、基于Cookie-ID的映射
與方式1的查詢方式類似,本方式是將用戶使用的瀏覽器等客戶端存儲的Cookie-ID作為輸入,輸入至電信運營商側的DMP系統,以發起查詢請求。
3、基于手機號、身份證等
從事線下精準營銷和個人征信服務的商業消費方,為了精確定位自己的目標受眾和潛在客戶,通常會拿自己已有的會員客戶真實身份ID,比如手機號和身份證,直接來查詢該電信用戶手機號的在網時長或者經常活動區域是否與目標業務的區域相一致。
4、基于MSISDN、IMSI等
內部業務系統間,比如流量經營分析系統和CRM(Customer Relationship Management,客戶關系管理)、BOSS(Business&Operation Support System,業務運營支撐系統)子系統間,在依據用戶標識信息進行數據關聯時,通常直接采用MSISDN(手機號)和IMSI(國際移動用戶識別碼)。
從上述方式可知:現有技術中,在從電信運營商獲取目標用戶的行為特征數據時,大都按照消費方的個性需求,即消費方輸入什么樣的用戶標識信息,電信運營商就直接將被查詢用戶的標識信息及對應的行為特征數據,作為數據交易內容輸出給消費方。
但是,隨著外部行業消費方所涉及的行業需求越來越廣泛,且不同行業對其目標用戶關注的行為特征差異很大,比如汽車行業關注用戶在汽車方面的行為偏好、電商行業關注用戶的網上購買行為、征信行業關注用戶的手機號在網年限等。所以,如何能滿足不同行業消費方對電信運營商內用戶各行業多樣性行為的精準感知,已成為重點關注的問題。
技術實現要素:
本發明的目的在于提供一種數據獲取方法及系統,用以解決現有技術中存在的不同行業數據獲取方不能對電信運營商內用戶各行業多樣性行為進行精準感知的技術問題。
為了實現上述的目的,本發明提供一種數據獲取方法,包括:
接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息;
從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方;
其中,所述目標用戶的行為特征數據包括與所述第一用戶標識信息對應的第一部分數據和與所述第一用戶標識信息不同但對應于所述目標用戶的至少一個第二用戶標識信息對應的第二部分數據。
優選的,所述第一用戶標識信息為終端標識信息、業務卡標識信息、Web用戶標識信息和Web客戶端標識信息中的一者或多者。
優選的,所述從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方的步驟之前還包括:
獲取所述目標用戶的統一用戶標識信息,所述統一用戶標識信息與所述第一用戶標識信息和至少一個第二用戶標識信息對應;
將所述統一用戶標識信息輸出給所述數據獲取方;
接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求;
根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
優選的,所述將所述統一用戶標識信息輸出給所述數據獲取方的步驟包括:
對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息;
將所述重編碼用戶標識信息輸出給所述數據獲取方;
所述接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求的步驟包括:
接收所述數據獲取方輸入的攜帶所述重編碼用戶標識信息的數據獲取請求;
解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息。
優選的,所述對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息的步驟包括:
利用數據獲取方標識信息和有效期,對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息。
優選的,所述解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息的步驟包括:
解密所述重編碼用戶標識信息,得到所述統一用戶標識信息和有效期;
驗證所述統一用戶標識信息和有效期;
所述根據統一用戶標識信息,查找所述目標用戶的行為特征數據的步驟包括:
在驗證結果為所述統一用戶標識信息有效且所述有效期在有效生命周期內時,根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
優選的,所述數據獲取方法還包括:
在驗證結果為所述統一用戶標識信息無效或所述有效期超出有效生命周期時,對計數器加1,所述計數器的初值為0;
當所述計數器的值大于一預設閾值時,將所述數據獲取方標識信息加入黑名單,所述數據獲取方標識信息是解密所述重編碼用戶標識信息時得到的。
本發明還提供一種數據獲取系統,包括:
第一接收模塊,用于接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息;
第一輸出模塊,用于從所述目標用戶的行為特征數據中選擇至少部分數據 輸出給所述數據獲取方;
其中,所述目標用戶的行為特征數據包括與所述第一用戶標識信息對應的第一部分數據和與所述第一用戶標識信息不同但對應于所述目標用戶的至少一個第二用戶標識信息對應的第二部分數據。
優選的,所述第一用戶標識信息為終端標識信息、業務卡標識信息、Web用戶標識信息和Web客戶端標識信息中的一者或多者。
優選的,所述數據獲取系統還包括:
獲取模塊,用于獲取所述目標用戶的統一用戶標識信息,所述統一用戶標識信息與所述第一用戶標識信息和至少一個第二用戶標識信息對應;
第二輸出模塊,用于將所述統一用戶標識信息輸出給所述數據獲取方;
第二接收模塊,用于接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求;
查找模塊,用于根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
優選的,所述第二輸出模塊包括:
加密模塊,用于對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息;
輸出子模塊,用于將所述重編碼用戶標識信息輸出給所述數據獲取方;
所述第二接收模塊包括:
接收子模塊,用于接收所述數據獲取方輸入的攜帶所述重編碼用戶標識信息的數據獲取請求;
解密模塊,用于解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息。
優選的,所述加密模塊具體用于利用數據獲取方標識信息和有效期,對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息。
優選的,所述解密模塊包括:
解密子模塊,用于解密所述重編碼用戶標識信息,得到所述統一用戶標識信息和有效期;
驗證子模塊,用于驗證所述統一用戶標識信息和有效期;
所述查找模塊具體用于在驗證結果為所述統一用戶標識信息有效且所述有效期在有效生命周期內時,根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
優選的,所述數據獲取系統還包括:
計數模塊,用于在驗證結果為所述統一用戶標識信息無效或所述有效期超出有效生命周期時,對計數器加1,所述計數器的初值為0;
加入模塊,用于當所述計數器的值大于一預設閾值時,將所述數據獲取方標識信息加入黑名單,所述數據獲取方標識信息是解密所述重編碼用戶標識信息時得到的。
通過本發明的上述技術方案,本發明的有益效果在于:
本發明實施例的數據獲取方法,通過接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息,從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方,能夠使得所述數據獲取方根據目標用戶的某一用戶標識信息,對所述目標用戶的多樣性行為進行全面的把握,得到所需要的所述目標用戶的行為特征數據。
附圖說明
圖1表示本發明實施例的數據獲取方法的流程圖。
圖2表示統一用戶標識信息與用戶的真實的標識信息的對應關系圖。
圖3表示本發明實施例的數據獲取系統的結構示意圖。
圖4表示現有技術中,數據獲取方利用目標用戶的終端標識信息獲取相應數據的示意圖。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合附圖對具體實施例進行詳細描述。
參見圖1所示,本發明實施例提供一種數據獲取方法,應用于電信運營商側的數據獲取系統,包括:
S101:接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息;
S102:從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方;
其中,所述目標用戶的行為特征數據包括與所述第一用戶標識信息對應的第一部分數據和與所述第一用戶標識信息不同但對應于所述目標用戶的至少一個第二用戶標識信息對應的第二部分數據。
本發明實施例的數據獲取方法,通過接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息,從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方,能夠使得所述數據獲取方根據目標用戶的某一用戶標識信息,對所述目標用戶的多樣性行為進行全面的把握,得到所需要的所述目標用戶的行為特征數據。
例如,數據獲取方A屬于房地產行業,知道目標用戶B的一個與房地產相關的Web賬號12**5。
現有技術中,A根據所述Web賬號12**5,在電信運營商側的數據獲取系統中只能查詢B的與房地產相關的數據。但是,通過本發明的數據獲取方法,A根據所述Web賬號12**5,可在電信運營商側的數據獲取系統中查詢B的與其他行業,例如電商行業、征信行業等相關的數據。
本發明實施例中,所述第一用戶標識信息(或第二用戶標識信息)例如為終端標識信息、業務卡標識信息、Web用戶標識信息和Web客戶端標識信息中的一者或多者。
具體的,所述終端標識信息主要針對終端Device,包括但不限于終端的IMEI,互聯網接入設備的MAC、IDFA、IDFV、Android ID等設備標識。實際應用中,互聯網廣告主、DSP等外部消費方,傾向于使用所述終端標識信息。
所述業務卡標識信息主要針對手機Mobile,包括但不限于SIM卡的IMSI、手機號MISDN。實際應用中,電信運營商側的內部業務子系統間在基于用戶數據關聯和聚合時,傾向于使用這一部分標識信息。
所述Web用戶標識信息主要針對Web用戶(Web user),包括但不限于Web賬號、Web昵稱。實際應用中,電信運營商側可通過解析流量包,獲取用戶在不同web站點和app應用中賬戶和昵稱。而互聯網行業例如房地產或電商在分析目標用戶時,傾向于使用這一部分標識信息。
所述Web客戶端標識信息主要針對Web客戶端(Web client),包括但不限于暫存資料cookies、瀏覽器類型user agent。
其中,根據實際需求,可將所述終端標識信息、業務卡標識信息、Web用戶標識信息和Web客戶端標識信息劃分為分屬4個維度,即終端標識信息屬于維度1,業務卡標識信息屬于維度2,Web用戶標識信息屬于維度3,Web客戶端標識信息屬于維度4,以方便區分。
本發明實施例中,所述從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方的步驟之前還包括:
獲取所述目標用戶的統一用戶標識信息,所述統一用戶標識信息與所述第一用戶標識信息和至少一個第二用戶標識信息對應;
將所述統一用戶標識信息輸出給所述數據獲取方;
接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求;
根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
本發明實施例的數據獲取方法,通過統一用戶標識信息,不僅能夠滿足數據獲取方的數據獲取需求,還能夠隱藏用戶的真實的標識信息,避免從電信運營商側泄露用戶的真實的標識信息的風險。
其中,參見圖2所述,所述統一用戶標識信息(UN-ID)是將上述4個維度的標識信息統一后的指代目標用戶的唯一的標識信息,是分配給目標用戶的身份標識,對應著目標用戶的全部行為特征數據。
例如,對于目標用戶M,在電信運營商側的數據獲取系統中,其移動終端的IMEI為123,業務卡的IMSI為136****0101,Web賬號為“天天”,Web客戶端中的cookies包括M登錄過的有關健身器械網站中的用戶標識,分別對應著M的部分行為特征數據。而目標用戶M的統一用戶標識信息,例如qazwsx123,將這些標識信息融合在一起,唯一指代M,對應著M的全部行為特征數據。
這樣,電信運營商側的數據獲取系統在接收到數據獲取方輸入的移動終端的IMEI 123后,會獲取到M的統一用戶標識信息qazwsx123,并將所述qazwsx123輸出給所述數據獲取方,以進行后續的數據獲取。
其中,用戶的統一用戶標識信息和真實的用戶標識信息的對應關系例如是 預先存儲于電信運營商側的數據獲取系統中,或是在初次接收到某一用戶的真實的用戶標識信息時,根據預設規則,為所述用戶分配一個統一用戶標識信息,并存儲這一對應關系,當再接收到所述用戶的其他真實的用戶標識信息時,直接根據存儲的對應關系,確定出所述用戶的統一用戶標識信息。
實際應用中,本發明實施例的數據獲取方法的應用場景一般包括對內和對外,即電信運營商內部獲取數據和電信運營商外部獲取數據。而為了區分,以更方便滿足電信運營商內部的需求,可通過為內部數據獲取方和外部數據獲取方配置不同權限的統一用戶標識信息的方式來實現,本發明不對其進行限制,都應屬于本發明所保護的范圍。
本發明實施例中,所述數據獲取請求中不僅攜帶目標用戶的統一用戶標識信息,還包括數據獲取方的需要限定,即數據獲取方限定的需要獲取的目標用戶的行為特征數據。這樣,電信運營商側的數據獲取系統在接收到數據獲取方輸入的數據獲取請求后,會查找相應目標用戶的行為特征數據(根據統一用戶標識信息),并從所述行為特征數據中選擇至少部分數據輸出給所述數據獲取方(根據數據獲取方的需要限定),以完成數據獲取過程。
為了避免用戶標識信息的泄露,可選擇在輸出統一用戶標識信息時,對所述統一用戶標識信息進行加密,例如,采用常用的MD5編碼加密的機制。
基于上述內容,在本發明具體實施例中,所述將所述統一用戶標識信息輸出給所述數據獲取方的步驟包括:
對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息;
將所述重編碼用戶標識信息輸出給所述數據獲取方;
所述接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求的步驟包括:
接收所述數據獲取方輸入的攜帶所述重編碼用戶標識信息的數據獲取請求;
解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息。
但是,采用常用的MD5編碼加密的機制對所述統一用戶標識信息進行加密,然后直接提供給不同數據獲取方的方式,電信運營商將無法保證從自身渠道獲得目標用戶的行為特征數據的數據獲取方,不會將這些行為特征數據進行 二次銷售獲利,即對外銷售獲取的統一用戶標識信息。并且,只進行一次購買,就可反復從電信運營商側獲取數據,使得電信運營商無法獲得應有的價值回報,特別是對一些生命周期很長的高價值數據。
為了克服上述問題,可選擇數據獲取方標識信息和有效期對所述統一用戶標識信息進行加密。這樣,在相同統一用戶標識信息的情況下:
1)對于不同的數據獲取方,可得到不同的重編碼用戶標識信息;
2)對于相同的數據獲取方但不同的時間點,前后會得到不同的重編碼用戶標識信息;
3)對于不同的數據獲取方且不同的時間點,前后也會得到不同的重編碼用戶標識信息。
基于上述內容,本發明實施例中,所述對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息的步驟包括:
利用數據獲取方標識信息和有效期,對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息。
其中,加密算法可為簡單疊加或輪流疊加字符等,本發明不對其進行限制,可依需求進行相應的選擇。
例如,數據獲取方C要獲取目標用戶D的行為特征數據。目標用戶D的統一用戶標識信息為tian45,數據獲取方C的標識信息為wangli112,有效期為2015/9/28。
當加密算法為簡單疊加時,利用wangli112和2015/9/28,對所述tian45進行加密,得到的重編碼用戶標識信息就是tian45wangli1122015/9/28。
而當加密算法為輪流疊加字符時,利用wangli112和2015/9/28,對所述tian45進行加密,得到的重編碼用戶標識信息就是tw2ia0an1ng54l/5i91/1228。
此外,為了增強對統一用戶標識信息的保護,也可增加數據獲取方輸入的目標用戶的用戶標識信息所屬維度編號對所述統一用戶標識信息進行加密,即利用數據獲取方標識信息、有效期和維度編號,對所述統一用戶標識信息進行加密,但本發明不對其進行限制。
例如,重編碼加密函數為:
Encode(UN-ID)=Encode_function(UN-ID,buyerID,date,userid_dimension)
其中,UN-ID為統一用戶標識信息,buyerID為數據獲取方標識信息,date為有效期,userid_dimension為用戶標識信息所屬維度編號。
這樣,能夠對加密方式進行定期修改,避免被不法者破解,增強對統一用戶標識信息的保護。
本發明實施例中,所述解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息的步驟包括:
解密所述重編碼用戶標識信息,得到所述統一用戶標識信息和有效期;
驗證所述統一用戶標識信息和有效期;
所述根據統一用戶標識信息,查找所述目標用戶的行為特征數據的步驟包括:
在驗證結果為所述統一用戶標識信息有效且所述有效期在有效生命周期內時,根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
這樣,數據獲取方只有利用有效的重編碼用戶標識信息,才能獲得所需數據,避免了數據獲取方的二次銷售獲利及只進行一次購買,就可反復從電信運營商側獲取數據的弊端,保證電信運營商的一些生命周期很長的高價值數據可得到應有的價值回報。
此外,為了對試圖通過嘗試不同的重編碼用戶標識信息獲取數據的數據獲取方進行管理識別,本發明實施例的數據獲取方法還包括:
在驗證結果為所述統一用戶標識信息無效或所述有效期超出有效生命周期時,對計數器加1,所述計數器的初值為0;
當所述計數器的值大于一預設閾值時,將所述數據獲取方標識信息加入黑名單,所述數據獲取方標識信息是解密所述重編碼用戶標識信息時得到的。
其中,所述預設閾值例如為5,即在計數器的值大于5時,將所述數據獲取方標識信息加入黑名單。
這樣,能夠避免某一數據獲取方一直占用電信運營商的系統資源,而試圖非法獲取數據。
參見圖3所示,本發明實施例還提供一種數據獲取系統,與圖1所示的數據獲取方法相對應,所述數據獲取系統包括:
第一接收模塊31,用于接收一數據獲取方輸入的對應于一目標用戶的第 一用戶標識信息;
第一輸出模塊32,用于從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方;
其中,所述目標用戶的行為特征數據包括與所述第一用戶標識信息對應的第一部分數據和與所述第一用戶標識信息不同但對應于所述目標用戶的至少一個第二用戶標識信息對應的第二部分數據。
本發明實施例的數據獲取系統,通過接收一數據獲取方輸入的對應于一目標用戶的第一用戶標識信息,從所述目標用戶的行為特征數據中選擇至少部分數據輸出給所述數據獲取方,能夠使得所述數據獲取方根據目標用戶的某一用戶標識信息,對所述目標用戶的多樣性行為進行全面的把握,得到所需要的所述目標用戶的行為特征數據。
本發明實施例中,所述第一用戶標識信息(或第二用戶標識信息)例如為終端標識信息、業務卡標識信息、Web用戶標識信息和Web客戶端標識信息中的一者或多者。
具體的,所述數據獲取系統還包括:
獲取模塊,用于獲取所述目標用戶的統一用戶標識信息,所述統一用戶標識信息與所述第一用戶標識信息和至少一個第二用戶標識信息對應;
第二輸出模塊,用于將所述統一用戶標識信息輸出給所述數據獲取方;
第二接收模塊,用于接收所述數據獲取方輸入的攜帶所述統一用戶標識信息的數據獲取請求;
查找模塊,用于根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
這樣,通過統一用戶標識信息,不僅能夠滿足數據獲取方的數據獲取需求,還能夠隱藏用戶的真實的標識信息,避免從電信運營商側泄露用戶的真實的標識信息的風險。
其中,為了避免用戶標識信息的泄露,所述第二輸出模塊包括:
加密模塊,用于對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息;
輸出子模塊,用于將所述重編碼用戶標識信息輸出給所述數據獲取方;
所述第二接收模塊包括:
接收子模塊,用于接收所述數據獲取方輸入的攜帶所述重編碼用戶標識信息的數據獲取請求;
解密模塊,用于解密所述重編碼用戶標識信息,得到相應的統一用戶標識信息。
所述加密模塊具體用于利用數據獲取方標識信息和有效期,對所述統一用戶標識信息進行加密,得到一重編碼用戶標識信息。
而所述解密模塊包括:
解密子模塊,用于解密所述重編碼用戶標識信息,得到所述統一用戶標識信息和有效期;
驗證子模塊,用于驗證所述統一用戶標識信息和有效期;
所述查找模塊具體用于在驗證結果為所述統一用戶標識信息有效且所述有效期在有效生命周期內時,根據所述統一用戶標識信息,查找所述目標用戶的行為特征數據。
這樣,數據獲取方只有利用有效的重編碼用戶標識信息,才能獲得所需數據,避免了數據獲取方的二次銷售獲利及只進行一次購買,就可反復從電信運營商側獲取數據的弊端,保證電信運營商的一些生命周期很長的高價值數據可得到應有的價值回報。
具體的,所述的數據獲取系統還包括:
計數模塊,用于在驗證結果為所述統一用戶標識信息無效或所述有效期超出有效生命周期時,對計數器加1,所述計數器的初值為0;
加入模塊,用于當所述計數器的值大于一預設閾值時,將所述數據獲取方標識信息加入黑名單,所述數據獲取方標識信息是解密所述重編碼用戶標識信息時得到的。
這樣,能夠避免某一數據獲取方一直占用電信運營商的系統資源,而試圖非法獲取數據。
以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護范圍。