本發(fā)明涉及數(shù)據(jù)流通領(lǐng)域,尤其涉及一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法、裝置及終端。
背景技術(shù):
在數(shù)據(jù)處理領(lǐng)域,數(shù)據(jù)流通是指數(shù)據(jù)持有人(對數(shù)據(jù)進行處理的主體)向他人提供數(shù)據(jù)的行為,可以包括與他人分享、互換、提供復本等行為,其中,所述數(shù)據(jù)是經(jīng)過合法生成、采集、取得的。提供數(shù)據(jù)的主體稱為數(shù)據(jù)提供人,接受數(shù)據(jù)主體稱為數(shù)據(jù)接受人。
現(xiàn)有技術(shù)中,用戶提供必要的數(shù)據(jù)是獲取相關(guān)當前服務(wù)的前提,個人數(shù)據(jù)可以在當前服務(wù)業(yè)務(wù)范圍內(nèi)使用和流動。但數(shù)據(jù)脫離當前服務(wù)業(yè)務(wù)范圍,在其它業(yè)務(wù)范圍或業(yè)務(wù)場景被使用,即構(gòu)成數(shù)據(jù)流通,例如可以是數(shù)據(jù)交換、數(shù)據(jù)共享和數(shù)據(jù)流通等形式。例如,某集團將自有電商數(shù)據(jù)提供給某企業(yè)使用,或者第三方數(shù)據(jù)平臺將運營商通信數(shù)據(jù)授權(quán)給某企業(yè)使用。從維護市場公平性和統(tǒng)一性出發(fā),需對數(shù)據(jù)流通進行全范圍的監(jiān)管,防范可能出現(xiàn)的違規(guī)流通、契約失靈和企業(yè)管理失效等帶來的風險。同時,用戶提供的數(shù)據(jù)可能涉及個人的隱私利益,甚至屬于企業(yè)的商業(yè)秘密。與此同時,有些數(shù)據(jù)可能涉及國家秘密,危害國家安全和利益,也應(yīng)當屬于禁止流通的數(shù)據(jù)范疇。
但是,在現(xiàn)有的數(shù)據(jù)流通過程中,對用戶數(shù)據(jù)的安全性沒有保障。
技術(shù)實現(xiàn)要素:
本發(fā)明解決的技術(shù)問題是如何保障數(shù)據(jù)流通過程中數(shù)據(jù)的安全性。
為解決上述技術(shù)問題,本發(fā)明實施例提供一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法,基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法包括:根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢,其中,所述供應(yīng)數(shù)據(jù)包括維度主鍵、標簽值、與所述查詢數(shù)據(jù)標識相同或相應(yīng)的數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng);將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果;提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù);將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
可選的,所述約束條件包括以下一種或多種:所述供應(yīng)數(shù)據(jù)的流通限制條件、供應(yīng)時間和計價方式。
可選的,所述根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢之前還包括:控制所述數(shù)據(jù)供應(yīng)方對所述流通限制條件對應(yīng)的流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式和數(shù)據(jù)應(yīng)用時限,所述供應(yīng)時間對應(yīng)的供應(yīng)頻率和供應(yīng)周期,所述計價方式對應(yīng)的計價類型和價格以及所述標簽值進行更新。
可選的,所述流通限制條件包括基礎(chǔ)約束條件;所述基礎(chǔ)約束條件包括:剔除滿足以下條件中至少兩項的供應(yīng)數(shù)據(jù);其中,所述條件包括:所述數(shù)據(jù)標識指向的主體為自然人、所述維度主鍵在時間軸上對應(yīng)常量以及所述標簽值為數(shù)值且為絕對值。
可選的,所述基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法還包括:形成日志,所述日志用于記錄所述數(shù)據(jù)供應(yīng)方與所述數(shù)據(jù)需求方的數(shù)據(jù)發(fā)送事件。
可選的,所述標簽值是通過所述數(shù)據(jù)供應(yīng)方對采集到的源數(shù)據(jù)進行處理得到的,用以表示所述數(shù)據(jù)標識指向的主體的統(tǒng)計特征。
可選的,所述維度主鍵包括以下一種或多種:人口屬性、家庭狀況、支付信息、設(shè)備網(wǎng)絡(luò)、地域軌跡、購買訂閱、興趣愛好、意圖需求、負面標記。
本發(fā)明實施例還公開了一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置,基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置包括:查詢單元,適于根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢,其中,所述供應(yīng)數(shù)據(jù)包括維度主鍵、標簽值、與所述查詢數(shù)據(jù)標識相同或相應(yīng)的數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng);匹配單元,適于將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果;提取單元,適于提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù);加密單元,適于將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
可選的,所述約束條件包括以下一種或多種:所述供應(yīng)數(shù)據(jù)的流通限制條件、供應(yīng)時間和計價方式。
可選的,所述數(shù)據(jù)流通裝置還包括:更新單元,適于控制所述數(shù)據(jù)供應(yīng)方對所述流通限制條件對應(yīng)的流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式和數(shù)據(jù)應(yīng)用時限,所述供應(yīng)時間對應(yīng)的供應(yīng)頻率和供應(yīng)周期,所述計價方式對應(yīng)的計價類型和價格以及所述標簽值進行更新。
可選的,所述流通限制條件包括基礎(chǔ)約束條件;所述數(shù)據(jù)流通裝置還包括:約束單元,適于按照所述基礎(chǔ)約束條件進行剔除操作;所述剔除操作包括剔除滿足以下條件中的至少兩項的供應(yīng)數(shù)據(jù);其中,所述條件包括:所述數(shù)據(jù)標識指向的主體為自然人、所述維度主鍵在時間軸上對應(yīng)常量以及所述標簽值為數(shù)值且為絕對值。
可選的,所述基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置還包括:日志形成單元,適于形成日志,所述日志用于記錄所述數(shù)據(jù)供應(yīng)方與所述數(shù)據(jù)需求方的數(shù)據(jù)發(fā)送事件。
可選的,所述標簽值是通過所述數(shù)據(jù)供應(yīng)方對采集到的源數(shù)據(jù)進行處理得到的,用以表示所述數(shù)據(jù)標識指向的主體的統(tǒng)計特征。
可選的,所述維度主鍵包括以下一種或多種:人口屬性、家庭狀況、支付信息、設(shè)備網(wǎng)絡(luò)、地域軌跡、購買訂閱、興趣愛好、意圖需求、負面標記。
本發(fā)明實施例還公開了一種終端,所述終端包括所述基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置。
與現(xiàn)有技術(shù)相比,本發(fā)明實施例的技術(shù)方案具有以下有益效果:
本發(fā)明實施例根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢,其中,所述供應(yīng)數(shù)據(jù)包括維度主鍵、標簽值、與所述查詢數(shù)據(jù)標識相同或相應(yīng)的數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng);將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果;提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù);將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。通過使用規(guī)范的數(shù)據(jù)標識進行查詢,規(guī)范的約束條件對供應(yīng)數(shù)據(jù)和數(shù)據(jù)需求方的需求進行匹配,保證了數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方之間數(shù)據(jù)流通的規(guī)范性;同時,通過約束條件匹配、發(fā)送標簽值和加密需求數(shù)據(jù),可保證數(shù)據(jù)流通的安全性。
進一步,所述維度主鍵可以包括以下一種或多種:人口屬性、家庭狀況、支付信息、設(shè)備網(wǎng)絡(luò)、地域軌跡、購買訂閱、興趣愛好、意圖需求、負面標記。對維度主鍵進行分類的方式有利于對各種類型數(shù)據(jù)的流通方式和應(yīng)用場景實施分級分類管理。
附圖說明
圖1是本發(fā)明實施例一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的流程圖;
圖2是本發(fā)明實施例另一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的流程圖;
圖3是本發(fā)明實施例又一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的示意圖;
圖4是本發(fā)明實施例一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置的結(jié)構(gòu)示意圖;
圖5是本發(fā)明實施例另一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置的結(jié)構(gòu)示意圖。
具體實施方式
如背景技術(shù)中所述,在現(xiàn)有的數(shù)據(jù)流通過程中,對用戶數(shù)據(jù)的安全性沒有保障。
本發(fā)明實施例使用基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方式,可以做到對數(shù)據(jù)在各個信息系統(tǒng)間流通的互識與約束,并可利用計算機編程技術(shù),實現(xiàn)數(shù)據(jù)傳輸加密、數(shù)據(jù)流轉(zhuǎn)追溯、流通主體追查、數(shù)據(jù)超限使用防控等安全措施,使得數(shù)據(jù)流通全程透明且可被審計,有利于構(gòu)筑大數(shù)據(jù)行業(yè)安全流通體系和環(huán)境。
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更為明顯易懂,下面結(jié)合附圖對本發(fā)明的具體實施例做詳細的說明。
圖1是本發(fā)明實施例一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的流程圖。
所述基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法可以包括以下步驟:
步驟S101:根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢。
步驟S102:將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果。
步驟S103:提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù)。
步驟S104:將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
下面結(jié)合圖1對步驟S101至步驟S104進行詳細的說明。
具體實施中,在步驟S101中,查詢數(shù)據(jù)標識可以指向數(shù)據(jù)需求方要獲取數(shù)據(jù)內(nèi)容的主體。供應(yīng)數(shù)據(jù)中的數(shù)據(jù)標識(Identity,ID)與所述查詢數(shù)據(jù)標識相同或相應(yīng)。具體而言,在查詢數(shù)據(jù)標識與供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識相同時,可直接進行查詢。當查詢數(shù)據(jù)標識與供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識不同時,可以將所述查詢數(shù)據(jù)標識進行映射,以映射至供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識。進一步而言,可以根據(jù)標識映射圖譜(ID Mapping)對查詢數(shù)據(jù)標識進行映射;標識映射圖譜中記錄有多個關(guān)聯(lián)數(shù)據(jù)標識之間的對應(yīng)關(guān)系。例如,數(shù)據(jù)標識“國際移動設(shè)備標識Imei”與數(shù)據(jù)標識“Cookie@域1”相對應(yīng),則根據(jù)查詢數(shù)據(jù)標識為Imei時,可以確定供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識Cookie@域1,在查詢操作時,根據(jù)數(shù)據(jù)標識Cookie@域1進行查詢。
具體地,經(jīng)步驟S101查詢后得到初步的查詢結(jié)果。初步的查詢結(jié)果中所有供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識與查詢數(shù)據(jù)標識相同或相應(yīng)。
其中,供應(yīng)數(shù)據(jù)可以包括維度主鍵、標簽值(value)、數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng)。具體而言,數(shù)據(jù)標識可以用以指向主體,可以是識別主體的信息編碼。例如可以是個體標識和群組標識,個體標識指向個體,群組標識指向群體,例如可以是女性、男性、青年等。維度主鍵可以用以表示供應(yīng)數(shù)據(jù)指向的主體的屬性。例如,對于個體標識,可以是地域、興趣愛好、消費信息等。維度主鍵可以作為供應(yīng)數(shù)據(jù)的標簽,那么標簽值與維度主鍵相對應(yīng),標簽值可以是維度主鍵的值。例如,在維度主鍵為年齡時,標簽值為年齡值或年齡所在的數(shù)值范圍。約束條件用以約束數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方的數(shù)據(jù)流通;也就是說,只有在約束條件約束的范圍內(nèi),數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方才可以進行數(shù)據(jù)流通。
可以理解的是,所述供應(yīng)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)可以是數(shù)據(jù)供應(yīng)方預(yù)先配置的。例如,對于數(shù)據(jù)標識,預(yù)先配置數(shù)據(jù)標識分類(如個體標識、群組標識等)。對于維度主鍵,預(yù)先配置維度主鍵標識,維度主鍵名稱,維度主鍵的分類信息。對于標簽值,預(yù)先配置類型,長度,精度,單位,參數(shù)類型維度表,更新頻率等。
具體實施中,維度主鍵可以包括以下一種或多種維度:主題維度、行業(yè)維度、時間維度、空間維度、查詢次數(shù)維度和流通次數(shù)維度。具體而言,對于維度主鍵,可以從不同的角度進行分類。主題維度可以是按照供應(yīng)數(shù)據(jù)的內(nèi)容進行分類,屬于同一主題的決策支撐信息屬于同一類別。行業(yè)維度可以根據(jù)數(shù)據(jù)供應(yīng)方所在行業(yè)進行分類,其下級類目可以有二級行業(yè)、三級行業(yè)等;時間維度可以是指根據(jù)時間屬性對供應(yīng)數(shù)據(jù)進行分類,時間屬性是固有屬性,其下級類目可以有年、月、日、時、分、秒等;空間維度可以是根據(jù)供應(yīng)數(shù)據(jù)所屬地區(qū)來劃分,其下級類目可按照省份來劃分信息資源所屬區(qū)域;查詢次數(shù)維度可以是指根據(jù)供應(yīng)數(shù)據(jù)被瀏覽的次數(shù)來劃分,以便于按照順序?qū)?shù)據(jù)進行排序,以反映對數(shù)據(jù)的歡迎程度或感興趣程度;流通次數(shù)維度可以是指根據(jù)信息被下載的次數(shù)來劃分,以便于按照順序?qū)?shù)據(jù)進行排序,以反映數(shù)據(jù)使用效率,下載次數(shù)越多,反映該數(shù)據(jù)使用價值越大。
具體地,維度主鍵可以包括以下一種或多種:人口屬性、家庭狀況、支付信息、設(shè)備網(wǎng)絡(luò)、地域軌跡、購買訂閱、興趣愛好、意圖需求、負面標記。
可以理解的是,根據(jù)不同的應(yīng)用環(huán)境,對于維度主鍵的分類還可以進行適應(yīng)性的調(diào)整,例如,主題維度還可以進一步細分;考慮應(yīng)用環(huán)境下的檢索手段、方法、技術(shù)條件以及實際工作的需要,從多個維度進行分類。本發(fā)明實施例對此不做限制。
對于供應(yīng)數(shù)據(jù)而言,在維度主鍵的類表結(jié)構(gòu)的設(shè)定上,多維分類表按照維度不同劃分一級基本大類,再根據(jù)數(shù)據(jù)的特征從總到分、從一般到具體層層細分,形成完整的邏輯分類體系。
可以理解的是,數(shù)據(jù)需求方的需求和查詢數(shù)據(jù)標識可以是數(shù)據(jù)需求方進行預(yù)先配置的。數(shù)據(jù)需求方的需求中包括對于需求數(shù)據(jù)的應(yīng)用相關(guān)的條件以及數(shù)據(jù)需求方的情況。具體而言,數(shù)據(jù)需求方的需求可以按照供應(yīng)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)形式進行確定。數(shù)據(jù)需求方的需求中可以包括:維度主鍵的條件、標簽值的條件、查詢數(shù)據(jù)標識和約束條件。查詢數(shù)據(jù)標識可以指向數(shù)據(jù)的主體;維度主鍵的條件可以是維度主鍵的名稱,維度主鍵的分類屬性;標簽值的條件可以是類型、長度、精度、單位、參數(shù)類型維度表;
例如,查詢數(shù)據(jù)標識可以是手機號;維度主鍵的名稱可以是手機號和身份證是否匹配,維度主鍵的分類為“人口屬性-信息驗證-手機身份驗證”;標簽值的條件為類型“無”,長度“無”,精度“無”,單位“無”。
在數(shù)據(jù)需求方的需求滿足供應(yīng)數(shù)據(jù)的約束條件時,則表示該供應(yīng)數(shù)據(jù)與數(shù)據(jù)需求方的需求相匹配,并將該供應(yīng)數(shù)據(jù)作為匹配結(jié)果;否則,該供應(yīng)數(shù)據(jù)與數(shù)據(jù)需求方的需求不匹配。
具體實施中,所述約束條件可以包括以下一種或多種:所述供應(yīng)數(shù)據(jù)的流通限制條件、供應(yīng)時間和計價方式。具體地,流通限制條件可以包括流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式、數(shù)據(jù)應(yīng)用時限。供應(yīng)時間可以包括供應(yīng)頻度和供應(yīng)周期。計價方式可以包括計價類型和價格。
具體而言,在步驟S103中,將匹配結(jié)果對應(yīng)供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值作為需求數(shù)據(jù)。至此數(shù)據(jù)需求方的需求數(shù)據(jù)已經(jīng)查詢并匹配得到。
具體地,標簽值是通過所述數(shù)據(jù)供應(yīng)方對采集到的源數(shù)據(jù)進行處理得到的,用以表示所述數(shù)據(jù)標識指向的主體的統(tǒng)計特征。進一步地,可以是由數(shù)據(jù)供應(yīng)方對供應(yīng)數(shù)據(jù)對應(yīng)的源數(shù)據(jù)進行數(shù)據(jù)加工,例如可以是進行“聚類、脫敏、加權(quán)、偏移、提取、篩選”,形成統(tǒng)計特征。所述統(tǒng)計特征可以是集合、抽樣、分段、區(qū)間、命中、評分等方式。在數(shù)據(jù)處理過程中,可以控制加工顆粒度大小,也就是保證精細度,避免在數(shù)據(jù)流通中被逆向推導至數(shù)據(jù)標識指向的主體。
需要說明的是,對源數(shù)據(jù)進行聚類、脫敏、加權(quán)、偏移、提取、篩選的過程可以采用現(xiàn)有技術(shù)中任意可實施的算法,本發(fā)明實施例對此不做限制。
通過上述從源數(shù)據(jù)得到標簽值的過程,可以保證源數(shù)據(jù)不被泄露,保證了數(shù)據(jù)流通的安全性。
在步驟S104中,為了保證數(shù)據(jù)傳輸?shù)陌踩裕瑢⑺鲂枨髷?shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。至此,數(shù)據(jù)需求方獲得標準化格式的數(shù)據(jù)。
本發(fā)明實施例中,標簽值具備語義化和短文本的特征。其中,語義化使得維度主鍵易于理解,有利于數(shù)據(jù)需求方獲得用戶畫像模型;同時,每個標簽值有唯一性,無需數(shù)據(jù)需求方再做過多文本分析等預(yù)處理工作,可以快速提取信息,在大數(shù)據(jù)處理領(lǐng)域,進一步提升精準度,提高信息獲取的效率,提高數(shù)據(jù)需求方的用戶體驗。
進一步而言,數(shù)據(jù)流通是針對多個數(shù)據(jù)供應(yīng)方、多個數(shù)據(jù)需求方的,為了保證數(shù)據(jù)流通的高效進行,對于多個數(shù)據(jù)供應(yīng)方和多個數(shù)據(jù)需求方,分配相應(yīng)的權(quán)限。在執(zhí)行時,只允許在權(quán)限限定的范圍內(nèi)對數(shù)據(jù)進行修改。
本發(fā)明實施例通過在數(shù)據(jù)流通過程中使用規(guī)范化的供應(yīng)數(shù)據(jù),并將供應(yīng)數(shù)據(jù)的標簽值作為需求數(shù)據(jù)發(fā)送至數(shù)據(jù)需求方,可以提高數(shù)據(jù)流通的便捷性;同時,通過約束條件對數(shù)據(jù)需求方進行限制,可以避免供應(yīng)數(shù)據(jù)被非法使用,保證數(shù)據(jù)流通的安全性。
圖2是本發(fā)明實施例另一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的流程圖。
基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法可以包括:
步驟S201:控制所述數(shù)據(jù)供應(yīng)方對所述流通限制條件對應(yīng)的流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式和數(shù)據(jù)應(yīng)用時限,所述供應(yīng)時間對應(yīng)的供應(yīng)頻率和供應(yīng)周期,所述計價方式對應(yīng)的計價類型和價格以及所述標簽值進行更新。
步驟S202:根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢。
步驟S203:剔除滿足以下條件中的至少兩項的供應(yīng)數(shù)據(jù);其中,所述條件包括:所述數(shù)據(jù)標識指向的主體為自然人、所述維度主鍵在時間軸上對應(yīng)常量以及所述標簽值為數(shù)值且為絕對值。
步驟S204:將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果。
步驟S205:提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù)。
步驟S206:將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
步驟S207:形成日志,所述日志用于記錄所述數(shù)據(jù)供應(yīng)方與所述數(shù)據(jù)需求方的數(shù)據(jù)發(fā)送事件。
下面結(jié)合圖2對步驟S201至步驟S207進行詳細說明。
具體實施中,在數(shù)據(jù)標識指向個體時,查詢維度主鍵和供應(yīng)數(shù)據(jù)的維度主鍵可以包括人口屬性,例如可以是年齡、性別、婚姻、教育、職業(yè)等統(tǒng)計特征;家庭狀況,例如可以是家庭財產(chǎn)、家庭組成、關(guān)系圈等統(tǒng)計特征;支付信息,例如可以是銷售終端支付、網(wǎng)絡(luò)支付、移動支付、信用授權(quán)等支付情況;設(shè)備網(wǎng)絡(luò),例如可以是寬帶接入、終端等所使用設(shè)備情況;地域軌跡,例如可以是居住、工作、常留等場所情況;購買訂閱,例如可以是對通訊、旅游、汽車、教育等各類商業(yè)服務(wù)的消費情況;興趣愛好,例如可以是新聞、財經(jīng)、娛樂、商貿(mào)、游戲等的興趣愛好;意圖需求,例如可以是對通訊、旅游、教育、汽車、房產(chǎn)等各類商業(yè)服務(wù)的意向;負面標記,例如可以是在各類商業(yè)服務(wù)的負面記錄。在數(shù)據(jù)標識指向群組時,查詢維度主鍵和供應(yīng)數(shù)據(jù)的維度主鍵可以根據(jù)實際的應(yīng)用需求進行調(diào)整。
具體實施中,在步驟S201中,數(shù)據(jù)供應(yīng)方根據(jù)所述供應(yīng)時間對應(yīng)的供應(yīng)頻率或供應(yīng)周期對所述標簽值進行更新。也就是說,在數(shù)據(jù)流通之前,數(shù)據(jù)供應(yīng)方在供應(yīng)時間對應(yīng)的供應(yīng)頻率或供應(yīng)周期,提供供應(yīng)數(shù)據(jù)。
具體實施中,在步驟S203中,所述流通限制條件可以包括基礎(chǔ)約束條件。所述基礎(chǔ)約束條件用以對數(shù)據(jù)供應(yīng)方的供應(yīng)數(shù)據(jù)進行限制,避免供應(yīng)數(shù)據(jù)中涉及用戶隱私,保證數(shù)據(jù)流通的安全性。具體地,所述數(shù)據(jù)標識指向的主體為自然人,表示根據(jù)數(shù)據(jù)標識可以確定自然人;所述維度主鍵在時間軸上對應(yīng)常量,表示維度主鍵在時間軸上的值為常量,不隨時間變化,例如年齡;所述標簽值為數(shù)值且為絕對值,表示標簽值對應(yīng)的統(tǒng)計特征的數(shù)值為絕對值。
例如,以手機號為數(shù)據(jù)標識,年齡為主鍵維度,標簽值的加工顆粒度為歲,涉及基礎(chǔ)約束條件中的3項,剔除所述供應(yīng)數(shù)據(jù),禁止流通;而以手機號為基礎(chǔ)約束條件,年齡為主鍵維度,標簽值的加工顆粒度為老年段,涉及基礎(chǔ)約束條件中的2項,剔除所述供應(yīng)數(shù)據(jù),禁止流通;指向群組的數(shù)據(jù)標識,主鍵維度為群內(nèi)每個個體的年齡(歲)分布的數(shù)據(jù),涉及基礎(chǔ)約束條件中的2項,剔除所述供應(yīng)數(shù)據(jù),禁止流通。
可以理解的是,對于基礎(chǔ)約束條件的內(nèi)容,可以根據(jù)實際的應(yīng)用環(huán)境進行自定義配置和適應(yīng)性的調(diào)整,本發(fā)明實施例對此不做限制。
具體實施中,在步驟S206中,對于需求數(shù)據(jù)的加密方式,可以通過以下方式實現(xiàn):獲取隨機公鑰,并通過隨機公鑰和數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方的約定私鑰進行加密。
具體而言,數(shù)據(jù)需求方在接收到加密后的需求數(shù)據(jù)之后,獲取隨機公鑰,并根據(jù)隨機公鑰和數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方的約定私鑰進行解密,得到需求數(shù)據(jù)。
具體地,需求數(shù)據(jù)可以是供應(yīng)數(shù)據(jù)中的標簽值。例如,在數(shù)據(jù)需求方的需求者包括查詢數(shù)據(jù)標識為137XXXXXXXX,維度主鍵分類為“手機號和身份證是否匹配”時,數(shù)據(jù)供應(yīng)方返回的供應(yīng)數(shù)據(jù)的標簽值為“是”。
需要說明的是,加密的具體過程可以通過任意可實施的算法來實現(xiàn),本發(fā)明實施例對此不做限制。
具體實施中,在步驟S207中,日志用于記錄所述數(shù)據(jù)供應(yīng)方與所述數(shù)據(jù)需求方的數(shù)據(jù)發(fā)送事件。具體地,根據(jù)數(shù)據(jù)發(fā)送事件以及根據(jù)供應(yīng)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)對供應(yīng)數(shù)據(jù)實現(xiàn)快速的甄別,以實現(xiàn)安全性的分析和控制,使得數(shù)據(jù)流動的每個環(huán)節(jié)可查詢和追溯。同時,在日志中了所有的變更信息,在實際應(yīng)用中有良好的吞吐量、靈活性和用戶體驗。
本發(fā)明實施例通過維度主鍵的分類為數(shù)據(jù)流通提供了各類數(shù)據(jù)流通方式和應(yīng)用場景,有利于數(shù)據(jù)的分級分類管理,防范數(shù)據(jù)流通中可能出現(xiàn)的交易違規(guī)、契約失靈和企業(yè)管理失效等帶來的風險。
本發(fā)明實施例的具體實施方式可參照前述相應(yīng)實施例,此處不再贅述。
本發(fā)明實施例通過使用規(guī)范的數(shù)據(jù)標識查詢,規(guī)范的約束條件對供應(yīng)數(shù)據(jù)和數(shù)據(jù)需求方的需求進行匹配,保證了數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方之間數(shù)據(jù)流通的規(guī)范性;同時,通過約束條件匹配、發(fā)送標簽值和加密需求數(shù)據(jù),保證了數(shù)據(jù)流通的安全性。
本發(fā)明另一實施例中基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法如圖3所示,圖3是本發(fā)明實施例又一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法的示意圖。
本發(fā)明實施例的基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通方法包括以下步驟:
步驟S301:數(shù)據(jù)供應(yīng)方按照設(shè)定格式對供應(yīng)數(shù)據(jù)進行配置。
步驟S302:數(shù)據(jù)供應(yīng)方提供配置完成的供應(yīng)數(shù)據(jù)。
步驟S303:數(shù)據(jù)需求方按照設(shè)定格式對篩選條件進行配置。
步驟S304:數(shù)據(jù)需求方提供配置完成的篩選條件。
步驟S305:將滿足篩選條件的供應(yīng)數(shù)據(jù)從數(shù)據(jù)供應(yīng)方流通至數(shù)據(jù)需求方。
步驟S306:數(shù)據(jù)需求方對供應(yīng)數(shù)據(jù)進行使用。
步驟S307:數(shù)據(jù)監(jiān)管層對數(shù)據(jù)流通進行監(jiān)管和審計。
下面對步驟S301至步驟S307進行詳細的說明。
具體實施中,所述設(shè)定格式可以是供應(yīng)數(shù)據(jù)和篩選條件包括維度主鍵(Key)、標簽值(Value)、數(shù)據(jù)標識(ID)、流通限制條件(Limit)、供應(yīng)時間(Time)和計價方式(Price)。
其中,步驟S301包括:定義數(shù)據(jù)標識的屬性:數(shù)據(jù)標識分類,例如手機號類型;定義維度主鍵:維度主鍵名稱,維度主鍵分類屬性,例如維度主鍵名稱為“手機號和身份證是否匹配”,維度主鍵分類屬性為“人口屬性-信息驗證-手機身份驗證”;定義標簽值屬性:類型,長度,精度,單位,參數(shù)類型維度表,數(shù)據(jù)標識范圍等,例如,類型為數(shù)值類型,長度為1,精度為0,單位為“無”,參數(shù)0代表否,參數(shù)1代表是,數(shù)據(jù)標識范圍為“全國”;定義流通限制條件屬性:基礎(chǔ)約束條件、流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式、數(shù)據(jù)應(yīng)用時限;定義供應(yīng)時間屬性:供應(yīng)日期、供應(yīng)周期,例如每月末;定義計價方式屬性:包括計價類型,價格,例如按條計算。
在步驟S302中,將上述配置完成的供應(yīng)數(shù)據(jù)作為數(shù)據(jù)流通中的數(shù)據(jù)。例如可以是提供給服務(wù)平臺,用以進行供應(yīng)數(shù)據(jù)的流通。
在步驟S301中,對篩選條件進行配置。具體的配置過程可以包括:定義數(shù)據(jù)標識的條件:數(shù)據(jù)標識分類,例如手機號;定義維度主鍵的條件:維度主鍵名稱,維度主鍵分類屬性,例如,維度主鍵名稱為“手機號和身份證是否匹配”,維度主鍵分類屬性為“人口屬性-信息驗證-手機身份驗證”;定義標簽值條件:類型,長度,精度,單位,參數(shù)類型維度表,數(shù)據(jù)標識范圍,例如類型為“無”,長度為“無”,精度為“無”,單位為“無”,參數(shù)類型為“無”,數(shù)據(jù)標識范圍為“上?!?;定義流通限制條件:基礎(chǔ)約束條件、流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式、數(shù)據(jù)應(yīng)用時限;定義供應(yīng)時間條件:供應(yīng)日期、供應(yīng)周期,例如供應(yīng)日期為“無”,供應(yīng)周期為月度。定義計價方式條件:包括計價類型,價格,例如計價類型為按條計算。
在步驟S304中,數(shù)據(jù)需方提供配置完成的篩選條件。篩選條件中包括數(shù)據(jù)標識,例如137XXXXXXXX。
具體地,在步驟S305中,數(shù)據(jù)需求方按照篩選條件發(fā)起查詢請求。數(shù)據(jù)供應(yīng)方接口機向數(shù)據(jù)供應(yīng)方數(shù)據(jù)管理平臺轉(zhuǎn)發(fā)需方數(shù)據(jù)查詢請求。數(shù)據(jù)供應(yīng)方數(shù)據(jù)管理平臺在數(shù)據(jù)庫中以數(shù)據(jù)標識為數(shù)據(jù)查詢主鍵進行查詢匹配后,向供方接口機返回查詢結(jié)果。供方接口機收到需方查詢結(jié)果后,向數(shù)據(jù)流通服務(wù)器發(fā)送隨機公鑰生成請求。數(shù)據(jù)流通服務(wù)器生成隨機公鑰,并記錄相關(guān)日志信息。數(shù)據(jù)流通服務(wù)器生成隨機公鑰后返回數(shù)據(jù)供應(yīng)方接口機。數(shù)據(jù)供應(yīng)方對查詢匹配結(jié)果數(shù)據(jù)進行二次加密。數(shù)據(jù)供應(yīng)方接口機向數(shù)據(jù)需求方接口及返回二次加密的查詢結(jié)果。數(shù)據(jù)需求方接口機在收到二次加密查詢結(jié)果后,向數(shù)據(jù)流通服務(wù)器發(fā)送隨機公鑰的解密查詢請求。數(shù)據(jù)流通服務(wù)器向數(shù)據(jù)需求方接口機返回隨機公鑰。數(shù)據(jù)需求方對查詢結(jié)果數(shù)據(jù)進行二次解密。數(shù)據(jù)需求方數(shù)據(jù)管理平臺從需方接口機取回結(jié)果數(shù)據(jù)。
至此,數(shù)據(jù)需求方已經(jīng)獲取到與篩選條件匹配的數(shù)據(jù)。
具體地,在步驟S306中,數(shù)據(jù)需求方最終獲得的數(shù)據(jù)是與篩選條件相匹配的供應(yīng)數(shù)據(jù)的數(shù)據(jù)標識,維度主鍵和標簽值,例如137XXXXXXXX,“手機號和身份證是否匹配”,“是”。其中,維度主鍵表示標簽。具體而言,用標簽可以指高度精煉的用戶特征標識。通過使用標簽及標簽值,在多種應(yīng)用領(lǐng)域中,都能進一步提升精準度,提高信息獲取的效率。
具體地,由于采用設(shè)定格式的供應(yīng)數(shù)據(jù)和篩選條件,包括數(shù)據(jù)供應(yīng)方、數(shù)據(jù)需求方,以及數(shù)據(jù)標識、維度主鍵、標簽值、流通限制條件、供應(yīng)時間和計價方式,監(jiān)管層可利用計算機編程技術(shù)實現(xiàn)快速的甄別,以實現(xiàn)隱私安全等的分析和控制,使得數(shù)據(jù)流動的每個環(huán)節(jié)可查詢和追溯。
在步驟S307中,對數(shù)據(jù)的監(jiān)管包括數(shù)據(jù)流通前的監(jiān)管。其中,在流通限制條件中依據(jù)法律法規(guī),對基礎(chǔ)約束條件進行配置,對危害國家安全、通過不法手段獲取、涉及個人身份信息、侵犯個人合法權(quán)益及企業(yè)商業(yè)秘密等數(shù)據(jù)的流通進行限制。
具體地,對數(shù)據(jù)的監(jiān)管還包括數(shù)據(jù)流通中的監(jiān)管。在數(shù)據(jù)流通過程中,實時監(jiān)管數(shù)據(jù)供應(yīng)方、數(shù)據(jù)需求方,以及數(shù)據(jù)標識、維度主鍵、標簽值、流通限制條件、供應(yīng)時間和計價方式。
具體地,對數(shù)據(jù)的監(jiān)管還包括數(shù)據(jù)流通后的監(jiān)管:每條記錄的數(shù)據(jù)供應(yīng)方、數(shù)據(jù)需求方,以及數(shù)據(jù)標識、維度主鍵、標簽值、流通限制條件、供應(yīng)時間和計價方式可以追溯查詢,監(jiān)管層可以按數(shù)據(jù)流通限制條件約定的目的(用途)、范圍、方式和時間等數(shù)據(jù)使用條件及違約責任進行監(jiān)測。
進一步而言,對于審計機構(gòu)而言,由于提供的數(shù)據(jù)包括供應(yīng)方、數(shù)據(jù)需求方,以及數(shù)據(jù)標識、維度主鍵、標簽值、流通限制條件、供應(yīng)時間和計價方式等數(shù)據(jù),記錄了每一筆數(shù)據(jù)流通過程中的數(shù)據(jù)供應(yīng)方、數(shù)據(jù)需求方、服務(wù)方、時間戳,以及匹配的價格等關(guān)鍵信息,提供了實時在線的自動化清算和審計。
圖4是本發(fā)明實施例一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置的結(jié)構(gòu)示意圖。
基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置40可以包括:查詢單元401、匹配單元402、提取單元403和加密單元404。
其中,查詢單元401適于根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢,其中,所述供應(yīng)數(shù)據(jù)包括維度主鍵、標簽值、與所述查詢數(shù)據(jù)標識相同或相應(yīng)的數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng)。
匹配單元402適于將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果。
提取單元403適于提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù)。
加密單元404適于將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
在數(shù)據(jù)需求方的需求滿足供應(yīng)數(shù)據(jù)的約束條件時,則表示該供應(yīng)數(shù)據(jù)與數(shù)據(jù)需求方的需求相匹配,并將該供應(yīng)數(shù)據(jù)作為匹配結(jié)果;否則,該供應(yīng)數(shù)據(jù)與數(shù)據(jù)需求方的需求不匹配。
具體實施中,所述約束條件可以包括以下一種或多種:所述供應(yīng)數(shù)據(jù)的流通限制條件、供應(yīng)時間和計價方式。具體地,流通限制條件可以包括流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式、數(shù)據(jù)應(yīng)用時限。供應(yīng)時間可以包括供應(yīng)頻度和供應(yīng)周期。計價方式可以包括計價類型和價格。
本發(fā)明實施例的具體實施方式可參照前述相應(yīng)實施例,此處不再贅述。
圖5是本發(fā)明實施例另一種基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置的結(jié)構(gòu)示意圖。
基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置50可以包括:更新單元501、查詢單元502、約束單元503、匹配單元504、提取單元505、加密單元506、和日志形成單元507。
其中,更新單元501適于控制所述數(shù)據(jù)供應(yīng)方對所述流通限制條件對應(yīng)的流通對象條件、流通遍歷條件、數(shù)據(jù)應(yīng)用范圍、數(shù)據(jù)用途、數(shù)據(jù)應(yīng)用方式和數(shù)據(jù)應(yīng)用時限,所述供應(yīng)時間對應(yīng)的供應(yīng)頻率和供應(yīng)周期,所述計價方式對應(yīng)的計價類型和價格以及所述標簽值進行更新。
查詢單元502適于根據(jù)查詢數(shù)據(jù)標識對至少一個數(shù)據(jù)供應(yīng)方提供的供應(yīng)數(shù)據(jù)進行查詢,其中,所述供應(yīng)數(shù)據(jù)包括維度主鍵、標簽值、與所述查詢數(shù)據(jù)標識相同或相應(yīng)的數(shù)據(jù)標識以及約束條件,所述維度主鍵與所述標簽值相對應(yīng)。
約束單元503適于按照所述約束條件進行剔除操作;所述剔除操作包括剔除滿足以下條件中的至少兩項的供應(yīng)數(shù)據(jù);其中,所述條件包括:所述數(shù)據(jù)標識指向的主體為自然人、所述維度主鍵在時間軸上對應(yīng)常量以及所述標簽值為數(shù)值且為絕對值。
匹配單元504適于將數(shù)據(jù)需求方的需求與所述供應(yīng)數(shù)據(jù)的約束條件進行匹配,得到匹配結(jié)果。
提取單元505適于提取所述匹配結(jié)果對應(yīng)的供應(yīng)數(shù)據(jù)的維度主鍵對應(yīng)的標簽值,以得到需求數(shù)據(jù)。
加密單元506適于將所述需求數(shù)據(jù)進行加密處理,并發(fā)送至所述數(shù)據(jù)需求方。
日志形成單元507適于形成日志,所述日志用于記錄所述數(shù)據(jù)供應(yīng)方與所述數(shù)據(jù)需求方的數(shù)據(jù)發(fā)送事件。
本發(fā)明實施例中,標簽值具備語義化和短文本的特征。其中,語義化使得維度主鍵易于理解,有利于數(shù)據(jù)需求方獲得用戶畫像模型;同時,每個標簽值有唯一性,無需數(shù)據(jù)需求方再做過多文本分析等預(yù)處理工作,可以快速提取信息,在大數(shù)據(jù)處理領(lǐng)域,進一步提升精準度,提高信息獲取的效率,提高數(shù)據(jù)需求方的用戶體驗。
本發(fā)明實施例通過在數(shù)據(jù)流通過程中使用規(guī)范化的供應(yīng)數(shù)據(jù),并將供應(yīng)數(shù)據(jù)的標簽值作為需求數(shù)據(jù)發(fā)送至數(shù)據(jù)需求方,可以提高數(shù)據(jù)流通的便捷性;同時,通過約束條件對數(shù)據(jù)需求方進行限制,可以避免供應(yīng)數(shù)據(jù)被非法使用,保證數(shù)據(jù)流通的安全性。
本發(fā)明實施例的具體實施方式可參照前述相應(yīng)實施例,此處不再贅述。
本發(fā)明實施例還公開了一種終端,所述終端可以包括基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置40或基于數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)流通裝置50。所述終端可以包括但不限于計算機設(shè)備、手機、筆記本、平板電腦等。
本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于以計算機可讀存儲介質(zhì)中,存儲介質(zhì)可以包括:ROM、RAM、磁盤或光盤等。
雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動與修改,因此本發(fā)明的保護范圍應(yīng)當以權(quán)利要求所限定的范圍為準。