本發明涉及一種數據共振系統及方法,特別是涉及一種基于時空軌跡異構多源數據共振系統及方法。
背景技術:
在傳統的歐幾里德距離函數的軌跡相似性計算過程中,要求軌跡等長且時間點對應,無法度量不等長且具有局部事件偏移的軌跡相似性。因此在發現異源同步軌跡集合過程中產生信息損失較大,影響軌跡數據的可用性。
技術實現要素:
本發明所要解決的技術問題是提供一種基于時空軌跡異構多源數據共振系統及方法,去能夠避免歐式距離脫離實際的情況,保證數據的完整性和一致性,提高計算效率,使用范圍廣泛。
本發明是通過下述技術方案來解決上述技術問題的:一種基于時空軌跡異構多源數據共振系統,其特征在于,其包括:
實時序列流接收模塊,用于實時接收時序向量,并保證數據傳輸過程中的完整性,一致性;
軌跡相似度計算模塊,用于計算軌跡相似度并篩選出相似度大于一定閾值的軌跡,作為共振軌跡;
軌跡可視化模塊,用于直觀顯示目標軌跡,軌跡數據同時包含空間和時間屬性,數據量大且維度高,分析起來難度很大,可視化技術可以直觀地呈現多維時空軌跡數據,并提供豐富的互動,以揭示數據中包含的時空規律。
優選地,所述實時序列流接收模塊包括:
數據轉換模塊,用于將原始的軌跡數據轉換為時序向量;
消息傳輸模塊,用于將時序向量以消息的方式實時傳送到相似度計算模塊,并保證數據傳輸過程中的完整性,一致性。
優選地,所述軌跡相似度計算模塊包括:
時序向量規則模塊,用于規則化接收到的時序向量,保證計算的一致性;
相似度篩選模塊,用于篩選出相似度大于一定閾值的軌跡,作為共振軌跡,進而大大減小計算量,提高計算效率;
軌跡缺失值補全模塊,用于補全原查詢軌跡,軌跡數據采集過程中常常會有缺失,把缺失的軌跡補全,以及經過這個軌跡點的時間范圍的估計區域的盡量縮小,對于實際的業務應用非常有用。
本發明還提供一種基于時空軌跡異構多源數據共振方法,其包括以下步驟:
步驟一,將原始軌跡數據轉換為時序向量;
步驟二,時序向量規則化;
步驟三,向量時間切片;
步驟四,通過相似度計算方法計算相似度作為共振率;
步驟五,篩選共振率大于一定數值的軌跡作為共振軌跡;
步驟六,補全原查詢軌跡;
步驟七,軌跡可視化;
步驟八,結束。
優選地,所述步驟四根據哈希區域映射的時空距離計算方法計算點與點之間的距離,把測地距離通過一定的hash算法映射為區域點之間的距離,在實際計算相似度的時候,通過hash查找對應的測地距離作為相似度,使用hash距離通過時序偏移的時空三維向量序列的相似度計算方法計算相似度作為共振率;對于不同長度的序列向量的相似度,以及時間點不對齊的序列向量的相似度的計算,通過動態規劃考慮時間軸可能偏移的情況,重新計算相似度,得到兩個時空三維向量序列的最終相似度。
優選地,所述步驟六使用相似軌跡來進行哈希映射的軌跡缺失值補全方法,把缺失的軌跡點盡量準確的補全和經過時間范圍估計縮小。
優選地,所述步驟七使用相似軌跡哈希映射的軌跡缺失值補全方法補全原查詢軌跡,進行可視化展示。
本發明的積極進步效果在于:本發明能夠在大量獲取的數據存在準確性不高以及數據碎片化的情況下,在無法通過確定手段進行關聯的情況下,通過數據共振,可以有效甄別數據,并將真實的數據關聯起來;數據共振將數據上未直接反應出來的內在關系挖掘出來,深入揭示不同實體的時間空間關聯,進而發現不同的獨立數據間的彼此關系。
附圖說明
圖1為本發明的結構示意圖。
圖2為本發明的流程圖。
具體實施方式
下面結合附圖給出本發明較佳實施例,以詳細說明本發明的技術方案。
如圖1所示,本發明基于時空軌跡異構多源數據共振系統包括實時序列流接收模塊、軌跡相似度計算模塊、軌跡可視化模塊,其中:
實時序列流接收模塊用于實時接收時序向量,并保證數據傳輸過程中的完整性,一致性;
軌跡相似度計算模塊用于計算軌跡相似度并篩選出相似度大于一定閾值的軌跡,作為共振軌跡;
軌跡可視化模塊用于直觀顯示目標軌跡,軌跡數據同時包含空間和時間屬性,數據量大且維度高,分析起來難度很大,可視化技術可以直觀地呈現多維時空軌跡數據,并提供豐富的互動,以揭示數據中包含的時空規律。
所述實時序列流接收模塊包括數據轉換模塊、消息傳輸模塊,其中:
數據轉換模塊用于將原始的軌跡數據轉換為時序向量;
消息傳輸模塊用于將時序向量以消息的方式實時傳送到相似度計算模塊,并保證數據傳輸過程中的完整性,一致性。
所述軌跡相似度計算模塊包括時序向量規則模塊、相似度篩選模塊、軌跡缺失值補全模塊,其中:
時序向量規則模塊用于規則化接收到的時序向量,保證計算的一致性;
相似度篩選模塊用于篩選出相似度大于一定閾值的軌跡,作為共振軌跡,進而可以大大減小計算量,提高計算效率;
軌跡缺失值補全模塊用于補全原查詢軌跡,軌跡數據采集過程中常常會有缺失,如何把缺失的軌跡補全,以及經過這個軌跡點的時間范圍的估計區域的盡量縮小,對于實際的業務應用非常有用。
如圖2所示,本發明基于時空軌跡異構多源數據共振方法包括以下步驟:
步驟一,將原始軌跡數據轉換為時序向量;
步驟二,時序向量規則化;
步驟三,向量時間切片;
步驟四,通過相似度計算方法計算相似度作為共振率;
步驟五,篩選共振率大于一定數值的軌跡作為共振軌跡;
步驟六,補全原查詢軌跡;
步驟七,軌跡可視化;
步驟八,結束。
所述步驟四根據哈希區域映射的時空距離計算方法計算點與點之間的距離,把測地距離通過一定的hash算法映射為區域點之間的距離,在實際計算相似度的時候,通過hash查找對應的測地距離作為相似度,使用hash距離通過時序偏移的時空三維向量序列的相似度計算方法計算相似度作為共振率;對于不同長度的序列向量的相似度,以及時間點不對齊(允許各種時間不等片的偏離)的序列向量的相似度的計算,通過動態規劃考慮時間軸可能偏移的情況,重新計算相似度,得到兩個時空三維向量序列的最終相似度。
所述步驟六使用相似軌跡來進行哈希映射的軌跡缺失值補全方法,把缺失的軌跡點盡量準確的補全和經過時間范圍估計縮小。
所述步驟七使用相似軌跡哈希映射的軌跡缺失值補全方法補全原查詢軌跡,進行可視化展示。
以上所述的具體實施例,對本發明的解決的技術問題、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施例而已,并不用于限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。