基于時間和路段相關性的數據修復方法
【專利摘要】本發明提出了一種基于時間和路段相關性的數據修復方法,包括:獲取經過數據清洗的動態交通數據;對所述動態交通數據進行基于時間相關性模型的修復,包括:采用二次指數平滑法對所述動態交通數據中連續點上缺失的交通進行預測,得到修復的觀測值對所述動態交通數據進行基于路段相關性模型的修復,包括:根據相鄰路段之間的相關,計算缺失數據路段上的車輛速度;根據vti,t和vsi,t計算基于時間相關性模型和路段相關性模型線性融合的i表示路段編號。本發明提高了數據修復的質量和數據修復預測的精度,從而提高了道路交通狀態的檢測精度。
【專利說明】
基于時間和路段相關性的數據修復方法
技術領域
[0001] 本發明涉及智能交通及車聯網技術領域,特別涉及一種基于時間和路段相關性的 數據修復方法。
【背景技術】
[0002] 隨著ITS(Intelligent Transport System,智能交通系統)的廣泛發展,動態交通 數據的應用越來越廣泛。通常所說的動態交通數據的清洗包括原始數據中異常數據的識 另IJ、過濾和修復等過程。由于數據過濾會引起信息的丟失,為保證城市道路交通狀態預測的 精確性,有必要使用數據修復方法對缺失的數據進行修復。目前常用與數據修復的算法有 加權平均算法和指數平滑法等兩種。
[0003] (1)加權平均算法是一種優先考慮相鄰時間對缺失數據的影響的算法。一般而言, 觀測值與缺失數據時間相隔越大,其對缺失數據的貢獻因子越小;觀測值與缺失數據時間 相隔越小,其對缺失數據的貢獻因子越大。但是該算法只考慮當前相鄰時間間隔內觀測值 對缺失數據的影響,并沒有不考慮缺失點的歷史趨勢,缺乏一定的靈活性。
[0004] (2)二次指數平滑法是在移動平均方法基礎發展起來的一種時間序列分析預測算 法,是對市場現象中的實際觀測值計算兩次平滑值,并由此建立預測模型,對市場現象進行 預測的方法。相對于一次指數平滑法,二次指數平滑法適用于預測有明顯趨勢變化的市場 現象,而且可以實現對市場現象的多期預測和修復。
[0005] 二次指數平滑法修復缺失數據的關鍵在于平滑系數的取值,根據以往的研究資 料,如果樣本點整體波動較大,則平滑系數的值應取大一些,即增加近期樣本點對預測結果 的影響。如果樣本點整體平穩,則平滑系數的值應取小一些。然而,實際的交通系統中,車輛 在道路網中采集的信息復雜多樣,并不能完全根據采集的交通信息就能判定出需要使用的 修復模型。此外,在相鄰時間間隔和相鄰路段采集的信息很難同步,這意味著如果只考慮交 通信息的路段相關性或時間相關性來修復數據,很大程度上將大大增大數據修復的誤差。
[0006] 因此,為提高數據修復和預測的精確度,有必要同時考慮城市道路網中路段的時 間相關性和路段相關性,對缺失的數據進行修復。
【發明內容】
[0007] 本發明的目的旨在至少解決所述技術缺陷之一。
[0008] 為此,本發明的目的在于提出一種基于時間和路段相關性的數據修復方法,提高 了數據修復的質量和數據修復預測的精度,從而提高了道路交通狀態的檢測精度。
[0009] 為了實現上述目的,本發明的實施例提供一種基于時間和路段相關性的數據修復 方法,包括如下步驟:
[0010]步驟S1,獲取經過數據清洗的動態交通數據;
[0011]步驟S2,對所述動態交通數據進行基于時間相關性模型的修復,包括:采用二次指 數平滑法對所述動態交通數據中連續點上缺失的交通進行預測,得到修復的觀測值其 中,T表示待修復數據與已知采樣點的時間間隔,t表示當前時刻;
[0012] 步驟S3,對所述動態交通數據進行基于路段相關性模型的修復,包括:根據相鄰路 段之間的相關,計算缺失數據路段上的車輛速度<,r表示缺失數據所在的路段號;
[0013] 步驟S4,根據步驟S2中的計算出時間相關模型下的道路車輛速度vt1>t,根據步 驟S3中的vf計算出路段相關模型下的道路車輛速度 Vsi,t,根據vti,t和vsi,t計算基于時間相 關性模型和路段相關性模型線性融合的?, i表示路段編號。 ':,
[0014] 進一步,在所述步驟S2中,
[0015] v-tvF = at -¥htT i
[0016] 其中,at,bt分別表示模型參數。
[0017] 進一步,
[0020] 其中,vf表示一次指數平滑所得的值,vf1表示二次指數平滑所得的值,令 # = C = >VQ表示用于預測數據的第一個速度值,〇1表示平滑常數,ai e (〇,1)。
[0021] 進一步,對下式取最小值,得到CH,
[0025]其中,r表示缺失數據所在的路段號,礦表示與路段r相鄰的路段的總條數,表示相 鄰路段的序列號,表示相鄰路段h在時間t時的車輛速度;/?'表示權值因子
[0027]其中,<表示缺失數據所在路段r與其他相鄰路段之間的路段相關系數。
[0028] 進一步,在所述步驟S4中,
[0029] = az · vt, , +(\-a2)· v.v,,
[0030] 其中,\表示路段^的道路交通速度,〇2表示平滑系數,α2 e (〇,1)。
[0031 ]根據本發明實施例的基于時間和路段相關性的數據修復方法,將時間相關性修復 和路段相關性修復進行融合,對缺失的交通狀態數據進行修復。提出的基于時間-路段相關 性模型進行數據修復的方法是可行的。從實際的城市道路網來,路段之間錯綜復雜,相互影 響。本發明相較于基于時間相關性模型的數據修復,修復結果更逼近實際觀測值,數據修復 的質量更高,提高了數據修復預測的精度,從而提高了道路交通狀態的檢測精度,為后期交 通策略的制定提供了理論基礎。
[0032] 本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發明的實踐了解到。
【附圖說明】
[0033] 本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得 明顯和容易理解,其中:
[0034] 圖1為根據本發明實施例的基于時間和路段相關性的數據修復方法的流程圖;
[0035] 圖2為根據本發明實施例的局部路段空間分布示意圖。
【具體實施方式】
[0036] 下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發明,而不能理解為對本發明的限制。
[0037] 本發明提出一種基于時間和路段相關性的數據修復方法,通過建立在完善的"端 (客戶端)-管(管理系統)-云(云平臺)"三層架構之上。利用道路參數的閾值屬性,實現車云 平臺數據的清洗;根據缺失數據的類型,使用城市道路網中路段的時間相關性和路段相關 性進行缺失數據的修復。
[0038] 如圖1所示,本發明實施例的基于時間和路段相關性的數據修復方法,包括如下步 驟:
[0039] 步驟S1,獲取經過數據清洗的動態交通數據。
[0040] 具體地,如果采集的動態交通數據在相鄰一段時間間隔內相對比較完整,則可以 采用交通信息的時間相關模型對數據進行修復和預測。
[0041] 在道路網中相鄰路段信息比較完整的情況下,交通信息的路段相關模型更適用數 據的修復和預測。
[0042] 步驟S2,對動態交通數據進行基于時間相關性模型的修復,包括:采用二次指數平 滑法對動態交通數據中連續點上缺失的交通進行預測,得到修復的觀測值,
[0043] ν?+τ: = at + btf (: 1:)
[0044] 其中,T表示待修復數據與已知采樣點的時間間隔,T = 1,2,…,t表示當前時刻,中 間變量£lt,bt分別表示模型參數。
[0045] at,bt可以通過以下公式計算得到:
[0048] 其中,表示一次指數平滑所得的值,vf表示二次指數平滑所得的值,令 # = vf = VU VQ表示用于預測數據的第一個速度值,〇1表示平滑常數,aie (〇, 1)。 .,
[0049] 令絕對誤差
[0051]理論上預測值越接近實際觀測值,即ε越小,說明數據修復越成功,此時的al即最 優的平滑系數。因此,對公式(4)取最小值,得到的〇1即為最優值。
[0052]圖2為單車道的局部路段空間分布示意圖。
[0053] 如圖2所示,黑色圓圈表示路口,實線表示道路(A1至A9路段),箭頭表示道路交通 流方說向。由于以單車道為例,因此箭頭為單向箭頭。表1列出了圖2中非高峰時段內路段A6 與其他路段之間的相關系數。由表1可知,相鄰路段的相關系數相對較大,路段之間的相關 系數隨著路段之間距離的增大而變小。需要注意的是,路段A6和上下流路段,即路段A5和路 段A9之間的相關系數相對其他路段要大,而平行路段之間的相關系數相對比較小。例如,路 段A6與路段A1、路段A2和路段A3之間的相關系數較小。因此,路段之間的相關系數可以通過 相鄰路段之間的道路平均速度計算得到。
[0054]
[0055] 表 1
[0056] 步驟S3,對動態交通數據進行基于路段相關性模型的修復,包括:根據相鄰路段之 間的相關,計算缺失數據路段上的車輛速度<,r表示缺失數據所在的路段號;
[0058]其中,r表示缺失數據所在的路段號,礦表示與路段r相鄰的路段的總條數,表示相 鄰路段的序列號,<(/〇表示相鄰路段h在時間t時的車輛速度表示權值因子
[0060] 其中,r/表示缺失數據所在路段r與其他相鄰路段之間的路段相關系數。
[0061] 在本發明的一個實施例中,路段之間的相關系數隨時間變化而變化,如果數據之 間沒有相關性,則 <可以取數據缺失日期之間一段時間內的相關系數的平均值。
[0062] 步驟S4,根據步驟S2中的;;&計算出時間相關模型下的道路車輛速度vt1>t,根據步 驟S3中的 <計算出路段相關模型下的道路車輛速度vsi,t,根據vti,t和vsi,t計算基于時間相 關性模型和路段相關性模型線性融合的% ^表示路段編號。
[0064] 其中,<表示路段^的道路交通速度,〇2表示平滑系數,a2 e (〇,1)。
[0065] 由此,&即為基于時間相關性和路段相關性進行數據修復后得到的缺失數據。采 用上述方法對各個路段上的車輛缺失的交通數據進行修復,從而可以得到較為準確道路交 通狀態,為后期應用分析提供準確的數據基礎。
[0066] 根據本發明實施例的基于時間和路段相關性的數據修復方法,將時間相關性修復 和路段相關性修復進行融合,對缺失的交通狀態數據進行修復。提出的基于時間-路段相關 性模型進行數據修復的方法是可行的。從實際的城市道路網來,路段之間錯綜復雜,相互影 響。本發明相較于基于時間相關性模型的數據修復,修復結果更逼近實際觀測值,數據修復 的質量更高,提高了數據修復預測的精度,從而提高了道路交通狀態的檢測精度,為后期交 通策略的制定提供了理論基礎。
[0067] 在本說明書的描述中,參考術語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特 點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不 一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何 的一個或多個實施例或示例中以合適的方式結合。
[0068] 盡管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例 性的,不能理解為對本發明的限制,本領域的普通技術人員在不脫離本發明的原理和宗旨 的情況下在本發明的范圍內可以對上述實施例進行變化、修改、替換和變型。本發明的范圍 由所附權利要求極其等同限定。
【主權項】
1. 一種基于時間和路段相關性的數據修復方法,其特征在于,包括如下步驟: 步驟S1,獲取經過數據清洗的動態交通數據; 步驟S2,對所述動態交通數據進行基于時間相關性模型的修復,包括:采用二次指數平 滑法對所述動態交通數據中連續點上缺失的交通進行預測,得到修復的觀測值,其中,T 表示待修復數據與已知采樣點的時間間隔,t表示當前時刻; 步驟S3,對所述動態交通數據進行基于路段相關性模型的修復,包括:根據相鄰路段之 間的相關,計算缺失數據路段上的車輛速度<,r表示缺失數據所在的路段號; 步驟S4,根據步驟S2中的;:w計算出時間相關模型下的道路車輛速度^i,t,根據步驟S3 中的 < 計算出路段相關模型下的道路車輛速度VSi,t,根據和VSi,t計算基于時間相關性 模型和路段相關性模型線性融合的i表示路段編號。2. 如權利要求1所述的基于時間和路段相關性的數據修復方法,其特征在于,在所述步 驟S2中,其中,at, bt分別表示模型參數。3. 如權利要求2所述的基于時間和路段相關性的數據修復方法,其特征在于,其中,V嚴表示一次指數平滑所得的值,咕"表示二次指數平滑所得的值,令皆j = vf = ?, VO表示用于預測數據的第一個速度值,αι表示平滑常數,αι e (Ο,1)。4. 如權利要求3所述的基于時間和路段相關性的數據修復方法,其特征在于,對下式取 最小值,得到曰1,5. 如權利要求1所述的基于時間和路段相關性的數據修復方法,其特征在于,在所述步 驟S3中,其中,r表示缺失數據所在的路段號,HT表示與路段r相鄰的路段的總條數,表示相鄰路 段的序列號,<林)表示相鄰路段h在時間t時的車輛速度;爲表示權值因子其中,語表示缺失數據所在路段r與其他相鄰路段之間的路段相關系數。6.如權利要求1所述的基于時間和路段相關性的數據修復方法,其特征在于,在所述步 驟S4中,其中,表示路段ri的道路交通速度,表示平滑系數,e (0,1)。
【文檔編號】G06F19/00GK106096302SQ201610459938
【公開日】2016年11月9日
【申請日】2016年6月22日
【發明人】劉化勝, 李從萍, 董文杰
【申請人】江蘇迪納數字科技股份有限公司