基于稀疏車牌識別數據挖掘的交通小區劃分方法
【技術領域】
[0001] 本發明涉及城市計算中交通小區劃分領域,尤其涉及基于稀疏車牌識別數據的交 通小區劃分方法。
【背景技術】
[0002] 隨著社會的發展,未來的城市將承載越來越多的人口壓力和交通壓力。解決城市 發展難題,建設智慧城市已經成為城市化發展道路的主流。為了緩解城市交通擁堵情況,首 先要對城市交通的生成和分布具有明確的了解。然而整個城市的交通狀況錯綜復雜,為了 增強交通調查的實際可操作性,盡可能的減小交通調查的工作量,降低交通分析與預測的 難度,將整個城市的交通網絡劃分成合理的交通小區成為建設智慧城市交通必要的一步。 交通小區是具有一定交通關聯度和交通相似度的節點和連線的集合,隨時間、關聯度和相 似度的變化而變化,反映城市交通特征的時空變化特性。劃分交通小區能夠為交通調查分 析和預測提供便利,影響整個城市的交通規劃和布局。
[0003][0004][0005][0006] 傳統的交通小區劃分方法,或是根據路網對應的土地性質和土地使用狀況來將相 近的交通小區歸類;或是分析各個路段出行比例來確定交通小區的半徑;或是借用地理信 息系統切割道路網絡后對交通小區進行聚類。這些方法需要完整的城市道路網絡數據的支 持,需要收集研究區域內每個路口的交通數據。然而,由于經費等問題,部署有傳感器的路 口數目有限,得到的交通數據十分稀疏,使用傳統劃分方法得到的結果往往不準確。
【發明內容】
[0007] 本發明提供一種基于稀疏車輛識別數據劃分交通小區的方法,通過建立時間、空 間和車輛類型的三維張量來反映路口交通狀況,引入社交媒體簽到數據和地理信息P0I數 據,利用協同張量分解對張量數據進行補全,從而得到能夠完整的反映整個城市道路交通 狀況的張量,最后通過空間聚類的方法劃分交通小區。
[0008] 本發明基于稀疏車牌識別數據挖掘的交通小區劃分方法包括車輛類型劃分、路口 數據補全和交通小區劃分三個階段,具體步驟如下:
[0009] 車輛類型劃分階段:針對城市地圖上每個可監測路口,將經過的車輛按照出行時 間分布劃分成η種類型;步驟1-1,針對城市地圖上每個可監測路口,采集車牌識別數據,計 算單位時間段內車輛經過的路口數目,建立車輛關于路口的矩陣;
[0010] 步驟1-1中,每條車牌識別數據包括記錄的設備編號、記錄的時間和識別的車牌數 據。
[0011] 結構如下:
[0012] L={lid,ltime,lcar} (1)
[0013] 其中:
[0014] hd為錄下該條數據的設備編號,設備可以是配置在路口的攝像機或傳感器等;
[0015] ltime為錄下該條數據的時間;
[0016] lcar為識別出的經過的車輛的車牌。
[0017] 步驟1-2,對車輛關于路口的矩陣進行非負矩陣分解;
[0018] 步驟1-3,根據非負矩陣分解的結果,將車輛按照出行時間分布劃分成η種類型。
[0019] 路口數據補全階段:在車輛類型劃分階段的基礎上,引入社交媒體簽到數據以及 Ρ0Ι數據,利用協同張量分解獲得包含所有路口的交通狀況張量;步驟2-1,讀取所述車牌識 別數據,計算每個可監測路口各個時間段內經過的不同類型車輛的數目,建立反映路口交 通狀況的張量并歸一化;
[0020] 步驟2-2,根據各路口地理位置統計各路口半徑k (取值一般在200m-1000m根據城 市地圖調整參數)公里范圍內各個時間段內的社交媒體軟件(例如微博、twitter flickr 等)的簽到數據,建立反映地圖上所有路口簽到狀況的矩陣并歸一化;
[0021] 步驟2-3,根據各路口地理位置統計各路口半徑k公里范圍內各種類型的Ρ0Ι (Point of Interest,在地理信息系統中,一個Ρ0Ι可以是一棟房子、一個商鋪、一個郵筒、 一個公交站等)的數目,建立反映地圖上所有路口地理特征的矩陣并歸一化;
[0022] 步驟2-4,根據車輛類型劃分階段的結果,統計各種類型的車輛在同一路口同時段 出現的概率,建立反映車輛類型之間相關性的矩陣并歸一化;
[0023] 步驟2-5,對步驟2-1至步驟2-4得到的四個歸一化后的矩陣進行協同張量分解,得 到一個完整反映城市地圖上所有路口交通狀況的張量。
[0024] 交通小區劃分階段:基于交通狀況張量對城市地圖進行空間聚類,將城市地圖劃 分成不同的交通小區;
[0025] 步驟3-1,劃分城市地圖,以路口為頂點,路段為邊界,將城市地圖劃分成最小的區 域塊;
[0026] 步驟3-2,建立引力模型,根據經過路口的車輛和路口的地理位置計算相鄰路口之 間的作用力;
[0027] 步驟3-3,采用空間聚類的方法,對路口進行聚類;
[0028]步驟3-3中,區域塊之間聚類的距離為:
[0029]
[0030] 式中,X和y代表兩個區域塊,α和β代表分別位于X和y中的兩個路口,Fa,e是路口α和 路口β之間的作用力,g(a,β)代表路口a和β之間的連通性。
[0031] 如果路a和β之間能夠通過道路相互到達,則表示路口 a和β之間具有連通性,g(a, β) = 1;
[0032] 反之路口 a和β之間路口不能夠通過道路相互到達,則路口 a和β之間不具有連通 性,g(a,0)=O〇
[0033] η是統計兩個區域塊之間總的路口對的數目。
[0034] 步驟3-4,根據路口聚類結果,將同類區域塊劃分到一起,完成交通小區的劃分。
[0035] 非負矩陣分解能夠在保證數據的非負性的情況下,將數據從高維空間投影到低維 空間,使得分解結果在現實中具有可解釋性;協同張量分解通過引入附加的數據,結合附加 數據得到與之相關的分解結果,能夠對稀疏數據進行補充。
[0036] 本發明針對交通小區劃分中車牌識別數據稀疏的問題,提出了一種基于稀疏車牌 識別數據的交通小區劃分方法,引入了社交媒體軟件簽到數據和Ρ0Ι數據進行協同張量分 解補全整個城市的路口交通數據,通過非負矩陣分解得到可解釋的車輛類型,并結合空間 聚類的方法劃分出合理的交通小區。
[0037]本發明的優點包括:
[0038] 1、給出一種結合非負矩陣分解和協同張量分解的交通小區劃分方法,劃分車輛出 行類型,建立路口交通張量,能夠在數據稀疏的情況下劃分交通小區;
[0039] 2、在車輛劃分過程中,基于非負矩陣分解對車輛類型劃分,在保證數據的可解釋 性下對車輛出行習慣進行研究;
[0040] 3、在數據補全過程中,基于協同張量分解引入附加數據對有限的路口車牌識別數 據進行補全。
【附圖說明】
[0041 ]圖1為本發明交通小區劃分方法總體流程圖;
[0042]圖2為建立簽到矩陣的流程圖;
[0043]圖3為建立Ρ0Ι矩陣的流程圖。
【具體實施方式】
[0044] 本發明提出了基于稀疏車牌識別數據的交通小區劃分方法,流程圖如圖1所示,分 為車輛類型識別、路口數據補全和交通小區劃分三個階段。
[0045] 在車輛類型識別階段主要劃分車輛出行類型,得到車輛類型之間的相關性,從而 建立反映不同類型車輛出行時間的路口交通狀況張量。
[0046] 由于配置交通數據傳感器的路口有限,使得車牌識別數據十分稀疏,為此對這個 張量中沒有配置傳感器的路口的數據進行補全。
[0047]在路口數據補全階段主要引入社交媒體軟件用戶簽到數據和地理信息Ρ0Ι數據, 結合反映不同類型車輛出行時間的路口交通狀況張量以及車輛類型之間的關系矩陣進行 協同張量分解,得到完整的反映不同類型車輛出行時間的路口交通狀況張量。
[0048] 在交通小區劃分階段,基于完整的反映不同類型車輛出行時間的路口交通狀況張 量,建立引力模型,對路口進行空間聚類,將交通狀況相近的路口聚類到一起,最終劃分出 交通小區。
[0049] 具體過程如下:
[0050] 車輛類型識別階段包括:
[0051] 步驟1-1,針對城市地圖上每個可監測路口,利用監控設備采集現場視頻,再經識 別軟件等工具獲取車牌識別數據,計算單位時間段內車輛經過的路口數目,建立車輛關于 路口的矩陣;
[0052] 一條原始的車牌識別數據包括記錄的設備編號、記錄的時間和識別的車牌數據。 [0053] 結構如下:
[0054] L={lid,ltime,lcar} (1)
[0055] 其中:
[0056] lld為錄下該條數據的設備編號,設備可以是配置在路口的攝像機或傳感器等;
[0057] ltime為錄下該條數據的時間;
[0058] lcar為識別出的經過的車輛的車牌。
[0059] 將一天劃分成t個時間段,讀取車牌識別數據后,統計單位時間段段內每輛車經過 的路口數目。
[0060] 初始化反映車輛特征的矩陣后,讀取一條車牌識別數據記錄,獲取車牌數據1。"; 匹配車牌數據,如果識別車牌不在矩陣中則矩陣增加一條數據,如果識別車牌在矩陣中,獲 得車輛經過路口的時間,在對應時間的位置數值加1;循環直到讀取全部車牌數據,輸出車 輛特征矩陣,即車輛關于路口的矩陣Pat,矩陣Pat共含有c X t個元素,c表示車輛的數目,t 表示時間維度。
[0061] 步驟1-2,對車輛關于路口的矩陣進行非負矩陣分解;
[0062]基于人們出行的習慣定義矩陣分解的秩,對步驟1-1的Pcxt進行非負矩陣分解。根 據非負矩陣分解的原理對Pc^xt進行非負