專利名稱:基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法
技術領域:
本發明涉及一種城市道路交通狀態檢測方法。
背景技術:
城市道路交通的運營管理中存在的最為突出的問題是交通擁擠和交通事故。通過對交通狀態檢測算法進行研究,可以減少交通事件對公路運行帶來的負面效應。通過對交通狀態的快速檢測、并運用交通流誘導、交通控制等手段,可以在全局上最大限度地減少交通擁堵對路網運行產生的不良影響,避免擁堵狀態的擴大,確保車輛安全、舒適地行駛。
國內外研究者對城市道路和高速公路的交通狀態判別做了一些研究。最早使用的自動事件檢測算法是加利福尼亞算法。該方法通過比較鄰近環型線圈檢測器獲得的占有率數據,對可能存在的突發交通事件進行判別。Li和McDonald提出了一種基于浮動車的高速公路交通事件檢測算法。該算法基于平均行程時間和相鄰兩時段平均行程時間差雙變量分析模型而設計。史忠科等采用擴展Kalman濾波方法對高速公路交通密度進行預測。王國林等使用一種面向全景視頻的交通狀態檢測方法。竇慧麗等提出了一種交通狀態預報的K近鄰非參數回歸模型用于城市道路不同預報時長的分級交通狀態的概率預報實驗。皮曉亮等采用聚類分析方法,實現了一種基于環形線圈檢測器采集信息的交通狀態分類方法。莊斌等分析路段上環形線圈采集到的占有率數據,給出城市道路路段上交通擁擠的平均占有率自動檢測算法。
發明內容
為了克服已有城市道路交通狀態檢測方法的準確性較差的不足,本發明提供一種有效提高準確性的基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法。本發明解決其技術問題所采用的技術方案是一種基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法,所述檢測方法包括以下步驟I)交通特征參數包括車輛平均速度V (m/s)、車流量f(veh/s)、時間占有率S、行程時間t (S),分別定義為V =...nT, (I)
nT/ = 7-(2)S = ^,(3)t=t2-t1, (4)上式中,Vi為每輛車經過某斷面的車速,T為設定的收集數據的時間間隔,nT為時間間隔T內通過該斷面的車輛總個數為車輛開始進入該設定路段的時刻,t2為車輛完全通過該路段的時刻;式(I)表示在指定的時間間隔內在固定的觀測地點測得的車速的平均值;式(2)表示單位時間內該路段通過的車輛個數;式(3)表示車輛通過該路段的總得時間占固定時間間隔T的比率,即時間占有率;式(4)定義了行程時間;行程時間表示車輛通過道路某一路段所需的總時間,包括行駛時間和延誤時間。實時監測路段的交通特征參數,并提取交通特征參數,得到測試樣本集;2)將測試樣本集輸入SVM-BP的兩層級聯分類器;
所述的SVM-BP的兩層級聯分類器包括以下處理過程2. I)運用SVM訓練函數分別進行訓練后和測試集樣本數據一起被輸入到SVM分類函數中,檢測出當前交通狀態,過程如下(2. I. I)對速度、流量、占有率、行程時間四個輸入特征參數設置權重,即對交通狀態影響大的特征參數速度和流量數據相乘的積,作為一個新的輸入特征維,使SVM訓練輸入參數維數增加到5維,再對交通數據樣本集的數據歸一化;(2. I. 2)利用歸一化后的訓練集樣本訓練SVM分類器,利用交叉驗證的思想找出優化后的參數C、Y,得到交通狀態分類器;參數Y是多項式、高斯徑向基、兩層感知機(Sigmoid)核函數的Y參數,參數C是設置SVM的懲罰參數,懲罰參數C為非負數;(2. I. 3)利用測試樣本集數據和訓練得到的分類器進行測試,判定是否屬于暢通狀態,如果是,則判定當前狀態為暢通狀態,如果否,則進入2. 2);2. 2)利用BP神經網絡方法訓練并對測試樣本集集進行測試(2. 2. I)對測試樣本集的數據歸一化;(2. 2. 2)利用歸一化后的訓練集樣本訓練BP神經網絡分類器,得到交通狀態分器;所述分類器是一個三層的前饋網絡,輸入層有4個節點,代表輸入的4個道路交通特征,隱層有12個節點,輸出層有2個節點,代表2種交通狀態類型,隱層和輸出層的激活函數采用Sigmoid函數;(2. 2. 3)利用測試集樣本和訓練得到的分類器進行測試,判定屬于繁忙狀態和擁堵狀態;即對2. I)中判定結果為分暢通的樣本進行繁忙與擁堵狀態的判別,將判別結果作為最終分類結果。進一步,所述步驟2)中,SVM-BP的兩層級聯分類器采用基于短時段內多層分類器疊加融合,具體過程如下Stepl、以所有數據樣本集作為訓練樣本,生成SVM-BP的兩層級聯分類器作為基礎分類器I ;St印2、將數據樣本集分成n份,n為自然數,3 ^ n ^ 12,標記為R”i = 1,2,.. ,n ;用基礎分類器I對&進行測試,將判斷錯誤的數據樣本集分離出來,記為W1 ;將W1與R2一同作為訓練樣本生成基礎分類器2 ;并用基礎分類器I對基礎分類器2的訓練樣本W1與R2進行測試,分離出錯誤判斷的數據樣本W2 ;St印3、將W2與R3 —同作為訓練樣本生成基礎分類器3 ;并用基礎分類器2對基礎分類器3的訓練樣本W2與R3進行測試,分離出錯誤判斷的數據樣本集W3 ;Step4、依此類推,共生成n個基礎分類器,將此n個基礎分類器采用集成學習方法融合,得到一個增強分類器為測試時采用的SVM-BP的兩層級聯分類器。再進一步,所述步驟(2. 2. 3)中,利用時間序列,通過對多個連續時間點的分類結果進行融合,得到最終的判別結果,具體過程如下
a、采用SVM-BP分類器作為測試的基礎分類器;b、對最初n次數據樣本進行分類并記錄分類結果,其結果即作為最終判別結果進行發布;C、在記錄第n+1次數據樣本分類結果后,采用集成學習的投票方式,對前n+1個分類結果進行投票,得出一個判別結果,作為第n+1次數據樣本的判別狀態進行發布。本發明的技術構思為對于我國城市快速道路車輛密度高、間距小、車速較低、常發性的交通擁堵路段多的運行狀況,本文利用了 SVM、BP網絡分類算法融合,設計一個兩層級聯分類器。利用SVM分類器將我國城市道路交通的特征參數預處理后作為訓練分類器的樣本,設置輸入特征參數的權重,優化SVM參數,將暢通狀態分類出來。再利用BP神經網絡對第一層分類器未分類的繁忙與擁堵狀態分類。該方法能夠有效地提高城市交通狀態檢測準確性。
本發明的有益效果主要表現在有效地提高城市交通狀態檢測準確性。
圖I是支持向量機的結構的示意圖。圖2是BP神經網絡的拓撲結構示意圖。圖3是交通數據樣本各特征參數數據分布圖。
具體實施例方式下面結合附圖對本發明作進一步描述。參照圖I 圖3,一種基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法,交通特征參數主要包括車輛平均速度、車流量、車輛時間占有率等。交通參數檢測的方法很多,主要有超聲波檢測、紅外檢測、環形感應圈檢測、計算機視覺檢測。超聲波檢測精度不高,容易受車輛遮擋和行人的影響,檢測的距離短(一般不超過12m)。紅外線檢測受車輛本身熱源的影響,抗噪聲的能力不強,檢測精度不高。環形感應器檢測精度高,但要求設置于路面土木結構中,對路面有損壞,施工和安裝不便,而且安裝的數量多。計算機視覺檢測近年來隨著計算機技術、圖像處理、人工智能、模式識別等技術的不斷發展,在交通流檢測中獲得越來越廣泛的應用。該課題的交通參數數據來自杭州市公交部門提供的杭州城區主要道路的微波數據和視頻數據及軟件VISSIM仿真得到的數據。特征參數車輛平均速度V (m/s)、車流量f(veh/s)、時間占有率S、行程時間t(s)的定義為v = ^,i=l,2,.nT,(5)
nTf = 1J-(WS = t^,(7)t=t2-t1; (8)上式中,Vi為每輛車經過某斷面的車速,T為設定的收集數據的時間間隔,nT為時間間隔T內通過該斷面的車輛總個數為車輛開始進入該設定路段的時刻,t2為車輛完全通過該路段的時刻。式(5)表示在指定的時間間隔內在固定的觀測地點測得的車速的平均值。式(6)表示單位時間內該路段通過的車輛個數。式(7)表示車輛通過該路段的總得時間占固定時間間隔T的比率,即時間占有率。式(8)定義了行程時間。行程時間表示車輛通過道路某一路段所需的總時間,包括行駛時間和延誤時間。本文將道路交通狀態分為三個等級暢通、繁忙、擁堵。暢通的服務水平是最高的。I)暢通該等級服務水平在自由流和穩定流范圍內。其高限為自由流,每個車輛基本不受交通流中其他車輛的影響,有很高的自由度來選擇所期望的速度。其低限為每個車輛要開始注意到交通流中其他使用者對他的影響,但選擇速度的自由度還不太受影響。2)繁忙該等級服務水平仍在穩定流范圍內,車輛間的相互作用變得大起來,選擇速度受到其他車輛的制約,舒適和便利程度有明顯下降。3)擁堵該等級服務水平由穩定流過度到不穩定流,速度和駕駛自由度均受到嚴格約束,舒適和便利程度低下,在信號交叉口有很長的排隊車輛。當交通量有少量增加就會在運行方面出現問題。當某路段的交通量達到或超過該路段的通行能力時,便會引起交通 堵塞。此時隊列中的運行出現停停走走的現象,它們極不穩定。車輛在交叉口有很長的停車延誤,有些車輛甚至要等兩個信號周期才能通過交叉口。數據的獲得是通過利用仿真軟件VISSIM仿真數據與杭州市體育場路-鳳起路(北向南)的微波數據結合的方式。根據杭州市交通部門提供的杭州市體育場路-鳳起路(北向南)的微波數據,利用VISSM軟件仿真該路口全天各個時段的交通狀況,共獲得交通數據樣本3170個。本文所用數據仿真了全天各個時段的交通狀態的數據。雖然分類準確率沒有其他文獻所述方法高,但是推廣能力比它們強。其中訓練集樣本1730個,其暢通、繁忙、擁堵的類別數分別為878、669、183。測試集樣本1440個,其暢通、繁忙、擁堵的類別數分別為740、565、135。交通數據樣本各特征參數數據分布如圖3所示。本實施例中,SVM的主要思想是建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。SVM的理論基礎是統計學習理論,是結構風險最小化的近似實現。此原理基于事實學習機器測試數據上的誤差率(泛化誤差率)以訓練誤差率和一個依賴于Vapnik-Chervonenkis (VC)維數的項之和為界;在可分模式情況下,支持向量機對于前一項的值為零,并且使第二項最小化。在支持向量Xi和輸入控件抽取的向量X之間的內積核這一個概念是構造支持向量機學習算法的關鍵。支持向量集是由算法從訓練數據中抽取的小的子集構成。支持向量機的結構如圖I所示。圖I中,k( )為核函數,其種類主要有I)線性核函數k (x,Xi) =X1Xi;2)多項式核函數kx, XiX Y X1Xi+!")15, y >0;3)RBF 徑向基核函數k(x,Xi)=exp(-Y I |x-xi| I2),y >0;4) Sigmoid 兩層感知器核函數kx, Xi) =tanh ( y xTXi+r)。SVM基于結構風險最小化原則,將整個求解過程轉化為一個凸二次規劃問題,其解
全局最優且唯一。交叉驗證(Cross Validation)是驗證分類器性能的一種統計分析方法。它的基本思想是在某種意義下將原始數據進行分組,一部分作為訓練集,另一部分作為驗證集。首先用訓練集對分類器進行訓練,再利用驗證集來測試訓練得到的模型,以此作為評價分類器的性能指標。BP神經網絡是當前應用最廣泛的神經網絡模型之一。它是一種多層前饋網絡,它按誤差逆傳播算法進行訓練。BP網絡能學習和存儲大量的輸入輸出模式映射關系。它的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡模型拓撲結構包括輸入層、隱層和輸出層。BP網絡是對非線性可微分函數進行權值訓練的反向傳播網絡,BP算法屬于8算法,是一種監督式的學習算法,主要思想是對于q個輸入學習樣本Xl,X2, , xq,已知其對應的輸出樣本為ypy2,...,yq。利用網絡的實際輸出與目標矢量之間的誤差來修正其權值,使得網絡輸出層的誤差平方達到最小。BP神經網絡拓撲結構如圖2所示。SVM分類器判別暢通狀態的準確率比BP網絡分類器判斷暢通狀態的準確率高;BP 網絡分類器在判別擁堵狀態時的準確率比SVM判斷擁堵的準確率高;故設計出第一層先由SVM判別出暢通狀態,第二層由BP判別余下的繁忙與擁堵狀態。實驗表明,該方法對分類準確率有一定的提聞。實驗步驟如下I)生成SVM 二分類器利用LIBSVM分類器訓練并測試樣本集(本文采用LIBSVM工具箱完成參數尋優、模型訓練和結果的測試)將提取的交通特征參數的車輛平均速度、車流量、車輛時間占有率、行程時間特征以及判定的狀態特征進行預處理,運用SVM訓練函數分別進行訓練后和測試集樣本數據一起被輸入到SVM分類函數中,檢測出當前交通狀態。(I)對速度、流量、占有率、行程時間四個輸入特征參數設置權重。即對交通狀態影響大的特征參數速度和流量數據相乘的積,Vf,作為一個新的輸入特征維,使SVM訓練輸入參數維數增加到5維。再對交通數據樣本集的數據歸一化。利用歸一化后的訓練集樣本訓練SVM分類器,利用交叉驗證的思想找出優化后的參數C、Y,得到交通狀態分類器。參數Y是多項式、高斯徑向基、兩層感知機(Sigmoid)核函數的Y參數。參數C是設置SVM的懲罰參數。懲罰參數C為非負數,它的大小表示對訓練集樣本中的離群點的重視程度的大小。不同的SVM模型、不同的核函數及其參數都影響著算法的性能指標。本文采取4種SVM模型線性、多項式、高斯徑向基、Sigmoid核函數進行分析。采用交叉驗證的思想針對不同的SVM模型和核函數進行參數優化。通過取不同的參數范圍反復實驗,最終獲得分類效果最優的一組參數。(2)訓練得到SVM分類器其判別狀態為暢通與非暢通。2)生成BP 二分類器(I)對交通數據樣本集的數據歸一化。(2)利用歸一化后的訓練集樣本訓練BP神經網絡分類器,得到交通狀態分類器。本文設計的網絡分類器是一個三層的前饋網絡。輸入層有4個節點,代表輸入的4個道路交通特征。隱層有12個節點。輸出層有2個節點,代表2種交通狀態類型繁忙與擁堵狀態。隱層和輸出層的激活函數采用Sigmoid函數。(3)利用測試集樣本和訓練得到的分類器進行測試。BP神經網絡在模式識別分類中具有良好的性能。一個具有無限隱層節點的三層BP網絡可以實現任意從輸入到輸出的非線性映射。3)將訓練生成的SVM、BP分類器進行融合(I)首先訓練生成SVM、BP 二分類器。其中SVM分類暢通與非暢通,BP分類繁忙與擁堵。(2)利用SVM分類器將測試集樣本中的暢通分離出來。(3)對第一層未檢測分類出來的繁忙與擁堵的測試集樣本進行第二層的BP網絡分類器分類。SVM-BP的融合是將SVM分類器與BP網絡分類器的優點融合,摒除各自的分類缺點,這種兩層分類器的準確率達到87. 0833%,比SVM (高斯徑向基)分類器高2個百分點,比BP網絡分類器高7個百分點。因此,基于SVM與BP的兩層分類器比單一的SVM或BP網絡 分類算法在分類效果上都要優越。仿真結果見表I。
Wn訓練樣測試樣檢測準確率^
__本數量本數量__
^SVM (高斯徑向基) 1730 144085.28%____(122_40)
BP1730 144080.07%
____(1153/1440)
SVM-BP 1730 1440 87.08% ___ (1252/1440)表I本實施例中,提出基于短時段內多層分類器疊加融合的方法來提高檢測準確率。Stepl、以所有數據樣本集作為訓練樣本,生成高斯徑向基核函數的SVM分類器或者SVM-BP的兩層級聯分類器作為基礎分類器I。St印2、將數據樣本集分成n份,n為自然數,3 ^ n ^ 12,標記為R”i = 1,2,.. ,n ;用基礎分類器I對R1進行測試,將判斷錯誤的數據樣本集分離出來,記為W1 ;將W1與R2 —同作為訓練樣本生成基礎分類器2 ;并用基礎分類器I對基礎分類器2的訓練樣本W1與R2進行測試,分離出錯誤判斷的數據樣本W2 ;Step3、將W2與R3 —同作為訓練樣本生成基礎分類器3 ;并用基礎分類器2對基礎分類器3的訓練樣本W2與R3進行測試,分離出錯誤判斷的數據樣本集W3 ; Step4、依此類推,共生成n個基礎分類器,將此n個基礎分類器采用集成學習方法融合,得到一個增強分類器為測試時采用的SVM-BP的兩層級聯分類器。這種方法能克服各個基礎分類器的檢測盲點,增強分類器的分類能力,最終得到一個增強的分類器,提高分類準確率。本實施例中,針對檢測實施階段,可以利用時間序列,通過對多個連續時間點的分類結果進行融合,得到最終的判別結果。假定城市道路交通狀態的發布時間間隔為I分鐘,每I分鐘記錄一次數據樣本。融合算法步驟如下(I)采用SVM(高斯徑向基)、SVM_BP或前述任一種融合后的分類器作為測試的基礎分類器。
(2)對最初4分鐘的4個時刻數據進行分類并記錄分類結果,其結果即作為最終判別結果進行發布。(3)在記錄第5分鐘分類結果后,采用集成學習的投票方式,對前5個分類結果進行投票,得出一個判別結果,作為第5分鐘的判別狀態進行發布。(4)從第6分鐘起,在第m分鐘(m>5)時,在記錄其分類結果后,對第m-4,m-3,m-2,m-1,m分鐘時刻的5個分類結果進行投票或基于集成學習的融合。得出一個判別結果,作為第m分鐘的發布結果。由于現實情況中,城市道路交通特征參數的數據采集工作可能存在誤差。使用的 分類器分類準確率也不能達到100%。該融合算法能有效地減少因為數據采集引起的數據不準確及分類誤差引起的相關噪聲,大大提高判別交通狀態的準確性。同時避免了單次誤判直接發布造成的混亂。
權利要求
1.一種基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法,其特征在于所述檢測方法包括以下步驟 1)交通特征參數包括車輛平均速度V(m/s)、車流量f(veh/s)、時間占有率S、行程時間t (S),分別定義為
2.如權利要求I所述的基于SVM與BP神經網絡分類器級聯融合的城市道路交通狀態檢測方法,其特征在于所述步驟2)中,SVM-BP的兩層級聯分類器采用基于短時段內多層分類器疊加融合,具體過程如下 Stepl、以所有數據樣本集作為訓練樣本,生成SVM-BP的兩層級聯分類器作為基礎分類器I; St印2、將數據樣本集分成n份,n為自然數,3 Sn < 12,標記為Ri, i = 1,2,. . .,n ;用基礎分類器I對R1進行測試,將判斷錯誤的數據樣本集分離出來,記為W1 ;將W1與R2 —同作為訓練樣本生成基礎分類器2 ;并用基礎分類器I對基礎分類器2的訓練樣本W1與R2進行測試,分離出錯誤判斷的數據樣本W2 ; Step3、將W2與R3 —同作為訓練樣本生成基礎分類器3 ;并用基礎分類器2對基礎分類器3的訓練樣本W2與R3進行測試,分離出錯誤判斷的數據樣本集W3 ; Step4、依此類推,共生成n個基礎分類器,將此n個基礎分類器采用集成學習方法融合,得到一個增強分類器為測試時采用的SVM-BP的兩層級聯分類器。
3.如權利要求I所述的基于SVM與BP神經網絡分類器級聯融合的城市道路交通狀態檢測方法,其特征在于所述步驟(2.2.3)中,利用時間序列,通過對多個連續時間點的分類結果進行融合,得到最終的判別結果,具體過程如下 a、采用SVM-BP分類器作為測試的基礎分類器; b、對最初n次數據樣本進行分類并記錄分類結果,其結果即作為最終判別結果進行發 布; C、在記錄第n+1次數據樣本分類結果后,采用集成學習的投票方式,對前n+1個分類結果進行投票,得出一個判別結果,作為第n+1次數據樣本的判別狀態進行發布。
全文摘要
一種基于神經網絡分類器級聯融合的城市道路交通狀態檢測方法,包括以下步驟1)交通特征參數包括車輛平均速度v(m/s)、車流量f(veh/s)、時間占有率s、行程時間t(s);實時監測路段的交通特征參數,并提取交通特征參數,得到測試樣本集;2)將測試樣本集輸入SVM-BP的兩層級聯分類器,包括以下處理過程2.1)運用SVM訓練函數分別進行訓練后和測試集樣本數據一起被輸入到SVM分類函數中,判定是否屬于暢通狀態,如果是,則判定當前狀態為暢通狀態,如果否,則進入2.2);2.2)利用BP神經網絡方法訓練并對測試樣本集集進行測試判定屬于繁忙狀態和擁堵狀態。本發明能有效提高準確性。
文檔編號G08G1/01GK102750825SQ20121020692
公開日2012年10月24日 申請日期2012年6月19日 優先權日2012年6月19日
發明者孟利民, 張標標, 彭宏, 杜克林, 沈益峰, 王輝, 裘加林, 韓露莎 申請人:銀江股份有限公司