本發明屬于視頻處理領域,特別涉及一種基于交通監控視頻的車牌定位方法。
背景技術:
隨著經濟的發展和人們生活水平的提高,汽車保有量也迅猛增長,給城市交通帶來了諸多挑戰,因此基于智能圖像處理理論的車牌自動識別與分析技術獲得了越來越多的關注。車牌定位作為車牌識別至關重要的一個環節,其準確率和召回率直接關系到后續環節的工作乃至整個系統的性能。
常見的車牌定位方法有基于圖像紋理特征的方法、基于變換的方法、基于人工神經網絡的方法、基于數學形態學的方法等。基于圖像紋理特征的方法通常需要先選擇合適的邊緣檢測算子,并輔以圖像預處理才能取得較好的結果;基于變換的方法往往難以應對車牌邊框模糊或變形的情況,也難以消除噪聲的影響;基于人工神經網絡的方法具有較好的容錯性和學習能力,但訓練需要的時間往往較長,收斂性和收斂速度都得不到保證;基于數學形態學的方法難以處理字符相連接、字符本身不連通等問題。
技術實現要素:
發明目的:針對現有技術中存在的問題,本發明提供一種能夠克服現有技術存在的背景噪聲和背景相似圖案干擾、車牌字符不連續等問題的基于交通監控視頻的車牌定位方法。
技術方案:為解決上述技術問題,本發明提供一種基于交通監控視頻的車牌定位方法,具體步驟如下:
第一步:對交通監控視頻中的原始圖像進行轉換,原始圖像轉換為灰度圖像,原始色彩空間轉換為hsv空間;
第二步:對轉換后的圖像進行預處理,
第三步:對預處理后的圖像進行邊緣檢測,
第四步:在邊緣檢測的基礎上,綜合運用局部閾值法、全局閾值法和動態閾值法,根據像素值與閾值的關系把圖像分為黑、白兩色區域實現圖像二值化;
第五步:圖像二值化后,采用數學形態學中的膨脹、區域填充和腐蝕操作操作,實現區域合并和噪聲進一步剔除;
第六步:對檢測好的邊緣圖像依次進行水平投影和垂直投影,確定車牌的上下左右邊界;
第七步:投影確認后通過支持向量機進行車牌定位。
進一步的,所述第二步中對轉換后的圖像進行預處理的步驟如下:利用交通監控視頻的特性消除攝像頭背景,對所得視頻圖像應用預濾波技術進一步消除噪聲點。
進一步的,所述第三步中所述邊緣檢測具體通過梯度算子、roberts算子、sobel算子、prewitt算子或canny算子來抑制背景低頻特征來實現。
進一步的,所述第一步中將原始圖像轉換為灰度圖像過程中需要對生成的灰度圖像進行灰度拉伸處理。
進一步的,所述第二步中在利用交通監控視頻的特性消除攝像頭背景的具體步驟如下:取前面若干幀圖像進行一次性的確定;計算得到每幅圖像與背景圖像的差值后,再進行高斯預濾波操作。
進一步的,所述第七步中通過支持向量機進行車牌定位的步驟如下:規范正例樣本和反例樣本的尺寸,利用支持向量機進行離線訓練,訓練完畢后應用于待處理視頻,實現車牌定位。
與現有技術相比,本發明的優點在于:
本發明第一,融合了基于圖像紋理特征的方法、基于人工神經網絡的方法、基于數學形態學的方法這三類方法的優點,能夠更快速、更可靠地獲得車牌定位結果;第二,利用交通監控視頻的固有特點消除背景,進一步提升了系統的速度和魯棒性。
附圖說明
圖1為本發明的總體流程圖。
具體實施方式
下面對照附圖,結合具體實施方式對本發明作進一步詳細說明。應該強調的是,下述說明僅僅是示例性的,而不是為了限制本發明的范圍及其應用。
本發明提出的基于交通監控視頻的車牌定位方法包括以下步驟:
(1)圖像轉換:將交通監控視頻中的原始圖像轉換為灰度圖像,將原始色彩空間轉換為hsv空間。其中,在原始圖像到灰度圖像的轉換中,為了避免因曝光不正確而導致的灰度級集中問題,可能還需要對生成的灰度圖像進行灰度拉伸處理。
以常見的yuv視頻格式為例,這里y為亮度分量(代表圖像的輪廓),u和v為色度分量(代表圖像的顏色)。根據已有的rgb空間,可以按如下公式計算出y的值:
y=0.299*r+0.587*g+0.114*b
式中的權值來源于人眼的視覺模型,人眼較敏感的綠色分量g權值較大,而人眼較不敏感的藍色b則權值較小。
具體實施時,為了避免因曝光不正確而導致灰度級集中,可采用如下步驟對生成的灰度圖像進行灰度拉伸處理:
步驟1:從灰度級0開始,向灰度級增大方向搜索直方圖,如果斜率絕對值大于20,將此灰度級保存為fmin。
步驟2:從灰度級255開始,向灰度級減小方向搜索直方圖,如果斜率絕對值大于20,將此灰度級存為fmax。
步驟3:灰度拉伸的結果如下:
這里f(x,y)、g(x,y)分別表示當前圖像和拉伸后的圖像在坐標(x,y)處的值。
(2)圖像預處理:利用交通監控視頻的特性消除攝像頭背景,對所得視頻圖像應用高斯預濾波進一步消除噪聲點。其中,攝像頭背景消除利用了監控視頻的特性,取前面若干幀圖像進行一次性的確定;計算得到每幅圖像與背景圖像的差值后,再進行高斯預濾波操作。具體實施時,對交通監控視頻可取前100幅圖像作為訓練集來生成背景幀,高斯預濾波可選用5×5的窗口進行。
(3)邊緣檢測:用梯度算子、roberts算子、sobel算子、prewitt算子或canny算子來抑制背景低頻特征。其中,梯度算子用一階差分近似計算:
這里
為了避免水平投影對水平邊界的干擾,可以僅檢測垂直方向的邊界:
(4)圖像二值化:在邊緣檢測的基礎上,綜合運用局部閾值法、全局閾值法和動態閾值法,根據像素值與閾值的關系把圖像分為黑、白兩色區域,從而每個像素僅用一個比特表示。
具體實施時,假設f(n)是灰度變化值為n的像素點個數,n_max是最大灰度變化值,則可以用下面的偽代碼確定二值化閾值,其中r是預設的百分比,將灰度變化值較大的一部分邊緣作為后續步驟的二值化邊緣。
(5)數學形態學操作:在二值化的基礎上,依次采用數學形態學中的膨脹、區域填充和腐蝕操作,實現區域合并和噪聲進一步剔除。具體實施時,區域填充的顏色根據研究對象而設置。以我國標準的小型轎車為例,應填充藍色以提取車牌。
(6)投影確認:對檢測好的邊緣圖像依次進行水平投影和垂直投影,確定車牌的上下左右邊界。
具體實施時,水平投影的步驟如下:
步驟1:用f(j)表示每一行中邊界點的個數,其中j為該行對應的高度,將其視為水平投影曲線。
步驟2:對上述水平投影曲線進行寬度為5的滑窗平滑,平滑的算法是對原曲線上的每個像素位置,取5×1的窗口的均值作為新曲線上對應位置的值,設新曲線為g(j)。
步驟3:對于新曲線上的每個位置,如果其5×1鄰域的均值不小于16,則down=j,j=j+1,跳至第4步;否則j=j+1,繼續第3步。
步驟4:對于新曲線上的每個位置,如果其5×1鄰域的均值小于16,則up=j,跳至第5步;否則j=j+1,繼續第4步。
步驟5:若up-down>20,則投影結束,否則j=up,跳到第3步。
垂直投影的步驟如下:
步驟1:用v(i)表示每一列中邊界點的個數,其中i為該列對應的寬度,將其視為垂直投影曲線。
步驟2:對上述垂直投影曲線進行寬度為11的滑窗平滑,平滑的算法是對原曲線上的每個像素位置,取11×1的窗口的均值作為新曲線上對應位置的值,設新曲線為w(j)。
步驟3:對于新曲線上的每個位置,如果其11×1鄰域的均值不小于3且其右側50×1鄰域的均值也不小于3,則left=i,i=i+1,跳至第4步;否則i=i+1,繼續第3步。
步驟4:對于新曲線上的每個位置,如果其11×1鄰域的均值小于3且其左側50×1鄰域的均值也小于3,則right=i,跳至第5步;否則i=i+1,繼續第4步。
步驟5:若right-left<5*(up-down),則投影結束,否則i=left,跳到第3步。
(7)支持向量機定位:規范正例樣本和反例樣本的尺寸,利用支持向量機進行離線訓練,訓練完畢后應用于待處理視頻,實現車牌定位。
總之,本發明提出的車牌定位方法綜合了基于圖像紋理特征的方法、基于人工神經網絡的方法、基于數學形態學的方法這三類方法的優點,并結合城市交通監控視頻的固有特點進行了攝像頭背景圖像的消除,更高效、更可靠地獲得了車牌定位結果,為后續的車牌分割和車牌字符識別環節夯實了基礎。
以上所述僅為本發明的實施例子而已,并不用于限制本發明。凡在本發明的原則之內,所作的等同替換,均應包含在本發明的保護范圍之內。本發明未作詳細闡述的內容屬于本專業領域技術人員公知的已有技術。