本發明屬于視障人士輔助技術、三維環境感知技術、斑馬線檢測技術、立體聲交互技術領域,尤其涉及一種基于RGB-D相機和立體聲的視障人士斑馬線檢測眼鏡,利用RGB-D相機采集彩色圖像和深度圖像,利用姿態角傳感器獲取相機的姿態角信息。小型處理器利用深度信息和姿態角信息,計算獲取場景的三維坐標。小型處理器對三維信息進行處理,去除彩色圖像中空中物體對斑馬線檢測的干擾。小型處理器對彩色圖像分塊,并計算每一塊的雙極系數,篩選出可能為斑馬線的區塊,利用連通域分析檢出斑馬線區域,最終通過骨傳導耳機傳遞斑馬線的距離和方向給視障人士進行輔助。
背景技術:
根據世界健康組織統計,全世界有2.85億視覺障礙人士。視障人士損失了正常的視覺,對顏色、形狀、距離、運動的理解都很困難,他們的生活在起居、出行等方面都受到了巨大的影響。尤其是路口的通行,尋找斑馬線區域,安全地過馬路是視障人士的一大痛點。
傳統的視障人士過馬路輔助方法,通過聽路口處紅綠燈的變化的聲音,以及聽路口車輛通過的聲音來猜測斑馬線區域,這種判斷是極其不準確的,而且很多路口的紅綠燈聲音播報系統損壞,無法給視障人士提供幫助。
導盲犬可以為視障人士過馬路提供幫助,但導盲犬在過馬路時比較迅速,難以照顧到視障人士精確定位斑馬線區域的需求。導盲犬的養護、訓練費用高昂,普通家庭難以承擔。另外很多城市的導盲犬培訓是不合格的,對視障人士的幫助有限。
基于彩色相機的斑馬線檢測,有很大概率被空中物體等所干擾,斑馬線檢測的準確性有限,而且也不能獲知斑馬線區域的精確距離和方位,對視障人士的幫助有限。
傳統視障人士輔助的交互方式主要有語音提示、觸覺震動。語義提示通常播報簡短的信息,需要一定的時間播放,造成延遲和事故風險,而且可傳遞的信息量少。觸覺震動通過震動腰帶或者震動背心為硬件,以震動來提示一些方位信息,可以解決延遲的問題,但給視障人士帶來負擔,不同人的穿戴感受不同。
技術實現要素:
本發明的目的在于針對現有技術的不足,提供一種基于RGB-D相機和立體聲的視障人士斑馬線檢測眼鏡。
本發明的目的是通過以下技術方案實現的:一種基于RGB-D相機和立體聲的視障人士斑馬線檢測眼鏡,所述眼鏡包含眼鏡本體、以及固定在眼鏡本體上的一個RGB-D相機,一個姿態角傳感器,一個USB集線器,一個小型處理器,一個骨傳導耳機模塊,兩個骨傳導震動模塊和一個電池模塊。所述RGB-D相機固定在眼鏡鏡片上方,兩個骨傳導震動模位于兩個鏡腳中間偏后處,貼合盲人耳朵前方顱骨處;USB集線器、姿態角傳感器和小型處理器嵌于一個鏡腳內;骨傳導耳機模塊和電池模塊嵌于另一個鏡腳內;RGB-D相機與姿態角傳感器通過USB集線器與小型處理器相連,電池模塊與小型處理器相連;兩個骨傳導震動模塊均通過骨傳導耳機模塊與小型處理器相連。RGB-D相機實時地采集三維場景的彩色圖像和深度圖像。姿態角傳感器實時獲取RGB-D相機的姿態角。小型處理器對RGB-D相機采集的彩色圖像和深度圖像,姿態角傳感器采集的姿態角信息進行分析,檢測出三維場景的斑馬線區域,并計算出斑馬線區域和方向,并將處理結果轉化為立體聲信號,傳到骨傳導耳機模塊。骨傳導耳機模塊將立體聲信號轉化為骨傳導震動信號,傳到兩個骨傳導震動模塊。最終骨傳導震動模塊通過震動傳輸立體聲信號給視障用戶,告知視障用戶當前場景中斑馬線區域的區域和方向。
上述眼鏡的斑馬線檢測方法如下:
(1)對RGB-D相機進行一次相機標定,獲取RGB-D相機的焦距f,主點位置(cx,cy)。
(2)RGB-D相機采集三維場景的深度圖像Depth和彩色圖像Color。
(3)姿態角傳感器采集RGB-D相機X,Y,Z三軸方向的轉角AngleX,AngleY,AngleZ。
(4)USB集線器將深度圖像Depth,彩色圖像Color,三軸方向的轉角AngleX,AngleY,AngleZ傳給小型處理器。
(5)小型處理器根據深度圖像Depth,RGB-D相機的焦距f,主點位置(cx,cy),可計算出每一點在相機坐標系下的三維坐標(Xc,Yc,Zc)。深度圖像Depth中一點坐標為(u,v),其深度值為depth,則相機坐標系下三維坐標(Xc,Yc,Zc)可由公式(1)計算出:
(6)根據深度圖像中每一點在相機坐標系下的三維坐標(Xc,Yc,Zc),以及姿態角傳感器三軸方向的轉角分布為AngleX=α,AngleY=β,AngleZ=γ,則可由公式(2)計算出每一點在世界坐標系下的三維坐標(Xw,Yw,Zw):
(7)三維場景中的每一點到RGB-D相機所在水平面的高度值H可由該點世界坐標系下的三維坐標的分量Yw表示。
(8)通過深度圖像Depth中所有點的分量Yw對各個點進行識別,Yw在(H0-Δh,H0+Δh)內則表示該點為地面上的點,否則為非地面點;其中,H0為RGB-D相機到水平面的豎直高度,Δh一般為0.1米;將彩色圖像Color中的非地面點的顏色置為透明色,獲得只留下地平面上的點的彩色圖像ColorG,即去除空中物體對斑馬線檢測的干擾。
(9)對只留下地平面上的點的彩色圖像ColorG均分成大小為M×N的小塊,且M、N均大于斑馬線的寬度。
(10)對每個小塊進行自適應灰度二值化處理,得到該小塊圖像的二值化閾值,將小塊的所有像素分成兩部分。第一部分的像素灰度低于閾值,這些像素的平均灰度為μ1,占所有像素的比例為α,第二部分的像素灰度大于等于閾值,這些像素的平均灰度為μ2,占所有像素的比例為1-α。小塊中所有像素的灰度方差為從而可定義一個雙極系數γ,表示小塊的黑白分明的程度,雙極系數γ可由公式(3)計算:
雙極系數γ的變化范圍為0~1,雙極系數γ越大,越接近黑白分明的斑馬線圖案。
(11)對每每個小塊,如果雙極系數γ大于閾值threshold(該閾值的取值范圍通常為0.85~0.95),則這一小圖像塊為斑馬線的候選區域。
(12)對所有斑馬線的候選區域進行連通域分析,去除一些零碎的小塊(即不與其他候選區域連通的小塊),連通的小塊形成一整塊斑馬線區域。
(13)根據該斑馬線區域中每一點的三維坐標(Xw,Yw,Zw),可獲得斑馬線區域到視障用戶的距離為(由斑馬線區域中所有點的平均深度表示),斑馬線區域的方向角θ(由斑馬線區域中點的平均水平坐標與平均深度之商的反正切表示,即
(14)用一種特定音色的樂器來表示斑馬線區域,斑馬線區域的距離越大,則該樂器的響度Volume越大。該樂器的發聲為立體聲,立體聲方向與斑馬線區域的方向角θ相對應。樂器可選鋼琴、小提琴、鑼、小號、木琴等有特別音色并悅耳的。
(15)小型處理器將立體聲信號傳給骨傳導耳機模塊。
(16)骨傳導耳機模塊將立體聲信號轉為骨傳導震動信號。
(17)骨傳導震動模塊將骨傳導信號傳遞給視障用戶。
本方法相比以往的視障人士輔助方法的優勢主要在于:
1、可以檢測出斑馬線區域的距離與方向。由于采用RGB-D相機進行斑馬線區域的檢測,可以獲知三維信息,因此可以檢出斑馬線區域到視障用戶的距離,以及在視障用戶的什么方位,這為視障人士在路口等室外場景的通行提供了極大的便利和幫助。
2、可以去除空中物體等其他不是地面區域的物體對斑馬線檢測的干擾。由于采用RGB-D相機與姿態角傳感器,可獲得場景中物體的真實的高度值,因此可以只對地平面附近的高度范圍的圖像進行檢測,不會將空中物體誤檢測為斑馬線,這極大了提高了斑馬線檢測的準確性和可靠性,有助于視障人士在路口準確地判斷并通行。
3、處理速度快。由于本方法利用三維信息去除了彩色圖像中的很多干擾,省去了對這些區域的處理,并且在檢測斑馬線的過程中只需計算分塊圖像的雙極系數等簡單操作,因此計算量小,處理速度快,能夠及時的輸出結果,并反饋給視障人士從而進行輔助。
4、斑馬線區域上有人或有車也可以及時響應。由于斑馬線區域上有人或者車經過時,這些不在地平面高度范圍的點將被去除,因此在檢出結果會產生變化,傳遞給視障人士的立體聲信號也會發生變化,視障人士從而可以判斷出斑馬線區域被人或車占據,預警斑馬線上行人、車輛的碰撞。
5、可自然地幫助視障人士過馬路。因為視障人士離斑馬線區域的距離越遠,立體聲的響度越大,斑馬線區域的距離越近,立體聲的響度越小。因此視障人士在遠離斑馬線區域就能聽出斑馬線區域的方位,并且此時聲音響度大,視障人士能對方位區分很精確。而當視障人士在靠近斑馬線區域時,聲音響度小,只是提示視障人士在正確的行進路線上,不會對視障人士的雙耳造成較大的干擾。聲音響度的大小的過度變化,可以很自然地輔助視障人士過馬路。
6、不占用雙耳。本方法采用骨傳導耳機傳遞信號給視障人士,不妨礙視障人士在路況通行時聽取外界的聲音。比如視障人士會通過車流的聲音判斷兩側有沒有汽車靠近。
7、不占用雙手。本方法使用RGB-D相機、姿態角傳感器和小型處理器,都是便攜和可穿戴的,不會給視障用戶帶來很大的負擔,也無需視障人士用手拿輔助工具。
附圖說明
圖1為視障人士斑馬線檢測系統的模塊連接示意圖;
圖2為視障人士斑馬線檢測系統的結構示意圖;
圖3為斑馬線區域檢測效果灰度圖;
圖4為斑馬線區域檢測效果灰度圖;
圖5為斑馬線區域檢測效果灰度圖。
具體實施方式
如圖2所示,一種基于RGB-D相機和立體聲的視障人士斑馬線檢測眼鏡,所述眼鏡包含眼鏡本體、以及固定在眼鏡本體上的一個RGB-D相機,一個姿態角傳感器,一個USB集線器,一個小型處理器,一個骨傳導耳機模塊,兩個骨傳導震動模塊和一個電池模塊。所述RGB-D相機固定在眼鏡鏡片上方,兩個骨傳導震動模位于兩個鏡腳中間偏后處,貼合盲人耳朵前方顱骨處;USB集線器、姿態角傳感器和小型處理器嵌于一個鏡腳內;骨傳導耳機模塊和電池模塊嵌于另一個鏡腳內;
如圖1所示,RGB-D相機與姿態角傳感器通過USB集線器與小型處理器相連,電池模塊與小型處理器相連;兩個骨傳導震動模塊均通過骨傳導耳機模塊與小型處理器相連。RGB-D相機實時地采集三維場景的彩色圖像和深度圖像。姿態角傳感器實時獲取RGB-D相機的姿態角。小型處理器對RGB-D相機采集的彩色圖像和深度圖像,姿態角傳感器采集的姿態角信息進行分析,檢測出三維場景的斑馬線區域,并計算出斑馬線區域和方向,并將處理結果轉化為立體聲信號,傳到骨傳導耳機模塊。骨傳導耳機模塊將立體聲信號轉化為骨傳導震動信號,傳到兩個骨傳導震動模塊。最終骨傳導震動模塊通過震動傳輸立體聲信號給視障用戶,告知視障用戶當前場景中斑馬線區域的區域和方向。
上述系統的斑馬線檢測方法如下:
(1)對RGB-D相機進行一次相機標定,獲取RGB-D相機的焦距f,主點位置(cx,cy)。
(2)RGB-D相機采集三維場景的深度圖像Depth和彩色圖像Color。
(3)姿態角傳感器采集RGB-D相機X,Y,Z三軸方向的轉角AngleX,AngleY,AngleZ。
(4)USB集線器將深度圖像Depth,彩色圖像Color,三軸方向的轉角AngleX,AngleY,AngleZ傳給小型處理器。
(5)小型處理器根據深度圖像Depth,RGB-D相機的焦距f,主點位置(cx,cy),可計算出每一點在相機坐標系下的三維坐標(Xc,Yc,Zc)。深度圖像Depth中一點坐標為(u,v),其深度值為depth,則相機坐標系下三維坐標(Xc,Yc,Zc)可由公式(1)計算出:
(6)根據深度圖像中每一點在相機坐標系下的三維坐標(Xc,Yc,Zc),以及姿態角傳感器三軸方向的轉角分布為AngleX=α,AngleY=β,AngleZ=γ,則可由公式(2)計算出每一點在世界坐標系下的三維坐標(Xw,Yw,Zw):
(7)三維場景中的每一點到RGB-D相機所在水平面的高度值H可由該點世界坐標系下的三維坐標的分量Yw表示。
(8)通過深度圖像Depth中所有點的分量Yw對各個點進行識別,Yw在(H0-Δh,H0+Δh)內則表示該點為地面上的點,否則為非地面點;其中,H0為RGB-D相機到水平面的豎直高度,Δh一般為0.1米;將彩色圖像Color中的非地面點的顏色置為透明色,獲得只留下地平面上的點的彩色圖像ColorG,即去除空中物體對斑馬線檢測的干擾。
(9)對只留下地平面上的點的彩色圖像ColorG均分成大小為M×N的小塊,且M、N均大于斑馬線的寬度。
(10)對每個小塊進行自適應灰度二值化處理,得到該小塊圖像的二值化閾值,將小塊的所有像素分成兩部分。第一部分的像素灰度低于閾值,這些像素的平均灰度為μ1,占所有像素的比例為α,第二部分的像素灰度大于等于閾值,這些像素的平均灰度為μ2,占所有像素的比例為1-α。小塊中所有像素的灰度方差為從而可定義一個雙極系數γ,表示小塊的黑白分明的程度,雙極系數γ可由公式(3)計算:
雙極系數γ的變化范圍為0~1,雙極系數γ越大,越接近黑白分明的斑馬線圖案。
(11)對每個小塊,如果雙極系數γ大于閾值threshold(該閾值的取值范圍通常為0.85~0.95),則這一小圖像塊為斑馬線的候選區域。
(12)對所有斑馬線的候選區域進行連通域分析,去除一些零碎的小塊(即不與其他候選區域連通的小塊),連通的小塊形成一整塊斑馬線區域。
(13)根據該斑馬線區域中每一點的三維坐標(Xw,Yw,Zw),可獲得斑馬線區域到視障用戶的距離為(由斑馬線區域中所有點的平均深度表示),斑馬線區域的方向角θ(由斑馬線區域中點的平均水平坐標與平均深度之商的反正切表示,即
(14)用一種特定音色的樂器來表示斑馬線區域,斑馬線區域的距離越大,則該樂器的響度Volume越大。該樂器的發聲為立體聲,立體聲方向與斑馬線區域的方向角θ相對應。樂器可選鋼琴、小提琴、鑼、小號、木琴等有特別音色并悅耳的。
(15)小型處理器將立體聲信號傳給骨傳導耳機模塊。
(16)骨傳導耳機模塊將立體聲信號轉為骨傳導震動信號。
(17)骨傳導震動模塊將骨傳導信號傳遞給視障用戶。