一種基于深度信念網絡的人體膚色區域分割方法
【技術領域】
[0001] 本發明屬于計算機視覺和圖像處理領域,涉及機器學習和人體分析技術,具體涉 及基于深度信念網絡的人體膚色區域分割方法。
【背景技術】
[0002] 人體膚色區域分割在計算機視覺處理領域具有較多的應用,例如可以快速檢測人 臉區域,在基于手勢交互的應用中定位人手位置,在身體的姿態估計和行為分析中給出人 體膚色部位的初始位置等。在使用膚色檢測的許多應用中,一般要求膚色檢測方法能夠在 復雜環境下提供魯棒的、較為準確的人體膚色區域,而不需要精確的逐像素分類的結果。 [0003]目前的膚色分割方法主要是基于逐像素分類的方法,該類方法以圖像的像素為處 理單位,通過制定的規則或訓練分類器對圖像中每個像素進行分類,分為膚色像素點或非 膚色像素點,最后通過腐蝕、膨脹等形態學操作獲得人體膚色區域分割結果。基于逐像素分 類的方法得到離散的膚色像素點,不僅影響后續的形態學操作產生不準確的結果,而且在 復雜環境下此類方法誤檢較多,直接影響到高級處理步驟的效果。考慮到相似像素點聚類 為區域的特點,也有方法提出了基于區域的膚色分割方法,但此類方法本質是以像素點分 類結果為基礎,逐像素檢測的缺點同樣會影響到膚色分割的效果。
[0004] 《計算機輔助設計與圖形學學報》在2013年01期的《與顏色空間選擇無關的膚色 檢測方法》公開了一種基于柔性神經樹的膚色檢測方法,該方法隨機生成不同結構的柔性 神經樹,使用基于語法引導的遺傳算法進行結構優化,同時使用粒子群優化算法對參數進 行優化,最終獲得膚色模型。文中方法的準確率和誤報率優于其他主流膚色檢測方法,且對 復雜環境下膚色細節的檢測有較好的效果。
[0005] 2014年斯普林格期刊公開了一篇關于多顏色空間融合的膚色檢測方法,名稱為: 膚色檢測中的多種顏色空間融合方法(Multiple color space channel fusion for skin detection),該文提出一種將不同顏色空間分量進行線性融合的膚色檢測方法,用于獲得 對光照變化魯棒的效果。其中提出的權重學習過程利用正樣本訓練數據學習顏色權重模 型。實驗結果證明了顏色空間融合方法能夠進行魯棒和穩定的膚色檢測。
[0006] 2014年斯普林格期刊還公開了一篇關于多顏色空間融合的膚色檢測方法,名 稱為:膚色檢測中的多種顏色空間融合方法(Systematic skin segmentation:merging spatial and non-spatial data),此文提出了一種使用圖割算法進行膚色分割的方法法, 首先利用檢測到的人臉的局部膚色信息作為前景種子,并用于計算圖的前景權重。如果局 部膚色信息不可用,則選擇通用種子,同時使用基于決策樹的分類器提升魯棒性,從而獲得 優于離線分類器的魯棒膚色分割結果。此外,使用人臉檢測的方式能夠有效利用場景上下 文信息,使用權重提升方法融合空間和非空間數據。實驗結果證明所提方法優于其他方法 并具有較好的魯棒性。
[0007] 2014年愛思唯爾期刊公開了一種基于空間和判別膚色表示特征的膚色檢測方 法,名稱為:Spatial_based skin detection using discriminative skin-presence features,該方法針對基于像素方法的局限性即膚色像素和非膚色像素在許多顏色空間中 的重疊問題,提出利用紋理特征和空間特征提升膚色分類器的判別能力。提出判別特征空 間用于膚色像素的空間分析,從膚色概率圖上抽取紋理特征。實驗結果顯示所提方法由于 其他使用紋理和空間特征的膚色檢測方法。
[0008] 2013年愛思唯爾期刊還公開了一種面向區域的膚色檢測方法,名稱為:Skin detection by dual maximization of detectors agreement for video monitoring,該 文提出一種自適應參數的膚色檢測方法,使用兩種檢測器分別獲得區域和離散像素點檢測 結果。通過學習檢測器參數之間的聯系提升框架的可用性,兩類檢測器通過形態學重構濾 波進行結合,既保留了膚色區域同時移除檢測錯誤區域。在人體行為識別數據集的實驗證 明所提方法優于大多數相關方法。
[0009] 綜上所述,現有人體膚色區域分割技術大多屬于逐像素分類的方法,而計算機視 覺領域使用膚色檢測的場景一般是利用膚色檢測方法提供身體膚色部位的大概范圍,而不 是精確的逐像素的分門別類。逐像素標記的方法的缺點是:一方面準確率不高,誤檢較多, 使得膚色檢測的結果達不到高級處理的要求;另一方面此類方法的檢測結果是一個個的離 散的像素點,為了獲得膚色區域分割結果,往往需要使用形態學操作進行后續處理,但是在 離散像素點的基礎上進行形態學操作,誤檢的像素點會對結果產生不利影響。
【發明內容】
[0010] 本發明的目的在于解決上述現有技術中存在的難題,提供一種基于深度信念網絡 的人體膚色區域分割方法,以圖像塊作為處理單元,訓練的深度信念網絡模型對復雜背景 下的膚色區域檢測具有較好的魯棒性。
[0011] 本發明是通過以下技術方案實現的:
[0012] -種基于深度信念網絡的人體膚色區域分割方法,其特征在于:所述方法包括:
[0013] (1).建立膚色塊數據集和非膚色塊數據集;
[0014] (2).產生不同的顏色空間及其組合上的深度信念網絡輸入特征集;
[0015] (3).訓練不同尺度的深度信念網絡,并優化確定各項參數;
[0016] (4).輸入測試圖像,在不同尺度約束下,使用滑動窗口策略獲取當前待檢測圖像 塊?Il圍;
[0017] (5).在當前滑動窗口確定的圖像塊上抽取需要的顏色空間分量或其組合,獲取輸 入特征向量;
[0018] (6).將輸入特征向量輸入訓練好的深度信念網絡,得到圖像塊的分類結果,如果 分類結果為膚色塊,則塊內像素點置1 ;如果分類結果為非膚色塊,則塊內像素點置〇 ;
[0019] (7).判斷整幅圖像掃描是否完成,如果否,則根據設定的滑動窗移動步長移動窗 口,然后返回步驟(5),如果是,則轉入步驟(8);
[0020] (8).獲得最終膚色檢測結果,結束。
[0021] 作為對本技術方案的進一步限定,所述步驟(1)包括以下步驟:
[0022] (11)從Compaq數據集中的非膚色樣本中隨機抽取尺寸為10x10以及20x20大小 的圖像塊作為非膚色塊數據集;
[0023] (12)從E⑶數據集中的膚色樣本中隨機抽取尺寸為10x10以及20x20大小的圖像 塊作為膚色塊數據集;
[0024] (13)對10x10和20x20的數據集隨機分為5等份,用于訓練深度信念網絡的交叉 驗證。
[0025] 作為對本技術方案的進一步限定,所述步驟(2)包括以下步驟:
[0026] Bl :選擇RGB,HSV,YCbCr和CIELab為實驗用顏色空間,每種顏色空間的各個通道 分量作為特征集中的特種分量,同時考慮移除Y分量后的CbCr顏色空間;
[0027] B2 :對顏色空間組合 RGB+YCbCr、RGB+HSV、RGB+CIELab、HSV+YCbCr、HSV+CIELab、 YCbCr+CIELab、RGB+YCbCr+HSV、RGB+CIELab+HSV 和 YCbCr+CIELab+HSV 以及四種空間的全 部組合空間分別進行實驗,檢測深度模型在這些組合空間上的效果;
[0028] B3 :抽取滑動窗口所在圖像塊的所有像素點的顏色空間分量,歸一化為[0, 1]范 圍,根據不同顏色空間或組合,獲得特征向量集。
[0029] 作為對本技術方案的進一步限定,所述步驟(3)包括以下步驟:
[0030] (31)確定深度信念網絡包含4層,其中隱含層三層,輸入層一層,由三個受限玻爾 茲曼機組成深度信念網絡;
[0031] (32)深度膚色分類器在深度信念網絡結構基礎上增加一層全連接網絡,用于分類 結果的輸出;
[0032] (33)分類器隱含層結構為100-100-100-2,訓練最小分組為100,迭代次數為 200 ;
[0033] (34)分別在10x10和20x20的數據集上訓練對應的深度膚色模型DSM1。和DSM 2。。
[0034] 作為對本技術方案的進一步限定,所述步驟(34)包括以下步驟:
[0035] C4. 1 :獲取當前圖像塊特征 X = (X。,X1, . . .,Xi);
[0036] C4. 2 :以X = h(0)為深度膚色模型輸入層,訓練模型的hi層;
[0037] C4. 3 :使用hi作為第二層的輸入數據;
[0038] C4. 4 :將hi作為訓練樣本,用于訓練RBM的h2層;
[0039] C4. 5 :迭代C4. 3和C4. 4步驟,指導完成所有層的訓練;
[0040]