專利名稱:基于表情的背景音樂控制方法及裝置的制作方法
技術領域:
本發明涉及視頻圖像處理和控制技術領域,尤其是一種基于表情的背景音樂控制方法及裝置。
背景技術:
當前,現代家居為了營造舒適,溫馨的居室環境氛圍,背景音樂成為家居中很重要的部分,所以現代家居安裝了背景音樂控制系統,背景音樂控制系統可以有效遮蔽環境噪音,創造輕松舒適的環境。但是目前家庭背景音樂控制系統只能通過手動來調節音量,選擇曲目,不能根據人的心情自動調節音量,選擇曲目,改變音效,無法和人的心情相匹配,缺乏人性化。
發明內容
為了解決上述存在的問題,本發明的目的在于提供ー種能根據人的心情自動調節音效、選擇曲目的基于表情的背景音樂控制方法及裝置。一種基于表情的背景音樂控制方法,其特征在于步驟如下步驟I :將采集的人臉24位真彩色圖像進行灰度化處理,灰度化算法采用加權平均值法f(i, j) = O. 30R(i, j)+0. 59G(i, j)+0. llB(i, j);式中f(i, j)為轉換后的灰度圖像在(i,j)處的灰度值,R(i,j)為原圖像在(i,j)處的R分量灰度值,G(i,j)為原圖像在(i, j)處的G分量灰度值,B(i,j)為原圖像在(i,j)處的B分量灰度值;步驟2 :利用積分圖像算法提取灰度化處理后圖像的Haar特征,將提取的圖像Haar特征通過級聯分類器來檢測圖像中的人臉區域;所述級聯分類器是利用樣本圖像的人臉Haar特征,采用AdaBoost分類算法進行分類器訓練后得到的;步驟3 :設人臉區域的高度為h,寬度為w,取左上角點為原點,取兩眼窗的起始坐
標為:左眼 j,右眼 —j,兩眼窗的大小為〔fg)步驟4:對兩眼窗內區域的圖像做直方圖分析,留取灰度最低的5%像素,其余部分灰度值置為255,然后將窗內圖像作水平投影,得到一條一維曲線;一維曲線上出現的兩個波谷自上而下分別代表眉毛區域和眼睛區域,眼睛區域波谷的谷點位置作為眼睛的縱坐
X
標;所述窗內圖像水平投影函數為式中I(x,y)為在(x,y)點的灰度值,N為投影像素點數;步驟5:將眉毛區域的灰度值置為255,然后將兩眼窗內圖像做垂直投影,得到一條ー維曲線,曲線左右波峰的峰點位置作為左右眼睛的橫坐標;所述垂直投影函數為
X
Φ) = ΣΙ(χ^>)式中I(x,y)為在(x,y)點的灰度值,N為投影像素點數;
■*
步驟6 :連接步驟4和步驟5得到的兩眼坐標,以兩眼坐標的連線中點作為坐標原點,建立人臉圖像坐標系,旋轉人臉圖像使雙眼為水平位置;步驟7 :根據人臉的面部比例特征確定嘴巴的位置并取嘴巴窗,嘴巴窗的起始坐
標為
權利要求
1.一種基于表情的背景音樂控制方法,其特征在于步驟如下 步驟I :將采集的人臉24位真彩色圖像進行灰度化處理,灰度化算法采用加權平均值法f(i, j) = O. 30R(i, j)+0. 59G(i, j)+0. llB(i, j);式中f(i, j)為轉換后的灰度圖像在(i, j)處的灰度值,R(i,j)為原圖像在(i,j)處的R分量灰度值,G(i,j)為原圖像在(i,j)處的G分量灰度值,B (i,j)為原圖像在(i,j)處的B分量灰度值; 步驟2 :利用積分圖像算法提取灰度化處理后圖像的Haar特征,將提取的圖像Haar特征通過級聯分類器來檢測圖像中的人臉區域;所述級聯分類器是利用樣本圖像的人臉Haar特征,采用AdaBoost分類算法進行分類器訓練后得到的; 步驟3 :設人臉區域的高度為h,寬度為W,取左上角點為原點,取兩眼窗的起始坐標為左眼「ど,—),右眼 生,蘭)’兩眼窗的大小為丨γ,?] 步驟4 :對兩眼窗內區域的圖像做直方圖分析,留取灰度最低的5%像素,其余部分灰度值置為255,然后將窗內圖像作水平投影,得到一條一維曲線;一維曲線上出現的兩個波谷自上而下分別代表眉毛區域和眼睛區域,眼睛區域波谷的谷點位置作為眼睛的縱坐標;Λ—所述窗內圖像水平投影函數為/〃(>’)=乙ぺ;)0式中I(x,y)為在(X,y)點的灰度值,N1j為投影像素點數;步驟5 :將眉毛區域的灰度值置為255,然后將兩眼窗內圖像做垂直投影,得到一條ー維曲線,曲線左右波峰的峰點位置作為左右眼睛的橫坐標;所述垂直投影函數為 ■Npv{x) = ^l(x,y)式中Kx,y)為在(X,y)點的灰度值,N為投影像素點數; V::: I ■, 步驟6 :連接步驟4和步驟5得到的兩眼坐標,以兩眼坐標的連線中點作為坐標原點,建立人臉圖像坐標系,旋轉人臉圖像使雙眼為水平位置; 步驟7 :根據人臉的面部比例特征確定嘴巴的位置并取嘴巴窗,嘴巴窗的起始坐標為は蕓j,窗的大小為ほ;將嘴巴窗內圖像做水平投影,取投影所得的曲線的最小值作V 4 10/VlS 5 J為嘴巴在垂直方向上的坐標;設兩眼之間距離為k,兩眼中心到嘴巴的距離為g,以兩眼距離中心為中心,左右取ぎ,向上取^4主下取^f,得到ー個切割后的人臉圖像; 94.4 步驟8 :將人臉圖像放縮到100 X 100像素,得到人臉圖像的ニ維矩陣M[k][g],其中k=100,g=100 ;對ニ維矩陣灰度歸ー化處理,得到具有相同的均值和方差的人臉圖像;所述灰度歸ー化處理公式:M W [./'] = ~^ (射[,][./.]-プり+ A 式中(i = 0 1,1-. J,= I ;淨._ μ。和σ。是變換后圖像的均值和標準差,聲和^:是變換前圖像的均值和標準差; 步驟9 :取像素點數寬為P,長為L的采樣窗,滑動步長為4X4,從左到右,從上向下在步驟8處理后的人臉圖像上滑動,獲取采樣圖像塊,然后,對于每個圖像塊采用8點的ニ維離散余弦變換公式進行變換,得到ニ維離散余弦變換系數C(u,ν)取變換系數的低頻部分4X4系數作為嵌入式隱馬 爾可夫模型的觀察向量序列;所述PXL為16X16; 步驟13 :使用前向-后向算法Forward-Backward Algorithm,將步驟9中得到的觀察向量序列分別與訓練完成的“快樂”“正常”“難過”三種表情的嵌入式隱馬爾可夫模型觀察向量序列的似然概率值,選擇似然概率值最高的模型作為采集圖像中人臉的表情信息所屬類別; 所述訓練“快樂” “正常” “難過”三種表情的嵌入式隱馬爾可夫模型的步驟 “快樂”的嵌入式隱馬爾可夫模型訓練選擇“快樂”表情的樣本圖像,其中“快樂”表情指6種基本表情中驚奇和高興的表情;取超級狀態的個數為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級狀態中嵌入狀態的個數定義為{3,5,3,5,3},訓練“快樂”表情的嵌入式隱馬爾可夫模型; “難過”的嵌入式隱馬爾可夫模型訓練選擇“難過”表情的樣本圖像,其中“難過”表情指6種基本表情中憤怒和悲傷的表情;取超級狀態的個數為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級狀態中嵌入狀態的個數定義為{3,5,3,5,3},訓練“難過”表情的嵌入式隱馬爾可夫模型; “正常”的嵌入式隱馬爾可夫模型訓練選擇“正常”表情的樣本圖像,其中“正常”表情指不包括在“快樂”和“難過”表情中的其他表情;取超級狀態的個數為5,分別是額頭、眼睛、鼻子、嘴和下巴五大部分;將超級狀態中嵌入狀態的個數定義為{3,5,3,5,3},訓練“正常”表情的嵌入式隱馬爾可夫模型; 所述三種表情的樣本圖像選自卡內基梅隆大學的Cohn-Kanade表情數據庫; 步驟14 :當識別的表情信息所屬類別為“快樂”時,將背景音樂提高音量5分貝,加大重低音3分貝,提高高音3分貝,開啟環繞聲; 當識別的表情信息所屬類別為“正常”時,將背景音樂降低音量至45分貝,降低重低音至30分貝,降低高音至25分貝,開啟環繞聲; 當識別的表情信息所屬類別為“難過”時,將背景音樂降低音量5分貝,關閉重低音,降低高音至20分貝,關閉環繞聲。
2.ー種實現權利要求I所述基于表情的背景音樂控制方法的裝置,其特征在于包括電源単元、圖像采集単元、主處理器DSP、存儲單元、功率放大器、音效處理器、MP3解碼器和微控制單元MCU ;主處理器DSP分別與圖像采集單元、存儲單元和微控制單元MCU,微控制單元MCU順序聯接MP3解碼器、音效處理器和功率放大器;微控制單元MCU還直接音效處理器聯接;電源單元與上述各個單元聯接并提供工作電源。
3.根據權利要求2所述的裝置,其特征在于所述圖像采集單元采用CMOS圖像傳感器。
4.據權利要求2所述的裝置,其特征在于所述主處理器DSP與微控制単元MCU之間采用RS-485總線進行連接,采用9600bps的波特率傳輸數據。·
全文摘要
本發明公開了一種基于表情的背景音樂控制方法及裝置,由電源單元、圖像采集單元、主處理器(DSP)、存儲單元及背景音樂調節單元組成;所述主處理器(DSP)分別與圖像采集單元、存儲單元及背景音樂調節單元相連接;所述電源單元連接于圖像采集單元、主處理器(DSP)、存儲單元以及背景音樂調節單元;本發明可通過表情識別技術來識別用戶的面部表情及心情,并根據用戶的心情來調整背景音樂模式,達到一種家居與用戶互動的效果,從而讓家居更加人性化,提升了用戶的體驗。該系統操作簡便使用方便,具有很強的實用性。
文檔編號G11B19/02GK102750964SQ20121026850
公開日2012年10月24日 申請日期2012年7月30日 優先權日2012年7月30日
發明者趙天云, 郭雷, 陳智慧 申請人:西北工業大學