專利名稱:實現聲音事件監控的影像攝錄設備及方法
技術領域:
本發明涉及一種聲音事件監控系統及方法,特別是涉及一種實現聲音事件監控的 影像攝錄設備及方法。
背景技術:
目前,在利用影像攝錄設備(例如攝像機)進行區域化監控作業時,對于不在影 像攝錄設備直視范圍內的具備聲音特征的異常事件,如車禍、槍擊、尖叫聲或特定人物的語 音等事件,現有的監控系統無法進行自動定位及識別監控,進而不能有效監控這些事件的 音源物件的影像。同時,在三維空間中,對于不在影像攝錄設備直視范圍內的具備聲音特征 的異常事件,現有的監控系統在不能對這些事件的聲音輸出方向進行定位的情況下,需要 在影像攝錄設備周圍架設盡量多的聲音收錄裝置(例如麥克風)以提高這些事件的聲音 收錄效果,然而,這種做法并不能保證這些事件的聲音收錄效果,且大大提高了聲音事件監 控成本。
發明內容
鑒于以上內容,有必要提供一種實現聲音事件監控的影像攝錄設備,能夠對監控 區域內發生聲音事件的音源方位進行精確定位,以對音源物件的影像進行有效監控,且提 高音源的聲音收錄效果。此外,還有必要提供一種實現聲音事件監控的方法,能夠對監控區域內發生聲音 事件的音源方位進行精確定位,以對音源物件的影像進行有效監控,且提高音源的聲音收 錄效果。一種影像攝錄設備,該影像攝錄設備周圍架設有至少三個聲音收錄設備,其可在 轉動馬達的帶動下進行影像攝錄方向調節。該影像攝錄設備包括音源定位訓練模塊及聲音 事件監控模塊。該音源定位訓練模塊用于對監控區域內發生聲音事件的音源方位進行定位 訓練,以確定聲音事件監控參數。該聲音事件監控模塊用于根據確定的聲音事件監控參數, 對監控區域內發生聲音事件的音源方位進行定位,并控制轉動馬達帶動影像攝錄設備按照 定位的方向進行轉動,以偵測攝錄音源的物件影像及收錄音源發出的聲音。一種聲音事件監控方法,適用于可進行影像攝錄方向調節的影像攝錄設備,該影 像攝錄設備周圍架設有至少三個聲音收錄設備。該方法包括步驟(ii)對監控區域內發生 聲音事件的音源方位進行定位訓練,以確定聲音事件監控參數;及(U)根據確定的聲音事 件監控參數,對監控區域內發生聲音事件的音源方位進行定位,并控制轉動馬達帶動影像 攝錄設備按照定位的方向進行轉動,以偵測攝錄音源的物件影像及收錄音源發出的聲音。相較現有技術,本發明首先為需監控的區域可能發生的聲音事件的音源方位進行 預先定位訓練,以確定聲音事件監控參數,進而根據確定的聲音事件監控參數控制轉動馬 達帶動影像攝錄設備,對需監控的區域即時發生的聲音事件進行精確定位和監控,提高了 對音源物件的影像監控效果,且提高了音源的聲音收錄效果。
圖1是本發明聲音事件監控系統較佳實施例的運行環境圖。圖2是本發明音源定位訓練方法較佳實施例的具體實施流程圖。圖3是本發明利用聲音收錄裝置進行聲音輸出方向識別的示意圖。圖4是本發明利用影像攝錄裝置進行聲音事件分區監控的示意圖。圖5是本發明基于音源定位訓練結果實現聲音事件監控的方法較佳實施例的具 體實施流程圖。
具體實施例方式如圖1所示,是本發明聲音事件監控系統較佳實施例的運行環境圖。該聲音事件 監控系統12運行于攝像機1中。該攝像機1還包括處理器10、存儲器11、聲音分類器13 及轉動馬達15。該攝像機1周圍架設有多個聲音收錄裝置5 (本實施例以3個為例進行說 明)。所述聲音收錄裝置5可以是麥克風或者其他任意適用的聲音收錄設備。該攝像機1 通過周圍架設的聲音收錄裝置5對監控區域發生的聲音事件進行監控。在本實施例中,該存儲器11用于存儲該聲音事件監控系統12及聲音事件監控參 數;在本發明的其他實施例中,該聲音事件監控系統12及聲音事件監控參數存儲在不同的 存儲器中。在本發明的其他實施例中,該聲音事件監控系統12還可以運行于對攝像機1進行 遠程控制的控制設備中,以遠程控制攝像機1對監控區域發生的聲音事件進行監控。該攝像機1還可以是其他任意適用的具有物件影像攝錄功能的設備。該轉動馬達15用于按照特定指令帶動該攝像機1轉動確定大小的角度。該聲音分類器13用于對聲音收錄裝置5接收到的聲音進行辨識,以對聲音事件進 行過濾。該聲音事件監控系統12包括音源定位訓練模塊120及聲音事件監控模塊121。該 音源定位訓練模塊120用于對監控區域內發生聲音事件的音源方位進行定位訓練,以確定 聲音事件監控參數;該聲音事件監控模塊121用于根據確定的聲音事件監控參數對監控區 域內發生的聲音事件進行監控。在本實施例中,所述聲音事件監控參數指的是攝像機1需 轉動的角度與監控區域內聲音輸出方向之間的對應關系參數。以下是結合本實施例逐步實現對聲音事件進行監控的內容,即該處理器10運行 該聲音事件監控系統12對監控區域發生的聲音事件進行監控的內容。如圖2所示,是本發明音源定位訓練方法較佳實施例的具體實施流程圖。步驟S10,在需要監控的區域內安裝攝像機1,并在安裝的每一個攝像機1的周圍 架設至少三個聲音收錄設備5 (本實施例以3個為例進行說明)。在本實施例中,在每一個 攝像機1周圍架設的聲音收錄設備5呈等邊三角形排布(如圖3所示);在本發明的其他 實施例中,在每一個攝像機1周圍架設的聲音收錄設備5還可以呈其他形式三角形排布。步驟S11,該音源定位訓練模塊120將需要監控的區域劃分成多個聚焦監控區塊, 并選擇一個聚焦監控區塊作為攝像機1的常態監控區塊,并將各個攝像機1的鏡頭聚焦至 常態監控區塊中央處。如圖4所示,需要監控的區域3被劃分成多個聚焦監控區塊4。原則上,在允許的范圍內,需要監控的區域3被劃分的聚焦監控區塊4越細化,該音源定位訓練 模塊120確定的聲音事件監控參數就越精確。步驟S12,在常態監控區塊中央處放置一個發聲器2且該發聲器2發出聲音時,該 音源定位訓練模塊120接收并分析該聲音以得到一個標準聲音輸出方向。如圖4所示,發 聲器2在劃分的各個聚焦監控區塊間移動,以制造出與各個聚焦監控區塊對應的聲音事件 樣本供該音源定位訓練模塊120進行訓練。在本實施例中,該音源定位訓練模塊120根據 攝像機1周圍架設的聲音收錄設備5接收到聲音的時間先后順序及時間差,確定發聲器2 的聲音輸出方向。步驟S13,該音源定位訓練模塊120在該發聲器2被移動至另一個聚焦監控區塊中 央處時,利用影像物件追蹤技術將攝像機鏡頭聚焦至該發聲器2上,且在該發聲器2發出聲 音時,接收并分析該聲音以得到一個聲音輸出方向。步驟S15,該音源定位訓練模塊120根據該聲音輸出方向相對于標準聲音輸出方 向所發生的偏轉,計算出攝像機1在追蹤聚焦過程中所轉動的角度,在計算出的轉動角度 與該聲音輸出方向之間建立對應關系,并將攝像機1的鏡頭重新聚焦至常態監控區塊中央 處。步驟S16,該音源定位訓練模塊120判斷是否還有劃分的聚焦監控區塊沒有訓練完畢。在還有劃分的聚焦監控區塊沒有訓練完畢時,轉入執行上述步驟步驟S13 ;或者, 在所有劃分的聚焦監控區塊都已訓練完畢時,轉入執行下述步驟S17。步驟S17,該音源定位訓練模塊120根據上述對每一個劃分的聚焦監控區塊的訓 練結果,生成聲音事件監控參數,即攝像機1需轉動的角度與監控區域內聲音輸出方向之 間的對應關系表。如圖5所示,是本發明基于音源定位訓練結果實現聲音事件監控的方法較佳實施 例的具體實施流程圖。步驟S20,該聲音事件監控模塊121通過聲音收錄設備5偵測在監控區域內發生的聲音事件。步驟S21,該聲音事件監控模塊121通過該聲音分類器13對聲音收錄裝置5偵測 到的聲音進行辨識,以判斷偵測到的聲音是否屬于欲偵測的聲音類。在偵測到的聲音屬于欲偵測的聲音類時,轉入執行下述步驟S22 ;或者,在偵測到 的聲音不屬于欲偵測的聲音類時,轉入執行上述步驟S20。步驟S22,該聲音事件監控模塊121分析偵測到的聲音以得到一個當前聲音輸出 方向。步驟S23,該聲音事件監控模塊121根據得到的當前聲音輸出方向從聲音事件監 控參數(即攝像機1需轉動的角度與監控區域內聲音輸出方向之間的對應關系表)中查 找出攝像機1需轉動的角度。步驟S25,該聲音事件監控模塊121控制轉動馬達15按照查找出的角度帶動攝像 機1進行轉動。步驟S26,該聲音事件監控模塊121控制攝像機1偵測攝錄音源的物件影像。步驟S27,該聲音事件監控模塊121通過聲音收錄裝置5收錄音源物件發出的聲曰° 最后所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,盡管參 照較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明 的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和范圍。
權利要求
1.一種影像攝錄設備,該影像攝錄設備周圍架設有至少三個聲音收錄設備,其可在轉 動馬達的帶動下進行影像攝錄方向調節,其特征在于,該影像攝錄設備包括音源定位訓練模塊,用于對監控區域內發生聲音事件的音源方位進行定位訓練,以確 定聲音事件監控參數;及聲音事件監控模塊,用于根據確定的聲音事件監控參數,對監控區域內發生聲音事件 的音源方位進行定位,并控制轉動馬達帶動影像攝錄設備按照定位的方向進行轉動,以偵 測攝錄音源的物件影像及收錄音源發出的聲音。
2.如權利要求1所述的影像攝錄設備,其特征在于,所述聲音事件監控參數指的是影 像攝錄設備需轉動的角度與監控區域內聲音輸出方向之間的對應關系參數。
3.如權利要求2所述的影像攝錄設備,其特征在于,所述音源定位訓練模塊進行音源 方位定位訓練按照以下步驟執行(a)將需要監控的區域劃分成多個聚焦監控區塊,選擇一個聚焦監控區塊作為影像攝 錄設備的常態監控區塊,并將影像攝錄設備的鏡頭聚焦至常態監控區塊中央處;(b)在常態監控區塊中央處放置一個發聲器,在該發聲器發出聲音時,接收并分析該聲 音以得到一個標準聲音輸出方向;(c)在該發聲器被移動至另一個聚焦監控區塊中央處時,將影像攝錄設備的鏡頭追 蹤聚焦至該發聲器上,在該發聲器發出聲音時,接收并分析該聲音以得到一個聲音輸出方 向;(d)根據該聲音輸出方向相對于標準聲音輸出方向所發生的偏轉,計算出影像攝錄設 備在追蹤聚焦過程中所轉動的角度,在計算出的轉動角度與該聲音輸出方向之間建立對應 關系,并將影像攝錄設備的鏡頭重新聚焦至常態監控區塊中央處;(e)在還有劃分的聚焦監控區塊沒有訓練完畢時,轉入執行上述步驟(c)及(d),或者, 在所有劃分的聚焦監控區塊都已訓練完畢時,根據對每一個劃分的聚焦監控區塊的訓練結 果,生成所述聲音事件監控參數。
4.如權利要求3所述的影像攝錄設備,其特征在于,所述聲音輸出方向是根據影像攝 錄設備周圍架設的聲音收錄設備接收到聲音的時間先后順序及時間差來確定的。
5.如權利要求2所述的影像攝錄設備,其特征在于,所述聲音事件監控模塊進行聲音 事件監控按照以下步驟執行通過聲音收錄設備偵測在監控區域內發生的聲音事件;對偵測到的聲音進行辨識,以判斷偵測到的聲音是否屬于欲偵測的聲音類;在偵測到的聲音屬于欲偵測的聲音類時,分析偵測到的聲音以得到一個當前聲音輸出 方向;根據得到的當前聲音輸出方向從聲音事件監控參數中查找出影像攝錄設備需轉動的 角度;控制轉動馬達按照查找出的角度帶動影像攝錄設備進行轉動;控制影像攝錄設備偵測攝錄音源的物件影像;及通過聲音收錄裝置收錄音源物件發出的聲音。
6.一種聲音事件監控方法,適用于可進行影像攝錄方向調節的影像攝錄設備,該影像 攝錄設備周圍架設有至少三個聲音收錄設備,該其特征在于,該方法包括步驟(il)對監控區域內發生聲音事件的音源方位進行定位訓練,以確定聲音事件監控參 數;及( 2)根據確定的聲音事件監控參數,對監控區域內發生聲音事件的音源方位進行定 位,并控制轉動馬達帶動影像攝錄設備按照定位的方向進行轉動,以偵測攝錄音源的物件 影像及收錄音源發出的聲音。
7.如權利要求6所述的聲音事件監控方法,其特征在于,所述聲音事件監控參數指的 是影像攝錄設備需轉動的角度與監控區域內聲音輸出方向之間的對應關系參數。
8.如權利要求7所述的聲音事件監控方法,其特征在于,所述步驟(il)包括(ill)將需要監控的區域劃分成多個聚焦監控區塊,選擇一個聚焦監控區塊作為影像 攝錄設備的常態監控區塊,并將影像攝錄設備的鏡頭聚焦至常態監控區塊中央處;( 12)在常態監控區塊中央處放置一個發聲器,在該發聲器發出聲音時,接收并分析該 聲音以得到一個標準聲音輸出方向;( 13)在該發聲器被移動至另一個聚焦監控區塊中央處時,將影像攝錄設備的鏡頭追 蹤聚焦至該發聲器上,在該發聲器發出聲音時,接收并分析該聲音以得到一個聲音輸出方 向;( 14)根據該聲音輸出方向相對于標準聲音輸出方向所發生的偏轉,計算出影像攝錄 設備在追蹤聚焦過程中所轉動的角度,在計算出的轉動角度與該聲音輸出方向之間建立對 應關系,并將影像攝錄設備的鏡頭重新聚焦至常態監控區塊中央處;( 15)在還有劃分的聚焦監控區塊沒有訓練完畢時,轉入執行上述步驟(il3)及 (il4),或者,在所有劃分的聚焦監控區塊都已訓練完畢時,根據對每一個劃分的聚焦監控 區塊的訓練結果,生成所述聲音事件監控參數。
9.如權利要求8所述的聲音事件監控方法,其特征在于,所述聲音輸出方向是根據影 像攝錄設備周圍架設的聲音收錄設備接收到聲音的時間先后順序及時間差來確定的。
10.如權利要求7所述的聲音事件監控方法,其特征在于,所述步驟(U)包括 通過聲音收錄設備偵測在監控區域內發生的聲音事件;對偵測到的聲音進行辨識,以判斷偵測到的聲音是否屬于欲偵測的聲音類; 在偵測到的聲音屬于欲偵測的聲音類時,分析偵測到的聲音以得到一個當前聲音輸出 方向;根據得到的當前聲音輸出方向從聲音事件監控參數中查找出影像攝錄設備需轉動的 角度;控制轉動馬達按照查找出的角度帶動影像攝錄設備進行轉動; 控制影像攝錄設備偵測攝錄音源的物件影像;及 通過聲音收錄裝置收錄音源物件發出的聲音。
全文摘要
本發明提供一種實現聲音事件監控的影像攝錄設備,其首先為需監控的區域可能發生的聲音事件的音源方位進行預先定位訓練,以確定聲音事件監控參數,進而根據確定的聲音事件監控參數,控制轉動馬達其對需監控的區域即時發生的聲音事件進行精確定位和監控,提高了對音源物件的影像監控效果,且提高了音源的聲音收錄效果。本發明還提供一種實現聲音事件監控的方法。
文檔編號H04N5/225GK102045497SQ20091030881
公開日2011年5月4日 申請日期2009年10月26日 優先權日2009年10月26日
發明者曹丕杰, 李達龍 申請人:鴻富錦精密工業(深圳)有限公司, 鴻海精密工業股份有限公司