目標圖像的生成方法和裝置、以及視頻監控系統的制作方法
【專利摘要】本發明公開了一種目標圖像的生成方法和裝置、以及視頻監控系統,其中,該方法包括:對于包含目標對象的多個圖像幀中的每個圖像幀,根據該圖像幀反應目標對象真實性的程度,確定該圖像幀的置信度;根據多個圖像幀和每個圖像幀的置信度,生成目標對象的圖像。本發明通過對多個圖像幀確定置信度,并根據置信度來生成目標對象的圖像,由于多個圖像幀對最終結果的影響取決于各自的置信度,因此,即使獲取圖像幀的圖像采集設備的分辨率較低,也能夠通過合理的方式綜合多個幀的圖像,得到更加準確、分辨率更高的結果,避免了圖像的獲取依賴于高分辨率設備的問題,并且,本發明的技術方案無需復雜計算,因此處理效率較高,適用于通過離線和在線方式生成圖像。
【專利說明】目標圖像的生成方法和裝置、以及視頻監控系統
【技術領域】
[0001] 本發明涉及計算機視覺領域,并且特別地,涉及一種目標圖像的生成方法和裝置、 以及視頻監控系統。
【背景技術】
[0002] 目前,高分辨率監控攝像機及其組成的智能監控網絡系統在眾多應用中開始發揮 越來越重要的作用。高分辨率監控攝像機及其組成的網絡系統能夠采集到清晰度較高的圖 像,從而在入侵檢測、目標識別等應用中發揮關鍵作用。但是對于家庭、便利店或者已經安 裝的監控網絡系統的應用場景而言,如果要安裝基于高分辨率攝像機的監控系統,將會大 幅提高監控成本。所以,由于受到成本的約束,模擬監控攝像機和網絡攝像機等非高清監控 攝像機仍然會得到廣泛應用。
[0003] 然而,高分辨率的視頻輸出對于保證用戶的安全以及滿足多種信息需求是至關重 要的。因此,如何在非高清監控網絡中輸出高清化入侵目標的技術將成為解決這一矛盾的 關鍵所在。
[0004] 目前,諸如入侵檢測系統等需要進行視頻信息獲取和處理的系統中,采用的目標 圖像獲取和輸出的方法主要包括以下三類:
[0005] 第一類方法使用傳統的紅外傳感器或其他監測傳感器來探測監控區域內是否存 在入侵目標或目標對象。該方法的優點在于能夠應對各種光照變化和噪聲,具有較高的魯 棒性,但是其缺點是誤報率比較高,能提供給用戶以便進行后續分析和處理的信息極其有 限。例如,在家庭安防應用中,當用戶家中無人時,這種方案只能夠檢測到是否發生入侵,但 是并不能夠反映入侵發生時的真實情況,往往無法保留有效的入侵信息;并且,由于傳感器 較為靈敏,往往會因為各種其他因素而被觸發,出現誤報警;
[0006] 第二類方法使用運動檢測技術在檢測區域的視頻序列中通過檢測運動目標來實 現入侵目標檢測,通常采用的經典算法包括幀間差分法、背景差分法和光流法等。這該類方 法基于視頻序列檢測運動目標并可以根據檢測結果保存和查詢入侵目標信息,對攝像頭的 分辨率要求比較低。但該類型方法的缺點時容易受到光照等環境變化的影響,誤報率較高 且無法對運動目標精確定位;例如,在安防系統中采用這類方法時,往往會因為自然因素導 致被監控區域的圖像出現變化而誤認為出現運動的目標,例如,在被監控區域的窗戶被風 吹開時,就會誤認為有入侵發生,進而出現誤報警;并且,這類方法同樣不能夠有效分析入 侵發生時的具體情況,其智能化程度較為有限;
[0007] 第三類方法采用目標檢測和目標識別技術,如人臉檢測和識別技術對監控視頻序 列進行入侵目標檢測。該類型方法能夠識別特定類型的對象,并判斷出特定類型的對象是 否確實存在,因此檢測的準確度有所提高,例如,當將該類方法應用于入侵監控系統中時, 能夠避免各種無關因素對監控結果帶來的不良影響。但是,在采用這類方法時,對用于采集 圖像的攝像頭的分辨率具有一定的要求,且檢測速度普遍較慢。
[0008] 基于上述方法,目前已經提出了新的方案,這種方案采用了上述第二和第三種方 法相結合的技術路線,先采用運動檢測獲取候選入侵目標,然后采用目標檢測器對候選入 侵目標進行精確分類和定位。但是,這種方案同樣對監控攝像機的分辨率有一定要求,在沒 有安裝高清監控攝像機的情況下,無法為用戶提供高質量的入侵目標信息。
[0009] 實際上,不僅僅是入侵監控系統,在其他很多應用場景下,都存在檢測目標對象并 針對目標對象生成圖像的需求,但是,因為上述已有方案受到攝像頭的分辨率和成本等因 素的限制,所以無法提供所需的信息,進而導致上述需求無法有效滿足。
【發明內容】
[0010] 針對相關技術中在生成目標圖像時無法兼顧成本和質量、以及處理速度較慢的問 題,本發明提出了一種目標圖像的生成方法和裝置、以及視頻監控系統,能夠快捷、準確地 生成目標對象的圖像,并且無需借助于高成本的高清攝像頭。
[0011] 為了實現上述目的,根據本發明的實施例,提供了一種目標圖像的生成方法。根據 本發明的目標圖像的生成方法包括:對于包含目標對象的多個圖像幀中的每個圖像幀,根 據該圖像幀反應目標對象真實性的程度,確定該圖像幀的置信度;根據多個圖像幀和每個 圖像幀的置信度,生成目標對象的圖像。
[0012] 根據本發明的實施例,還提供了一種目標圖像的生成裝置。根據本發明的目標圖 像的生成裝置包括:確定模塊,用于對包含目標對象的多個圖像幀中的每個圖像幀,根據該 圖像幀反應目標對象真實性的程度,確定該圖像幀置信度;生成模塊,用于根據多個圖像幀 和每個圖像幀的置信度,生成目標對象的圖像。
[0013] 根據本發明的實施例,還提供了一種視頻監控系統。根據本發明的視頻監控系統 包括:圖像采集設備,用于獲取圖像幀;確定模塊,用于對包含目標對象的多個圖像幀中的 每個圖像幀,根據該圖像幀反應目標對象真實性的程度,確定該圖像幀置信度;生成模塊, 用于根據多個圖像幀和每個圖像幀的置信度,生成目標對象的圖像;輸出模塊,用于將生成 的圖像作為監控結果輸出。
[0014] 本發明通過對多個圖像幀確定置信度,并根據置信度來生成目標對象的圖像,由 于多個圖像幀對最終結果的影響取決于各自的置信度,因此,即使獲取圖像幀的圖像采集 設備的分辨率較低,也能夠通過合理的方式綜合多個幀的圖像,得到更加準確、分辨率更高 的結果,避免了圖像的獲取依賴于高分辨率設備的問題,并且,本發明的技術方案無需復雜 計算,因此處理效率較高,適用于通過離線和在線方式生成圖像。
【專利附圖】
【附圖說明】
[0015] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施 例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲 得其他的附圖。
[0016] 圖1是根據本發明實施例的目標圖像的生成方法的流程圖;
[0017] 圖2是將根據本發明實施例的目標圖像的生成方法用于入侵目標檢測的處理流 程圖;
[0018] 圖3是根據本發明實施例的目標圖像的生成裝置的框圖;
[0019] 圖4是實現本發明技術方案的計算機的示例性結構框圖。
【具體實施方式】
[0020] 在下文中將結合附圖對本發明的示范性實施例進行描述。為了清楚和簡明起見, 在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發任何這種實際實施 例的過程中必須做出很多特定于實施方式的決定,以便實現開發人員的具體目標,例如,符 合與系統及業務相關的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有 所改變。此外,還應該了解,雖然開發工作有可能是非常復雜和費時的,但對得益于本公開 內容的本領域技術人員來說,這種開發工作僅僅是例行的任務。
[0021] 在此,還需要說明的一點是,為了避免因不必要的細節而模糊了本發明,在附圖中 僅僅示出了與根據本發明的方案密切相關的裝置結構和/或處理步驟,而省略了與本發明 關系不大的其他細節。
[0022] 根據本發明的實施例,提供了 一種目標圖像的生成方法。
[0023] 如圖1所示,根據本發明實施例的目標圖像的生成方法包括:
[0024] 步驟S101,對于包含目標對象的多個圖像幀中的每個圖像幀,根據該圖像幀反應 目標對象真實性的程度,確定該圖像幀的置信度;
[0025] 步驟S103,根據多個圖像幀和每個圖像幀的置信度,生成目標對象的圖像。
[0026] 在一個實施例中,在根據多個圖像幀的置信度生成目標對象的圖像時,其生成的 方式可以理解為進行加權求和運算,而每個圖像幀的置信度可以認為是求和運算當中相應 圖像幀所對應數據的權值。
[0027] 所以,對于反應目標對象真實性較好的圖像幀,可以配置較高的置信度(分配較 大的權值),對于反應目標對象真實性較差的圖像幀,可以配置較低的置信度(分配較小的 權值),這樣,置信度較高的圖像幀就會對得到的結果產生更大的影響,而置信度較低的圖 像幀會對得到的結果產生更小的影響,從而使得到的目標對象的圖像更加真實。
[0028] 在生成圖像時,即使采集圖像幀的設備性能一般,但是本發明的上述技術方案能 夠將多個圖像幀合理利用,從而使得生成的圖像具有較高的清晰度,并且具有更高的準確 性。
[0029] 在生成目標對象的圖像時,可以先根據至少兩個圖像幀得到目標對象的圖像,作 為一個初步的結果,之后根據其他的圖像幀和該初步結果得到目標對象的圖像(可以理解 為對初步結果進行更新)。在一個實施例中,可以通過在線更新的方式得到目標對象的圖 像,例如,可以根據T1時刻獲取的圖像幀F1、和T1時刻之后的T2時刻獲取的圖像幀F2得 到初步結果R1,之后可以根據T2時刻之后的T3時刻獲取的圖像幀F3與R1得到更新后的 結果R2。對于之后獲取的其他圖像巾貞,同樣可以根據圖像幀的獲得時間,逐個根據圖像幀與 之前得到的結果生成新的結果,即,對目標對象的圖像不斷更新。并且,在每次更新時,既可 以使用一個圖像幀,也可以使用多個圖像幀。另外,結果R1也可以根據3個或更多的圖像 幀得到。在每次更新時,都應當考慮圖像幀所對應的置信度。
[0030] 在另一實施例中,還可以直接根據多個圖像幀得到目標對象的圖像。例如,以離線 更新方式生成目標對象的圖像時,已經獲得了包含目標對象的圖像幀,此時可以根據這些 圖像幀和相應的置信度直接得到目標對象的圖像。
[0031] 實際上,在線更新方式和離線更新方式可以組合使用,圖像幀的獲取時間和每次 生成或更新目標對象的圖像時所使用的圖像幀的數量也可以根據實際需要來調整。例如, 當通過在線更新方式得到了目標對象的圖像之后,如果之后又獲取了包含目標對象的圖像 幀,則可以通過離線更新方式對之前通過在線更新方式得到的圖像進行更新。相反,通過在 線更新方式也可以對離線方式得到的圖像進行更新,這里不再重復。
[0032] 另外,圖像幀的獲得時間(輸入時間)并沒有特別限定,實際上,在有需要的情況 下,任何時刻輸入的包含目標圖像的圖像幀都可以用于對目標對象的已有圖像進行更新。
[0033] 在一個可選的實施例中,為了進一步提高生成的圖像的準確度,對于每個圖像幀, 可以以預定方式將該圖像幀中的目標對象劃分為多個部分;并且,在確定每個圖像幀的置 信度時,根據該圖像幀中目標對象的每個部分反映目標對象相應部分的真實性的程度,確 定該圖像幀的每個部分的置信度。并且,在根據多個圖像幀和每個圖像幀的置信度生成目 標對象的圖像時,根據多個圖像幀中目標對象的每個部分的置信度,生成目標對象相應部 分的圖像。例如,可以將每個圖像巾貞中的目標對象分為部分A、部分B和部分C,在一個圖像 幀F1中,部分A更加真實的反映了目標對象,相應的,其置信度較高,而部分B和C較為模 糊,因此,部分B和部分C對應的置信度較低;而在另一個圖像幀F2中,部分A較為模糊,而 部分B和C的置信度較高。在根據圖像幀F1和F2得到的目標對象的圖像中,目標對象的 部分A受圖像幀F1中部分A的影響較大,更加接近真實的目標對象,而目標對象的部分B 和C則更多受圖像幀F2中部分B和部分C的影響,更加接近真實的目標對象,也就是說,最 終得到的結果,部分A、B和C都能夠更加接近真實情況。
[0034] 此外,為了提高最終輸出結果的清晰度,在生成目標對象的圖像時,可以借助于參 考圖像。參考圖像可以是預先配置或訓練完成的一般性圖像,并且可以是一類對象的通用 圖像,例如,當目標對象為人頭部時,在針對人頭部生成圖像時,采用的參考圖像可以是人 頭部的圖像,并且具有人頭部所具有的平均或典型特征。在生成目標對象的圖像時,可以根 據多個圖像幀與參考圖像進行生成,并且,同樣可以直接采用多個圖像幀與參考圖像生成 目標對象的圖像,也可以先采用部分圖像幀與參考圖像生成初步結果,之后再用其他圖像 幀對該初步結果進行更新。在生成目標對象的圖像時,對于參考圖像可以預先配置一個適 當的置信度。同樣地,置信度較高的圖像幀會對生成的目標對象的圖像產生較大影響(即, 最終生成的圖像將較為接近置信度較高的圖像幀中的目標對象),如果所有圖像幀的置信 度都比較低,則得到的目標對象的圖像將與參考圖像中的目標對象較為接近,同時也會受 到獲取的圖像幀的較少影響,在一定程度上具有圖像幀中目標對象的特征。
[0035] 在采用參考圖像生成目標對象的情況下,同樣可以對參考圖像中的目標對象劃分 為多個部分,相應地,對獲取的圖像幀同樣進行劃分,并對劃分的每個部分分別確定置信 度,并按照之前所描述的類似方式得到目標對象的圖像。另外,在采用參考圖像生成目標對 象的情況下,同樣可以采用上述在線更新方式和/或離線更新的方式,不斷完善目標對象 的圖像,也可以一次性直接使用多個圖像幀直接與參考圖像進行計算,得到目標對象的圖 像。
[0036] 在一個實施例中,參考圖像可以具有較高的分辨率,這樣就能夠使生成的目標對 象的圖像同樣具有較高的分辨率。在一個可選實施例中,參考圖像可以包括超分辨率模型, 從而顯著提高輸出結果的分辨率。
[0037] 另外,對于每個圖像幀,其置信度可以根據很多因素確定,例如,可以根據獲取圖 像幀時的光照情況,或圖像幀中的目標對象是否正在快速運動或抖動等。可選地,為了使得 置信度的確定更加方便,可以根據該圖像幀中目標對象的朝向和采集該圖像幀的圖像采集 設備的朝向,確定該圖像幀反應目標對象真實性的程度。具體地,當一個圖像幀中的目標對 象基本正面朝向圖像采集設備時,可以認為該圖像幀中的目標對象與實際的目標對象比較 接近,很好地反應目標對象的真實性,對于該圖像幀可以分配較高的置信度;當一個圖像幀 中的目標對象的側面朝向圖像采集設備時,可以認為該圖像幀中的目標對象與實際的目標 對象的接近程度一般,只是較好地反映了目標對象的真實性,因此,可以對該圖像幀分配適 中或較低的置信度。具體地,可以根據目標對象的朝向與圖像采集設備的朝向之間的夾角 大小來確定該圖像幀對應的置信度。
[0038] 此外,在不斷更新已有目標對象的圖像過程中,可以在每次對已有結果進行更新 之后,判斷是否有必要繼續對已有結果進行更新。假設當前用置信度較高的圖像幀對已 有結果進行了更新,得到的更新后的圖像與該置信度較高的圖像幀具有很高的相似度(例 如,兩者的相似度大于預定相似度閾值),則可以認為當前更新后的圖像已經滿足要求,將 當前得到的圖像作為結果輸出,以便后續進行圖像分析、識別或其他用途。另外,當通過在 線更新方式對目標對象的圖像進行更新時,如果在連續的多個圖像幀(其數量可以根據需 要來設定)中均不存在目標對象,則同樣可以停止更新,并且將當前得到的圖像作為結果 輸出。
[0039] 此外,當以在線更新方式對目標對象的圖像進行更新時,可以首先獲取k個圖像 幀,根據k個圖像幀(或進一步根據參考圖像)得到目標對象的圖像,然后,根據之后獲得 的另外k個圖像幀(每個圖像幀同樣具有相應的置信度)對之前得到的目標對象的圖像進 行更新,以此循環。另外,k的數值可以是常數,也可以根據實際需要進行調整,例如,如果根 據前k個圖像幀得到的目標對象的圖像已經與置信度較高的圖像幀具有較高相似度,則可 以修改k的數值,使得后續每次獲取較少的圖像幀更新已有結果,以便降低處理的復雜度, 縮短處理時間。
[0040] 根據本發明的技術方案可以結合其他多種技術,應用于多種場景,例如,可以結合 目標對象檢測和跟蹤技術,將本發明的技術方案應用于安防監控系統,離線生成被監控到 的某個對象的圖像;另外,也可以將本發明的技術方案應用于入侵檢測系統,從而以在線方 式生成并不斷更新入侵目標的圖像。并且,本發明的技術方案能夠對多種類型的目標對象 進行圖像生成,目標對象包括但不限于人的全身、人的頭部(臉部)、車輛整體、車輛的部分 (例如,車牌等)或者其他物體等。
[0041] 下面將以對入侵目標進行檢測為例,描述本發明的技術方案。
[0042] 在進行入侵檢測時,實施步驟主要包括:
[0043] 步驟1,獲取監控攝像機的信息,例如,可以獲取監控攝像機的拍攝方向(可用于 確定圖像幀的置信度)和監控區域;或者,也可以直接接收輸入的視頻或圖像序列,并在視 頻或圖像序列中標出監控區域;
[0044] 步驟2,通過運動檢測和目標檢測,獲取入侵目標的初始位置(例如,可以通過計 算得到);
[0045] 步驟3,利用運動跟蹤技術和目標檢測技術對入侵目標進行跟蹤,并獲取其在監控 區域中的圖像序列;
[0046] 步驟4,利用離線學習獲得的超分辨率模型,對跟蹤獲得的圖像序列信息對監控目 標進行高清化處理(即,采用多個圖像幀構成的圖像序列以及高清化參考圖像得到目標的 1?清圖像);
[0047] 步驟5,獲取高清化的入侵目標信息及其對應的視頻序列信息,S卩,得到了高清化 入侵目標的結果圖像;該結果圖像既可以作為最終結果輸出,也可以用運動跟蹤得到的該 入侵目標的其他圖像序列進行進一步更新。
[0048] 另外,在上述處理過程中,還可以根據監控場景采用的監控攝像頭信息設置更新 的頻率和幅度。
[0049] 在實際應用中,可以根據實際設置的情況,針對目標對象的臉部或全身生成圖像, 并對圖像進行高清化處理。
[0050] 下面將以人入侵檢測并輸出高質量入侵者正面臉部圖像為例闡述本發明的實施 方式。
[0051] 如圖2所示,采集入侵者正面臉部圖像的過程具體包括以下步驟:
[0052] S201,攝像機信息獲取。在該步驟中,獲取系統中的監控攝像機的機內參數和拍攝 方向,并標出監控區域;如果輸入為監控視頻序列,則估計監控攝像頭的拍攝方向并在視頻 起始巾貞中標出監控區域;
[0053] 其中,監控攝像機的拍攝方向可表示為:CAM_0RI,(0°彡CAM_0RI彡180° );
[0054] 監控攝像機的監控區域表示為:CAM_R0I = (roi_x,roi_y,roi_width,roi_ height);
[0055] 視頻序列中的第i巾貞表示為:frames
[0056] S202,獲取入侵目標初始位置。對監控攝像機的視頻序列進行運動檢測,并獲得 framei中的運動目標區域。運動目標區域的計算方法可采用幀間差方法、背景差分法或者 光流法等多種方法。然后,使用基于學習的目標檢測器(此處為人臉檢測器)對運動區域 進行目標檢測,從而獲取framei中入侵目標的初始位置以及范圍(例如,可以通過矩形或 其他形狀的框在fram ei中進行標注)。
[0057] 其中,監控區域中的第i個入侵目標可表示為:0bji ;
[0058] Obj1的初始位置表示為:PoSi = (px, py);
[0059] 其中,roi_x < px < roi_x+roi_width, roi_y < py < roi_y+roi_height ;
[0060] Obj1的初始范圍表示為:Ai = (Wi, hj ;
[0061] 其中,0 < Wi < roi-width,0 < hi < roi-height。
[0062] S203,運動跟蹤及獲取入侵目標圖像序列。基于步驟S202中獲取的入侵目標Obf 初始位置和范圍對Obf進行運動追蹤。運動追蹤可以采用卡爾曼濾波器,粒子濾波器或者 二者結合的方法實現。通過運動追蹤,提取〇bf在時間t內的K幀圖像序列輸入后續步驟。
[0063] 通過追蹤獲取的入侵目標圖像序列表示為:{frame^ ···, framei+K};
[0064] 其對應的入侵目標序列表示為:{ObjV · · ·,(ΛΛ+Κ}。
[0065] S204,估計入侵目標運動方向。基于入侵目標圖像序列計算Obf的運動信息。運 動信息的計算方法可采用運動矢量法,光流估計法或者運動歷史信息法。然后基于運動信 息采用主成分分析法或者投票法對入侵目標的運動信息主方向做出統計,從而估計其運動 方向。
[0066] 其中,入侵目標的運動方向表示為Abj^ORI,(0°彡Obj^ORI彡180° )。
[0067] 這里,可以通過投票法估計運動方向指的施統計運動信息中的所有運動方向,將 出現次數最多的方向確定為主方向。
[0068] S205,更新高清化入侵目標圖像。由于人在行走時正面人臉朝向和人體運動方向 基本時一致的,所以本發明將步驟S204中估計的入侵目標運動方向直接作為正面人臉的 朝向。根據監控攝像機拍攝角度CAM_0RI和人臉朝向Obj^ORI計算其夾角Λ Θ。然后計 算入侵目標人臉圖像序列對于更新高清化入侵目標正面人臉圖像的更新置信度λ,,其中, K k < Κ。
[0069] 高清化的入侵目標正面人臉圖像表示為:0bj^HDJMGAGE ;
[0070] 更新置信度的計算方法為
【權利要求】
1. 一種目標圖像的生成方法,其特征在于,包括: 對于包含目標對象的多個圖像幀中的每個圖像幀,根據該圖像幀反應目標對象真實性 的程度,確定該圖像幀的置信度; 根據所述多個圖像幀和每個圖像幀的置信度,生成所述目標對象的圖像。
2. 根據權利要求1所述的生成方法,其特征在于,進一步包括: 對于每個圖像幀,以預定方式將該圖像幀中的目標對象劃分為多個部分; 并且,在確定每個圖像幀的置信度時,根據該圖像幀中目標對象的每個部分反映目標 對象相應部分的真實性的程度,確定該圖像幀的每個部分的置信度。
3. 根據權利要求2所述的生成方法,其特征在于,在根據所述多個圖像幀和每個圖像 幀的置信度生成所述目標對象的圖像時,根據多個圖像幀中目標對象的每個部分的置信 度,生成所述目標對象相應部分的圖像。
4. 根據權利要求1所述的生成方法,其特征在于,根據所述多個圖像幀和每個圖像幀 的置信度,生成所述目標對象的圖像包括: 根據所述多個圖像幀和預定的參考圖像生成所述目標對象的圖像。
5. 根據權利要求4所述的生成方法,其特征在于,根據所述多個圖像幀和預定的參考 圖像生成所述目標對象的圖像包括: 通過所述多個圖像幀和預定的參考圖像直接得到所述目標對象的圖像;或者 根據所述多個圖像幀中的至少一個圖像幀與所述參考圖像生成所述目標對象的圖像, 并根據所述多個圖像幀中的其他圖像幀對已生成的所述圖像進行更新。
6. 根據權利要求4所述的生成方法,其特征在于,所述參考圖像包含超分辨率模型。
7. 根據權利要求1所述的生成方法,其特征在于,對于每個圖像幀,根據該圖像幀中目 標對象的朝向和采集該圖像幀的圖像采集設備的朝向,確定該圖像幀反應目標對象真實性 的程度。
8. 根據權利要求1所述的生成方法,其特征在于,在生成的所述圖像中的目標對象與 置信度高于預定置信度閾值的圖像幀中的目標對象的相似度大于預定相似度閾值的情況 下,將所述圖像作為結果輸出。
9. 根據權利要求1所述的生成方法,其特征在于,進一步包括: 獲取包含目標對象的多個其他圖像幀,根據所述多個其他圖像幀對所述目標對象的 圖像進行更新,其中,每個圖像幀的置信度取決于該圖像幀反應目標對象真實性的程度,其 中,所述多個其他圖像幀的數量為常數或者為可變數值。
10. -種目標圖像的生成裝置,其特征在于,包括: 確定模塊,用于對包含目標對象的多個圖像幀中的每個圖像幀,根據該圖像幀反應目 標對象真實性的程度,確定該圖像幀置信度; 生成模塊,用于根據所述多個圖像幀和每個圖像幀的置信度,生成所述目標對象的圖 像。
11. 根據權利要求10所述的生成裝置,其特征在于,進一步包括: 劃分模塊,用于對每個圖像幀,以預定方式將該圖像幀中的目標對象劃分為多個部 分; 并且,所述確定模塊用于在確定每個圖像幀的置信度時,根據該圖像幀中目標對象的 每個部分反映目標對象相應部分的真實性的程度,確定該圖像幀的每個部分的置信度。
12. 根據權利要求11所述的生成裝置,其特征在于,所述生成模塊用于在根據所述多 個圖像幀和每個圖像幀的置信度生成所述目標對象的圖像時,根據多個圖像幀中目標對象 的每個部分的置信度,生成所述目標對象相應部分的圖像。
13. 根據權利要求10所述的生成裝置,其特征在于,所述生成模塊用于根據所述多個 圖像幀和預定的參考圖像生成所述目標對象的圖像。
14. 根據權利要求13所述的生成裝置,其特征在于,所述生成模塊通過所述多個圖像 幀和預定的參考圖像直接得到所述目標對象的圖像;或者 所述生成模塊根據所述多個圖像幀中的至少一個圖像幀與所述參考圖像生成所述目 標對象的圖像,并根據所述多個圖像幀中的其他圖像幀對已生成的所述圖像進行更新。
15. 根據權利要求13所述的生成裝置,其特征在于,所述參考圖像包含超分辨率模型。
16. 根據權利要求10所述的生成裝置,其特征在于,對于每個圖像幀,所述確定模塊用 于根據該圖像幀中目標對象的朝向和采集該圖像幀的圖像采集設備的朝向,確定該圖像幀 反應目標對象真實性的程度。
17. -種視頻監控系統,其特征在于,包括: 圖像采集設備,用于獲取圖像幀; 確定模塊,用于對包含目標對象的多個圖像幀中的每個圖像幀,根據該圖像幀反應目 標對象真實性的程度,確定該圖像幀置信度; 生成模塊,用于根據所述多個圖像幀和每個圖像幀的置信度,生成所述目標對象的圖 像; 輸出模塊,用于將生成的所述圖像作為監控結果輸出。
18. 根據權利要求17所述的視頻監控系統,其特征在于,進一步包括: 劃分模塊,用于對每個圖像幀,以預定方式將該圖像幀中的目標對象劃分為多個部 分; 并且,所述確定模塊用于在確定每個圖像幀的置信度時,根據該圖像幀中目標對象的 每個部分反映目標對象相應部分的真實性的程度,確定該圖像幀的每個部分的置信度。
19. 根據權利要求17所述的視頻監控系統,其特征在于,所述生成模塊用于根據所述 多個圖像幀和預定的參考圖像生成所述目標對象的圖像。
20. 根據權利要求19所述的視頻監控系統,其特征在于,所述生成模塊根據所述多個 圖像幀中的至少一個圖像幀與所述參考圖像生成所述目標對象的圖像,并在獲取了所述多 個圖像幀中的其他圖像幀的情況下,根據其他圖像幀對已生成的所述圖像進行更新。
21. 根據權利要求20所述的視頻監控系統,其特征在于,進一步包括: 判斷模塊,用于在生成所述圖像或每次更新所述圖像的情況下,判斷生成的或更新后 的所述圖像中的目標對象與置信度高于預定置信度閾值的圖像幀中的目標對象的相似度 是否大于預定相似度閾值;并且,所述輸出模塊用于在判斷結構為是的情況下,將當前生成 或更新后的所述圖像作為結果輸出。
【文檔編號】H04N7/18GK104219488SQ201310214849
【公開日】2014年12月17日 申請日期:2013年5月31日 優先權日:2013年5月31日
【發明者】張登, 李亮 申請人:索尼公司