專(zhuān)利名稱(chēng):Roi設(shè)置方法和設(shè)備、電子照相機(jī)設(shè)備、程序和記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
廣義地,本發(fā)明涉及圖像處理領(lǐng)域,具體地,本發(fā)明涉及用于在諸如電子照相機(jī)設(shè)備這樣的電子處理設(shè)備中設(shè)置圖像的感興趣區(qū)域(ROI)的技術(shù)。
背景技術(shù):
在例如數(shù)字照相機(jī)這樣的電子設(shè)備中,捕獲的圖像通常在被記錄到記錄介質(zhì)上之前被壓縮。
目前,JPEG被廣泛用于壓縮圖像數(shù)據(jù);然而,正在進(jìn)行相當(dāng)大數(shù)量的研究來(lái)促進(jìn)新的圖像壓縮技術(shù)也就是JPEG 2000(ISO/IEC FCD 15444-1)的使用。JPEG 2000具有可選擇的區(qū)域圖像質(zhì)量改進(jìn)功能(ROI功能),用于降低圖像的感興趣區(qū)域的壓縮比(提高圖像質(zhì)量)而不用降低整個(gè)圖像的壓縮比。
這個(gè)ROI功能尤其對(duì)電子照相機(jī)設(shè)備有吸引力。通過(guò)將被捕獲圖像的重要區(qū)域設(shè)置為ROI,能夠在重要的區(qū)域中保持較高的圖像質(zhì)量,同時(shí)能夠顯著地減少除重要區(qū)域之外的整個(gè)圖像的數(shù)據(jù)量。
為了使用ROI功能,有必要指明每個(gè)單獨(dú)的被捕獲圖像中的ROI。例如,在日本專(zhuān)利公開(kāi)出版物No.2001-230947中公開(kāi)了用于指明ROI的為大眾所熟知的技術(shù)。在這個(gè)文件中,公開(kāi)了具有顯示導(dǎo)向框或者模板圖像的EVF(電子取景器)屏幕的電子照相機(jī)設(shè)備。導(dǎo)向框或者模板圖像被用作用于定位和捕獲圖像的基像。然后,導(dǎo)向框以?xún)?nèi)的區(qū)域或者不同于模板圖像的區(qū)域在捕獲圖像的壓縮過(guò)程中被處理為ROI。同樣的,ROI信息被記錄在相應(yīng)圖像文件的頭部,因此在圖像重現(xiàn)過(guò)程中ROI能夠被顯示在重現(xiàn)圖像的剩余部分上。
同樣的,日本專(zhuān)利公開(kāi)出版物No.2001-119625公開(kāi)了一種數(shù)字照相機(jī),它依據(jù)用戶(hù)的操作來(lái)確定所捕獲圖像的主要目標(biāo)的范圍,將這個(gè)范圍處理為ROI,用比其他各區(qū)域更低的壓縮比來(lái)壓縮對(duì)應(yīng)的范圍,并且在相應(yīng)的被壓縮圖像文件的頭部上描述ROI信息。該公開(kāi)出版物提到可以根據(jù)圖像的邊界或者柱狀圖信息來(lái)自動(dòng)確定主要目標(biāo)的范圍。然而,在這個(gè)文件中沒(méi)有顯示提及了JPEG 2000。
如在日本專(zhuān)利公開(kāi)出版物No.2001-230947中所公開(kāi)的使用導(dǎo)向框或者模板圖像的ROI設(shè)置方法限制了定位和場(chǎng)景捕獲操作的靈活性。
同樣的,如日本專(zhuān)利公開(kāi)出版物No.2001-119625中所公開(kāi)的將主要目標(biāo)的范圍手動(dòng)設(shè)置為ROI的方法,存在著手動(dòng)操作可能非常麻煩并且此方法可能不能用于靜止圖像的連續(xù)捕獲或者移動(dòng)圖像的捕獲等的問(wèn)題。盡管提到了根據(jù)圖像的邊界和頻率曲線(xiàn)來(lái)自動(dòng)確定主要目標(biāo)的范圍,但在這個(gè)文件中沒(méi)有顯示已經(jīng)公開(kāi)了用于確定ROI的詳細(xì)方法。諸如上述確定方法等因素決定了所確定的ROI的正確性。
同樣的,一般而言,在將ROI設(shè)置操作自動(dòng)化的過(guò)程中需要考慮很多種的場(chǎng)景捕獲操作。此外,因?yàn)橛脩?hù)偏好可以千變?nèi)f化,所以更可行的作法也許是容許用戶(hù)在某種程度上干預(yù)捕獲操作。
發(fā)明內(nèi)容
本發(fā)明的構(gòu)想針對(duì)著先有技術(shù)的上述問(wèn)題,并且其一般性目的是提供ROI設(shè)置設(shè)備和方法,該設(shè)備和方法能夠在如電子照相機(jī)設(shè)備等圖像處理設(shè)備中實(shí)現(xiàn)更加實(shí)用的ROI設(shè)置功能。本發(fā)明的另一個(gè)一般性目的是提供諸如數(shù)字照相機(jī)等電子照相機(jī)設(shè)備,該設(shè)備具有更加實(shí)用的ROI設(shè)置功能。
依據(jù)本發(fā)明的一個(gè)方面,ROI設(shè)置設(shè)備包括多個(gè)ROI識(shí)別裝置,每個(gè)都適用于根據(jù)預(yù)定的方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果;和ROI控制單元,適用于從多個(gè)ROI識(shí)別裝置選擇ROI識(shí)別裝置并且根據(jù)由所選ROI識(shí)別裝置獲得的識(shí)別結(jié)果來(lái)設(shè)置ROI信息。
因?yàn)槟軌蚴褂脤?duì)應(yīng)于ROI識(shí)別方法的多個(gè)不同的ROI識(shí)別裝置,所以能夠執(zhí)行合適的ROI設(shè)置操作,用于多種捕獲場(chǎng)景的各種圖像數(shù)據(jù)。值得注意的是,本發(fā)明的ROI設(shè)置設(shè)備可以用在靜止圖像的連續(xù)捕獲或者移動(dòng)圖像的捕獲中。
此外,ROI控制單元可以依據(jù)來(lái)自用戶(hù)的指令來(lái)選擇ROI識(shí)別裝置。用戶(hù)能夠如愿地改變ROI識(shí)別方法以便于可以進(jìn)行最佳ROI設(shè)置操作。
在本發(fā)明的一個(gè)實(shí)施例中,ROI控制單元可以依據(jù)用戶(hù)選擇的場(chǎng)景類(lèi)型來(lái)選擇ROI識(shí)別裝置。用戶(hù)可只選擇場(chǎng)景類(lèi)型,而ROI可根據(jù)這個(gè)場(chǎng)景類(lèi)型的最佳ROI識(shí)別方法來(lái)設(shè)置。
此外,在本發(fā)明的一個(gè)實(shí)施例中,ROI控制單元可以依據(jù)所選區(qū)域設(shè)置ROI信息,該所選區(qū)域選自由所選ROI識(shí)別裝置識(shí)別的多個(gè)區(qū)域,該所選區(qū)域的選擇依據(jù)諸如來(lái)自用戶(hù)的指令。用戶(hù)能夠更改自動(dòng)識(shí)別的ROI來(lái)設(shè)置適合用戶(hù)偏好的最佳ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,ROI控制單元可以依據(jù)用戶(hù)的指令來(lái)放大或者縮小由所選的ROI識(shí)別裝置識(shí)別的區(qū)域。用戶(hù)能夠更改自動(dòng)識(shí)別的ROI來(lái)設(shè)置適合用戶(hù)偏好的最佳ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中的每一個(gè)都可以包括一個(gè)識(shí)別條件,并且ROI控制單元可以依據(jù)來(lái)自用戶(hù)的指令來(lái)改變所選ROI識(shí)別裝置的識(shí)別條件。用戶(hù)能夠調(diào)整ROI識(shí)別條件來(lái)設(shè)置適合用戶(hù)偏好的最佳ROI。
此外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)包含面部的圖像數(shù)據(jù)區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。例如,肖像圖像的面部部分可以被設(shè)置為ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)高頻成分集中的圖像數(shù)據(jù)區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。例如,風(fēng)景圖像的細(xì)致部分可以被設(shè)置為ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)集中了具有顯著對(duì)比圖案的圖像數(shù)據(jù)區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。包括條形碼或者字母的圖像區(qū)域能夠被設(shè)置為ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)在包括目標(biāo)的圖像數(shù)據(jù)的中心部分處的區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。包括經(jīng)常位于圖像的中心部分的目標(biāo)的區(qū)域能夠被設(shè)置為ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于將用于圖像數(shù)據(jù)的圖像捕獲操作的AF評(píng)估區(qū)域作為基本圖像以便于識(shí)別ROI。包括在其上進(jìn)行聚焦的目標(biāo)的區(qū)域能夠被設(shè)置為ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于將用于圖像數(shù)據(jù)的圖像捕獲操作的AE評(píng)估區(qū)域作為基本圖像以便于識(shí)別ROI。包括在其上進(jìn)行曝光的目標(biāo)的區(qū)域能夠被設(shè)置為ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)其中察覺(jué)到移動(dòng)的圖像數(shù)據(jù)的區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。在移動(dòng)目標(biāo)的所捕獲圖像中包括移動(dòng)目標(biāo)的區(qū)域能夠被設(shè)置為ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于抽取比恰好在圖像捕獲操作之前獲得的監(jiān)視圖像數(shù)據(jù)的對(duì)應(yīng)區(qū)域顯著明亮的圖像數(shù)據(jù)的區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。所捕獲的閃光圖像中,包括不遠(yuǎn)處目標(biāo)的部分能夠被設(shè)置為ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)圖像數(shù)據(jù)高亮區(qū)域并且將此區(qū)域用作基本區(qū)域以便于識(shí)別ROI。包括目標(biāo)的圖像的明亮部分能夠被設(shè)置為ROI。
另外,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于檢測(cè)圖像數(shù)據(jù)的高亮區(qū)域,將在圖像數(shù)據(jù)預(yù)定部分的高亮區(qū)域部分從上述區(qū)域中去除,并且將所得結(jié)果的區(qū)域用作基本區(qū)域以便于識(shí)別ROI。除了表示天空的圖像的上部分以外,圖像的明亮部分能夠被設(shè)置為ROI。
同樣的,在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)ROI識(shí)別裝置中至少有一個(gè)適合于根據(jù)圖像數(shù)據(jù)的被壓縮數(shù)據(jù)的數(shù)據(jù)包的大小來(lái)識(shí)別ROI。如下面所述,依據(jù)JPEG 2000,板塊(tile)數(shù)據(jù)是被稱(chēng)為分區(qū)(precincts)的各個(gè)區(qū)域的數(shù)據(jù)包,具有較大包尺寸(代碼的數(shù)量)的分區(qū)有可能是圖像的重要部分。能夠根據(jù)每個(gè)分區(qū)的數(shù)據(jù)包的大小來(lái)設(shè)置ROI。
在本發(fā)明的另一個(gè)實(shí)施例中,電子照相機(jī)設(shè)備包括依據(jù)本發(fā)明的ROI設(shè)置設(shè)備。能夠設(shè)置最佳ROI用于各種被捕獲場(chǎng)景,并且還能夠依據(jù)用戶(hù)偏好來(lái)設(shè)置ROI。
在本發(fā)明的另一個(gè)方面中,依據(jù)本發(fā)明,程序允許計(jì)算機(jī)起到ROI識(shí)別設(shè)備的多個(gè)ROI識(shí)別裝置和ROI控制單元的功能。此外,在本發(fā)明的另一個(gè)方面中,計(jì)算機(jī)可讀記錄介質(zhì)存儲(chǔ)依據(jù)本發(fā)明的程序。通過(guò)利用這些程序和/或者記錄介質(zhì),本發(fā)明的ROI設(shè)置設(shè)備能夠通過(guò)例如個(gè)人計(jì)算機(jī)或者微型計(jì)算機(jī)這樣的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。
在本發(fā)明的另一個(gè)方面,ROI設(shè)置方法包括第一步,從多個(gè)ROI識(shí)別方法中選擇ROI識(shí)別方法;第二步,依據(jù)在第一步中所選的ROI識(shí)別方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果;以及第三步,依據(jù)在第二步中所獲的識(shí)別結(jié)果來(lái)設(shè)置ROI信息。
圖1是圖解說(shuō)明本發(fā)明的實(shí)施例的示意性的方框圖;圖2是圖解說(shuō)明JPEG 2000圖像壓縮/解壓縮算法的示意性的方框圖;圖3A-3D是圖解說(shuō)明二維小波變換處理的示意圖;圖4是顯示依據(jù)JPEG 2000所產(chǎn)生的被壓縮圖像數(shù)據(jù)(代碼流)的結(jié)構(gòu)的示意圖;圖5是ROI設(shè)置操作的流程圖;圖6是如圖5中所示的步驟S2的流程圖;圖7是ROI識(shí)別裝置(1)的流程圖;圖8是ROI識(shí)別裝置(2)的流程圖;圖9是ROI識(shí)別裝置(3)的流程圖;圖10是ROI識(shí)別裝置(4)的流程圖;圖11是ROI識(shí)別裝置(5)的流程圖;圖12是ROI識(shí)別裝置(6)的流程圖;圖13是ROI識(shí)別裝置(7)的流程圖;圖14是ROI識(shí)別裝置(8)的流程圖;圖15是ROI識(shí)別裝置(9)的流程圖;具體實(shí)施方式
在如下所述的本發(fā)明的優(yōu)選實(shí)施例中,符合JPEG 2000的算法被用于圖像的壓縮過(guò)程中。例如,“新一代圖像編碼技術(shù)JPEG 2000”(Next GenerationImage Encoding Technique JPEG 2000,Yasuyuki Nomizu,Triceps,Co.Ltd.)中詳細(xì)描述了依據(jù)JPEG 2000的圖像壓縮算法。在下文中,參考圖2到4給出該算法的簡(jiǎn)要描述。
圖2是圖解說(shuō)明依據(jù)JPEG 2000的圖像壓縮/解壓縮步驟的示意性方框圖。在這里,待壓縮處理的圖像數(shù)據(jù)(例如,在處理移動(dòng)圖像時(shí)每幀圖像數(shù)據(jù))被分成彼此互不重疊的被稱(chēng)為板塊的矩形區(qū)域。在DC電平/顏色空間轉(zhuǎn)換/反轉(zhuǎn)換單元200中,執(zhí)行電平漂移操作和顏色空間轉(zhuǎn)換過(guò)程以便于增加壓縮比。電平漂移操作包括從如RGB這樣無(wú)代碼的整形值中減去動(dòng)態(tài)范圍的一半。在有代碼的整形值上不進(jìn)行電平漂移操作,因此,如果輸入的圖像數(shù)據(jù)對(duì)應(yīng)YCrCb數(shù)據(jù),例如,已經(jīng)附加了代碼的Cr和Cb部分將不經(jīng)過(guò)電平漂移操作。顏色空間轉(zhuǎn)換過(guò)程包括當(dāng)輸入的圖像數(shù)據(jù)對(duì)應(yīng)RGB數(shù)據(jù)或者CMY數(shù)據(jù)的時(shí)候?qū)⑤斎氲膱D像數(shù)據(jù)轉(zhuǎn)換成YCrCb數(shù)據(jù)。應(yīng)注意在可替換的實(shí)施例中,可以省略這個(gè)DC電平/顏色空間轉(zhuǎn)換器/反轉(zhuǎn)換單元200。
然后,在二維小波變換/反變換單元202中,對(duì)已經(jīng)被DC電平/顏色空間轉(zhuǎn)換器/反轉(zhuǎn)換單元200處理過(guò)的每個(gè)板塊的每個(gè)成分的圖像數(shù)據(jù)進(jìn)行二維小波變換(離散小波變換DWT)。
圖3A-3D是圖解說(shuō)明在分解級(jí)別為三時(shí)的示意性的二維小波變換過(guò)程。具體的,隨著二維小波變換過(guò)程,如圖3A中所示的板塊圖像被分成如圖3B中所示的子帶1LL、1HL、1L和1HH。然后,通過(guò)在子帶1LL的系數(shù)上進(jìn)行進(jìn)一步的二維小波變換,子帶1LL被分成如圖3C中所示的子帶2LL、2HL、2LH和2HH。然后,通過(guò)在子帶2LL的系數(shù)上進(jìn)行進(jìn)一步的二維小波變換,子帶2LL被分成如圖3D中所示的子帶3LL、3HL、3LH、3HH。
回過(guò)來(lái)參考圖2,從低頻率成分(子帶LL的系數(shù))的遞歸劃分(倍頻程劃分,octave division)而獲得的每個(gè)子帶系數(shù)被量化/反量化單元204所量化,此后通過(guò)熵編碼/解碼單元206來(lái)編碼數(shù)據(jù)。在JPEG 2000中,可逆壓縮(無(wú)損壓縮)和不可逆壓縮(有損壓縮)兩種都是有可能的。在可逆壓縮情況中,量化節(jié)距寬度是1,即量化在這個(gè)階段實(shí)際上并不被執(zhí)行。
熵編碼/解碼單元206在小波系數(shù)上進(jìn)行熵編碼。在上述熵編碼中,使用了被稱(chēng)作EBCOT(具有優(yōu)化截?cái)嗟那度胧綁K編碼)塊基位平面編碼方案,包括塊的劃分、系數(shù)建模和二進(jìn)制算術(shù)編碼。待編碼的小波系數(shù)或者是正整數(shù)或者是負(fù)整數(shù),并且當(dāng)以指定的次序執(zhí)行這些系數(shù)的掃描操作的時(shí)候,從較高位平面到較低位平面一次一個(gè)位平面地對(duì)以絕對(duì)值表示的系數(shù)進(jìn)行編碼。
在熵編碼/解碼單元206中生成的編碼序列被發(fā)送到標(biāo)簽處理單元208中,其中編碼序列被排列成其上具有附加標(biāo)簽信息的代碼流,然后輸出代碼流。
圖4是圖解說(shuō)明代碼流(被壓縮的圖像數(shù)據(jù))的結(jié)構(gòu)的圖。如圖中所示,代碼流起始于SOC標(biāo)記,其后為主頭部,用來(lái)描述參數(shù),例如用于編碼操作的參數(shù)或者用于量化處理的參數(shù)。然后是各個(gè)板塊的代碼流。每個(gè)板塊的代碼流起始于SOT標(biāo)記,其后緊跟著板塊頭部,然后是SOD標(biāo)記,和板塊數(shù)據(jù)。此外,在代碼流中最后一個(gè)板塊數(shù)據(jù)組之后放置一個(gè)指示代碼流結(jié)束的EOC標(biāo)記。每組板塊數(shù)據(jù)對(duì)應(yīng)于在被稱(chēng)作分區(qū)的每個(gè)區(qū)域中的子帶系數(shù)代碼的數(shù)據(jù)包。
在這里,應(yīng)該注意到除高壓縮比(低位比)下實(shí)現(xiàn)極好的圖像品質(zhì)之外,依據(jù)JPEG 2000的算法還具有許多其他特征。
JPEG 2000算法的一個(gè)特征是如上所述的選擇性區(qū)域圖像品質(zhì)改進(jìn)功能(ROI功能)。依據(jù)JPEG 2000的基本方法(JPEG 2000,部分1),采用了在編碼小波系數(shù)之前將被選區(qū)域的小波系數(shù)值移動(dòng)到較高位平面并且將其他區(qū)域的小波系數(shù)移動(dòng)到低位平面的ROI方法(最大位移方法,maxshift)??商娲模梢酝ㄟ^(guò)使用比在其他區(qū)域使用的更為細(xì)致的量化節(jié)距來(lái)量化ROI的小波系數(shù)值,在量化過(guò)程中實(shí)現(xiàn)ROI功能。在任一情況中,所述ROI方法都能夠?qū)崿F(xiàn)代碼總量的減少而不降低圖像的ROI圖像品質(zhì)。
回過(guò)去參考圖2,代碼流的解壓縮過(guò)程是壓縮過(guò)程的相反過(guò)程。即,讀取輸入代碼流的標(biāo)簽信息,并且借助標(biāo)簽處理單元208將其分成各個(gè)板塊的各個(gè)成分的代碼序列。然后,借助熵編碼/解碼單元206以依據(jù)標(biāo)簽信息的順序?qū)⑺媒Y(jié)果的序列解碼成小波系數(shù)。通過(guò)量化/反量化單元204將解碼的小波系數(shù)反量化,此后借助二維小波變換/反變換單元202對(duì)反量化數(shù)據(jù)執(zhí)行二維小波反變換以便于重現(xiàn)各個(gè)板塊的各個(gè)成分的圖像數(shù)據(jù)。然后,DC電平/顏色空間轉(zhuǎn)換/反轉(zhuǎn)換單元200在各個(gè)板塊的各個(gè)部分的圖像數(shù)據(jù)上進(jìn)行與在壓縮過(guò)程中執(zhí)行的轉(zhuǎn)換相反的轉(zhuǎn)換,然后輸出圖像。
圖1是圖解說(shuō)明本發(fā)明的實(shí)施例的示意性的方框圖。如此圖中所示的電子照相機(jī)設(shè)備具有圖像捕獲單元100、存儲(chǔ)單元102、顯示單元104、壓縮/解壓縮單元106、寫(xiě)/讀單元108、包括ROI控制單元120和ROI識(shí)別單元122的ROI設(shè)置設(shè)備、和用于用戶(hù)輸入ROI設(shè)置操作有關(guān)指令的操作單元124。
圖像捕獲單元100通過(guò)光學(xué)鏡頭利用圖像傳感器捕獲目標(biāo)圖像并且輸出所捕獲得圖像數(shù)據(jù),就如同數(shù)字照相機(jī)的傳統(tǒng)的圖像捕獲單元。此外,圖像捕獲單元100具有靜止圖像捕獲模式和移動(dòng)圖像捕獲模式。同樣的,圖像捕獲單元100可以具有諸如自動(dòng)聚焦(AF)功能,自動(dòng)曝光(AE)功能和閃光功能。在本實(shí)施例中,假設(shè)電子照相機(jī)設(shè)備使用AF配置和AE配置以便于根據(jù)圖像的多個(gè)評(píng)估區(qū)域來(lái)確定聚焦條件或者曝光條件。
存儲(chǔ)單元102用于臨時(shí)存儲(chǔ)由圖像捕獲單元100輸出的圖像數(shù)據(jù)或者由壓縮/解壓縮單元106解壓縮的圖像數(shù)據(jù)。顯示單元104用于在LCD面板上顯示例如存儲(chǔ)在存儲(chǔ)單元102中的圖像數(shù)據(jù)和其他信息,并且還被用作EVF(電子取景器)。壓縮/解壓縮單元106用于利用依據(jù)如上所述的JPEG 2000的算法來(lái)在圖像數(shù)據(jù)上執(zhí)行壓縮處理并且在代碼流上執(zhí)行解壓縮過(guò)程。寫(xiě)/讀單元108用于將從壓縮/解壓縮單元106輸出的代碼流寫(xiě)入記錄介質(zhì)110中作為圖像文件或者從記錄介質(zhì)110中讀取圖像文件。
ROI識(shí)別單元122被設(shè)置為自動(dòng)識(shí)別圖像的ROI,包括十種不同的ROI識(shí)別裝置(1)到(10),每一個(gè)都符合彼此互不相同的ROL識(shí)別方法。這些識(shí)別裝置的每一個(gè)ROI識(shí)別方法將在后面詳細(xì)描述。ROI控制單元120用于依據(jù)對(duì)與ROI識(shí)別單元122的ROI識(shí)別裝置的選擇、所選ROI識(shí)別裝置的控制和被ROI識(shí)別裝置所識(shí)別的ROI(候選)的有關(guān)的信息來(lái)最終設(shè)置ROI信息。ROI控制單元120還存儲(chǔ)ROI識(shí)別條件(參數(shù)值)。
將來(lái)自用戶(hù)的有關(guān)ROI設(shè)置操作的指令從操作單元124輸入到ROI控制單元120。在下面,給出了從操作單元124輸入的指令的實(shí)例。
(a)執(zhí)行涉及用戶(hù)的ROI設(shè)置操作的指令;(b)在涉及用戶(hù)的ROI設(shè)置操作期間給出的指令,在已經(jīng)自動(dòng)識(shí)別了多個(gè)ROI(候選)的情況中指示特殊區(qū)域的選擇;(c)在涉及用戶(hù)的ROI設(shè)置操作期間給出的指令,指示已經(jīng)被自動(dòng)識(shí)別的ROI(候選)的放大/縮?。?d)在涉及用戶(hù)的ROI設(shè)置操作期間給出的指令,指示改變有關(guān)ROI識(shí)別過(guò)程的參數(shù);(e)選擇ROI識(shí)別方法(裝置)的指令;(f)自動(dòng)設(shè)置靜止圖像的ROI的指令;(g)捕獲移動(dòng)圖像時(shí)自動(dòng)設(shè)置ROI的指令。
同樣的,圖像捕獲單元100將圖像捕獲條件信息提供給ROI控制單元120,諸如圖像捕獲模式信息(區(qū)別靜止圖像捕獲模式和移動(dòng)圖像捕獲模式的信息)、閃光信息(指示閃光模式的信息)、AF信息(關(guān)于用在用于圖像捕獲操作的聚焦評(píng)估中的AF評(píng)估區(qū)域的信息)、AE信息(關(guān)于用在用于圖像捕獲操作的最佳曝光評(píng)估中的AE評(píng)估區(qū)域的信息)和場(chǎng)景選擇信息(指示被場(chǎng)景選擇開(kāi)關(guān)選擇的場(chǎng)景的類(lèi)型的信息)等等。
圖5是圖解說(shuō)明涉及用戶(hù)的ROI設(shè)置操作的流程圖,該操作在諸如每次捕獲靜止圖像的時(shí)候被執(zhí)行。在這樣的情況中,在靜止圖像捕獲模式中,在監(jiān)視操作期間(或者通過(guò)圖像[through image]顯示的期間)可以給出執(zhí)行涉及用戶(hù)的ROI設(shè)置操作的指令(a),在此操作期間,被圖像捕獲單元100捕獲的圖像(監(jiān)視圖像或者通過(guò)圖像)在顯示單元104上被連續(xù)顯示。
如圖5中所示,在步驟S1中,ROI控制單元120選擇在ROI識(shí)別單元122中被實(shí)現(xiàn)的ROI識(shí)別裝置中的一個(gè)。在圖像捕獲單元100的場(chǎng)景選擇開(kāi)關(guān)已選擇某特殊場(chǎng)景類(lèi)型的情況下,依據(jù)場(chǎng)景選擇信息選擇用于被選場(chǎng)景類(lèi)型的ROI識(shí)別裝置。在沒(méi)有選擇場(chǎng)景類(lèi)型的情況下,選擇默認(rèn)ROI識(shí)別裝置或者由用戶(hù)預(yù)先指定的ROI識(shí)別裝置。
圖像捕獲單元100執(zhí)行場(chǎng)景監(jiān)視直到按下釋放開(kāi)關(guān)。在這里,圖像捕獲單元100連續(xù)地輸出監(jiān)視圖像的數(shù)據(jù),這些數(shù)據(jù)被存儲(chǔ)在存儲(chǔ)單元102中。然后,在顯示單元104上顯示監(jiān)視圖像。應(yīng)該注意到監(jiān)視圖像通常是其中略去一些掃描線(xiàn)的圖像。
當(dāng)按下釋放開(kāi)關(guān)時(shí),圖像捕獲單元100捕獲靜止圖像。沒(méi)有略去掃描線(xiàn)的被捕獲的靜止圖像的數(shù)據(jù)被存儲(chǔ)在存儲(chǔ)單元102中,在此之后,在顯示單元104上顯示這個(gè)被捕獲的圖像。在這里,至少一個(gè)剛好在圖像捕獲操作之前獲得的監(jiān)視圖像的數(shù)據(jù)也被存儲(chǔ)在存儲(chǔ)單元102中。
在步驟S2中,ROI控制單元120管理所選ROI識(shí)別裝置從而在這個(gè)被捕獲的靜止圖像數(shù)據(jù)上執(zhí)行ROI識(shí)別過(guò)程,并且還管理顯示單元104從而在被捕獲的靜止圖像上顯示被識(shí)別的ROI。此時(shí),有可能進(jìn)行諸如放大/縮小操作或者選擇被自動(dòng)識(shí)別的ROI,或者改變確定ROI識(shí)別條件的參數(shù)值。這些操作將在后面詳細(xì)描述。
在步驟S3中,如果用戶(hù)通過(guò)操作單元124輸入指令來(lái)確認(rèn)ROI,則在步驟S5中,ROI控制單元120基于當(dāng)前ROI確認(rèn)ROI信息,并且將這個(gè)信息設(shè)置到壓縮/解壓縮單元106和寫(xiě)/讀單元108。同樣的,ROI控制單元120存儲(chǔ)用于這個(gè)ROI識(shí)別過(guò)程的參數(shù)值。然后在步驟S6中,通過(guò)壓縮/解壓縮單元106來(lái)壓縮存儲(chǔ)在存儲(chǔ)單元102中的被捕獲的靜止圖像數(shù)據(jù),并且借助寫(xiě)/讀單元108將所得結(jié)果的代碼流寫(xiě)在記錄介質(zhì)110上作為圖像文件。在這個(gè)壓縮過(guò)程中,依據(jù)所設(shè)置的ROI信息,用比其他區(qū)域更低的壓縮比來(lái)壓縮ROI。同樣的,在圖像文件的頭部中描述ROI信息。
此外,如果用戶(hù)在步驟S2以后輸入指令(e)來(lái)選擇ROI識(shí)別裝置,則可以改變ROI識(shí)別裝置。為響應(yīng)這個(gè)指令,ROI控制單元120在步驟S4中選擇不同于當(dāng)前所選ROI識(shí)別裝置的一個(gè)ROI識(shí)別裝置,并且管理新的所選ROI識(shí)別裝置來(lái)重新執(zhí)行ROI識(shí)別過(guò)程并且在顯示單元104上顯示被識(shí)別的ROI。
圖6是圖解說(shuō)明用于步驟2的操作的詳細(xì)處理步驟的流程圖。
首先,在步驟S11中,ROI控制單元120設(shè)置用于控制所選ROI識(shí)別裝置(方法)的識(shí)別條件的參數(shù)值(下面描述)。參數(shù)值可以是默認(rèn)值或者先前使用并存儲(chǔ)的值。然后,在步驟S12中,ROI控制單元120管理ROI識(shí)別裝置以便于執(zhí)行ROI識(shí)別,并且管理顯示單元104來(lái)在捕獲的圖像上顯示被識(shí)別的ROI(在此時(shí)仍然是候選ROI)。
因此,用戶(hù)能夠看見(jiàn)被顯示的候選ROI,然后如果必要或者需要,能夠輸入指令(b)、(c)和/或者(d)。更明確的,當(dāng)識(shí)別出多個(gè)候選ROI的時(shí)候,例如,用戶(hù)可以在顯示單元104的屏幕上利用光標(biāo)來(lái)指定必須或者想要的區(qū)域和不需要的區(qū)域(指令(b))。同樣的,用戶(hù)可以使用顯示在顯示單元104的屏幕上的放大/縮小指示器來(lái)指示被識(shí)別的候選ROI中所需區(qū)域的放大/縮小,或者使用光標(biāo)指示每個(gè)候選ROI的放大/縮小(指令(c))。同樣的,用戶(hù)可以利用顯示在顯示單元104上的參數(shù)值指示器來(lái)指示控制ROI識(shí)別條件的參數(shù)值的增加或者減少(指令(d))。
在步驟S14中,ROI控制單元120確定從操作單元124輸入的指令的類(lèi)型,并且依據(jù)確定的指令來(lái)執(zhí)行適當(dāng)?shù)牟僮鳌?br>
在輸入?yún)^(qū)域選擇指令(b)的情況中,過(guò)程進(jìn)行到步驟S15,其中ROI控制單元120使得用戶(hù)從多個(gè)被識(shí)別的候選ROI中所選擇的區(qū)域失效。因此,當(dāng)識(shí)別出多個(gè)候選ROI的時(shí)候用戶(hù)能夠使得優(yōu)選的候選ROI生效??梢灾貜?fù)執(zhí)行這個(gè)過(guò)程,并且在每次執(zhí)行這個(gè)過(guò)程以后,在步驟S12中重新布置顯示。
在輸入?yún)^(qū)域放大/縮小指令(c)的情況中,過(guò)程進(jìn)行到步驟S16,其中ROI控制單元120依據(jù)這個(gè)指令來(lái)放大或者縮小候選ROI。因此,用戶(hù)能夠按需要或必要放大或者縮小自動(dòng)識(shí)別的候選ROI。可以重復(fù)執(zhí)行這個(gè)過(guò)程,在每次執(zhí)行這個(gè)過(guò)程以后,在步驟S12中重新布置顯示。
在輸入?yún)?shù)改變指令(d)的情況中,過(guò)程進(jìn)行到步驟S17,其中ROI控制單元120改變參數(shù)值,并且管理ROI識(shí)別裝置來(lái)再次執(zhí)行識(shí)別過(guò)程以便于在步驟S12中在顯示單元104上顯示新識(shí)別出的候選ROI。
接下來(lái),將描述在ROI識(shí)別單元122中執(zhí)行的每個(gè)ROI識(shí)別裝置和有關(guān)每個(gè)ROI識(shí)別裝置的各自的參數(shù)。
參考圖7,依據(jù)ROI識(shí)別裝置(1),在步驟S21中在圖像數(shù)據(jù)上執(zhí)行面部部分識(shí)別過(guò)程以便于特別考慮人的眼睛、鼻子、嘴和其他面部特征并且從圖像中檢測(cè)人的面部的中心區(qū)域。然后在步驟S22中,檢測(cè)具有顯著對(duì)比并且包括中心區(qū)域(基本區(qū)域)的范圍,并且在步驟S23中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,顯著對(duì)比的確定閥值和/或者范圍的放大程度符合這個(gè)ROI識(shí)別裝置(1)的參數(shù)值。此外,當(dāng)通過(guò)場(chǎng)景選擇開(kāi)關(guān)將“人”選作場(chǎng)景類(lèi)型時(shí),選擇這個(gè)ROI識(shí)別裝置(1)。同樣的,在步驟S22中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
參考圖8,依據(jù)ROI識(shí)別裝置(2),在步驟S31中檢測(cè)高頻成分集中的圖像區(qū)域。然后在步驟S32中,檢測(cè)具有顯著對(duì)比并且包括這個(gè)區(qū)域(基本區(qū)域)的范圍,并且在步驟S33中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,高頻成分檢測(cè)閥值、顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(2)的參數(shù)值。此外,在步驟S32中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
參考圖9,依據(jù)ROI識(shí)別裝置(3),在步驟S41中檢測(cè)其中集中了具有諸如條碼或者字母等明顯對(duì)比圖案的圖像區(qū)域。然后在步驟S42中,檢測(cè)具有顯著對(duì)比并且包括這個(gè)區(qū)域(基本區(qū)域)的范圍,并且在步驟S43中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,顯著對(duì)比確定檢測(cè)閥值、顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(3)的參數(shù)值。此外,在步驟S42中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
參考圖10,依據(jù)ROI識(shí)別裝置(4),在步驟S51中識(shí)別位于圖像中心部分的目標(biāo)。然后,在步驟S52中,檢測(cè)具有顯著對(duì)比并且包括所識(shí)別的目標(biāo)區(qū)域(基本區(qū)域)的范圍。然后,在步驟S53中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,顯著對(duì)比確定檢測(cè)閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(4)的參數(shù)值。此外,在步驟S52中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
參考圖11,依據(jù)ROI識(shí)別裝置(5),在步驟S61中檢測(cè)具有顯著對(duì)比并且包括用在聚焦確定中的最終AF評(píng)估區(qū)域(由圖像捕獲單元100作為AF信息提供)的范圍。然后在步驟S62中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(5)的參數(shù)值。此外,在步驟S61中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。同樣的,為了在記錄介質(zhì)110中記錄的圖像上使用ROI識(shí)別裝置(5),可以在相應(yīng)的圖像文件的頭部上記錄捕獲這個(gè)圖像時(shí)所獲得的AF信息。
參考圖12,依據(jù)ROI識(shí)別裝置(6),在步驟S71中檢測(cè)具有顯著對(duì)比并且包括用在最佳曝光確定中的最終AE評(píng)估區(qū)域(由圖像捕獲單元100作為AE信息提供)的范圍。然后在步驟S72中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(6)的參數(shù)值。此外,在步驟S71中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。同樣的,為了在記錄介質(zhì)110中記錄的圖像上使用ROI識(shí)別裝置(6),可以在相應(yīng)的圖像文件的頭部上記錄捕獲這個(gè)圖像時(shí)所獲得的AE信息。
參考圖13,依據(jù)ROI識(shí)別裝置(7),在步驟S81檢測(cè)在待處理圖像中能夠檢測(cè)到移動(dòng)的區(qū)域,其中移動(dòng)的檢測(cè)基于諸如待處理圖像和恰好在圖像捕獲操作之前的空閑圖像之間的對(duì)比。然后在步驟S82中,檢測(cè)具有顯著對(duì)比并且包括這個(gè)區(qū)域(基本區(qū)域)的范圍。然后在步驟S83中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,移動(dòng)確定閥值、顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(7)的參數(shù)值。此外,在步驟S82中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。當(dāng)通過(guò)場(chǎng)景選擇開(kāi)關(guān)將“移動(dòng)目標(biāo)”選擇作為場(chǎng)景類(lèi)型的時(shí)候選擇這個(gè)ROI識(shí)別裝置。同樣的,為了在記錄介質(zhì)110中記錄的靜止圖像上使用ROI識(shí)別裝置(7),可以在圖像捕獲階段中檢測(cè)發(fā)生移動(dòng)的范圍并將這個(gè)信息記錄在相應(yīng)的圖像文件的頭部上。
參考圖14,依據(jù)用在閃光圖像捕獲操作中的ROI識(shí)別裝置(8),在步驟S91中檢測(cè)比恰好在打開(kāi)閃光之前的空閑圖像中對(duì)應(yīng)區(qū)域顯著更亮的待處理圖像(例如,人或者一些其他目標(biāo))區(qū)域。然后在步驟S92中,檢測(cè)具有顯著對(duì)比并且包括這個(gè)區(qū)域(基本區(qū)域)的范圍,并且在步驟S93中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,用于確定在所處理圖像中比在空閑圖像中更亮的區(qū)域的閥值、顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(8)的參數(shù)值。此外,在步驟S92中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
參考圖15,依據(jù)ROI識(shí)別裝置(9),在步驟S101中檢測(cè)圖像的高亮區(qū)域,然后在步驟S102中,檢測(cè)具有顯著對(duì)比并且包括這個(gè)區(qū)域(基本區(qū)域)的范圍。然后,在步驟S103中,輕微放大檢測(cè)到的范圍并且將這個(gè)放大的范圍識(shí)別為候選ROI。在這里,高亮確定閥值、顯著對(duì)比確定閥值和/或者范圍的放大程度都符合這個(gè)ROI識(shí)別裝置(9)的參數(shù)值。此外,在步驟S102中檢測(cè)到的范圍可以被用作候選ROI而不用被放大。
ROI識(shí)別裝置(10)用與ROI識(shí)別裝置(9)的方式相同的方式來(lái)識(shí)別區(qū)域。然而,ROI識(shí)別裝置(10)還從ROI識(shí)別裝置(9)所檢測(cè)到的高亮區(qū)域中減去一個(gè)高亮區(qū)域部分,所減去的高亮區(qū)域部分(例如,對(duì)應(yīng)于天空的區(qū)域)超過(guò)預(yù)定值并且位于圖像的預(yù)定區(qū)域(例如,上部區(qū)域),并且將所得結(jié)果的區(qū)域識(shí)別為候選ROI。
現(xiàn)在,回過(guò)來(lái)參考圖5,將描述在給定用于在靜止圖像捕獲模式中自動(dòng)設(shè)置ROI的指令(f)的基礎(chǔ)上執(zhí)行的操作。
在這個(gè)情況中,在步驟S1中,ROI控制單元120選擇用戶(hù)所預(yù)先指定的ROI識(shí)別裝置或者對(duì)應(yīng)于場(chǎng)景選擇開(kāi)關(guān)所選場(chǎng)景類(lèi)型的ROI識(shí)別裝置。在步驟S2中,對(duì)每個(gè)捕獲圖像通過(guò)ROI識(shí)別裝置來(lái)識(shí)別候選ROI。對(duì)用于ROI識(shí)別過(guò)程的參數(shù)值,如果存儲(chǔ)了用于所選ROI識(shí)別裝置的參數(shù)值,則使用存儲(chǔ)的參數(shù)值,如果沒(méi)有存儲(chǔ)用于所選識(shí)別裝置的參數(shù)值,則將默認(rèn)參數(shù)值設(shè)置給ROI識(shí)別裝置。然后,在步驟S5中,不用等待來(lái)自用戶(hù)的確認(rèn)指令,將所識(shí)別的候選ROI確認(rèn)為ROI,并且將這個(gè)ROI信息設(shè)置給壓縮/解壓縮單元106和寫(xiě)/讀單元108。此外,在這個(gè)情況中,盡管可以進(jìn)行ROI識(shí)別裝置的改變(步驟4),但是不可以進(jìn)行區(qū)域的選擇(圖6,步驟S15)、區(qū)域的放大/縮小(圖6,步驟S16)和參數(shù)的改變(圖6,步驟S17)。
另一方面,當(dāng)給定了用于在移動(dòng)圖像捕獲模式中自動(dòng)設(shè)置ROI的指令(g)的時(shí)候,執(zhí)行與在響應(yīng)用于在靜止圖像捕獲模式中自動(dòng)設(shè)置ROI的指令(f)所執(zhí)行的相同的操作,不同之處僅在于對(duì)于所捕獲的移動(dòng)圖像相應(yīng)的每個(gè)捕獲幀的每張圖像,ROI被自動(dòng)設(shè)置。此外,對(duì)于移動(dòng)圖像數(shù)據(jù),每個(gè)所捕獲的幀的圖像被單獨(dú)壓縮,像靜止圖像一樣,在此之后全部幀的圖像數(shù)據(jù)以移動(dòng)JPEG 2000(ISO/IEC FCD 15444-1)文件格式記錄在記錄介質(zhì)110上。
當(dāng)在圖像重放模式中給定執(zhí)行涉及用戶(hù)的ROI設(shè)定的指令(a)時(shí),用戶(hù)可以干預(yù)設(shè)置靜止圖像或者移動(dòng)圖像的每幀圖像的ROI,所述圖像的ROI通過(guò)無(wú)損壓縮或者低比例壓縮并且記錄在記錄介質(zhì)110上。下面參考圖5描述在這種情況中執(zhí)行的操作。
在示范性的圖像重放模式中,可以在顯示單元104上顯示已經(jīng)記錄在記錄介質(zhì)110上的多個(gè)圖像的縮略圖或者列表,并且用戶(hù)能夠選擇所需圖像。
當(dāng)選擇了特定圖像時(shí),寫(xiě)/讀單元108讀出對(duì)應(yīng)的圖像文件并且通過(guò)壓縮/解壓縮單元106來(lái)解壓縮。然后在存儲(chǔ)單元102中存儲(chǔ)被解壓縮的圖像數(shù)據(jù),并在顯示單元104上顯示圖像。然后,在步驟S2中,借助所選的ROI識(shí)別裝置來(lái)識(shí)別ROI。剩下的操作與圖像捕獲操作隨后的ROI設(shè)置操作完全相同。然而,不可使用ROI識(shí)別裝置(5)和/或者ROI識(shí)別裝置(6),除非在對(duì)應(yīng)的圖像文件的頭部中描述了AF信息和/或者AE信息。同樣的,在重放靜止圖像的情況中,不可使用ROI識(shí)別裝置(7)和ROI識(shí)別裝置(8)。在重放移動(dòng)圖像的情況中,因?yàn)槟軌蛟谙噜弾膱D像之間檢測(cè)移動(dòng),所以可以使用ROI識(shí)別裝置(7),但是不可使用ROI識(shí)別裝置(8)。
如果在重放的圖像中已經(jīng)設(shè)置了ROI,則將在對(duì)應(yīng)的圖像文件的頭部中描述這個(gè)ROI信息。因此,ROI控制單元120管理顯示單元104以便于依據(jù)這個(gè)ROI信息在圖像上顯示ROI。
在上述示范性操作中,使用了ROI識(shí)別單元122。可替代的,還能夠?qū)崿F(xiàn)ROI識(shí)別方法而不用利用ROI識(shí)別單元122。下面參考圖5描述這種操作的示例。
當(dāng)在步驟S1或者S4中選擇上述ROI識(shí)別方法而不用使用ROI識(shí)別單元122的時(shí)候,ROI控制單元120管理壓縮/解壓縮單元106以便于在步驟S2中在圖像數(shù)據(jù)上執(zhí)行無(wú)損或者低比例壓縮過(guò)程。例如,可以在分解級(jí)別1時(shí)在小波系數(shù)上進(jìn)行壓縮過(guò)程。然后,通過(guò)壓縮/解壓縮單元106來(lái)獲得每個(gè)板塊數(shù)據(jù)中每個(gè)數(shù)據(jù)包的大小(代碼數(shù)量),并且將其與確定閾值進(jìn)行比較。然后,將對(duì)應(yīng)于具有比確定的閥值更大的尺寸的數(shù)據(jù)包的區(qū)域(分區(qū))識(shí)別為ROI。換句話(huà)說(shuō),依據(jù)這個(gè)操作,ROI控制單元120與壓縮/解壓縮單元106合作來(lái)起到ROI識(shí)別裝置的功能??商娲模梢元?dú)立于ROI控制單元120設(shè)置用于執(zhí)行ROI識(shí)別的方法。在步驟S6中,將ROI信息設(shè)置到壓縮/解壓縮單元106以便于執(zhí)行壓縮過(guò)程。同樣的,將ROI信息設(shè)置到寫(xiě)/讀單元108以便于在將被寫(xiě)在記錄介質(zhì)110上的圖像文件的頭部中描述這個(gè)信息。
此外,在這個(gè)ROI識(shí)別方法中,也可能進(jìn)行涉及用戶(hù)的ROI識(shí)別。在這樣的情況中,首先在顯示單元104上顯示所識(shí)別的ROI。在這里,用戶(hù)能夠指令諸如區(qū)域的選擇(對(duì)應(yīng)于圖6的步驟S15)、區(qū)域的放大/縮小(對(duì)應(yīng)于圖6的步驟S16)和/或者數(shù)據(jù)包大小確定閥值的改變(對(duì)應(yīng)于圖6的步驟S17)。然后,當(dāng)用戶(hù)輸入完成指令的時(shí)候,ROI控制單元120確認(rèn)ROI并且設(shè)置ROI信息(圖5的步驟S5)。
此外可替代的,可以設(shè)置壓縮/解壓縮單元106來(lái)執(zhí)行壓縮過(guò)程而不用考慮ROI,并且可以重寫(xiě)具有超出數(shù)據(jù)包大小確定閥值的尺寸的數(shù)據(jù)包的頭部以便于將對(duì)應(yīng)于這個(gè)數(shù)據(jù)包的分區(qū)(precinct)設(shè)置成ROI。
從上述描述中很容易看出,還可以通過(guò)在諸如個(gè)人計(jì)算機(jī)或者微機(jī)這樣的計(jì)算機(jī)中執(zhí)行的程序來(lái)實(shí)現(xiàn)如圖1中所示的ROI控制單元120、ROI識(shí)別單元122和部分或者全部壓縮/解壓縮單元106(和/或者它們的功能和/或者過(guò)程)。這樣的程序和在其上記錄程序的各種記錄(存儲(chǔ))介質(zhì)也都包括在本發(fā)明的范圍中。同樣的,依據(jù)本發(fā)明的ROI設(shè)置設(shè)備和方法不局限于在諸如數(shù)字照相機(jī)這樣的電子照相機(jī)設(shè)備和它的方法中實(shí)現(xiàn);相反,本發(fā)明可以應(yīng)用到能夠通過(guò)圖像壓縮記錄圖像的各種其他類(lèi)型的圖像處理設(shè)備。
依據(jù)本發(fā)明,諸如電子照相機(jī)設(shè)備這樣的圖像處理設(shè)備能夠減少圖像成幀中的限制,同時(shí)還能減少完全手動(dòng)操作所產(chǎn)生的麻煩。此外,本發(fā)明還可以適合于各種場(chǎng)景和用戶(hù)偏好,能夠?qū)崿F(xiàn)適用于諸如靜止圖像的連續(xù)捕獲或者移動(dòng)圖像的捕獲等各種操作的實(shí)用的ROI設(shè)置功能。
本申請(qǐng)基于并且要求早先于2002年8月9日申請(qǐng)的日本優(yōu)先申請(qǐng)No.2002-232475中主張的權(quán)利,該申請(qǐng)的全部?jī)?nèi)容融入本文作為參考。
權(quán)利要求
1.ROI設(shè)置設(shè)備包括多個(gè)ROI識(shí)別裝置,每個(gè)都適用于依據(jù)預(yù)定的方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果;和ROI控制單元,它適用于從多個(gè)ROI識(shí)別裝置中選擇某ROI識(shí)別裝置并且基于通過(guò)所選ROI識(shí)別裝置獲得的識(shí)別結(jié)果設(shè)置ROI信息。
2.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中ROI控制單元依據(jù)來(lái)自用戶(hù)的指令來(lái)選擇ROI識(shí)別裝置。
3.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中ROI控制單元依據(jù)用戶(hù)所選場(chǎng)景類(lèi)型來(lái)選擇ROI識(shí)別裝置。
4.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中ROI控制單元根據(jù)所選區(qū)域設(shè)置ROI信息,該所選區(qū)域從多個(gè)由所選ROI識(shí)別裝置所識(shí)別的區(qū)域中選擇,該所選區(qū)域依據(jù)用戶(hù)的指令來(lái)選擇。
5.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中ROI控制單元依據(jù)來(lái)自用戶(hù)的指令來(lái)改變由所選ROI識(shí)別裝置所識(shí)別的區(qū)域的大小。
6.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置每個(gè)都包括識(shí)別條件并且ROI控制單元依據(jù)來(lái)自用戶(hù)的指令來(lái)改變所選ROI識(shí)別裝置的識(shí)別條件。
7.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)包括面部的圖像數(shù)據(jù)的區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
8.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)高頻成分集中的圖像數(shù)據(jù)區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
9.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)集中了具有明顯對(duì)比圖案的圖像數(shù)據(jù)區(qū)域并且將上述區(qū)域作為基本區(qū)域以便于識(shí)別ROI。
10.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)包括目標(biāo)的圖像數(shù)據(jù)中心部分的區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
11.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于將用在圖像數(shù)據(jù)的圖像捕獲操作中的AF評(píng)估區(qū)域用作基本圖像以便于識(shí)別ROI。
12.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于將用在圖像數(shù)據(jù)的圖像捕獲操作中的AE評(píng)估區(qū)域用作基本圖像以便于識(shí)別ROI。
13.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)其中發(fā)生移動(dòng)的圖像數(shù)據(jù)區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
14.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于提取比恰好在圖像捕獲操作之前獲得的監(jiān)視圖像數(shù)據(jù)的對(duì)應(yīng)區(qū)域顯著明亮的圖像數(shù)據(jù)區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
15.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)圖像數(shù)據(jù)的高亮度區(qū)域并且將上述區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
16.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于檢測(cè)圖像數(shù)據(jù)的高亮度區(qū)域,從上述區(qū)域減去在圖像數(shù)據(jù)預(yù)定部分的高亮度區(qū)域部分,并將所得結(jié)果區(qū)域用作基本區(qū)域以便于識(shí)別ROI。
17.如權(quán)利要求1所述ROI設(shè)置設(shè)備,其中多個(gè)ROI識(shí)別裝置中至少有一個(gè)適用于基于圖像數(shù)據(jù)的壓縮數(shù)據(jù)的數(shù)據(jù)包大小識(shí)別ROI。
18.電子照相機(jī)設(shè)備,包括ROI設(shè)置裝置,具有多個(gè)ROI識(shí)別裝置,每個(gè)都適用于依據(jù)預(yù)定的方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果;以及ROI控制單元,適用于從多個(gè)ROI識(shí)別裝置中選擇ROI識(shí)別裝置,并且根據(jù)由所選ROI識(shí)別裝置獲得的識(shí)別結(jié)果來(lái)設(shè)置ROI信息。
19.管理計(jì)算機(jī)的程序,用來(lái)實(shí)現(xiàn)如下功能多種ROI識(shí)別裝置,用來(lái)依據(jù)預(yù)定的ROI識(shí)別方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI,并且由此獲得識(shí)別結(jié)果;以及ROI控制單元,用來(lái)從多種ROI識(shí)別裝置中選擇某種ROI識(shí)別裝置,并且根據(jù)由所選ROI識(shí)別裝置所獲得的識(shí)別結(jié)果來(lái)設(shè)置ROI信息,所述ROI識(shí)別裝置和所述ROI控制單元在ROI設(shè)置設(shè)備中實(shí)現(xiàn)。
20.計(jì)算機(jī)可讀記錄介質(zhì),適用于存儲(chǔ)程序,該程序用于管理計(jì)算機(jī)以實(shí)現(xiàn)如下功能多種ROI識(shí)別裝置,用來(lái)依據(jù)預(yù)定的ROI識(shí)別方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI,并且由此獲得識(shí)別結(jié)果;以及ROI控制單元,用來(lái)從多種ROI識(shí)別裝置中選擇某種ROI識(shí)別裝置,并且根據(jù)由所選ROI識(shí)別裝置所獲得的識(shí)別結(jié)果來(lái)設(shè)置ROI信息,所述ROI識(shí)別裝置和所述ROI控制單元在ROI設(shè)置設(shè)備中實(shí)現(xiàn)。
21.ROI設(shè)置方法,包括第一步,從多種ROI識(shí)別方法選擇一種ROI識(shí)別方法;第二步,依據(jù)第一步所選ROI識(shí)別方法,識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果;和第三步,根據(jù)第二步所獲得的識(shí)別結(jié)果,設(shè)置ROI信息。
22.如權(quán)利要求21所述ROI設(shè)置方法,其中第一步包括以下步驟依據(jù)來(lái)自用戶(hù)的指令來(lái)選擇ROI識(shí)別方法。
23.如權(quán)利要求21所述ROI設(shè)置方法,其中第一步包括以下步驟依據(jù)用戶(hù)所選場(chǎng)景類(lèi)型來(lái)選擇ROI識(shí)別方法。
24.如權(quán)利要求21所述ROI設(shè)置方法,其中第三步包括以下步驟根據(jù)從第二步識(shí)別的多個(gè)區(qū)域中選擇的區(qū)域,設(shè)置ROI信息,上述被選區(qū)域依據(jù)來(lái)自用戶(hù)的指令選擇。
25.如權(quán)利要求21所述ROI設(shè)置方法,其中第二步包括以下步驟依據(jù)來(lái)自用戶(hù)的指令來(lái)改變由所選ROI識(shí)別裝置所識(shí)別的區(qū)域的大小。
26.如權(quán)利要求21所述ROI設(shè)置方法,其中多種ROI識(shí)別方法中的每一種都包括識(shí)別條件,并且第二步包括依據(jù)來(lái)自用戶(hù)的指令來(lái)改變識(shí)別條件的步驟。
全文摘要
提供了包括ROI識(shí)別單元和ROI控制單元的ROI設(shè)置設(shè)備。ROI識(shí)別單元包括用于依據(jù)各種方法來(lái)識(shí)別圖像數(shù)據(jù)的ROI并且由此獲得識(shí)別結(jié)果的多個(gè)ROI識(shí)別裝置。ROI控制單元從多個(gè)ROI識(shí)別裝置中選擇一個(gè)ROI識(shí)別裝置并且根據(jù)識(shí)別的結(jié)果來(lái)設(shè)置ROI信息。依據(jù)用戶(hù)通過(guò)操作單元所輸入的指令或者由圖像捕獲單元的場(chǎng)景選擇開(kāi)關(guān)所選場(chǎng)景類(lèi)型來(lái)選擇ROI識(shí)別裝置。ROI控制單元執(zhí)行例如對(duì)由ROI識(shí)別裝置所識(shí)別的ROI的選擇、放大或者縮小,或者依據(jù)用戶(hù)通過(guò)操作單元輸入的各指令來(lái)改變ROI識(shí)別條件等的操作。
文檔編號(hào)H04N7/26GK1496110SQ0315868
公開(kāi)日2004年5月12日 申請(qǐng)日期2003年8月9日 優(yōu)先權(quán)日2002年8月9日
發(fā)明者牧隆史, 一, 池邊慶一, 作山宏幸, 幸, 児玉卓, 子, 則, 山城郁子, 夫, 矢野隆則, 高橋彰, 井上隆夫 申請(qǐng)人:株式會(huì)社理光