用于基于感興趣的區域的圖像編碼的技術的制作方法
【技術領域】
[0001]本文所述的實施例一般涉及在壓縮圖像中使用捕獲的圖像的視場(field ofview)內的感興趣的區域。
【背景技術】
[0002]用其捕獲、存儲和數字式查看靜止和運動視頻成像(imagery) 二者的增加的顏色深度和分辨率已經使得數字攝影能夠甚至以專業水平匹敵基于膠片的攝影的質量,在所述專業水平中清晰度和顏色再現的預期被提高。然而,顏色深度和分辨率二者中的增加還導致對于每個圖像的增加的數據大小。這造成對于存儲設備的增加的存儲容量需求以及對于包括這樣的圖像的數據交換的增加的數據傳遞速率需求二者。
[0003]在對這些增加的需求的應答中,已經越來越多地將重點放在圖像壓縮技術的領域中,所述圖像壓縮技術對單獨的圖像或者運動視頻的圖像集進行編碼,以減小其數據大小。一些圖像壓縮技術采用無損編碼算法,其中圖像數據的通常觀察到的特性被用來以不丟棄針對圖像的任何像素的任何數據的方式減小數據大小。雖然無損編碼算法使得圖像數據能夠在隨后解壓縮時被忠實地再現,但它們典型地實現只不過減小圖像的數據大小大約一半。
[0004]其它圖像壓縮技術采用有損編碼算法,其中考慮人類視覺的方面,以丟棄通過人眼和/或視覺皮層與該數據的其它部分相比較少貢獻于該圖像的感知的圖像的數據部分。在本質上,存在對被認為與其它數據相比在缺失時較少有可能被注意到的數據的選擇性移除。這樣的有損編碼算法通常能夠實現相當更大程度的壓縮,有時將圖像的數據大小減小至其原始數據大小的大約1/10。
[0005]然而,隨著分辨率和顏色深度二者繼續增加,壓縮程度的增加已被認為是合期望的。是關于這些和其它考慮而需要本文所述的實施例的。
【附圖說明】
[0006]圖1圖示在計算設備之間的交互的第一實施例的不同部分。
[0007]圖2A和2B圖示圖1的實施例的可能實現方式中的圖像捕獲的方面。
[0008]圖3A和3B圖示圖1的實施例的可能實現方式中的圖像編碼的方面。
[0009]圖4圖示圖1的實施例的一部分。
[0010]圖5圖示圖1的實施例的變型的方面。
[0011]圖6圖示第一邏輯流的實施例。
[0012]圖7圖示第二邏輯流的實施例。
[0013]圖8圖示第三邏輯流的實施例。
[0014]圖9圖示處理架構的實施例。
【具體實施方式】
[0015]各種實施例一般目的在于在圖像捕獲期間確定的感興趣的區域(ROI)的使用,以增強圖像的壓縮來用于存儲和/或傳輸。指示在捕獲圖像的時間處或大約捕獲圖像的時間已知的圖像的感興趣的區域的邊界的數據被存儲在捕獲設備內。隨后在表示所捕獲的圖像的數據的壓縮期間使用感興趣的區域的這些邊界的指示,以使得感興趣的區域內的圖像的部分的壓縮將與感興趣的區域之外的圖像的另一個部分不同地被執行。
[0016]更具體地,使用一個或多個參數來壓縮感興趣的區域之外的所捕獲的圖像的一部分,所述一個或多個參數經選擇以實現更高程度的壓縮,這是以在隨后解壓縮和查看時該部分中的圖像質量為代價的。相反,使用一個或多個參數來壓縮感興趣的區域內的所捕獲的圖像的部分,所述一個或多個參數經選擇來以壓縮程度為代價實現該部分中更高的圖像質量,以用于隨后的解壓縮和查看。采用在感興趣的區域內的所捕獲的圖像的部分與感興趣的區域之外的所捕獲的圖像的一部分的壓縮中的這樣的差異使得能夠實現對表示感興趣的區域之外的部分的數據的更進取性的壓縮以實現更小的總體數據大小,而同時仍然允許感興趣的區域維持較高的圖像質量。
[0017]在捕獲圖像的時間處或大約捕獲圖像的時間確定圖像的感興趣的區域的邊界。那些邊界可以由捕獲設備作為實現自動化對焦形式的部分而自動確定,或者捕獲設備的控制裝置可以被操作以指定那些邊界。還應當指出的是:在捕獲的圖像中可以存在多于一個感興趣的區域,其各自具有其自己的邊界。此外,應當指出的是:感興趣的區域的這樣的使用不限于單個或“靜止”圖像的捕獲,因為可以針對在運動視頻的捕獲中所捕獲的幀而指定一個或多個感興趣的區域。
[0018]預想到的是,至少在一些實施例中,圖像的捕獲以及表示該圖像的數據的壓縮編碼二者都由捕獲設備執行。然而,其它實施例是可能的,其中捕獲設備被拆分成兩個部分或設備,捕獲圖像的第一部分或設備和采用壓縮編碼算法的第二部分或設備,所述壓縮編碼算法使用指示感興趣的區域的邊界的數據以壓縮表示所捕獲的圖像的數據,其二者都是從第一設備接收的。
[0019]一般地參考本文所用的記號和命名法,可以在計算機或計算機網絡上執行的程序過程方面呈現隨后的詳細描述的部分。這些過程性描述和表示由本領域技術人員用來將他們的工作的實質最有效地傳達給本領域其他技術人員。過程在這里并且通常被認為是導致所期望的結果的操作的自相一致的序列。這些操作是需要物理量的物理操縱的那些。通常,盡管不是必要地,這些量取能夠被存儲、傳遞、組合、比較和以其它方式操縱的電學、磁性或光學信號的形式。主要由于普遍使用的原因,將這些信號稱為位、值、元素、符號、字符、項、數字等等有時經證明是方便的。然而,應當指出的是,所有這些和類似的術語將與適當的物理量相關聯,并且僅僅是應用于那些量的方便的標簽。
[0020]此外,經常在通常與由人類操作員執行的智力操作相關聯的術語(諸如添加或比較)中提及這些操縱。然而,在形成一個或多個實施例的部分的本文所述的任何操作中,沒有任何這樣的人類操作員的能力是必要的,或者是大多數情況下合期望的。相反,這些操作是機器操作。用于執行各種實施例的操作的有用機器包括通用數字計算機,所述通用數字計算機如由存儲在內的根據本文的教導所編寫的計算機程序而被選擇性地激活或配置,和/或包括為了所需目的而特別構造的裝置。各種實施例還涉及用于執行這些操作的裝置或系統。這些裝置可以為了所需目的而被特別構造,或者可以合并通用計算機。用于各種的這些機器的所需結構將從給出的描述中顯現。
[0021]現在對附圖作出參考,其中同樣的參考標號貫穿全文用于指代同樣的元件。在以下的描述中,為了解釋的目的,闡述眾多具體細節,以便提供對其的透徹理解。然而,可以實踐新穎的實施例而沒有這些具體細節可以是顯然的。在其它實例中,以框圖形式示出公知的結構和設備,以使得便于其描述。意圖在于覆蓋權利要求的范圍內的所有修改、等效物以及可替代方案。
[0022]圖1描繪在圖像處置系統1000的計算設備之間的交互的框圖,所述圖像處置系統1000包括:捕獲和壓縮圖像的捕獲設備200,解壓縮和查看圖像的查看設備700,并且可能包括至少暫時存儲表示如壓縮的圖像的數據的服務器500。這些計算設備200、500和700中的每一個可以是各種類型的計算設備中的任一個,包括而不限于:臺式計算機系統、數據錄入終端、膝上型計算機、上網本計算機、超級本計算機、平板計算機、手持式個人數據助理、智能電話、數碼相機、移動設備、并入到服裝中的身體佩帶的計算設備、集成到車輛中的計算設備、服務器、服務器集群、服務器農場等。
[0023]如所描繪的,這些計算設備200、500和700通過網絡999交換信號,所述信號傳送表示所捕獲的圖像(壓縮或否)的數據連同指示一個或多個感興趣的區域的數據。然而,這些計算設備中的一個或多個可以交換與圖像或感興趣的區域完全無關的其它數據。在各種實施例中,網絡999可以是可能限于在單個建筑物或其它相對有限的區域內擴展的單個網絡、可能擴展相當大距離的所連接的網絡的組合,和/或可以包括因特網。因此,網絡999可以基于可以通過其交換信號的各種通信技術(或其組合)中的任一個,包括而不限于:采用電學和/或光學傳導的線纜敷設的有線技術,以及采用紅外、射頻或其它形式的無線傳輸的無線技術。還應當指出的是:這樣的數據可以可替換地至少在計算設備200和700之間經由可移除的存儲裝置(例如基于FLASH (閃速)存儲器技術的固態存儲裝置,光盤介質等)的直接耦合在對每一個不同的時間處被交換。
[0024]在各種實施例中,捕獲設備200合并以下中的一個或多個:處理器元件250、存儲裝置260、控制裝置220、顯示器280、光學器件110、距離傳感器112、圖像傳感器115以及將捕獲設備200耦合到網絡999的接口 390。存儲裝置260存儲控制例程240、ROI數據132、捕獲的數據135和壓縮的數據335中的一個或多個。圖像傳感器115可以基于用于捕獲場景圖像的各種技術中的任一個,包括而不限于電荷耦合器件(CCD)半導體技術。光學器件110由一個或多個透鏡、反射鏡、棱鏡、光閘(shutter)、濾光器等組成。光學器件110插入在圖像傳感器115和場景之間,使得圖像傳感器被提供有將通過光學器件110捕獲的場景的視野。因此,從場景發出的光通過光學器件110而被傳送到圖像傳感器115。光學器件110和圖像傳感器115的特性一起協作以限定捕獲設備200的視場。
[0025]在一些實施例中,光學器件110可以提供可控地變更光學器件110傳送到圖像傳感器115的場景的光的焦距的能力,這可以對應地變更視場。在這樣的實施例中,光學器件110可以合并可移動的和/或在其形狀上可變更的一個或多個透鏡和/或反射表面。而且,在這樣的實施例中,捕獲設備200可以合并將結合光學器件110使用的距離傳感器112,以使能焦距的自動化控制。如果存在的話,距離傳感器112可以基于用于至少確定視場中至少一個對象自捕獲設備200的距離的各種技術中的任一個。在一些實施例中,可以使用超聲輸出和接收的組合,其中可以通過朝著該對象投射超聲聲波并確定對于那些聲波在由該對象反射之后返回所需的時間量來確定至少這樣的距離。在其它實施例中,可以以類似方式采用紅外光的射束來代替超聲聲波。盡管如此,仍然有確定對象自捕獲設備200的距離的其它技術將由本領域技術人員想起。
[0026]在執行控制例程240的指令的序列中,使得處理器元件250等待觸發信號,所述觸發信號向捕獲設備200傳送命令,以至少操作光學器件110來自動調節焦距和/或至少操作圖像傳感器115來捕獲圖像。觸發信號可以是從控制裝置220接收的,并且表示由捕獲設備200的操作者對控制裝置220的直接操作,或者觸發信號可以是從另一計算設備(未示出)接收的,可能地經由網絡999。在圖2A和2B中描繪這樣的自動化對焦和圖像的捕獲的方面。
[0027]轉向圖2A,在支持自動化對焦的一些實施例中,處理器元件250操作距離傳感器112以確定在捕獲設備200和通過光學器件110的圖像傳感器115的視場815中的對象之間的距離。處理器元件250然后操作光學器件110以針對該確定的距離而調節焦距。在一些可能的實現方式中,可以操作距離傳感器112,以確定從捕獲設備200到最接近捕獲設備200的視場815中的對象的距離。在這樣的實現方式中,距離傳感器112可以具有用來確定在視場815中的該最接近的對象的位置和大小的一些能力,并且處理器元件250可以確定包括如由距離傳感器112檢測的視場815內的該最接近對象的至少一部分的位置的感興趣的區域812的邊界813。在其它可能的實現方式中,可以操作距離傳感器112以確定在捕獲設備