通過使用大型變換單元編碼和解碼圖像的方法和設備本申請是申請日為2010年8月13日,申請號為“201080036020.4”,標題為“通過使用大型變換單元編碼和解碼圖像的方法和設備”的發明專利申請的分案申請。技術領域示例性實施例涉及一種編碼和解碼圖像的方法和設備,更具體地說,涉及一種通過將像素域的圖像變換為頻域的系數來對圖像進行編碼和解碼的方法和設備。
背景技術:為了執行圖像壓縮,多數圖像編碼和解碼方法和設備通過將像素域的圖像變換為頻域的系數來對圖像編碼。作為頻率變換技術之一的離散余弦變換(DCT)是廣泛使用于圖像和聲音壓縮中的公知技術。使用DCT的圖像編碼方法包括:對像素域的圖像執行DCT,生成離散余弦系數,量化生成的離散余弦系數,對生成的離散余弦系數執行熵編碼。
技術實現要素:技術方案示例性實施例提供一種通過使用更有效的離散余弦變換(DCT)來對圖像進行編碼和解碼的方法和設備,還提供一種其上記錄了用于執行所述方法的程序的計算機可讀記錄介質。有益效果根據一個或多個示例性實施例,可以將變換單元設置為比預測單元大,并執行DCT,從而可有效地對圖像進行壓縮和編碼。附圖說明通過參照附圖詳細描述本發明的示例性實施例,示例性實施例的以上和其它特點將變得更清楚,其中:圖1是根據示例性實施例的圖像編碼設備的框圖;圖2是根據另一示例性實施例的圖像解碼設備的示圖;圖3是根據另一示例性實施例的層次編碼單元;圖4是根據另一示例性實施例的基于編碼單元的圖像編碼器的框圖;圖5是根據另一示例性實施例的基于編碼單元的圖像解碼器的框圖;圖6示出根據另一示例性實施例的最大編碼單元、次級編碼單元和預測單元;圖7是根據另一示例性實施例的編碼單元和變換單元的示圖;圖8A和圖8B示出根據另一示例性實施例的最大編碼單元、預測單元和變換單元的劃分形狀;圖9是根據另一示例性實施例的圖像編碼設備的框圖;圖10是變換器的示圖;圖11A到圖11C示出根據另一示例性實施例的變換單元的類型;圖12示出根據另一示例性實施例的不同變換單元;圖13是根據另一示例性實施例的圖像解碼設備的框圖;圖14是根據示例性實施例的圖像編碼方法的流程圖;圖15是根據另一示例性實施例的圖像解碼方法的流程圖。最佳實施方式根據示例性實施例的一方面,提供了一種圖像編碼方法,包括以下操作:通過選擇多個相鄰預測單元來設置變換單元;根據變換單元將所述多個相鄰預測單元變換為頻域,并生成頻率分量系數;量化頻率分量系數;對量化的頻率分量系數執行熵編碼。可基于指示大小縮減的等級的深度來執行設置變換單元的操作,所述大小縮減從當前片段或當前圖片的最大編碼單元到包括所述多個相鄰預測單元的次級編碼單元逐級執行。可通過選擇根據相同預測模式執行預測的多個相鄰預測單元來執行設置變換單元的操作。相同預測模式可以是幀間預測模式或幀內預測模式。圖像編碼方法還可包括通過對不同的變換單元重復執行上述操作來設置最佳變換單元的操作,其中,上述操作包括以下操作:通過選擇多個相鄰預測單元來設置變換單元,根據變換單元將所述多個相鄰預測單元變換為頻域并生成頻率分量系數,量化頻率分量系數并對量化的頻率分量系數執行熵編碼。根據示例性實施例的另一方面,提供了一種圖像編碼設備,包括:變換器,通過使用多個相鄰預測單元來設置變換單元,根據變換單元將所述多個相鄰預測單元變換為頻域并生成頻率分量系數;量化單元,量化頻率分量系數;熵編碼單元,對量化的頻率分量系數執行熵編碼。根據示例性實施例的另一方面,提供了一種圖像解碼方法,包括以下操作:根據變換單元對通過被變換到頻域而生成的頻率分量系數進行熵解碼;反量化頻率分量系數;將頻率分量系數反變換為像素域,并重構包括在變換單元中的多個相鄰預測單元。根據示例性實施例的另一方面,提供了一種圖像解碼設備,包括:熵解碼器,根據變換單元對通過被變換到頻域而生成的頻率分量系數進行熵解碼的;反量化單元,反量化頻率分量系數;反變換器,將頻率分量系數反變換為像素域,并重構包括在變換單元中的多個相鄰預測單元。根據示例性實施例的另一方面,提供了一種記錄了用于執行圖像編碼和解碼方法的計算機可讀記錄介質。具體實施方式在下文,將參照附圖詳細描述示例性實施例。在示例性實施例中,根據上下文,“單元”可表示或可不表示單元的大小,“圖像”可表示視頻的靜止圖像或運動圖像(即,視頻本身)。圖1是根據示例性實施例的用于編碼圖像的設備100的框圖。參照圖1,設備100包括最大編碼單元劃分單元110、編碼深度確定單元120、圖像數據編碼器130以及編碼信息編碼器140。最大編碼單元劃分單元110可基于作為最大大小的編碼單元的最大編碼單元劃分當前圖片或片段。也就是說,最大編碼單元劃分單元110可劃分當前圖片或片段以獲得至少一個最大編碼單元。根據示例性實施例,可使用最大編碼單元和深度來表示編碼單元。如上所述,最大編碼單元指示當前圖片的編碼單元中的具有最大大小的編碼單元,深度指示通過層次地減小編碼單元而獲得的次級編碼單元的大小。隨著深度增加,編碼單元可在大小上從最大編碼單元減小到最小編碼單元,其中,最大編碼單元的深度被定義為最小深度,最小編碼單元的深度被定義為最大深度。由于編碼單元的大小隨著深度增加從最大編碼單元減小,因此第k深度的次級編碼單元可包括多個第(k+n)(k和n是等于或大于1的整數)深度的次級編碼單元。根據將要編碼的圖片的大小的增加,以更大的編碼單元對圖像編碼可得到更高的圖像壓縮率。然而,如果固定采用更大的編碼單元,則考慮到連續變化的圖像特征的因素,不能高效地編碼圖像。例如,當對諸如大海或天空的平滑區域進行編碼時,編碼單元越大,壓縮率就會越增加。然而,當對諸如人物或建筑物的復雜區域進行編碼時,編碼單元越小,壓縮率就會越增加。因此,根據示例性實施例,對每個圖片或片段設置不同最大圖像編碼單元和不同最大深度。由于最大深度表示編碼單元可減小的倍數的最大數量,因此可根據最大深度不同地設置包括在最大圖像編碼單元中的每個最小編碼單元的大小。編碼深度確定單元120確定最大深度。可基于速率失真(R-D)成本的計算來確定最大深度。可為每個圖片或片段或每個最大編碼單元不同地確定最大深度。確定的最大深度被提供到編碼信息編碼器140,根據最大編碼單元的圖像數據被提供到圖像數據編碼器130。最大深度表示可包括在最大編碼單元中的具有最小大小的編碼單元(即最小編碼單元)。換句話說,最小編碼單元可被劃分為根據不同深度的具有不同大小的次級編碼單元。稍后參照圖8A到圖8B對此詳細描述。此外,可基于具有不同大小的處理單元預測或變換包括在最大編碼單元中的具有不同大小的次級編碼單元。換句話說,設備100可基于具有不同大小和不同形狀的處理單元執行用于圖像編碼的多種處理操作。為了對圖像數據進行編碼,執行諸如預測、變換和熵編碼的處理操作,其中,具有相同大小的處理單元可用于每個操作,或者具有不同大小的處理單元可用于每個操作。例如,設備100可選擇與編碼單元不同的處理單元來預測所述編碼單元。當編碼單元的大小是2N×2N(其中N是正整數)時,用于預測的處理單元可以是2N×2N、2N×N、N×2N和N×N。換句話說,可基于具有編碼單元的高和寬中的至少一個被等分為二的形狀的處理單元來執行運動預測。在下文,作為預測的基礎的處理單元被定義為“預測單元”。預測模式可以是幀內模式(intra-mode)、幀間模式(inter-mode)、跳過模式和僅對具有特定大小或形狀的預測單元執行的特定預測模式中的至少一個。例如,可僅對具有2N×2N和N×N的大小的形狀為正方形的預測單元執行幀內模式。此外,僅對具有2N×2N的大小的預測單元執行跳過模式。如果多個預測單元存在于編碼單元中,則可在對每個預測單元執行預測之后選擇具有最少編碼錯誤的預測模式。可選擇地,設備100可基于具有與編碼單元的大小不同大小的處理單元對圖像數據執行頻率變換。對于編碼單元中的頻率變換而言,可基于具有與編碼單元的大小相同的大小或比編碼單元的大小小的大小的處理單元執行頻率變換。在下文,作為頻率變換基礎的處理單元被定義為“變換單元”。頻率變換可以是離散余弦變換(DCT)或Karhunen-Loeve變換(KLT)。編碼深度確定單元120可使用基于拉格朗日乘數的RD優化來確定包括在最大編碼單元中的次級編碼單元。換句話說,編碼深度確定單元120可確定從最大編碼單元劃分的多個次級編碼單元的形狀,其中,所述多個次級編碼單元根據它們的深度具有不同的大小。圖像數據編碼器130通過基于由編碼深度確定單元120確定的劃分形狀(即,劃分最大編碼單元的形狀)對最大編碼單元進行編碼來輸出比特流。編碼信息編碼器140對與由編碼深度確定單元120確定的最大編碼單元的編碼模式有關的信息進行編碼。換句話說,編碼信息編碼器140通過對關于最大編碼單元的劃分形狀的信息、關于最大深度的信息以及關于每個深度的次級編碼單元的編碼模式的信息進行編碼來輸出比特流。關于次級編碼單元的編碼模式的信息可包括:關于次級編碼單元的預測單元的信息、關于每個預測單元的預測模式的信息以及關于次級編碼單元的變換單元的信息。由于每個最大編碼單元存在具有不同大小的次級編碼單元,并且必須為每個次級編碼單元確定關于編碼模式的信息,因此可為一個最大編碼單元確定關于至少一個編碼模式的信息。設備100可根據深度的增加通過將最大編碼單元的高和寬兩者等分為二來生成次級編碼單元。也就是說,當第k深度的編碼單元的大小是2N×2N時,第(k+1)深度的編碼單元的大小是N×N。因此,根據示例性實施例的設備100可考慮到圖像特征,基于最大編碼單元的大小和最大深度確定每個最大編碼單元的最佳劃分形狀。通過考慮到圖像特征不同地調整最大編碼單元的大小,并通過將最大編碼單元劃分為不同深度的次級編碼單元來對圖像編碼,可更有效地對具有不同分辨率的圖像進行編碼。圖2是根據示例性實施例的用于解碼的設備200的框圖。參照圖2,設備200包括圖像數據獲得單元210、編碼信息提取單元220以及圖像數據解碼器230。圖像數據獲得單元210通過解析由設備200接收的比特流來獲得根據最大編碼單元的圖像數據,并將圖像數據輸出到圖像數據解碼器230。圖像數據獲得單元210可從當前圖片或片段的頭提取關于當前圖片或片段的最大編碼單元的信息。換句話說,圖像數據獲得單元210按照最大編碼單元劃分比特流,從而圖像數據解碼器230可根據最大編碼單元對圖像數據進行解碼。編碼信息提取單元220通過解析由設備200接收的比特流來從當前圖片的頭提取關于最大編碼單元、最大深度、最大編碼單元的劃分形狀以及次級編碼單元的編碼模式的信息。關于劃分形狀的信息和關于編碼模式的信息被提供到圖像數據解碼器230。關于最大編碼單元的劃分形狀的信息可包括關于根據包括在最大編碼單元中的深度具有不同大小的次級編碼單元的信息,關于編碼模式的信息可包括關于根據次級編碼單元的預測單元的信息、關于預測模式的信息以及關于變換單元的信息。圖像數據解碼器230通過基于由編碼信息提取單元220提取的信息對每個最大編碼單元的圖像數據進行解碼來恢復當前圖片。...