本申請總體涉及圖像處理領域,尤其涉及一種降低有損壓縮圖像的壓縮失真的方法及裝置。
背景技術:
有損壓縮是采用不精確近似或部分數據丟棄來表示已經被編碼的內容的一類數據編碼方法。這種壓縮技術用于減少那些需要存儲、處理和/或發送所表示的內容的數據量。有損圖像壓縮格式有多種,例如jpeg、webp、jpegxr和hevc-msp。jpeg格式仍然是各種可選方式中最為廣泛采用的格式。
有損壓縮引入壓縮失真,特別是在其被用于低比特率/量化級中時。例如,jpeg壓縮失真是包括塊效應、振鈴效應和模糊的不同特定失真的復雜組合。當對每個塊進行編碼,而沒有考慮與相鄰塊的關聯性時,導致邊界處的不連續性時,產生塊效應。因高頻分量的粗量化發生邊緣的振鈴效應。因高頻分量的丟失發生模糊。
用于消除失真的現有算法可被分為基于去塊效應的方法和基于復原的方法。基于去塊效應的方法著重于去除塊效應和振鈴效應。然而,大多數基于去塊效應的方法無法重現銳利的邊緣,并且趨于對紋理區域過度地進行平滑。基于復原的方法將壓縮操作視為失真,并提出復原算法。由于基于復原的方法傾向于直接重構原始圖像,因此銳化輸出通常伴隨著邊緣的振鈴效應和平滑區域的突兀過渡。
技術實現要素:
以下給出本公開的簡要概述,以提供一種本公開一些方面的降低有損壓縮圖像的壓縮失真的裝置。本概述不是本公開的擴展概述。它并不旨在識別本公開的關鍵或重要元素,也不旨在描述本公開特定實施例的任何范圍或權利要求的任何范圍。其唯一目的是以簡化的形式呈現本公開的一些概念,作為后文呈現的更加詳細的描述的前序。
根據本申請的實施例,公開了一種降低有損壓縮圖像的壓縮失真的裝置。裝置可以包括:特征提取設備,包括第一組濾波器,第一組濾波器被配置為從有損壓縮圖像提取塊,并將提取的塊映射為第一組高維特征向量;以及,特征增強設備,其與特征提取設備執行電通信,并且包括第二組濾波器,第二組濾波器被配置為對第一組中的每個高維特征向量進行去噪,并將去噪的高維特征向量映射為第二組高維特征向量。該裝置還包括:映射設備,其與特征增強設備電耦合,并且包括第三組濾波器,第三組濾波器被配置為將第二組中的每個高維特征向量非線性地映射為復原的分塊表示;以及,聚合設備,其與映射設備執行電通信,并且被配置為對由第二組中的所有高維特征向量映射的分塊表示進行聚合,以生成復原的清晰圖像。
在一方面,第一組濾波器可以被配置為從有損壓縮圖像提取塊,并將每個提取的塊非線性地映射為高維特征向量,所有塊的映射向量形成所述第一組高維特征向量。
在另一方面,第二組濾波器可以被配置為對第一組中的每個高維特征向量進行去噪,并且將去噪的高維特征向量非線性地映射為第二組高維特征向量。
在一方面,第一組濾波器、第二組濾波器和第三組濾波器和聚合設備可分別基于預定的第一參數、第二參數和第三參數映射向量,或者可以基于第四參數對分塊表示進行聚合。
在另一方面,裝置還包括比較設備,其可以耦合到聚合設備,并且被配置為從預定訓練集采樣得到與有損壓縮圖像相應的真實未壓縮圖像,并且比較由聚合設備接收的經過聚合復原得到的清晰圖像與相應的真實未壓縮圖像之間的不相似度,以生成重構誤差,其中,重構誤差被反向傳輸,以優化第一參數、第二參數和第三參數。
根據本申請的實施例,裝置還可以包括電耦合到比較設備的訓練集準備設備,其中,所述訓練集準備設備還包括:裁剪器,其被配置為從隨機選擇的訓練圖像隨機地裁剪出多個子圖像,以生成一組真實未壓縮子圖像;和有損壓縮子圖像生成器,其與裁剪器執行電通信,并且被配置為基于從裁剪器接收的一組真實未壓縮子圖像,生成一組有損壓縮子圖像;此外,所述訓練集準備設備還包括配對設備,其與裁剪器和有損壓縮子圖像生成器執行電通信,并且被配置為,對真實未壓縮子圖像與相應的有損壓縮子圖像進行配對;和收集器,其與配對設備執行電通信,并且被配置為收集配成對的真實未壓縮子圖像和有損壓縮子圖像以生成預定訓練集。
在一方面,所述有損壓縮子圖像生成器還包括壓縮設備,其與裁剪器執行電通信,并且被配置為,通過壓縮編碼器和解碼器來編碼和解碼真實未壓縮子圖像,以生成有損壓縮子圖像。
在一方面,所述重構誤差包括均方誤差。
根據本申請的一種實施例,公開了一種降低有損壓縮圖像的壓縮失真的方法,所述方法可以包括:通過包括第一組濾波器的特征提取設備,從有損壓縮圖像提取塊,并將提取的塊映射為第一組高維特征向量;通過與特征提取設備執行電通信并包括第二組濾波器的特征增強設備,對第一組中的每個高維特征向量進行去噪,并將去噪的高維特征向量映射為第二組高維特征向量;通過電耦合到特征增強設備并包括第三組濾波器的映射設備,將第二組中的每個高維特征向量非線性地映射為復原的分塊表示;和通過與映射設備執行電通信的聚合設備,對由第二組中的所有高維特征向量映射的分塊表示進行聚合,以生成復原的清晰圖像。
根據本申請的一種實施例,公開了一種降低有損壓縮圖像的壓縮失真的裝置,該裝置可以包括:重構單元,其被配置為基于預定參數將有損壓縮圖像重構為復原的清晰圖像,以及訓練單元,其被配置為使用預定訓練集來訓練卷積神經網絡系統,以便確定重構單元使用的參數。重構單元可以包括:特征提取設備,包括第一組濾波器,其被配置為從有損壓縮圖像提取塊,并將提取的塊映射為第一組高維特征向量;特征增強設備,其與特征提取設備執行電通信,并且包括第二組濾波器,第二組濾波器被配置為對第一組中的每個高維特征向量進行去噪,并將去噪的高維特征向量映射為第二組高維特征向量;映射設備,其電耦合到特征增強設備,并且包括第三組濾波器,第三組濾波器被配置為將第二組中的每個高維向量非線性地映射為復原的分塊表示;和聚合設備,其與映射設備執行電通信,其被配置為對由第二組中的所有高維向量映射的分塊表示進行聚合,以生成復原的清晰圖像;特征提取設備、特征增強設備、映射設備和聚合設備分別包括至少一個卷積層,并且卷積層依次相互連接以形成卷積神經網絡系統。
根據本申請的一種實施例,公開了一種降低有損壓縮圖像的壓縮失真的系統。該系統可以包括用于存儲可執行組件的存儲器;和處理器,用于執行可執行組件,以執行系統的操作;可執行組件包括:特征提取組件,被配置為從有損壓縮圖像提取塊,并將提取的塊映射為第一組高維特征向量;特征增強組件,被配置為對第一組中的每個高維特征向量進行去噪,并且將去噪的高維特征向量映射為第二組高維特征向量;映射組件,被配置為將第二組中的每個高維向量非線性地映射為復原的分塊表示;和聚合組件,被配置為對由第二組中的所有高維向量映射的分塊表示進行聚合,以生成復原的清晰圖像。
以下描述和附圖闡明了本公開的某些示意性方面。然而,這些方面僅指示可運用本發明的原理的各種方式中的一些方式。當結合附圖考慮本發明的以下詳細描述時,本發明的其他方面將變得顯而易見。
附圖說明
下面參照附圖描述本發明的示例性非限制性實施例。附圖是說明性的,通常未按照精確尺寸繪制。不同圖上的相同或相似的元素用相同的附圖標記表示。
圖1是示出與本申請的實施例一致的用于降低有損壓縮圖像的壓縮失真的裝置的示意圖。
圖2是示出與本申請的另一實施例一致的用于降低有損壓縮圖像的壓縮失真的裝置的示意圖。
圖3是示出與公開的一些實施例一致的卷積神經網絡系統的示意圖。
圖4是示出與公開的一些實施例一致的裝置的訓練單元的示意圖。
圖5是示出與公開的一些實施例一致的訓練單元的訓練集準備設備的示意圖。
圖6是示出與公開的一些實施例一致的用于降低有損壓縮圖像的壓縮失真的方法的示意性流程圖。
圖7是示出與公開的一些實施例一致的用于訓練用于降低有損壓縮圖像的壓縮失真的卷積神經網絡系統的方法的示意性流程圖。
圖8是示出與本申請的實施例一致的用于降低有損壓縮圖像的壓縮失真的系統的示意圖。
具體實施方式
現在將詳細參考本發明的一些具體實施例,包括發明人為實現本發明而設想的最佳模式。在附圖中示出了這些具體實施例的示例。盡管結合這些具體實施例描述了本發明,但是應當理解,本發明并不旨在將本發明限制于所描述的實施例。相反,旨在覆蓋在由所附權利要求限定的本發明的精神和范圍內可包括的替代、修改和等同物。在下面的描述中,為了提供對本發明的充分理解,闡述了許多具體細節。可以在沒有這些具體細節中的一些或全部的情況下實施本發明。在其他情況下,為了避免不必要地模糊本發明,未詳細描述公知的處理操作。
本文使用的術語僅用于描述特定實施例的目的,而不旨在限制本發明。如本文所使用的,單數形式“一個”、“一種”和“這個”也旨在包括復數形式,除非上下文另有明確指示。可以進一步理解,當在本說明書中被使用時,術語“包括”和/或“包含”表明所述特征、整體、步驟、操作、元件和/或部件的存在,但不排除存在或添加一個或多個其它特征、整體、步驟、操作、元件、部件和/或其組合。
參見圖1,裝置1000可以包括特征提取設備100、特征增強設備200、映射設備300和聚合設備400。在下文中,將對特征提取設備100、特征增強設備200、映射設備300和聚合設備400進行詳細描述。為了便于描述,以y表示有損壓縮圖像,以f(y)表示復原的清晰圖像,復原的清晰圖像與真實未壓縮的圖像x盡可能地相似。
根據一個實施例,特征提取設備100包括第一組濾波器。第一組濾波器被配置為,從有損壓縮圖像提取塊(patch),并將提取的塊映射為第一組高維特征向量。例如,第一組濾波器通過函數f'(第一參數)將提取的塊映射為第一組高維特征向量,其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且由與有損壓縮圖像相關聯的預定參數確定第一參數。
在一個實施例中,這些第一組高維特征向量可以包括一組特征圖,特征圖的數量等于向量的維數。圖像復原的流行策略是,密集地提取塊,然后通過一組預先訓練的基礎來表示這些塊,前述的基礎例如,pca(主成分分析)、dct(離散余弦變換)、haar等。
根據一個實施例,特征提取設備100的操作可以被公式化為:
f1(y)=f’(w1*y+b1)(1)
其中,w1和b1分別代表濾波器和誤差,f'(x)是非線性函數(例如,max(0,x)、1/(1+exp(-x))或tanh(x))。這里,w1的大小為c×f1×f1×n1,其中,c是輸入圖像的通道數,f1是濾波器的空域大小,n1是濾波器的數量。直觀地,w1對圖像應用n1個卷積,并且每個卷積具有c×f1×f1大小的核。輸出由n1個特征圖組成。b1是n1維向量,其每個元素與濾波器相關聯。
特征增強設備200可以與特征提取設備100執行電通信,并且可以包括第二組濾波器,第二組濾波器被配置為對第一組中的每個高維特征向量進行去噪,并且將去噪的高維特征向量映射為第二組高維特征向量,例如,一組相對更干凈的特征向量。
根據一個實施例,特征增強設備200被配置為對第一組中的每個高維特征向量進行去噪,并且通過函數f'(第二參數)將去噪的高維特征向量映射為第二組高維特征向量,其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且第二參數由與第一組高維特征向量相關聯的預定參數確定。
在該實施例中,特征提取設備100為每個塊提取n1維特征。第二組濾波器將這些n1維向量映射成一組n2維向量。每個經映射的向量在概念上是相對更干凈的特征向量。這些向量包括另一組特征圖。
根據一個實施例,特征增強可以被公式化為:
f2(y)=f’(w2*y+b2)(2)
其中,w2的大小為n1×f2×f2×n2,b2是n2維向量。
如圖所示,裝置1000還可包括映射設備300。映射設備300可耦合到特征增強設備200,并且包括第三組濾波器,其被配置為將第二組中的每個高維向量非線性地映射為復原的分塊表示。
根據一個實施例,映射設備300被配置為通過函數f'(第三參數)將每個高維向量非線性地映射為分塊表示,其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且第三參數由與第二組高維特征向量(即更干凈的高維特征向量)相關聯的預定參數確定。
在一個實施例中,特征增強設備200生成一組n2維特征向量。映射設備300將這些n2維向量中的每個映射成n3維向量。每個經映射的向量在概念上是一個復原的塊的表示。這些向量包括另一組特征圖。
根據一個實施例,映射可被公式化為:
f3(y)=f’(w3*f2(y)+b3)(3)
其中,w3的大小為n2×f3×f3×n3,b3為一個n3維向量。輸出的n3維向量中的每個在概念上是將用于重構的復原的塊的表示。
如圖所示,裝置1000還可包括聚合設備400。聚合設備400可與映射設備300執行電通信,并且被配置為對分塊表示進行聚合,以生成復原的清晰圖像。
聚合設備400對復原的分塊表示進行聚合,以生成復原的清晰圖像。聚合可被公式化為:
f(y)=w4*f3(y)+b4(4)
其中,w4的大小為n3×f4×f4×c,b4是c維向量。
根據該實施例,裝置1000還可包括比較設備(未示出),其被耦合到聚合設備400,并且被配置為,從預定訓練集采樣得到與有損壓縮子圖像相應的真實未壓縮子圖像,并且比較從聚合設備400接收的聚合復原的清晰子圖像與采樣得到的真實未壓縮子圖像之間的不相似度,以生成重構誤差。例如,重構誤差包括均方誤差。將重構誤差反向傳輸,以確定例如w1、w2、w3、w4、b1、b2、b3和b4等參數。
圖2是示出與本申請的另一實施例一致的用于降低有損壓縮圖像的壓縮失真的裝置1000'的示意圖。如圖2所示,裝置1000'可包括重構單元100'和訓練單元200'。重構單元100'被配置為,基于預定參數將有損壓縮圖像重構為復原的清晰圖像。
根據圖2所示的實施例,重構單元100'還可包括特征提取設備110'、特征增強設備120'、映射設備130'和聚合設備140'。在一個實施例中,特征提取設備110'、特征增強設備120'、映射設備130'和聚合設備140'可分別包括至少一個卷積層,并且卷積層依次相互連接,以形成卷積神經網絡系統。
圖3示出了數學模擬模型中卷積神經網絡系統的層結構。在一個實施例中,特征提取設備110'、特征增強設備120'、映射設備130'和聚合設備140'中的每個可分別被模擬為至少一個卷積層。分別在不同的卷積層進行不同的操作。
在該實施例中,特征提取設備110'被配置為,從有損壓縮圖像提取塊,并將提取的塊映射為第一組高維特征向量。這相當于通過如上所述的濾波器組對圖像進行卷積。
特征增強設備120'被配置為,與特征提取設備110'執行電通信,并且對第一組中的每個高維特征向量去噪,并且將去噪的高維特征向量映射為第二組高維特征向量,例如,一組相對更干凈的特征向量。這相當于應用如上所述的第二組濾波器。
映射設備130'被配置為耦合到特征增強設備120',并且將第二組中的每個高維向量非線性地映射為復原的分塊表示。這相當于應用如上所述的第三組濾波器。
聚合設備140'被配置為,與映射設備130'執行電通信,并且對由第二組中的所有高維向量映射的分塊表示進行聚合,以生成復原的清晰圖像。
在一個實施例中,特征提取設備110'、特征增強設備120'、映射設備130'和聚合設備140'分別包括至少一個卷積層,并且卷積層依次相互連接,以形成卷積神經網絡系統。卷積神經網絡系統可追溯到數十年前,最近顯示出爆炸性的流行態勢,部分原因在于其在圖像分類上的成功。卷積神經網絡系統通常用于自然圖像去噪和去除噪聲模式(污物/雨)。
可替代地,可添加更多的卷積層以增加非線性。然而,這會顯著增加卷積神經網絡系統的復雜度,從而需要更多的訓練數據和時間。
訓練單元200'被配置為,使用預定訓練集訓練卷積神經網絡系統,以便優化重構單元所使用的參數,例如w1、w2、w3、w4、b1、b2、b3和b4等。根據圖4所示的實施例,訓練單元200'還可包括采樣設備210'、比較設備220'和反向傳輸設備230'。
采樣設備210'可被配置為,對預定訓練集進行采樣,得到有損壓縮子圖像及其相應的真實未壓縮子圖像,并將有損壓縮子圖像輸入到卷積神經網絡系統。此處,“子圖像”指這些樣本被視為小的“圖像”而不是“塊”,在某種意義上,多個“塊”是重疊的,需要一些取平均后處理,而“子圖像”不需要該后處理。
比較設備220'可被配置為,比較由卷積神經網絡系統基于輸入的有損壓縮子圖像得到的重構清晰子圖像與相應的真實未壓縮子圖像之間的不相似度,以生成重構誤差。例如,重構誤差可包括均方誤差,并且通過使用標準反向傳輸的隨機梯度下降來將誤差最小化。
反向傳輸設備230'被配置為,通過卷積神經網絡系統反向傳輸重構誤差,以便調整卷積神經網絡系統的神經元之間的連接的權重。
應當注意,如果只有重構誤差是可推導的,則卷積神經網絡系統不排除使用其他種類的重構誤差。如果在訓練期間更好的感知激勵度量被給定,則卷積神經網絡系統能靈活地適應該度量。
在一個實施例中,裝置1000和1000'還可包括耦合到比較設備的訓練集準備設備,并且該訓練集準備設備被配置為,準備用于訓練卷積神經網絡系統的預定訓練集。圖5是示出了訓練集準備設備的示意圖。如圖所示,訓練集準備設備可包括裁剪器241'、有損壓縮子圖像生成器242'、配對設備243'和收集器244'。
裁剪器241'可被配置為,從隨機選擇的訓練圖像中隨機裁剪出多個子圖像,以生成一組真實未壓縮的子圖像。例如,裁剪器241'可裁剪出n個像素為m×m的子圖像。有損壓縮子圖像生成器242'可與裁剪器241'執行電通信,并且被配置為,基于從裁剪器241'接收到的真實未壓縮子圖像來生成一組有損壓縮子圖像。配對設備243'可與裁剪器241'和有損壓縮子圖像生成器242'執行電通信,并且被配置為,將每個真實未壓縮子圖像與相應的有損壓縮子圖像進行配對。收集器244'可與配對設備243'執行電通信,并且被配置為,收集所有配對子圖像,以形成預定訓練集。
根據一個實施例,有損壓縮子圖像生成器242'可包括壓縮設備,其與裁剪器241'執行電通信,并且被配置為,通過壓縮編碼器和解碼器對真實子圖像進行編碼和解碼,以生成一組有損壓縮子圖像。
圖6是示出了與公開的一些實施例一致的用于降低有損壓縮圖像的壓縮失真的方法2000的示意性流程圖。以下可結合圖6對方法2000進行詳細描述。
在步驟s210,通過包括第一組濾波器的特征提取設備,從有損壓縮圖像提取塊,并將每個提取的塊映射為高維特征向量,以形成第一組高維特征向量。在一個實施例中,這些向量包括一組特征圖,特征圖的數量等于向量的維數。圖像復原的流行策略,是密集地提取塊,然后通過一組預先訓練的基礎來表示這些塊,前述的基礎例如,pca,dct,haar等。
在步驟s220,通過與特征提取設備執行電通信并且包括第二組濾波器的特征增強設備,對第一組中的每個高維特征向量進行去噪,并將去噪的高維特征向量映射為第二組高維特征向量中。在本實施例中,特征提取設備為每個塊提取n1維特征。第二組濾波器將這些n1維向量映射成一組n2維向量。每個經映射的向量在概念上是相對更干凈的特征向量。這些向量包括另一組特征圖。
在步驟s230,通過耦合到特征增強設備并且包括第三組濾波器的映射設備,將第二組中的每個高維向量非線性地映射為復原的分塊表示。在該實施例中,特征增強設備生成一組n2維特征向量。映射設備將這些n2維向量中的每個映射成n3維向量。每個經映射的向量在概念上是復原的分塊表示。這些向量包括另一組特征圖。
在步驟s240,通過與映射設備執行電通信的聚合設備,將由第二組中的所有高維向量映射得到的分塊表示進行聚合,以生成復原的清晰圖像。在一個實施例中,這些步驟s210-s230可通過上述公式(1)-(3)進行模擬。
根據一個實施例,可從有損壓縮圖像提取塊,并通過函數f'(第一參數)將每個提取的塊映射為高維特征向量。其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第一參數由與有損壓縮圖像相關聯的預定參數確定得到。
根據一個實施例,第一組高維特征向量可被去噪,并且去噪的高維特征向量可通過函數f'(第二參數)非線性地映射為第二組高維特征向量,即一組相對更干凈的特征向量。其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第二參數由與第一組高維特征向量相關聯的預定參數確定得到。
根據一個實施例,通過函數f'(第三參數)可將第二組中的每個高維向量非線性地映射為復原的分塊表示。其中,f'(x)是非線性函數(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第三參數由與第二組高維向量相關聯的預定參數確定得到。
根據一個實施例,在對分塊表示進行聚合以生成復原的清除圖像之后,方法2000還可包括從預定訓練集中采樣得到與有損壓縮子圖像相應的真實未壓縮子圖像的步驟、比較經過聚合后復原的清晰子圖像與相應的真實未壓縮子圖像之間的不相似度,以生成重構誤差的步驟。將重構誤差反向傳輸以優化參數,例如,w1、w2、w3、w4、b1、b2、b3和b4。
根據一個實施例,在從預定訓練集進行采樣得到與有損壓縮子圖像相應的真實未壓縮子圖像之前,方法2000還包括準備預定訓練集的步驟。具體地,首先從隨機選擇的訓練圖像中裁剪出多個子圖像,以生成一組真實未壓縮子圖像。例如,可裁剪出n個m×m像素的子圖像。接下來,基于一組真實未壓縮子圖像生成一組有損壓縮子圖像。然后,將每個真實未壓縮子圖像與相應的有損壓縮子圖像進行配對。之后,收集所有的配對子圖像,以形成預定訓練集。
根據一個實施例,示出了用于訓練用于降低有損壓縮圖像的壓縮失真的卷積神經網絡系統的方法3000。以下可結合圖7對訓練方法3000進行詳細描述。
如圖7所示,在步驟s310,從預定訓練集中采樣得到有損壓縮子圖像及其相應的真實未壓縮子圖像。在步驟s320,通過卷積神經網絡系統將有損壓縮子圖像重構為復原的清晰子圖像。在步驟s330,通過比較重構的清晰子圖像和真實未壓縮子圖像之間的不相似度,生成重構誤差。在步驟s340,將重構誤差反向傳輸給卷積神經網絡系統,以調整卷積神經網絡系統的神經元之間連接的權重。重復步驟s310-s340,直到重構誤差的平均值低于預定閾值為止,例如,預定閾值為預定訓練集中的有損壓縮子圖像和真實未壓縮子圖像之間的均方誤差的一半。
參考圖8,示出了系統4000。系統4000包括存儲可執行組件的存儲器402和耦合到存儲器402的處理器404,處理器404執行可執行組件,以執行系統4000的操作。可執行組件可包括:特征提取組件410,被配置為從有損壓縮圖像提取塊,并將所提取的塊映射為第一組高維特征向量;特征增強組件420,被配置為對第一組中的每個高維特征向量進行去噪,并且將去噪的高維特征向量映射為第二組高維特征向量。此外,可執行組件還可包括:映射組件430,被配置為將第二組中的每個高維向量非線性地映射為復原的分塊表示;以及聚合組件440,被配置為對由第二組中的所有高維向量映射的分塊表示進行聚合,以生成復原的清晰圖像。
在一方面,特征提取組件410被配置為,從有損壓縮圖像提取塊,并將提取的塊中的每個非線性地映射為高維特征向量,并且經過映射的所有塊的向量形成所述第一組高維特征向量。
在一個實施例中,特征增強組件420被配置為,對第一組中的每個高維特征向量進行去噪,并將去噪的高維特征向量非線性地映射為第二組高維特征向量。
在一個實施例中,特征提取組件410、特征增強組件420和映射組件430分別基于預定的第一參數、第二參數和第三參數映射向量。
根據另一個實施例,可執行組件還包括比較組件,其耦合到聚合組件,并且被配置為,從預定訓練集采樣獲得與有損壓縮子圖像相應的真實未壓縮圖像,并且比較從聚合組件接收到的聚合復原的干凈圖像與相應的真實未壓縮圖像之間的不相似度,以生成重構誤差,其中,重構誤差被反向傳輸以優化第一參數、第二參數和第三參數。
在一個實施例中,可執行組件還包括耦合到比較組件的訓練集準備組件。所述訓練集準備組件還包括:裁剪器,被配置為從隨機選擇的訓練圖像隨機裁剪出多個子圖像,以生成一組真實未壓縮子圖像;有損壓縮子圖像生成器,與裁剪器執行電通信,并且被配置為,基于從裁剪器接收的真實未壓縮子圖像生成一組有損壓縮子圖像;配對模塊,與裁剪器和生成器執行電通信,并且被配置為,將每個真實未壓縮子圖像與相應的有損壓縮子圖像進行配對;以及收集器,與配對模塊執行電通信,并且被配置為,收集配成對的真實未壓縮子圖像和有損壓縮子圖像,以形成預定訓練集。
在一個實施例中,有損壓縮子圖像生成器還包括壓縮模塊,其與裁剪器和生成器執行電通信,并且被配置為,通過壓縮編碼器和解碼器對真實子圖像進行編碼和解碼,以生成有損壓縮子圖像組。
與現有方法相反,本申請的方法并不明確地學習用于塊域建模的字典或流形,這些是通過卷積層內部實現的。此外,特征提取、特征增強和聚合也被形成為卷積層,因此在優化中被涉及。本申請的方法和裝置揭示了不同種類的壓縮失真,并且提供了對不同圖像區域中的各種壓縮失真的有效降低。在本申請的方法和裝置中,整個卷積神經網絡完全通過訓練獲得,無需經過預處理/后處理。由于采用輕質結構,本申請的裝置和方法較現有技術實現了更優越的性能。
本發明范圍內的實施例可在數字電子電路中實現,或在計算機硬件、固件、軟件或其組合中實現。在本發明范圍內的裝置可在有形地體現在機器可讀存儲設備中的用于由可編程處理器執行的計算機程序產品中實現;并且,本發明范圍內的方法步驟可由執行指令程序的可編程處理器執行,以通過對輸入數據進行操作并產生輸出來執行本發明的功能。
可通過在可編程系統上執行一個或多個計算機程序來有益地實現本發明范圍內的實施例,該可編程系統包括至少一個可編程處理器以及至少一個輸入設備和至少一個輸出設備,可編程處理器被耦合以從數據存儲系統接收數據和指令,并將數據和指令傳送到數據存儲系統。每個計算機程序可通過高級過程語言或面向對象的編程語言來實現,或者如果需要,以匯編語言或機器語言來實現;在任何情況下,該語言可以是編譯或解釋語言。合適的處理器包括例如通用和專用的微處理器。通常,處理器將從只讀存儲器和/或隨機存取存儲器接收指令和數據。通常,計算機將包括一個或多個用于存儲數據文件的大容量存儲設備。
在本發明的范圍內的實施例包括用于攜帶或存儲有計算機可執行指令、計算機可讀指令或數據結構的計算機可讀介質。這樣的計算機可讀介質可以是可由通用或專用計算機系統訪問的任何可用介質。計算機可讀介質的示例可以包括物理存儲介質,例如ram、rom、eprom、cd-rom或其他光盤存儲器、磁盤存儲器或其他磁存儲設備,或可用于攜帶或存儲期望的程序代碼的任何其他介質,程序代碼以計算機可執行指令、計算機可讀指令或數據結構的形式表示,并且可由通用或專用計算機系統訪問。任何上述內容可以由asic(專用集成電路)補充或并入asic中。雖然已經示出和描述了本發明的特定實施例,但是在不脫離本發明的真實范圍的情況下,可以對這些實施例進行改變和修改。
雖然已經描述了本發明的優選實施例,但是本領域技術人員在獲知基本的發明構思時,可以對這些實施例進行變形或修改。所附權利要求旨在被認為包括優選實施例,并且所有有變形或修改均落入本發明的范圍內。
顯然,在不脫離本發明的精神和范圍的情況下,本領域技術人員可以對本發明進行變形或修改。因此,如果這些變形或修改屬于權利要求和等同技術的范圍,它們也可落入本發明的范圍內。