基于gpu加速的非局部平均濾波實時處理方法
【專利摘要】本發明公開了一種基于GPU加速的非局部平均濾波實時處理方法,主要解決了非局部平均濾波算法難以滿足實時性要求這一問題。本方法利用GPU卓越的多線程并行數據處理能力,使用OpenCL平臺,在GPU上并行地實現圖像的濾波處理。在濾波過程中,對中心圖像片和相似圖像片進行投影,并且利用拆分核函數、優化訪存等方法有效減少了計算量和數據讀取時間。與現有的非局部平均濾波方法相比,本發明能夠在保證去噪性能的前提下,對VGA(分辨率為640*480)和SVGA(分辨率為600*800)圖像進行實時的非局部平均濾波處理,較之傳統的串行處理方法,本方法取得了最高達111倍的加速比。
【專利說明】
基于GPU加速的非局部平均濾波實時處理方法
技術領域
[0001] 本發明屬于圖像處理技術領域,更進一步涉及一種自然圖像處理濾波技術領域的 基于圖形計算單元GPU(Graphics Processing Unit)加速的非局部平均濾波實時處理方 法。該方法可用于對醫學、衛星遙感、工業、軍事和視頻多媒體等領域的數字圖像進行預處 理,縮短預處理時間,達到實時處理的效果。
【背景技術】
[0002] 作為最好的圖像去噪方法之一,非局部平均濾波算法能夠達到很好的去噪效果。 但是由于算法復雜度高,處理時間長,所以很難在實際應用中被直接使用。自從Buades提出 非局部平均的思想以來,研究者們也提出了各種各樣的改進算法。
[0003] 隨著大數據時代的到來,人們急切的想尋求一種可以加快數據處理速度的方案, 此時,異構并行計算模式應運而生。GPU專為計算密集型、高度并行化的程序設計,并且在浮 點計算能力方面表現超群,自然而然的,處理機制從多核處理器過渡到GPU,并廣泛應用于 各個領域。各行各業的人們都嘗試利用這一新興技術加速數據處理,在圖像處理領域就有 很多算法已經在異構平臺下成功實現。
[0004] 華中科技大學申請的專利"一種三維超聲圖像非局部均值濾波方法"(專利申請號 201310428718.6,公布號CN103544682A)中公布了一種三維超聲圖像非局部平均濾波方法。 該方法將待濾波的三維圖像拆分成基準塊,給每個基準塊指定搜索區域,然后將搜索區域 中的所有與基準塊大小相同的圖像塊作為相似塊,并且計算每一相似塊與基準塊之間相似 度,接下來以相似塊的加權平均值作為基準塊濾波結果,權重為相似度,最后將基準塊的濾 波結果進行整合得到三維超聲圖像最終濾波結果,該方法應用GPU加速,一定程度上縮短了 濾波時間。但是該方法存在的不足之處是,在利用GPU進行非局部平均濾波的過程中,算法 復雜度高導致運行時間長,GPU數據訪存沒有優化導致運行時間長,有重復的數據處理過程 導致運行時間長,無法滿足對圖像進行非局部平均濾波處理的實時性要求。
【發明內容】
[0005] 本發明的目的在于克服上述現有技術中的不足,提出一種基于GPU(GraphicS Processing Unit)加速的非局部平均濾波實時處理方法。通過對圖像片進行投影,減小算 法復雜度,優化訪存方式,縮短訪存時間,并將非局部平均濾波在GPU的實現拆分成兩個內 核,減少運算量。
[0006] 為實現上述目的,本發明具體實現步驟包括如下:
[0007] (1)搭建環境;
[0008] (la)調用開放運算語言OpenCL提供的應用程序編程接口API進行平臺查詢,獲取 該平臺上可用的設備對象;
[0009] (lb)調用開放運算語言OpenCL提供的應用程序編程接口 API依次創建上下文、創 建命令隊列、構建程序對象、創建2個內核對象;
[0010] (2)讀取待處理圖像;
[0011] 將中央處理器CPU作為主機端讀取待處理圖像,將讀取的待處理圖像保存到中央 處理器CPU的內存;
[0012] (3)按照下式,計算半徑為Z的一維高斯模板:
[0014]其中,W(r)表示一維高斯模板W上與該模板中心點相距r處的值,W表示一維高斯模 板,r表不一維高斯模板上任意點到中心點的距離,rG (-Z,Z),G表不屬于符號,Z表不一維 高斯模板的半徑,e表示自然對數,〇表示高斯模板的標準差;
[0015] (4)拷貝高斯模板和待處理圖像;
[0016] (4a)在圖形計算單元GPU中申請用于保存高斯模板和待處理圖像的顯存;
[0017] (4b)將高斯模板拷貝到顯存的常量存儲器中,將待處理圖像拷貝到顯存的全局存 儲器中;
[0018] (5)執行第一個內核對象;
[0019] (5a)給待處理圖像的每一個像素點分配一個工作項;
[0020] (5b)給執行第一個內核對象的每一個工作組分配256個工作項;
[0021] (5c)給第一個內核對象設置4個參數,分別為:待處理圖像的長度,待處理圖像的 寬度,拷貝進GHJ顯存的待處理圖像和高斯模板;
[0022] (5d)將圖形計算單元GPU全局存儲器中的待處理圖像緩存到局部存儲器中;
[0023] (5e)從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索 窗;
[0024] (5f)讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索 窗中心像素點為中心,大小為dXd的二維搜索窗中心圖像片,d = 2 XZ+1,表示二維搜索窗 中心圖像片的邊長,Z表示高斯模板的半徑;
[0025] (5g)讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索 窗下半部分每一個像素點為中心,大小為dXd的二維搜索窗相似圖像片,d = 2XZ+l,表示 二維搜索窗相似圖像片的邊長,Z表示高斯模板的半徑;
[0026] (5h)按照下式,對二維搜索窗中心圖像片和二維搜索窗相似圖像片進行投影,得 到一維搜索窗中心圖像片和一維搜索窗相似圖像片:
[0029]其中,運dxl(;a;>表示以目標像素點(a,b)為中心的二維搜索窗中心圖像片IPdxd (a,b) 經過投影后得到的一維搜索窗中心圖像片,d = 2XZ+l,Z表示高斯模板的半徑,x表示二維 搜索窗中心圖像片IPdxd(a,b)的列序號,xG [b_Z,b+Z],G表不屬于符號,E表不求和操作, 表示以像素點(i,j)為中心的二維搜索窗相似圖像片ISdxd(i,j)經過投影后得到的 一維搜索窗相似圖像片,y表示二維搜索窗相似圖像片ISdxd(i,j)的列序號,yG[j-Z,j+Z]; [0030] (5i)按照下式,計算一維搜索窗中心圖像片和一維搜索窗相似圖像片高斯加權的 歐式距離:
[0031 ] Temp(i, j,a,b) - W ? ISdxi(i)-IPdxi(a) L J 2
[0032]其中,Temp (i , j , a, b)表示一維搜索窗中心圖像片iPdrt (_a)和一維搜索窗相似圖像 片運dxl(i)高斯加權的歐式距離,W表示高斯模板,?表示卷積操作,|||表示歐氏距離操作;
[0033] (5j)在圖形計算單元GPU的全局存儲器中創建一個數組,將高斯加權的歐氏距離 保存在該數組里;
[0034] (6)執行第二個內核對象;
[0035] (6a)給待處理圖像的每個像素點分配一個工作項;
[0036] (6b)給執行第二個內核對象的每個工作組分配256個工作項;
[0037] (6c)在圖形計算單元GPU中申請用于存放濾波后圖像的顯存;
[0038] (6d)給第二個內核設置4個參數:待處理圖像的長度,待處理圖像的寬度,拷貝進 GHJ緩存的待處理圖像和濾波后圖像;
[0039] (6e)將圖形計算單元GPU的全局存儲器里的待處理圖像緩存到局部存儲器;
[0040] (6f)從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索 窗;
[0041] (6g)按照下式,計算搜索窗上像素點的權值:
[0043]其中,《(1,」,&,13)表示搜索窗上像素點(1,」)的權值,6表示自然對數,1 1表示衰減 因子,Temp (i,j,a,b)表不一維搜索窗中心圖像片IPdxi (a)和一維搜索窗相似圖像片ISdxi (i)_ 高斯加權的歐氏距離;
[0044] (6h)按照下式,計算搜索窗中心像素點經過非局部平均濾波后的像素值:
[0046] 其中,$(a,b):表示搜索窗中心像素點的像素值y(a,b)經過非局部平均濾波后的像 素值,E表示求和操作,(i,j)表示搜索窗上像素點,G表示屬于符號,Q(a,b)表示以搜索 窗中心像素點(a,b)為中心的21X21大小的鄰域,《(1,」, &,13)表示搜索窗上像素點(1,」) 的權值,y (i,j)表示像素點(i,j)處的像素值;
[0047] (6i)用搜索窗中心像素點濾波后的像素值賦給步驟(6c)申請的濾波后圖片的對 應像素點,得到圖形計算單元GHJ中的濾波后圖像;
[0048] (7)保存結果圖像;
[0049]從圖形計算單元GPU拷貝濾波后圖像,保存于中央處理器CPU內存中。
[0050]本發明與現有的技術相比具有以下優點:
[0051]第一,由于本發明對二維搜索窗中心圖像片和二維搜索窗相似圖像片進行投影, 得到一維搜索窗中心圖像片和一維搜索窗相似圖像片,克服了現有技術的算法復雜度高導 致運行時間長,無法滿足對圖像進行非局部平均濾波處理的實時性要求的問題,使得本發 明算法復雜度明顯降低,原本需要對dXd個像素點間進行的運算減少到dXl,運算時間顯 著減少,從而滿足實時性要求。
[0052]第二,由于本發明將高斯模板拷貝到顯存的常量存儲器中,將圖形計算單元GPU全 局存儲器中的待處理圖像緩存到局部存儲器中,克服了 GPU數據訪存沒有優化導致運行時 間過長,無法滿足對圖像進行非局部平均濾波處理的實時性要求的問題,使得本發明訪存 時間縮短,工作項不需要直接從全局存儲器存取數據,進而縮短了運算時間,滿足實時性要 求。
[0053]第三,由于本發明計算一維搜索窗中心圖像片和一維搜索窗下半部分相似圖像片 高斯加權的歐式距離,克服了現有技術存在的有重復的數據處理過程導致運行時間長,無 法滿足對圖像進行非局部平均濾波處理的實時性要求的問題,使得本發明避免了大量的重 復數據處理的過程,計算量明顯減少,縮短了運算時間,滿足實時性要求。
【附圖說明】
[0054]圖1為本發明的流程圖;
[0055]圖2為本發明的仿真結果圖。
【具體實施方式】
[0056] 下面結合附圖對本發明作進一步的詳細描述。
[0057] 參照附圖1,對本發明的步驟作進一步的詳細描述。
[0058] 步驟1,搭建環境。
[0059] 調用開放運算語言OpenCL提供的應用程序編程接口API進行平臺查詢,獲取平臺 上可用的設備對象。
[0060] 調用開放運算語言OpenCL提供的應用程序編程接口 API依次創建上下文,創建命 令隊列,構建程序對象,創建2個內核對象。
[0061 ] 步驟2,讀取待處理圖像。
[0062]將中央處理器CPU作為主機端讀取待處理圖像,將讀取的待處理圖像保存到中央 處理器CPU的內存。
[0063]步驟3,按照下式,計算半徑為Z的一維高斯模板:
[0065]其中,W(r)表示一維高斯模板W上與該模板中心點相距r處的值,W表示一維高斯模 板,r表不一維高斯模板上任意點到中心點的距離,rG (-Z,Z),G表不屬于符號,Z表不一維 高斯模板的半徑,e表示自然對數,〇表示高斯模板的標準差。
[0066] -維高斯模板的半徑Z的取值范圍是1~5個像素。高斯模板的標準差〇的取值范圍 是[0,3]。
[0067]步驟4,拷貝高斯模板和待處理圖像到顯存。
[0068]在圖形計算單元GPU中申請顯存,用來保存高斯模板和待處理圖像。
[0069] 將高斯模板拷貝到顯存的常量存儲器中,將待處理圖像拷貝到顯存的全局存儲器 中。
[0070] 步驟5,執行第一個內核對象。
[0071] 給待處理圖像的每以個像素點分配一個工作項。
[0072]給執行第一個內核對象的每一個工作組分配256個工作項。
[0073]給第一個內核對象設置4個參數,分別為:待處理圖像的長度,待處理圖像的寬度, 拷貝進GPU顯存的待處理圖像和高斯模板。
[0074]將圖形計算單元GPU全局存儲器中的待處理圖像緩存到局部存儲器中。
[0075]從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索窗。
[0076] 讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索窗中 心像素點為中心,大小為d X d的二維搜索窗中心圖像片,d = 2 X Z+1,Z表示高斯模板的半 徑。
[0077] 讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索窗下 半部分每一個像素點為中心,大小為dXd的二維搜索窗下半部分相似圖像片,d = 2XZ+l,Z 表示高斯模板的半徑。
[0078] 按照下式,對二維搜索窗中心圖像片和二維搜索窗下半部分相似圖像片進行投 影,得到一維搜索窗中心圖像片和一維搜索窗下半部分相似圖像片:
[0081] 其中,I^ixi(a)表示以目標像素點(a,b)為中心的二維搜索窗中心圖像片IPdxd(a,b) 經過投影后得到的一維搜索窗中心圖像片,d = 2XZ+l,Z表示高斯模板的半徑,x表示二維 搜索窗中心圖像片IPdxd(a,b)的列序號,xG [b_Z,b+Z],G表不屬于符號,E表不求和操作, 虱xl(i)表示以像素點(i,j)為中心的二維搜索窗下半部分相似圖像片ISdxd(i,j)經過投影 后得到的一維搜索窗下半部分相似圖像片,y表示二維搜索窗下半部分相似圖像片ISdxd(i, j)的列序號,y e [ j_Z, j+Z]。
[0082] 按照下式,計算一維搜索窗中心圖像片和一維搜索窗下半部分相似圖像片高斯加 權的歐式距離: _ _ 2
[0083] Temp(i9j,a5b) = W? ISdx丨(i)-IPdxi(a) L J 2
[0084] 其中,Temp(i,j,a,b)表示一維搜索窗中心圖像片和一維搜索窗下半部分 相似圖像片高斯加權的歐式距離,W表示高斯模板,0表示卷積操作,|||表示歐氏距 離操作
[0085]在圖形計算單元GPU的全局存儲器中創建一個數組,將高斯加權的歐氏距離保存 在該數組里。
[0086]步驟6,執行第二個內核對象。
[0087]給待處理圖像的每個像素點分配一個工作項。
[0088]給執行第二個內核對象的每個工作組分配256個工作項。
[0089]在圖形計算單元GPU中申請用來存放濾波后圖像的顯存。
[0090]給第二個內核設置4個參數:待處理圖像的長度,待處理圖像的寬度,拷貝進GPU緩 存的待處理圖像和濾波后圖像。
[0091]將圖形計算單元GPU的全局存儲器里的待處理圖像緩存到局部存儲器。
[0092]從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索窗。 [0093]按照下式,計算搜索窗上像素點的權值:
[0095] 其中,《(1,」,8,13)表示搜索窗上像素點(1,」)的權值,6表示自然對數,11表示衰減 因子,1' 61^(1,」,8,13)表示一維搜索窗中心圖像片1]^44和一維搜索窗下半部分相似圖像 片高斯加權的歐氏距離。
[0096] 衰減因子h的取值范圍是[7,20]。
[0097] 按照下式,計算搜索窗中心像素點經過非局部平均濾波后的像素值:
[0099] 其中,Ka,b)表示搜索窗中心像素點的像素值y(a,b)經過非局部平均濾波后的像 素值,E表示求和操作,(i,j)表示搜索窗上像素點,G表示屬于符號,Q(a,b)表示以搜索 窗中心像素點(a,b)為中心的21X21大小的鄰域,《(1,」, &,13)表示搜索窗上像素點(1,」) 的權值,y (i,j)表示像素點(i,j)處的像素值。
[0100] 用搜索窗中心像素點濾波后的像素值賦給申請的濾波后圖片的對應像素點,得到 圖形計算單元GHJ中的濾波后圖像。
[0101]步驟7,保存結果圖像。
[0102]從圖形計算單元GPU拷貝濾波后圖像,保存于中央處理器CPU內存中。
[0103]下面結合附圖2的仿真圖對本發明的效果做進一步的描述。
[0104] 1.仿真實驗條件:
[0105] 本發明的仿真實驗使用的CPU是Intel(R)Xeon(R)E5410,使用的GPU是AMD Radeon R9 270,軟件環境是Windows7 32位,Visual Studio 2013,Matlab R2015a。仿真實驗算法 去噪效果由PSNR (峰值信噪比)來表征。
[0106] 2 ?仿真效果圖:
[0107]圖2是使用本發明對不同分辨率圖像去噪的效果圖。其中,圖2(a)是顯示繪圖陣列 VGA(Video Graphic Array)分辨率(640X480)的灰度圖,用Matlab軟件加方差為0? 1的高 斯噪聲后,PSNR為26.8109的待處理圖像,圖2(b)是對圖2(a)利用本發明方法的去噪后的效 果圖,高斯模板半徑是3,高斯模板的標準差是1.26,圖2(c)是超級顯示繪圖陣列SVGA (Super Video Graphic Array)分辨率(600X800)的灰度圖,用Matlab軟件加方差為0.5的 高斯噪聲后,PSNR為28.3164的待處理圖像,圖2(d)是對圖2(c)利用本發明方法的去噪效果 圖,高斯模板半徑是3,高斯模板的標準差是0.86。
[0108] 表1和表2列出了本發明對附圖2(a)和附圖2(c)分別在5 X 5和7 X 7高斯模板尺寸 下,得到的去噪效果和加速比(時間單位為ms) XPU多線程一項指的是多核CPU采用本發明 進行非局部平均濾波所用時間,GPU多線程一項指的是GPU采用本發明進行非局部平均濾波 所用時間,加速比指的是CPU多線程所用時間與GPU多線程所用時間之比,PSNR指的是濾波 后圖像的峰值信噪比,表征濾波效果。
[0109] 表1.對圖2(a)處理結果
[0111] 表2.對圖2(c)處理結果
[0113] 由表1和表2可見:
[0114] 經本發明提出的方法濾波后圖像的峰值信噪比(PSNR)明顯提高,且高斯模板大小 為7 X 7時濾波去噪效果更好。經本發明提出的加速方法較傳統CPU處理方法運行時間大幅 縮短,取得的最大加速比達111,對VGA和SVGA分辨率的圖像能實現實時處理。
[0115] 綜上,本發明所提出的基于GPU加速的非局部平均濾波處理方法可有效濾除圖像 噪聲,且能通過異構并行計算大幅提升算法的處理速度,滿足實時應用需求,并且采用的 OpenCL編程環境有很好的可移植性,不僅支持GPU,還支持FPGA、ARM等。
【主權項】
1. 一種基于GPU加速的非局部平均濾波實時處理方法,包括如下步驟: (1) 搭建環境; (la) 調用開放運算語言OpenCL提供的應用程序編程接口API進行平臺查詢,獲取該平 臺上可用的設備對象; (lb) 調用開放運算語言OpenCL提供的應用程序編程接口 API依次創建上下文、創建命 令隊列、構建程序對象、創建2個內核對象; (2) 讀取待處理圖像; 將中央處理器CPU作為主機端讀取待處理圖像,將讀取的待處理圖像保存到中央處理 器CHJ的內存; (3) 按照下式,計算半徑為Z的一維高斯模板:其中,W (r)表不一維高斯模板W上與該模板中心點相距r處的值,W表不一維高斯模板,r 表示一維高斯模板上任意點到中心點的距離,re (-Z,Z),e表示屬于符號,Z表示一維高斯 模板的半徑,e表示自然對數,〇表示高斯模板的標準差; (4) 拷貝高斯模板和待處理圖像; (4a)在圖形計算單元GRJ中申請用于保存高斯模板和待處理圖像的顯存; (4b)將高斯模板拷貝到顯存的常量存儲器中,將待處理圖像拷貝到顯存的全局存儲器 中; (5) 執行第一個內核對象; (5a)給待處理圖像的每一個像素點分配一個工作項; (5b)給執行第一個內核對象的每一個工作組分配256個工作項; (5c)給第一個內核對象設置4個參數,分別為:待處理圖像的長度,待處理圖像的寬度, 拷貝進GPU顯存的待處理圖像和高斯模板; (5d)將圖形計算單元GPU全局存儲器中的待處理圖像緩存到局部存儲器中; (5e)從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索窗; (5f)讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索窗中 心像素點為中心,大小為d X d的二維搜索窗中心圖像片,d = 2 X Z+1,Z表示高斯模板的半 徑; (5g)讀取緩存到局部存儲器中待處理圖像的一個小圖像片,該小圖像片是以搜索窗下 半部分每一個像素點為中心,大小為dXd的二維搜索窗下半部分相似圖像片,d = 2XZ+l,Z 表不尚斯t旲板的半徑; (5h)按照下式,對二維搜索窗中心圖像片和二維搜索窗下半部分相似圖像片進行投 影,得到一維搜索窗中心圖像片和一維搜索窗下半部分相似圖像片:其中,(a)表示以目標像素點(a,b)為中心的二維搜索窗中心圖像片IPdXd (a,b)經過 投影后得到的一維搜索窗中心圖像片,d = 2XZ+l,Z表示高斯模板的半徑,X表示二維搜索 窗中心圖像片IPdxd(a,b)的列序號,xe [b_Z,b+Z],e表不屬于符號,Σ表不求和操作, 瓦ui(i)表示以像素點(i,j)為中心的二維搜索窗下半部分相似圖像片ISdxd(i,j)經過投影 后得到的一維搜索窗下半部分相似圖像片,y表示二維搜索窗下半部分相似圖像片ISdxd(i, 」)的列序號,5^[」__2,」_+2]; (5i)按照下式,計算一維搜索窗中心圖像片和一維搜索窗下半部分相似圖像片高斯加 權的歐式距離:其中,Temp(i,j,a,b)表示一維搜索窗中心圖像片(a)和一維搜索窗下半部分相似 圖像片瓦兒)高斯加權的歐式距離,w表示高斯模板,Θ表示卷積操作,HI表示歐氏距離操 作; (5j)在圖形計算單元GPU的全局存儲器中創建一個數組,將高斯加權的歐氏距離保存 在該數組里; (6)執行第二個內核對象; (6a)給待處理圖像的每個像素點分配一個工作項; (6b)給執行第二個內核對象的每個工作組分配256個工作項; (6c)在圖形計算單元GRJ中申請用于存放濾波后圖像的顯存; (6d)給第二個內核設置4個參數:待處理圖像的長度,待處理圖像的寬度,拷貝進GPU緩 存的待處理圖像和濾波后圖像; (6e)將圖形計算單元GPU的全局存儲器里的待處理圖像緩存到局部存儲器; (6f)從緩存到局部存儲器中的待處理圖像依次讀取21X21個像素點,組成搜索窗; (6g)按照下式,計算搜索窗上像素點的權值:其中,co(i,j,a,b)表示搜索窗上像素點(i,j)的權值,e表示自然對數,h表示衰減因 子,Temp(i,j,a,b)表不一維搜索窗中心圖像片IP&^a)和一維搜索窗下半部分相似圖像片 高斯加權的歐氏距離; (6h)按照下式,計算搜索窗中心像素點經過非局部平均濾波后的像素值:其中,f(a,b)表示搜索窗中心像素點的像素值y(a,b)經過非局部平均濾波后的像素值, Σ表示求和操作,(i,j)表示搜索窗上像素點,e表示屬于符號,Q(a,b)表示以搜索窗中心 像素點(a,b)為中心的21\21大小的鄰域,《(1,」,&,13)表示搜索窗上像素點(1,」)的權值, y (i,j)表示像素點(i,j)處的像素值; (6i)用搜索窗中心像素點濾波后的像素值賦給步驟(6c)申請的濾波后圖片的對應像 素點,得到圖形計算單元GHJ中的濾波后圖像; (7)保存結果圖像; 從圖形計算單元GHJ拷貝濾波后圖像,保存于中央處理器CRJ內存中。2. 根據權利要求1所述的基于GPU加速的非局部平均濾波實時處理方法,其特征在于: 步驟(3)中一維高斯模板半徑Z的取值范圍是1~5個像素。3. 根據權利要求1所述的基于GPU加速的非局部平均濾波實時處理方法,其特征在于: 步驟(3)中所述的高斯模板的標準差σ的取值范圍是[〇,3]。4. 根據權利要求1所述的基于GPU加速的非局部平均濾波實時處理方法,其特征在于: 步驟(6g)中所述衰減因子h的取值范圍是[7,20]。
【文檔編號】G06T5/00GK105931207SQ201610370775
【公開日】2016年9月7日
【申請日】2016年5月30日
【發明人】賴睿, 王維, 孟靈非, 楊銀堂, 周慧鑫, 王炳建, 秦翰林
【申請人】西安電子科技大學