獲取立體片源視差參數的方法及裝置的制造方法
【專利摘要】本發明公開了一種獲取立體片源視差參數的方法及裝置,涉及圖像處理領域,為解決獲取立體片源視差參數效率低下的問題而發明。本發明的方法包括:從立體片源文件中讀取圖像幀,圖像幀包括左眼圖像和右眼圖像;在左眼圖像或右眼圖像中確定多個第一圖像區域;在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖像區域,相互對應的第一圖像區域和第二圖像區域尺寸相同;分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水平距離,獲得多個視差參數;確定最大視差參數和最小視差參數,獲得立體片源的視差變動范圍。本發明主要應用于獲取立體視頻的視差參數的過程中。
【專利說明】
獲取立體片源視差參數的方法及裝置
技術領域
[0001] 本發明設及圖像處理領域,尤其設及一種獲取立體片源視差參數的方法及裝置。
【背景技術】
[0002] 隨著3D技術的發展,立體片源的數量越來越多,支持觀看立體片源的設備也越來 越多。3D技術的原理在于,通過兩臺處于同一水平線但是間隔一定水平距離的拍攝設備對 同一物體同時進行拍攝,獲得對應該物體的左右兩張圖像。在播放立體片源時,通過左右眼 分別對應的偏光鏡使用戶左眼觀看左邊圖像,右眼觀看右邊圖像。由于拍攝設備之間存在 用于模擬人眼瞳距的水平間距,因此左右圖像分別呈現的物體之間具有一定的視差。用戶 在觀看立體片源時,左右圖像經視網膜同時傳遞到大腦中,大腦利用該視差產生物體遠近 的景深效果,從而獲得立體感。
[0003] 為了播放出較好的立體效果,需要預先獲得立體片源的視差參數。而立體片源本 身并不提供視差參數,若要獲得視差參數就需要人工進行計算。專業人員在左右圖像中分 別查找同一個物體,例如分別在左右圖像中查找物體"水杯",然后手動計算兩個"水杯"在 水平方向上間隔的像素點個數,獲得X軸上的水平距離,從而得到兩個"水杯"之間的視差參 數。通常,3D圖像中不同物體的立體程度有所差異,因此左右圖像中不同物體的水平距離互 不相同,在獲取視差參數時就需要專業人員對不同物體分別進行選取和計算,獲得多個視 差參數,并從中選取視差參數的最大值和最小值W確定立體片源的視差變動范圍。
[0004] 由于現有技術完全依靠專業人員的主觀識別和判斷進行物體選取,并且計算水平 距離也是由專業人員手動完成的,因此當3D圖像中的物體較多時,獲取視差參數的效率會 非常低。現有方式尚且能夠對靜態的立體圖片進行處理,但是對于由幾十萬帖、甚至上百萬 帖組成的立體視頻來說,如果人工手動獲取每一帖的視差參數,那么耗費的時間成本將是 無法想象的。
【發明內容】
[0005] 本發明提供了一種獲取立體片源視差參數的方法及裝置,能夠解決獲取立體片源 視差參數效率低下的問題。
[0006] 為解決上述問題,一方面,本發明提供了一種獲取立體片源視差參數的方法,包 括:
[0007] 從立體片源文件中讀取圖像帖,圖像帖包括左眼圖像和右眼圖像;
[000引在左眼圖像或右眼圖像中確定多個第一圖像區域;
[0009] 在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖像區域,相互對 應的第一圖像區域和第二圖像區域尺寸相同;
[0010] 分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水平距離,獲得多 個視差參數;
[0011] 確定最大視差參數和最小視差參數,獲得立體片源的視差變動范圍。
[0012] 另一方面,本發明還提供了一種獲取立體片源視差參數的裝置,包括:
[0013] 讀取單元,用于從立體片源文件中讀取圖像帖,圖像帖包括左眼圖像和右眼圖像;
[0014] 區域確定單元,用于在左眼圖像或右眼圖像中確定多個第一圖像區域;
[0015] 查找單元,用于在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖 像區域,相互對應的第一圖像區域和第二圖像區域尺寸相同;
[0016] 計算單元,用于分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水 平距離,獲得多個視差參數;
[0017] 參數確定單元,用于確定最大視差參數和最小視差參數,獲得立體片源的視差變 動范圍。
[0018] 本發明提供的獲取立體片源視差參數的方法及裝置,能夠自動從立體片源文件中 讀取圖像帖,并在圖像帖中的左右眼圖像中分別確定多個數量相同并且一一對應的第一圖 像區域和第二圖像區域,分別計算每一對第一和第二圖像區域的水平距離,獲得對應每一 對第一和第二圖像區域的視差參數,然后從多個視差參數中確定一個最大視差參數和一個 最小視差參數,由此獲得立體片源的視差變動范圍。與現有技術相比,本發明中獲取圖像 帖、確定圖像區域、計算視差參數等過程全部由計算機自動完成,專業人員僅需向計算機提 供立體片源文件的存儲路徑即可。由于不設及人工操作,因此本發明能夠大大縮短獲取視 差參數的耗時,提高處理效率,特別是在對立體視頻進行處理時優勢尤為明顯。
【附圖說明】
[0019] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發 明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可W根 據運些附圖獲得其他的附圖。
[0020] 圖1為本發明實施例提供的一種獲取立體片源視差參數的方法流程圖;
[0021 ]圖2為本發明實施例提供的另一種獲取立體片源視差參數的方法流程圖;
[0022] 圖3為本發明實施例提供的又一種獲取立體片源視差參數的方法流程圖;
[0023] 圖4a至圖4d為本發明實施例提供的一種確定第一圖像區域的示意圖;
[0024] 圖4e為本發明實施例提供的一種確定第二圖像區域的示意圖;
[0025] 圖5a至圖5d為本發明實施例提供的一種確定像素點的示意圖;
[0026] 圖6為本發明實施例提供的一種獲取立體片源視差參數的裝置的組成框圖;
[0027] 圖7為本發明實施例提供的另一種獲取立體片源視差參數的裝置的組成框圖;
[0028] 圖8為本發明實施例提供的一種獲取立體片源視差參數的裝置的實體結構示意 圖。
【具體實施方式】
[0029] 為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例 中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員 在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0030] 本發明實施例提供了一種獲取立體片源視差參數的方法,如圖1所示,該方法包 括:
[0031] 101、從立體片源文件中讀取圖像帖。
[0032] 本實施例中的立體片源可W是立體圖片或者立體視頻,當為立體圖片時,立體片 源文件中通常只包括一個圖像,而對于立體視頻而言,立體片源文件中一般會包含許多圖 像帖。為便于統一表述,本實施例將立體圖片中的圖像一并稱為圖像帖。
[0033] 如前所述,立體片源是通過兩個處于同一水平線并且間隔一定距離的兩個攝像設 備拍攝獲得的,因此不論是立體圖片還是立體視頻,每一個圖像帖都是由一個左眼圖像和 一個右眼圖像組成的。由于兩個攝像設備之間存在用于模擬人眼瞳距的水平間隔,所W左 眼圖像和右眼圖像兩者在水平方向上存在一定的位置偏移量,運個位置偏移量即為本實施 例中要計算的視差參數。
[0034] 本步驟中,計算機可W按照默認的存儲路徑從存儲區域或數據庫中讀取立體片源 文件,也可W通過預設的應用程序接口直接接收網絡側發送的立體片源文件,或者通過預 設的操作界面接收用戶上傳的立體片源文件,本實施例不對立體片源文件的獲取方式進行 具體限制。
[0035] 102、在左眼圖像或右眼圖像中確定多個第一圖像區域。
[0036] 獲取視差參數的前提條件是,分別在左右圖像中確定對應同一內容的兩個圖像區 域,即第一圖像區域和第二圖像區域。本實施例中,首先W左右圖像中的任意一個圖像為基 準在其中確定第一圖像區域,然后在另一個圖像中對應的確定第二圖像區域。為便于表述, 本實施例后續將W在左眼圖像中確定第一圖像區域為例進行說明,當然,實際應用中也可 W首先W右眼圖像為基準在其中確定第一圖像區域,對于后者方式,獲取視差參數的方式 與前者方式相同,本實施例后續不作重復說明。
[0037] 通常,左右圖像中會設及多種不同的內容,例如對于街景圖像而言,其中就會包括 行人、汽車、樹木、街道W及商店等。雖然理論上左右圖像中所有內容的視差應當是一致的, 即行人1與行人2(注:行人1為左眼圖像中的行人,行人2為右眼圖像中對應的運個行人,后 同)的視差、汽車1與汽車2的視差等均應當是相同的,但是由于不同物體的景深各有差異, 因此實際情況中不同內容的視差有可能是不相同的,運就需要在左眼圖像中確定多個第一 圖像區域,并在后續在右眼圖像中對應的確定多個第二圖像區域,并由此計算出多個視差 參數。
[0038] 本實施例中,可W通過圖像識別技術對左眼圖像中的物體進行識別,然后根據不 同物體的位置和大小,確定包含不同物體的不同第一圖像區域。運種方式可自然形成 的物體為對象準確的計算物體之間的視差參數,但是因為使用到圖像識別技術,所W實際 應用中會設及巨大的計算量。為降低計算機的處理負荷,提高視差參數的獲取速度,本實施 例中也可W對第一圖像區域進行模糊確定,即不W物體識別作為確定第一圖像區域的前提 要求而直接確定第一圖像區域。例如在左眼圖像中隨機選取位置,確定幾個第一圖像區域, 或者按照左眼圖像的尺寸比例,在特殊位置上確定幾個第一圖像區域。運種方式無需對圖 像的內容進行識別,實現起來速度較快。
[0039] 103、在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖像區域。
[0040] 所謂內容對應是指第二圖像區域中顯示的內容與第一圖像區域中顯示的內容相 同。從控制變量的角度講,只有衡量同一個內容分別在左右圖像中的位置差別,才能夠體現 出該內容在左右圖像中的視差,因此本實施例中要求第一和第二圖像區域中的內容是對應 的。在該前提下,第一圖像區域和第二圖像區域之間應當至少在下述幾個方面是相同的:1、 內容相同;2、區域的尺寸相同;3、區域的數量相同。
[0041] 本步驟中,計算機可W通過圖像匹配技術(例如化enCV中提供的方法)在右眼圖像 中查找與第一圖像區域內容相對應的內容,并根據查找到的內容確定第二圖像區域的位 置。實際應用中,圖像匹配技術屬于較為成熟的技術手段,本步驟對此不作過多介紹。
[0042] 需要說明的是,當在右眼圖像中確定第二圖像區域時,需要通過圖像匹配技術對 右眼圖像中的內容進行識別,其目的在于使確定出的第二圖像區域與左眼圖像中的第一圖 像區域在內容上相互對應,作為計算視差參數的前提條件,運種內容識別的過程是必要的。 而在步驟102中,在確定第一圖像區域時進行的圖像識別,由于無需要求第一圖像區域的內 容與某些內容對應,因此為提高處理速度,步驟102中的圖像識別過程是可省略的。
[0043] 104、分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水平距離,獲 得多個視差參數。
[0044] 在獲得數量相等的第一圖像區域和第二圖像區域后,分別計算內容對應的第一圖 像區域和第二圖像區域之間水平距離,從而得到對應每對第一 /第二圖像區域的視差參數。 示例性的,假設在步驟102中確定了4個第一圖像區域,那么在步驟103中就會確定出相對應 的4個第二圖像區域。在步驟104中,分別計算第一圖像區域1和第二圖像區域1之間的視差 參數a、第一圖像區域2和第二圖像區域2之間的視差參數b、第一圖像區域3和第二圖像區域 3之間的視差參數cW及第一圖像區域4和第二圖像區域4之間的視差參數d,獲得與第一圖 像區域或第二圖像區域數量相等的4個視差參數。
[0045] 本實施例中,可第一圖像區域和第二圖像區域中的某個像素點為基準計算水 平距離,也可第一圖像區域和第二圖像區域的同一個區域邊緣為基準計算水平距離, 還可第一圖像區域和第二圖像區域整體為基準計算水平距離,本實施例對計算水平距 離參考的對象不作具體限制。
[0046] 本實施例中,水平距離是指第一圖像區域和第二圖像區域在X上的距離差值,其單 位可W是像素點數量,也可W是一般意義上的長度單位,例如毫米、厘米等,本實施例對此 不作限制,但是一般情況下該距離差值是存在正負之分的。
[0047] 105、確定最大視差參數和最小視差參數,獲得立體片源的視差變動范圍。
[0048] 如前所述,不同內容之間視差可能不同,實際應用中獲取圖像帖整體的視差變動 范圍相比獲得該圖像帖中每個區域的視差參數更有實際價值。因此本步驟中,計算機從獲 取的所有視差參數中找出一個最大的視差參數W及一個最小的視差參數,作為視差變動范 圍的上下邊界值,確定出圖像帖的視差變動范圍。
[0049] 對于立體圖片而言,由于其只包含一個圖像帖,因此本步驟中獲得的視差變動范 圍即為立體片源的視差變動范圍;對于立體視頻而言,由于其包含許多圖像帖,所W可W將 所有圖像帖中的所有視差參數放在一起,從中找出一個最大視差參數和一個最小視差參 數,確定出立體視頻的視差變動范圍。
[0050] 下面,本發明實施例將給出一個對包含多個圖像帖的立體片源進行視差參數獲取 的方法。實際應用中,包含多個圖像帖的立體片源通常為立體視頻,但是也不排除部分立體 圖片由至少兩個圖像帖組成,對于后者情況同樣適用于該方法。如圖2所示,該方法包括:
[0051] 201、從立體片源文件中抽取至少兩個圖像帖作為抽樣帖。
[0052] 本實施例中,計算機對立體片源文件中的至少兩個圖像帖計算視差參數,并將所 有圖像帖的視差參數放在一起,選取最大視差參數和最小視差參數。
[0053] 在本步驟中,計算機按照預定的規則從立體片源文件中抽取圖像帖。抽取幾個圖 像帖,W及抽取哪些圖像帖由該預設規則限定。下面給出兩種抽取圖像針的實現方式:
[0054] 方式一按照抽樣間隔進行抽取
[0055] 通常圖像帖在立體片源文件中具有一定的排列順序,運個順序一般是由圖像帖播 放的先后順序決定的。在本方式中,可W基于該排序,按照預設的抽樣間隔抽取至少兩個抽 樣帖。所述抽樣間隔可W是間隔帖數,也可W是間隔時間。對于前者實現方式,可W規定從 第一個圖像帖開始,每間隔4個圖像帖抽取一個圖像帖,或者每間隔100個圖像帖抽取一個 圖像帖;對于后者實現方式,可W依據圖像帖的播放時序,W播放第一個圖像帖的時刻為起 始時刻,每間隔100毫秒抽取一個圖像帖,或者每間隔15000毫秒抽取一個圖像帖。本方式中 的具體數值僅用作示例性說明,不作為對實際應用的具體限制。
[0化6] 方式二隨機抽取
[0057]計算機可W采用隨機數生成算法對抽樣帖進行抽取。在本方式的一個示例中,計 算機通過隨機數發生函數多次隨機生成數值不大于圖像帖總數量的隨機數,將圖像帖編號 與該隨機數相同的圖像帖抽取出來作為抽取帖,該示例中需要保證生成的隨機數為正整 數。而在本方式的另一個示例中,計算機還可W通過隨機數發生函數多次隨機生成大于0、 小于等于1的浮點型隨機數,然后將隨機數乘W圖像帖總數,即可得到隨機抽取的圖像帖的 編號,運種方式需要對算法進行優化,W保證隨機數與圖像帖總數的乘積為正整數。
[005引除上述兩種方式外,計算機也可W通過預設的人機交互方式接收工作人員設定的 抽取規則,該抽取規則可W僅限定抽取的圖像帖數量,也可W詳細限定抽取哪些具體的圖 像帖,本實施例對此不作限制。在本實施例的一種極端方式中,可W將立體片源文件中所有 的圖像帖全部進行抽取。
[0059] 202、分別獲得每個抽樣帖的視差參數。
[0060] 在本步驟中,計算機針對每一個抽樣帖分別執行圖1中的步驟102至步驟104,獲得 每個抽樣帖的視差參數。示例性的,假設有130個抽樣帖,每個抽樣帖需要計算4個視差參 數,即每個抽樣帖的左右圖像中分別確定有4個第一 /第二圖像區域。那么在對每個抽樣帖 分別執行步驟102至步驟104后,總共獲得了 4*130 = 520個視差參數。
[0061] 需要說明的是,實際應用中,每個抽樣帖計算獲得的視差參數數量可W是相同的, 例如上述示例中的4個,也可W針對不同抽樣帖制定差異化的視差參數數量,例如對部分抽 樣帖獲取3個視差參數,對另一部分抽樣帖獲取7個視差參數。本實施例不對每個抽樣帖中 獲取的視差參數的數量進行限制,同時也不限制每個抽樣帖中獲取的視差參數數量一定相 同。
[0062] 本步驟中,計算機可W按照抽樣帖編號由小到大的順序分別對各個抽樣帖獲取視 差參數,也可W按照抽取抽樣帖的先后順序進行視差參數的獲取。而在實際應用中,當閑置 的計算資源足夠多時,計算機也可W通過預設數量的并行線程,對部分或全部抽樣帖同時 進行視差參數獲取。
[0063] 203、在所有抽樣帖的視差參數中,確定最大視差參數和最小視差參數,獲得立體 片源的視差變動范圍。
[0064] 所述最大視差參數和最小視差參數是從所有抽樣帖的所有視差參數中選擇出來 的。在上述示例中,當對130個抽樣帖獲取了共520個視差參數時,計算機從運520個視差參 數中選擇一個數值最大的視差參數和一個數值最小的視差參數。
[0065] 進一步的,作為對圖1和圖2所示方法的細化,本發明實施例還提供了一種獲取立 體片源視差參數的方法。為便于表述,該方法W從一個圖像帖中獲取視差參數的角度進行 說明,應當明確,雖然表述角度具有一定的局限性,但是并不影響該方法在圖2情況下的應 用。如圖3所示,該方法包括:
[0066] 301、從立體片源文件中讀取圖像帖。
[0067] 302、在左眼圖像或右眼圖像中的預設位置上,確定多個預設尺寸的第一圖像區 域。
[0068] W從左眼圖像中選擇第一圖像區域為例,計算機從左眼圖像中的預設位置上確定 多個預設尺寸的第一圖像區域。其中可W由計算機自動設定或人工手動設定的變量包括: 1、預設位置的坐標;2、預設位置的數量(亦即第一圖像區域的數量);3、第一圖像區域的尺 寸。下面給出本實施例中幾種確定第一圖像區域的示例:
[0069] 如圖4a所示,在本實施例的一種實現方式中,計算機通過隨機算法在左眼圖像中 隨機選取了 3個矩形區域,確定為第一圖像區域(矩形的長寬數值未示出)。
[0070] 如圖4b所示,在本實施例的另一種實現方式中,計算機按照四宮格的布局位置,選 取了 4個正方形區域,確定為第一圖像區域。其中正方形的尺寸W四宮格的尺寸為基礎按預 設比例縮小(正方形的邊長數值未示出)。
[0071] 如圖4c所示,在本實施例的另一種實現方式中,計算機按照九宮格的布局位置,選 取了 9個正方形區域,確定為第一圖像區域。其中正方形的尺寸W九宮格的尺寸為基礎按預 設比例縮小(正方形的邊長數值未示出)。
[0072] 如圖4d所示,在本實施例的另一種實現方式中,計算機在左眼圖像的對角線位置 上選取了 8個正方形區域,確定為第一圖像區域(正方形的邊長數值未示出)。
[0073] 303、對第一圖像區域進行篩選,剔除像素色度的離散程度小于預設離散程度的第 一圖像區域。
[0074] 為提高計算視差參數的準確度,在本實施例的可選方案中,可W對確定出的第一 圖像區域進行篩選,將色度單一的圖像區域剔除掉。實際應用中,對于單一色度的圖像區域 而言(例如全白或者全綠的圖像區域)由于圖像區域中各個像素的色度相同或相近,因此在 后續與第二圖像區域進行比對時,無法準確確定圖像的水平偏移量,由此使得計算出來的 視差參數會大于或小于實際的視差參數。因此在本步驟中,可W將色度單一的第一圖像區 域剔除掉,從而消除不準確的視差參數。需要說明的是,所謂單一色度的圖像區域不僅僅包 括只設及一種色度的圖像區域(例如全白區域),也包括設及多種色度但是色度之間較為相 近的圖像區域。例如設及藍天白云的圖像區域,雖然其包含了白藍兩種色度,但是在一些特 定的氣候條件下,白云的色度跟作為背景的藍天的色度十分相近,兩者沒有明顯的區別,對 于運種圖像區域,本步驟同樣會將其剔除。
[0075] 計算機可W通過計算像素色度離散程度的方式,將單一色度的第一圖像區域剔除 掉。像素色度的離散程度反映了圖像區域中各個像素之間的色度差異程度,離散程度越大 表示像素色度差異越大。預設離散程度用作于區分單一色度圖像區域和色度離散程度滿足 計算要求的圖像區域的邊界條件,實際應用中,預設離散程度可W由計算機根據歷史視差 參數的準確率調教獲得,也可W由工作人員根據經驗設定獲得。
[0076] 在本實施例的一種實現方式中,像素色度的離散程度可W通過標準差值量化體 現,標準差值用于對所有數值相對平均值的偏差程度進行表征,其中平均值是所有數值的 平均值,偏差程度由每一個數值相對平均值的個體差異貢獻得出。因此,標準差值可W從整 體上對所有數值(相對均值)的離散程度進行反映。在本方式中,計算機計算第一圖像區域 中每一個像素分別對應紅、綠、藍Ξ種顏色分量的標準差值,獲得紅色標準差值、綠色標準 差值及藍色標準差值Ξ個差值參數。其中W紅色標準差值為例,該標準差值體現了不同像 素點在紅色分量上相對紅色色度均值的偏差程度,紅色標準差值越大,表示各個像素在紅 色分量上的離散程度越大,圖像區域整體在紅色分量上的色度越不單一。在獲得紅色標準 差值、綠色標準差值及藍色標準差值后,計算機對Ξ者進行求和,獲得綜合標準差值,然后 將該綜合標準差值與預設的標準差值闊值進行比較,將綜合標準差值小于標準差值闊值的 第一圖像區域剔除掉。
[0077] 具體的,標準差值的計算公式如下:
[007引
[0079] 其中,0為標準差值,N為第一圖像區域中的像素點個數,XI為第i個像素點的色度 值,y為所有像素點的色度均值。
[0080] 首先,計算機通過下述公式計算所有像素點在紅色分量上的標準差值:
[0081]
[0082] 其中,r代表紅色分量,Or為第一圖像區域在紅色分量上的標準差值,Xri為第i個像 素點在紅色分量上的色度值,μτ為所有像素點在紅色分量上的色度均值。
[0083] 其次,計算機通過下述公式計算所有像素點在綠色分量上的標準差值:
[0084]
[0085] 其中,g代表綠色分量,og為第一圖像區域在綠色分量上的標準差值,xgi為第i個像 素點在綠色分量上的色度值,yg為所有像素點在綠色分量上的色度均值。
[0086] 然后,計算機通過下述公式計算所有像素點在藍色分量上的標準差值:
[0087]
[008引其中,b代表藍色分量,Ob為第一圖像區域在藍色分量上的標準差值,Xbi為第i個像 素點在藍色分量上的色度值,叫為所有像素點在藍色分量上的色度均值。
[0089]需要說明的是,計算標準差值時,需要對每個像素點相對均值的離散程度進行計 算,但是得到的標準差值則是反映所有像素點整體偏離程度的數值,因此在一個顏色分量 上,一個圖像區域對應個標準差值。
[0090] 由此,計算機就獲得了第一圖像區域對應Ξ個顏色分量的標準差值〇r、〇g和Ob。然 后將〇r、〇g和Ob進行求和,獲得綜合標準差值0。。最后,計算機將0。與預設的標準差值闊值進 行比較,如果0。大于標準差值闊值,則說明第一圖像區域中像素色度的離散程度足夠大,保 留該第一圖像區域;如果0。小于標準差值闊值,則說明第一圖像區域中像素色度的離散程 度不夠大,剔除該第一圖像區域。由此完成第一圖像區域的篩選。在圖4a所示的示例中,右 下角的第一圖像區域會被剔除掉。
[0091] 上述方式僅僅是篩選第一圖像區域的一種實現方式之一,實際應用中,也可W使 用更為簡便的算法篩選第一圖像區域。例如,按照下述公式分別計算各個顏色分量的平均 差值:
[0092]
[0093] 其中,V是某個顏色分量的平均差值,絕對值符號中的字符和運算符號與前述公式 中的內容對應相同。相對于標準差值算法而言,平均差值算法能夠在一定程度上減小計算 機的計算量,但是從反映顏色偏離程度的角度而言,標準差值算法的準確度更高。此外,實 際應用中,還可W根據像素點的亮度變化度對圖像中的物體邊緣進行識別,并據此將包含 物體較少的第一圖像區域剔除掉,本實施例對此不作一一介紹。
[0094] 需要說明的是,步驟303是圖3中的可選步驟,實際應用中也可W在執行完步驟302 后直接執行步驟304,即不對第一圖像區域進行篩選。
[00M] 304、在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖像區域。
[0096] 本實施例中,另一圖像為右眼圖像,計算機在右眼圖像中確定出多個第二圖像區 域,第二圖像區域的數量和尺寸與左眼圖像中的第一圖像區域的數量和尺寸相同。但是值 得注意的是,由于左右圖像之間存在水平間距,因此第二圖像區域在右眼圖像中的位置一 般不同于第一圖像區域在左眼圖像中的位置。當然,對于不體現立體效果的物體,兩圖像區 域分別在左右圖像中的位置是相同的。
[0097] 本步驟中,計算機需要保證第二圖像區域中設及的內容與第一圖像區域中設及的 內容相同,計算機通過圖像匹配技術在右眼圖像中查找第一圖像區域中設及的內容,然后 在該內容上,按照第一圖像區域的尺寸確定出第二圖像區域。示例性的,圖4e示出了在右眼 圖像中確定出的第二圖像區域,可W看出,與左眼圖像中的第一圖像區域相比,兩者在數 量、尺寸及內容上對應相同,但是由于存在水平間距,所W第二圖像區域的位置相對第一圖 像區域而言稍稍偏左一些。
[0098] 305、在相互對應的第一圖像區域和第二圖像區域中,選取同一個像素點。
[0099] 對于左右圖像中相互對應的第一圖像區域和第二圖像區域(即左右圖像中設及同 一內容的第一圖像區域和第二圖像區域),計算機分別從兩個圖像區域中選取同一個像素 點作為計算視差參數的參考依據。所謂同一個像素點是指在圖像區域中的相對坐標相同的 像素點,例如第一圖像區域中的第4行第5個像素,與第二圖像區域中的第4行第5個像素,運 兩個像素點就屬于相同的像素點。由于第一圖像區域和第二圖像區域的尺寸相同,因此使 用相對坐標的概念可W保證選取的像素點是相同的。但需要說明的是,實際應用中不宜使 用左右圖像中的絕對坐標概念選擇像素點,運是因為第一圖像區域和第二圖像區域兩者之 間本身存在水平間距,兩者在左右圖像中的位置有所差異,如果使用相對圖像整體的絕對 坐標概念,那么選擇出來的兩個像素點在第一 /第二圖像區域中的位置就會有所不同。
[0100] 在本實施例的一個示例中,計算機確定的像素點可W如圖5a所示。實際應用中,還 可W選取特殊位置上的像素點,例如圖像區域四角上的像素點、圖像區域中屯、像素點、或者 圖像區域邊緣上的像素點。后Ξ種情況分別如圖化、5c和5d所示。
[0101] 306、計算像素點在X軸上的坐標差值,獲得視差參數。
[0102] 在確定像素點后,計算機計算兩個像素點在X軸上的坐標差值,即得到對應一對第 一 /第二圖像區域的視差參數。計算機針對每一對第一 /第二圖像區域分別順序執行步驟 305和步驟306,獲得對應第一 /第二圖像區域數量的多個視差參數。
[0103] 本實施例中計算機可W獲得兩個像素點分別在左右圖像中的絕對坐標,然后將兩 個絕對坐標的X軸分量值相減,即可獲得像素點在X軸上的坐標差值。
[0104] 307、剔除超出預設視差合理范圍的最大視差參數和最小視差參數。
[0105] 實際應用中,視差參數存在正負之分,運種區別用于體現第二圖像區域相對第一 圖像區域而言是向左偏移了,還是向右偏移了。基于不同的參考標準,向左偏移及向右偏移 在視覺上分別體現物體凸出及凹陷,或者分別體現物體凹陷及凸出。
[0106] -般情況下,視差參數的絕對值反映了物體凸出或凹陷的立體程度,通常立體片 源中物體的立體程度是有一定限制的,凸凹程度過大會使用戶的眼睛感到難受。基于此,當 上述步驟中獲取的最大視差參數過于大,或者最小視差參數過于小(負值)時,說明視差參 數的計算結果是不準確的,需要將運部分視差參數剔除掉。
[0107] 對于最大視差參數的取舍,計算機查找所有數值大于0的視差參數,并計算出第一 視差平均值,將第一視差平均值的預設倍數作為剔除最大視差參數的邊界條件。若最大視 差參數小于第一視差平均值的預設倍數,則保留最大視差參數,否則剔除最大視差參數。在 剔除不符合要求的最大視差參數后,計算機在剩余的視差參數中進一步查找最大視差參 數,并按照上述方式進行取舍,直至不存在大于上述邊界條件的視差參數為止,計算機將此 時剩余的視差參數中數值最大的視差參數確定為最終的最大視差參數。
[0108] 對于最小視差參數的取舍,計算機查找所有數值小于0的視差參數,并出第二視差 平均值,將第二視差平均值的預設倍數作為剔除最小視差參數的邊界條件。若最小視差參 數小于第二視差平均值的預設倍數,則保留最小視差參數,否則剔除最小視差參數。在剔除 不符合要求的最小視差參數后,計算機在剩余的視差參數中進一步查找最小視差參數,并 按照上述方式進行取舍,直至不存在小于上述邊界條件的視差參數為止,計算機將此時剩 余的視差參數中數值最小的視差參數確定為最終的最小視差參數。
[0109] 實際應用中,上述預設倍數可W取"Γ或者"2"。下面給出本步驟的一個示例:計算 機獲得了6個視差參數,分別為"+3"、"+護、"+30"、"-Γ、"-2"和。將視差參數"+3"、"+ 護和"+30"求均值獲得第一視差平均值"+13",然后將第一視差平均值"+13"與預設倍數"2" 相乘得到"巧護。與"+26"相比,視差參數"+30"超出了該數值,計算機將其剔除,視差參數"+ 護沒有超出該數值,計算機將其確定為最大視差參數。然后計算機將視差參數"-Γ、"-2"和 "-12"求均值獲得第二視差平均值"-5",然后將第二視差平均值"-5"與預設倍數"2"相乘得 到"-10"。與"-10"相比,視差參數超出了該數值,計算機將其剔除,視差參數"-2"沒有 超出該數值,計算機將其確定為最小視差參數。
[0110] 與步驟303類似的,步驟307同樣屬于圖3所示流程中的可選步驟。當不執行步驟 307時,在執行完步驟306后直接執行步驟308;當執行步驟307時,圖3所示流程所獲得的視 差變動范圍更加準確。
[0111] 308、根據獲得的最大視差參數和最小視差參數,界定立體片源的視差變動范圍。
[0112] 在上述示例中,最終確定的最大視差參數為"+護,最小視差參數為"-2",由此可W 得到立體片源的視差變動范圍為[-2,+6]。
[0113] 進一步的,作為對上述圖1、圖2及圖3所示方法的實現,本發明實施例還提供了一 種獲取立體片源視差參數的裝置。該裝置可軟件或硬件的形態集成在客戶端側,或者 服務器側,W對本地存儲或外部數據庫提供的立體片源進行視察參數的計算。如圖6所示, 該裝置包括:讀取單元61、區域確定單元62、查找單元63、計算單元64 W及參數確定單元65; 其中
[0114] 讀取單元61,用于從立體片源文件中讀取圖像帖,圖像帖包括左眼圖像和右眼圖 像;
[0115] 區域確定單元62,用于在左眼圖像或右眼圖像中確定多個第一圖像區域;
[0116] 查找單元63,用于在另一個圖像中查找與多個第一圖像區域內容對應的多個第二 圖像區域,相互對應的第一圖像區域和第二圖像區域尺寸相同;
[0117] 計算單元64,用于分別計算每個第一圖像區域和與其對應的第二圖像區域之間的 水平距離,獲得多個視差參數;
[0118] 參數確定單元65,用于確定最大視差參數和最小視差參數,獲得立體片源的視差 變動范圍。
[0119] 進一步的,如圖7所示,該裝置進一步包括:
[0120] 抽取單元66,用于當立體片源文件中存在多個圖像帖時,從立體片源文件中抽取 至少兩個圖像帖作為抽樣帖;
[0121] 計算單元64,用于分別獲得每個抽樣帖的視差參數;
[0122] 參數確定單元65,用于在所有抽樣帖的視差參數中,確定最大視差參數和最小視 差參數,獲得立體片源的視差變動范圍。
[0123] 進一步的,如圖7所示,抽取單元66,包括:
[0124] 間隔抽取模塊661,用于基于圖像帖在立體片源文件中的排序,按照預設的抽樣間 隔抽取至少兩個抽樣帖,抽樣間隔包括間隔帖數和/或間隔時長;或者,
[0125] 隨機抽取模塊662,用于通過隨機數生成算法隨機抽取至少兩個抽樣帖。
[0126] 進一步的,區域確定單元62用于在左眼圖像或右眼圖像中的預設位置上,確定多 個預設尺寸的第一圖像區域;其中,預設位置隨機確定,或者按照圖像的尺寸比例計算確 定。
[0127] 進一步的,如圖7所示,該裝置進一步包括:
[0128] 篩選單元67,用于在確定多個第一圖像區域之后,對第一圖像區域進行篩選,剔除 像素色度的離散程度小于預設離散程度的第一圖像區域。
[0129] 進一步的,如圖7所示,篩選單元67,包括:
[0130] 第一計算模塊671,用于計算第一圖像區域中像素點分別對應紅、綠、藍Ξ種顏色 分量的標準差值;
[0131] 第二計算模塊672,用于對紅色標準差值、綠色標準差值及藍色標準差值進行求和 計算,獲得綜合標準差值;
[0132] 剔除模塊673,用于剔除綜合標準差值小于標準差值闊值的第一圖像區域。
[0133] 進一步的,計算單元64用于:
[0134] 在相互對應的第一圖像區域和第二圖像區域中,選取同一個像素點;
[0135] 計算像素點在X軸上的坐標差值,獲得視差參數。
[0136] 進一步的,參數確定單元65用于剔除超出預設視差合理范圍的最大視差參數和最 小視差參數。
[0137] 進一步的,如圖7所示,參數確定單元65,包括:
[0138] 第一確定模塊651,用于計算數值大于0的所有視差參數的平均值,獲得第一視差 平均值,當最大視差參數小于第一視差平均值的預設倍數時,保留最大視差參數,否則剔除 最大視差參數;
[0139] 第二確定模塊652,用于計算數值小于0的所有視差參數的平均值,獲得第二視差 平均值,當最小視差參數大于第二視差平均值的預設倍數時,保留最小視差參數,否則剔除 最小視差參數。
[0140] 本發明實施例提供的獲取立體片源視差參數的裝置,能夠自動從立體片源文件中 讀取圖像帖,并在圖像帖中的左右眼圖像中分別確定多個數量相同并且一一對應的第一圖 像區域和第二圖像區域,分別計算每一對第一和第二圖像區域的水平距離,獲得對應每一 對第一和第二圖像區域的視差參數,然后從多個視差參數中確定一個最大視差參數和一個 最小視差參數,由此獲得立體片源的視差變動范圍。與現有技術相比,本發明實施例中獲取 圖像帖、確定圖像區域、計算視差參數等過程全部由計算機自動完成,專業人員僅需向計算 機提供立體片源文件的存儲路徑即可。由于不設及人工操作,因此本發明實施例能夠大大 縮短獲取視差參數的耗時,提高處理效率,特別是在對立體視頻進行處理時優勢尤為明顯。
[0141] 需要說明的是,針對上述獲取立體片源視差參數的裝置,凡是本發明實施例中使 用到的各個單元模塊的功能都可W通過硬件處理器化ardware processor)來實現。
[0142] 示例性的,如圖8所示,圖8示出了本發明實施例提供的一種獲取立體片源視差參 數的裝置的實體結構示意圖,該裝置可W包括:處理器(processor )81、通信接口 (Communications Interface)82、存儲器(memory)83和總線84,其中,處理器81、通信接口 82、存儲器83通過總線84完成相互間的通信。通信接口 82可W用于服務器與客戶端之間的 信息傳輸。處理器81可W調用存儲器83中的邏輯指令,W執行如下方法:從立體片源文件中 讀取圖像帖,圖像帖包括左眼圖像和右眼圖像;在左眼圖像或右眼圖像中確定多個第一圖 像區域;在另一個圖像中查找與多個第一圖像區域內容對應的多個第二圖像區域,相互對 應的第一圖像區域和第二圖像區域尺寸相同;分別計算每個第一圖像區域和與其對應的第 二圖像區域之間的水平距離,獲得多個視差參數;確定最大視差參數和最小視差參數,獲得 立體片源的視差變動范圍。
[0143] 此外,上述的存儲器83中的邏輯指令可W通過軟件功能單元的形式實現并作為獨 立的產品銷售或使用時,可W存儲在一個計算機可讀取存儲介質中。基于運樣的理解,本發 明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的部分可軟 件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用W使 得一臺計算機設備(可w是個人計算機,服務器,或者網絡設備等)執行本發明各個實施例 所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(ROM, Read-Only Memoir)、隨機存取存儲器(RAM,Random Access Memoir)、磁碟或者光盤等各種 可W存儲程序代碼的介質。
[0144] W上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 W是或者也可W不是物理上分開的,作為單元顯示的部件可W是或者也可W不是物理單 元,即可W位于一個地方,或者也可W分布到多個網絡單元上。可W根據實際的需要選擇其 中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性 的勞動的情況下,即可W理解并實施。
[0145] 通過W上的實施方式的描述,本領域的技術人員可W清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現,當然也可W通過硬件。基于運樣的理解,上 述技術方案本質上或者說對現有技術做出貢獻的部分可軟件產品的形式體現出來,該 計算機軟件產品可W存儲在計算機可讀存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指 令用W使得一臺計算機設備(可W是個人計算機,服務器,或者網絡設備等)執行各個實施 例或者實施例的某些部分所述的方法。
[0146] 最后應說明的是:W上實施例僅用W說明本發明的技術方案,而非對其限制;盡管 參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可 W對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換; 而運些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和 范圍。
【主權項】
1. 一種獲取立體片源視差參數的方法,其特征在于,所述方法包括: 從立體片源文件中讀取圖像幀,所述圖像幀包括左眼圖像和右眼圖像; 在所述左眼圖像或所述右眼圖像中確定多個第一圖像區域; 在另一個圖像中查找與所述多個第一圖像區域內容對應的多個第二圖像區域,相互對 應的第一圖像區域和第二圖像區域尺寸相同; 分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水平距離,獲得多個視 差參數; 確定最大視差參數和最小視差參數,獲得立體片源的視差變動范圍。2. 根據權利要求1所述的方法,其特征在于,當所述立體片源文件中存在多個圖像幀 時,從所述立體片源文件中抽取至少兩個圖像幀作為抽樣幀; 分別獲得每個抽樣幀的視差參數; 在所有抽樣幀的視差參數中,確定最大視差參數和最小視差參數,獲得立體片源的視 差變動范圍。3. 根據權利要求2所述的方法,其特征在于,所述從所述立體片源文件中抽取至少兩個 圖像幀作為抽樣幀,包括: 基于圖像幀在立體片源文件中的排序,按照預設的抽樣間隔抽取至少兩個抽樣幀,所 述抽樣間隔包括間隔幀數和/或間隔時長;或者, 通過隨機數生成算法隨機抽取至少兩個抽樣幀。4. 根據權利要求1所述的方法,其特征在于,所述在所述左眼圖像或所述右眼圖像中確 定多個第一圖像區域,包括: 在所述左眼圖像或所述右眼圖像中的預設位置上,確定多個預設尺寸的第一圖像區 域;其中,所述預設位置隨機確定,或者按照圖像的尺寸比例計算確定。5. 根據權利要求1所述的方法,其特征在于,在確定多個第一圖像區域之后,所述方法 進一步包括: 對所述第一圖像區域進行篩選,剔除像素色度的離散程度小于預設離散程度的第一圖 像區域。6. 根據權利要求5所述的方法,其特征在于,所述對所述第一圖像區域進行篩選,剔除 像素色度的離散程度小于預設離散程度的第一圖像區域,包括: 計算所述第一圖像區域中像素點分別對應紅、綠、藍三種顏色分量的標準差值; 對紅色標準差值、綠色標準差值及藍色標準差值進行求和計算,獲得綜合標準差值; 剔除綜合標準差值小于標準差值閾值的第一圖像區域。7. 根據權利要求1所述的方法,其特征在于,所述分別計算每個第一圖像區域和與其對 應的第二圖像區域之間的水平距離,獲得多個視差參數,包括: 在相互對應的第一圖像區域和第二圖像區域中,選取同一個像素點; 計算所述像素點在X軸上的坐標差值,獲得視差參數。8. 根據權利要求1所述的方法,其特征在于,所述確定最大視差參數和最小視差參數, 包括: 剔除超出預設視差合理范圍的最大視差參數和最小視差參數。9. 根據權利要求8所述的方法,其特征在于,所述剔除超出預設視差合理范圍的最大視 差參數和最小視差參數,包括: 計算數值大于0的所有視差參數的平均值,獲得第一視差平均值; 若所述最大視差參數小于所述第一視差平均值的預設倍數,則保留所述最大視差參 數,否則剔除所述最大視差參數; 計算數值小于0的所有視差參數的平均值,獲得第二視差平均值; 若所述最小視差參數大于所述第二視差平均值的預設倍數,則保留所述最小視差參 數,否則剔除所述最小視差參數。10. -種獲取立體片源視差參數的裝置,其特征在于,所述裝置包括: 讀取單元,用于從立體片源文件中讀取圖像幀,所述圖像幀包括左眼圖像和右眼圖像; 區域確定單元,用于在所述左眼圖像或所述右眼圖像中確定多個第一圖像區域; 查找單元,用于在另一個圖像中查找與所述多個第一圖像區域內容對應的多個第二圖 像區域,相互對應的第一圖像區域和第二圖像區域尺寸相同; 計算單元,用于分別計算每個第一圖像區域和與其對應的第二圖像區域之間的水平距 離,獲得多個視差參數; 參數確定單元,用于確定最大視差參數和最小視差參數,獲得立體片源的視差變動范 圍。11. 根據權利要求10所述的裝置,其特征在于,所述裝置進一步包括: 抽取單元,用于當所述立體片源文件中存在多個圖像幀時,從所述立體片源文件中抽 取至少兩個圖像幀作為抽樣幀; 所述計算單元,用于分別獲得每個抽樣幀的視差參數; 所述參數確定單元,用于在所有抽樣幀的視差參數中,確定最大視差參數和最小視差 參數,獲得立體片源的視差變動范圍。12. 根據權利要求11所述的裝置,其特征在于,所述抽取單元,包括: 間隔抽取模塊,用于基于圖像幀在立體片源文件中的排序,按照預設的抽樣間隔抽取 至少兩個抽樣幀,所述抽樣間隔包括間隔幀數和/或間隔時長;或者, 隨機抽取模塊,用于通過隨機數生成算法隨機抽取至少兩個抽樣幀。13. 根據權利要求10所述的裝置,其特征在于,所述區域確定單元用于在所述左眼圖像 或所述右眼圖像中的預設位置上,確定多個預設尺寸的第一圖像區域;其中,所述預設位置 隨機確定,或者按照圖像的尺寸比例計算確定。14. 根據權利要求10所述的裝置,其特征在于,所述裝置進一步包括: 篩選單元,用于在確定多個第一圖像區域之后,對所述第一圖像區域進行篩選,剔除像 素色度的離散程度小于預設離散程度的第一圖像區域。15. 根據權利要求14所述的裝置,其特征在于,所述篩選單元,包括: 第一計算模塊,用于計算所述第一圖像區域中像素點分別對應紅、綠、藍三種顏色分量 的標準差值; 第二計算模塊,用于對紅色標準差值、綠色標準差值及藍色標準差值進行求和計算,獲 得綜合標準差值; 剔除模塊,用于剔除綜合標準差值小于標準差值閾值的第一圖像區域。16. 根據權利要求10所述的裝置,其特征在于,所述計算單元用于: 在相互對應的第一圖像區域和第二圖像區域中,選取同一個像素點; 計算所述像素點在X軸上的坐標差值,獲得視差參數。17. 根據權利要求10所述的裝置,其特征在于,所述參數確定單元用于剔除超出預設視 差合理范圍的最大視差參數和最小視差參數。18. 根據權利要求17所述的裝置,其特征在于,所述參數確定單元,包括: 第一確定模塊,用于計算數值大于〇的所有視差參數的平均值,獲得第一視差平均值, 當所述最大視差參數小于所述第一視差平均值的預設倍數時,保留所述最大視差參數,否 則剔除所述最大視差參數; 第二確定模塊,用于計算數值小于〇的所有視差參數的平均值,獲得第二視差平均值, 當所述最小視差參數大于所述第二視差平均值的預設倍數時,保留所述最小視差參數,否 則剔除所述最小視差參數。
【文檔編號】H04N13/00GK105872516SQ201511000911
【公開日】2016年8月17日
【申請日】2015年12月28日
【發明人】楚明磊
【申請人】樂視致新電子科技(天津)有限公司