專利名稱:一種視頻圖像發(fā)送方法、裝置及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種視頻圖像發(fā)送方法、裝置及系統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)和視頻編碼技術(shù)的進步,具有現(xiàn)實感和立體感的3D顯示技術(shù)已經(jīng)逐漸應(yīng)用到各種通信終端,如電視、游戲機、筆記本電腦、視頻播放器,以及手機等。使用3D 視頻播放終端可以發(fā)送3D視頻,能夠提高3D視頻業(yè)務(wù)的用戶體驗。3D視頻播放終端有兩個圖像采集單元(攝像頭),兩個圖像采集單元同時獲取在不同角度拍攝的兩幅圖像,圖像經(jīng)編碼后發(fā)送給接收方終端。接收方對接收到的圖像進行解碼,用戶感受到具有立體效果的視頻。但是,3D視頻在以某種格式表現(xiàn)時,帶來大量的數(shù)據(jù)。大量的數(shù)據(jù)對獲取視頻、編碼、發(fā)送,或顯示3D視頻的各個環(huán)節(jié)都提出了挑戰(zhàn)。在網(wǎng)絡(luò)技術(shù),尤其是在無線網(wǎng)絡(luò)技術(shù)中,不僅帶寬資源非常缺乏,而且無線發(fā)送環(huán)境中無限終端的功率有限,大量的數(shù)據(jù)在較窄的帶寬中發(fā)送,會引起丟包以及圖像的失真,從而導(dǎo)致無法有效并可靠地發(fā)送3D視頻。目前,2D視頻發(fā)送過程使用H.324協(xié)議簇中的H. 263視頻通信協(xié)議進行視頻發(fā)送。 H. 263視頻通信協(xié)議是在低速率下(幾十Kbps)發(fā)送視頻的一種通信標(biāo)準(zhǔn),使用這種通信協(xié)議發(fā)送視頻可以最大限度的減少需要發(fā)送的視頻的數(shù)據(jù)量,節(jié)省帶寬。由于3D視頻的數(shù)據(jù)量較大,在現(xiàn)有H. 263所要求的帶寬下,無法有效并可靠地發(fā)送3D視頻。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種視頻圖像發(fā)送方法、裝置及系統(tǒng),用以在現(xiàn)有H. 263所要求的帶寬下,可靠有效地發(fā)送3D視頻。本發(fā)明實施例提供的一種視頻圖像發(fā)送方法,應(yīng)用于視頻播放設(shè)備之間的3D視頻圖像發(fā)送,包括比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。本發(fā)明實施例提供的一種視頻數(shù)圖像接收方法,包括接收終端發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。本發(fā)明實施例提供的一種視頻圖像發(fā)送裝置,包括視頻圖像比較單元,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像發(fā)送單元,在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。
4
本發(fā)明實施例提供的一種視頻圖像接收裝置,包括視頻圖像接收單元,用于接收來自網(wǎng)絡(luò)側(cè)的I幀視頻圖像中的與第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像生成單元,用于根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。本發(fā)明實施例提供的一種視頻圖像發(fā)送系統(tǒng),包括視頻圖像發(fā)送方和視頻圖像接收方;所述視頻圖像發(fā)送方,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;以及當(dāng)發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè);所述視頻圖像接收方,用于接收所述視頻圖像發(fā)送方發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。本發(fā)明實施例,通過比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;以及當(dāng)發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè);所述網(wǎng)絡(luò)側(cè)接收所述I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像,實現(xiàn)了在現(xiàn)有H. 263所要求的帶寬下,可靠有效地發(fā)送3D視頻。
圖I為本發(fā)明實施例提供的包含遠(yuǎn)景和近景的左視圖和右視圖;圖2為本發(fā)明實施例提供的一種視頻圖像發(fā)送方法總體流程示意圖;圖3為本發(fā)明實施例提供的一種視頻圖像接收方法總體流程示意圖;圖4為本發(fā)明實施例提供的一種視頻圖像發(fā)送方法具體流程示意圖;圖5為本發(fā)明實施例提供的H. 263圖像層的編碼結(jié)構(gòu)示意圖;圖6為本發(fā)明實施例提供的H. 263塊組層的編碼結(jié)構(gòu)示意圖;圖7為本發(fā)明實施例提供的宏塊層的數(shù)據(jù)結(jié)構(gòu)示意圖;圖8為本發(fā)明實施例提供的一種視頻圖像接收方法具體流程示意圖;圖9為本發(fā)明實施例提供的一種視頻圖像發(fā)送裝置結(jié)構(gòu)示意圖;圖10為本發(fā)明實施例提供的一種視頻圖像發(fā)送裝置結(jié)構(gòu)示意圖;圖11為本發(fā)明實施例提供的一種視頻圖像接收裝置結(jié)構(gòu)示意圖;圖12為本發(fā)明實施例提供的一種視頻圖像接收裝置結(jié)構(gòu)示意圖;圖13為本發(fā)明實施例提供的一種視頻圖像發(fā)送系統(tǒng)結(jié)構(gòu)示意圖。
具體實施例方式本發(fā)明實施例提供了一種視頻圖像發(fā)送方法、裝置及系統(tǒng),用以在現(xiàn)有H. 263所要求的帶寬下,可靠有效地發(fā)送3D視頻。3D也稱為立體,基本原理為人的左眼和右眼由于觀看景象的位置不同,看到的景象具有一定差別。大腦對接收到的來自左眼和右眼的不同圖像進行處理,人感受到物體的遠(yuǎn)近差別,對看到的視頻有了視覺立體感。3D視頻播放終端具有兩個相當(dāng)于人的左眼和右眼的圖像采集單元,所述圖像采集單元可以為攝像頭。圖像采集單元可以一次采集左眼和右眼兩幅視頻圖像,將采集到的左眼視頻圖像(或左視圖)和右眼視頻圖像(或右視圖)同時傳遞給視頻播放終端的視頻編碼器,由視頻接收方對接收到的視頻圖像進行解碼并顯示3D圖像。根據(jù)成像原理得知,物體與鏡頭的距離越近,左右兩個攝像頭成像位置的差異越大。通常情況下,只有距離鏡頭比較近的圖像(也即近景),左眼視頻圖像和右眼視頻圖像才具有明顯差異,而距離鏡頭比較遠(yuǎn)的圖像(也即遠(yuǎn)景)在左右眼中成像的位置之間的差距很小,可以忽略。例如參見圖1, 為左眼和右眼成像后的兩幅圖像,每幅圖像包含近景(如樹木)和遠(yuǎn)景(如房屋),由于左右眼觀測角度的不同,兩幅圖像顯示出的樹木與房屋的位置關(guān)系是不同的,這也是立體感產(chǎn)生的原因。因此,現(xiàn)有的3D技術(shù)設(shè)法讓人的左眼和右眼同時看到左右兩個不同的視頻畫面, 以使人感受到立體效果。目前,視頻發(fā)送過程中使用H.263通信協(xié)議,這種通信協(xié)議使用了差量發(fā)送、運動預(yù)測估計等手段對視頻進行處理,可以最大程度節(jié)省帶寬。具體地,通過I幀和P幀交替的方式發(fā)送圖像,每幀圖像最終都可以在圖像接收方生成一幅兩幅完整的圖像。所述I幀通常稱為INTRA,用于發(fā)送完整的圖像,例如發(fā)送2D視頻的一幅完整圖像,或者發(fā)送3D視頻的兩幅圖像(左眼圖像和右眼圖像),1幀作為P幀的基準(zhǔn)幀使用。P幀通常稱為INTER,用于發(fā)送與上一幀的差量,接收端接收到該P幀的發(fā)送的差量值,根據(jù)上一幀生成的完整圖像, 得到當(dāng)前一幀的完整圖像。每間隔多個P幀發(fā)送一個I幀,以防止出錯后無基準(zhǔn)幀無法恢復(fù)圖像。上述P幀使用了預(yù)測編碼,圖像接收方和發(fā)送方同時針對之前視頻中物體的移動特征預(yù)測下一幅圖像中之前在移動物體的移動地點,如果預(yù)測結(jié)果正確,那么發(fā)送方不需要發(fā)送任何數(shù)據(jù),接收方直接根據(jù)自己的預(yù)測顯示下一幅圖像。如果預(yù)測結(jié)果不正確,即有差異,圖像發(fā)送方只需要向圖像接收方發(fā)送圖像中某一部分移動的運動向量,接收方根據(jù)自己的預(yù)測結(jié)果,再根據(jù)發(fā)送方發(fā)送的運動向量調(diào)整圖像,就能得到下一幅圖像,最大程度減少了網(wǎng)絡(luò)發(fā)送的數(shù)據(jù)量。由于3D視頻發(fā)送相比較2D視頻發(fā)送,每幀發(fā)送的圖像由一幅變成兩幅(左眼視頻圖像和右眼視頻圖像),圖像的宏塊數(shù)據(jù)比之前要多一倍,I幀和P幀需都要發(fā)送相當(dāng)于 2D視頻2倍的數(shù)據(jù),大大增加了發(fā)送數(shù)據(jù)的帶寬。為了在現(xiàn)有的H. 263通信協(xié)議體系以盡量小的改動兼容3D格式的視頻發(fā)送,以達(dá)到有效并可靠地發(fā)送3D視頻數(shù)據(jù)。本發(fā)明實施例通過在已有的圖像編碼器前或圖像編碼器中增加左右視圖比較單元,以及在已有的解碼器后或圖像編碼器中增加左右視圖生成單
J Li ο所述左右視圖比較單元和左右視圖生成單元用于在發(fā)送I幀圖像時,只發(fā)送其中一幅完整的視圖和另一幅視圖中與所述完整視圖有差異的視圖,無需發(fā)送與所述完整圖像相同的圖像,節(jié)約帶寬。本發(fā)明實施例在發(fā)送P幀圖像時,只需要發(fā)送一套運動向量給視頻接收方。這是因為,如果視頻中的景象發(fā)生運動,左右兩幅視圖中的運動位移是一致的,即運動向量相同,只需發(fā)送一個運動向量,接收方可以將所述運動向量同時作用在左右兩幅視圖上。在發(fā)送P幀時,相比較現(xiàn)有技術(shù),數(shù)據(jù)量并沒有增加。因此,本發(fā)明在現(xiàn)有H. 263通信協(xié)議所要求的帶寬下,就可以高效優(yōu)質(zhì)地發(fā)送3D視頻。下面通過附圖對本發(fā)明實施例提供的技術(shù)方案進行說明。參見圖2,本發(fā)明實施例提供的一種視頻圖像發(fā)送方法,用于發(fā)送3D視頻,該方法包括以下步驟SlOU比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;S102、在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。較佳地,在得到所述宏塊之后,發(fā)送所述宏塊之前,該方法還包括對所述第一視頻圖像以及所述宏塊進行編碼,將編碼后的視頻圖像發(fā)送給網(wǎng)絡(luò)側(cè)。較佳地,在發(fā)送P幀視頻圖像時,向網(wǎng)絡(luò)側(cè)發(fā)送用于表征所述P幀視頻圖像相對于上一幀視頻圖像的第一視頻圖像或者第二視頻圖像的運動位移。本發(fā)明實施例中所述的網(wǎng)絡(luò)側(cè)為接收視頻的設(shè)備。參見圖3,本發(fā)明實施例提供的一種視頻數(shù)圖像接收方法,具體包括以下步驟S201、接收終端(視頻圖像發(fā)送方)發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;S202、根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。較佳地,根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像,具體為將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像。較佳地,所述在接收到第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊之后,生成所述第二視頻圖像之前,該方法還包括對所述第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊進行解碼。較佳地,所述視頻圖像接收方法還包括接收終端發(fā)送的P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移;以及根據(jù)所述一套運動向量,對上一幀視頻圖像中的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。下面結(jié)合附圖分別說明本發(fā)明實施例提供的發(fā)送視頻圖像的過程和接收視頻圖像的過程。為描述方便,下面提到的發(fā)送方為發(fā)送視頻圖像終端設(shè)備,接收方為網(wǎng)絡(luò)側(cè)接收視頻圖像的設(shè)備,所述發(fā)送方設(shè)備或接收方設(shè)備可以為任何支持3D視頻的視頻播放設(shè)備。 以及所提到的左視圖為左眼視頻圖像,右視圖為右眼視頻圖像。當(dāng)視頻播放設(shè)備作為發(fā)送方,用于發(fā)送視頻圖像時,本發(fā)明實施例提供的視頻播放設(shè)備發(fā)送視頻的方法,具體流程如圖4所示,包括步驟S301、發(fā)送方采集左視圖和右視圖。具體地,視頻播放設(shè)備上的兩個視頻采集單元,如攝像頭,以不同的角度(一般為左右兩個攝像頭)采集某一時刻的兩幅視頻圖像,圖像A和圖像B,每幅圖像中包括遠(yuǎn)景和近景。所述遠(yuǎn)景一般為視頻畫面中的背景或者離鏡頭較遠(yuǎn)的景象。左右兩個視圖中的遠(yuǎn)景在整個視圖中的位置幾乎沒有差異。其中,左右兩個攝像頭成像的位置差異不超過一定像素則認(rèn)為沒有差異,如不超過2個像素或I個像素為沒有差異。同理,所述近景為視頻畫面中的離鏡頭較近的景象。近景成像的位置差異較大。因此,本發(fā)明實施例中視頻圖像的發(fā)送過程中,I幀的遠(yuǎn)景無需重復(fù)發(fā)送。S302、比較所述左視圖和右視圖,得到左視圖中與右視圖有差異的圖像的宏塊。所述宏塊為左右視圖中成像位置有差異的宏塊。具體地,視頻播放設(shè)備中,置于圖像編碼器中或獨立于所述圖像編碼器的圖像比較單元,對左視圖和右視圖中的宏塊進行匹配,找出左視圖和右視圖中有差異的宏塊。例如,找出左視圖相對于右視圖,與右視圖有差異的宏塊。S303、圖像編碼器對所述宏塊和右視圖進行編碼。如圖5中的H. 263圖像層的編碼結(jié)構(gòu),當(dāng)圖像層的編碼結(jié)構(gòu)中用于表示圖像類型的PTYPE中的第九個bit為“I”時,代表該幀圖像為INTRA編碼,即I幀編碼。當(dāng)PTYPE中的第九個bit為“O”時,代表該幀圖像為INTER編碼,即P幀編碼。I幀編碼在本發(fā)明實施例所述的I幀中同時包含了兩幅視圖,一幅為完整的視圖,如所述右視圖,一幅為不完整的視圖,如左視圖中與右視圖有差異的宏塊,也即宏塊。具體地,I幀的塊組(group of blocks)包含了左右兩幅視圖的圖像信息,其中右視圖是完整的圖像,左視圖在實際數(shù)據(jù)中只包含與右視圖在像素層面有差異的部分。如圖6中H. 263塊組層的編碼結(jié)構(gòu),在現(xiàn)有的H. 263中,I巾貞中的一個塊組數(shù)據(jù)(macroblock data)包含一個圖像的所有宏塊。本發(fā)明實施例中,一個塊組數(shù)據(jù)僅包含一幅視圖中的遠(yuǎn)景宏塊和近景宏塊,以及另一幅視圖中與近景宏塊有差異的宏塊,省去了對其中一幅視圖的遠(yuǎn)景宏塊和該視圖中部分近景宏塊(該部分近景宏塊為與另一視圖中近景宏塊相同的宏塊)。本發(fā)明實施例,相比較同時編碼包含有兩幅完整視圖的I幀3D視圖,大大降低了編碼器編碼圖像的數(shù)據(jù)量,也降低了 3D視頻圖像數(shù)據(jù)的發(fā)送量。相比較編碼一幅圖像的I幀2D視圖,僅僅增加了數(shù)據(jù)量較小的宏塊,幾乎沒有增加網(wǎng)絡(luò)發(fā)送的帶寬。圖像編碼技術(shù)中,對圖像的編碼包括I巾貞編碼、P巾貞編碼和PB巾貞編碼等。下面簡單說明本發(fā)明對P幀編碼的過程。P幀編碼P幀是進行運動預(yù)測與差量發(fā)送的幀,結(jié)合運動預(yù)測與補償,只發(fā)送每一塊圖像與預(yù)測有差異的差量。參見圖7所示的宏塊層的數(shù)據(jù)結(jié)構(gòu)示意圖,如果某個宏塊預(yù)測與實際完全相同, 則在該宏塊層的COD為0,后面不再發(fā)送數(shù)據(jù)。否則,COD為1,并發(fā)送運動向量或者發(fā)送運動向量與塊數(shù)據(jù)。本發(fā)明實施例在編碼P幀圖像時,當(dāng)接收到所述宏塊和右視圖時,不進行任何處理。本發(fā)明實施例在發(fā)送P幀的過程中包括如下兩種情況I、當(dāng)視頻圖像中的圖像沒有發(fā)生運動時,左視圖和右視圖都未發(fā)生改變,也即運動預(yù)測值正確,與上一幀得到的圖像的差量為零,則發(fā)送方不需要發(fā)送任何數(shù)據(jù),接收方直接根據(jù)自己的預(yù)測顯示下一幅圖像。2、當(dāng)視頻圖像中的圖像發(fā)生運動時,運動向量與運動預(yù)測有所差別,同時,圖像本身并未發(fā)生突變,則P幀僅僅發(fā)送一套運動向量,該一套運動向量為左視圖的運動向量或者右視圖的運動向量,發(fā)送左視圖還是右視圖的運動向量都是一樣的,這是因為,一旦視頻中的景象發(fā)生運動,左右兩幅視圖中的運動位移是一致的,運動向量也是相同的,因此只傳
輸一套運動矢量。接收方接收到所述運動向量時,作用在已經(jīng)解碼的左視圖和右視圖上。S304、將所述編碼后的宏塊和右視圖發(fā)送給接收方。該宏塊和右視圖屬于I幀圖像。當(dāng)視頻播放設(shè)備作為接收方,用于接收視頻圖像時,本發(fā)明實施例提供的視頻播放設(shè)備接收視頻的方法,具體流程如圖8所示,包括步驟S401、接收發(fā)送方發(fā)送的I幀視頻圖像,具體地,接收所述宏塊和右視圖。S402、對所述I幀視頻圖像進行解碼。具體地,對接收到的完整視圖(如右視圖)和不完整的視圖(如只包含差異宏塊的視圖)按照正常解碼方式進行解碼。S403、生成完整的左視圖。具體地,視頻圖像生成單元通過將解碼后的右視圖中與左視圖相同的宏塊,與所述左視圖與右視圖有差異的宏塊進行拼接,生成一幅完整的左視圖。或者通過將右視圖中與左視圖相同的宏塊添加到所述不完整的左視圖中。需要說明的是,本發(fā)明對P幀進行解碼時,具體為當(dāng)接收到發(fā)送方的一套運動向量時,將該運動向量作用到上一幀的左右兩幅視圖上,生成新的完整的左右兩幅視圖。參見圖9,本發(fā)明實施例提供的一種視頻發(fā)送裝置,包括視頻圖像比較單元11,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像發(fā)送單元12,發(fā)送I幀視頻時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。較佳地,所述視頻圖像發(fā)送單元12還用于在發(fā)送P幀視頻圖像時,向網(wǎng)絡(luò)側(cè)發(fā)送用于表征所述P幀視頻圖像相對于上一幀視頻圖像中第一視頻圖像或第二視頻圖像的運動位移。參見圖10,所述裝置還包括視頻圖像編碼單元13,該視頻圖像編碼單元13可以包括在所述視頻圖像比較單元11內(nèi),也可以是獨立于所述視頻圖像比較單元11,用于對所述第一視頻圖像以及所述宏塊進行編碼,將所述編碼后的視頻圖像發(fā)送給網(wǎng)絡(luò)側(cè);視頻圖像接收單元14,用于接收來自網(wǎng)絡(luò)側(cè)的I幀視頻圖像中的與第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;以及接收P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移;視頻圖像生成單元15,用于根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像,具體地,將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像
9中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像;以及根據(jù)所述一套運動向量,對上一幀的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。視頻圖像解碼單元16,用于對所述第一視頻圖像以及所述宏塊進行解碼。參見圖11,本發(fā)明實施例提供的一種視頻圖像接收裝置,包括視頻圖像接收單元21,用于接收來自網(wǎng)絡(luò)側(cè)的I幀視頻圖像中的與第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;以及接收P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移。視頻圖像生成單元22,用于根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像,具體地,將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像;以及根據(jù)所述一套運動向量,對上一幀的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。參見圖12,所述視頻圖像發(fā)送裝置,還包括視頻圖像解碼單元23,用于對所述第一視頻圖像以及所述宏塊進行解碼。參見圖13,本發(fā)明實施例提供的一種視頻圖像發(fā)送系統(tǒng),包括視頻圖像發(fā)送方 33和視頻圖像接收方34 ;視頻圖像發(fā)送方31,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;以及當(dāng)發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè);視頻圖像接收方32,用于接收所述視頻圖像發(fā)送方發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。本發(fā)明實施例提供的發(fā)送3D視頻的裝置,可以適用于發(fā)送2D視頻,具體地,在進行2D視頻發(fā)送的過程中,關(guān)閉一個圖像采集單元,同時視頻圖像比較單元11對接收到的2D 視頻圖像不做任何處理,并將所述2D視頻圖像發(fā)送給編碼器進行編碼;接收方的視頻圖像生成單元13對接收到的2D圖像不做任何處理,直接顯示2D視頻。本發(fā)明實施例提供的3D視頻發(fā)送的方法及裝置,在現(xiàn)有的H. 263協(xié)議下,能夠兼容2D與3D視頻發(fā)送使得用戶能夠相互根據(jù)機型特征發(fā)送。需要說明的是,在H. 245 (H. 324協(xié)議簇中的通話控制協(xié)議)中應(yīng)添加3D2D或/和 3D視頻播放支持能力,對宏塊的數(shù)量進行握手約定,避免通信出錯。當(dāng)移動終端都支持雙攝像頭3D可視電話時,通過H. 245握手成功,才會啟動3D可視電話。當(dāng)一方不支持該功能握手失敗時,視頻部分仍然以原有H. 263協(xié)議的要求進行編解碼。綜上所述,本發(fā)明實施例,通過在已有的圖像編碼器前或圖像編碼器中增加左右視圖比較單元,以及在已有的解碼器后或圖像編碼器中增加左右視圖生成單元。所述左右視圖比較單元和左右視圖生成單元用于在發(fā)送I幀圖像時,只發(fā)送其中一幅完整的視圖和另一幅視圖中與所述完整視圖有差異的視圖,無需發(fā)送與所述完整圖像相同的部分圖像。 在發(fā)送P幀圖像時,只需要發(fā)送一幀中的一幅視圖的運動向量給視頻接收方。也就是說,發(fā)送3D視頻的P幀所耗的數(shù)據(jù)量與發(fā)送2D視頻所耗的數(shù)據(jù)量完全相同。發(fā)送3D視頻的I幀所耗的數(shù)據(jù)量比發(fā)送2D視頻所耗的數(shù)據(jù)量稍多。在現(xiàn)有H. 263通信協(xié)議所要求的帶寬下,最大程度的在保證3D圖像發(fā)送的基礎(chǔ)上節(jié)省了帶寬,并能高效優(yōu)質(zhì)地發(fā)送3D視頻。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲吐介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
1權(quán)利要求
1.一種視頻圖像發(fā)送方法,應(yīng)用于視頻播放設(shè)備之間的3D視頻圖像發(fā)送,其特征在于,該方法包括比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,在得到所述宏塊之后,發(fā)送所述宏塊之前,該方法還包括對所述第一視頻圖像以及所述宏塊進行編碼,將編碼后的視頻圖像發(fā)送給網(wǎng)絡(luò)側(cè)。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,該方法還包括在發(fā)送P幀視頻圖像時, 向網(wǎng)絡(luò)側(cè)發(fā)送用于表征所述P幀視頻圖像相對于上一幀視頻圖像的第一視頻圖像或者第二視頻圖像的運動位移。
4.一種視頻數(shù)圖像接收方法,其特征在于,該方法包括接收終端發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像,具體為將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像。
6.根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述在接收到第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊之后,生成所述第二視頻圖像之前,該方法還包括對所述第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊進行解碼。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,該方法還包括接收終端發(fā)送的P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,該方法還包括根據(jù)所述一套運動向量,對上一幀視頻圖像中的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。
9.一種視頻圖像發(fā)送裝置,其特征在于,該裝置包括視頻圖像比較單元,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像發(fā)送單元,在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,該裝置還包括視頻圖像編碼單元,用于對所述第一視頻圖像以及所述宏塊進行編碼,將所述編碼后的視頻圖像發(fā)送給網(wǎng)絡(luò)側(cè)。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,視頻圖像發(fā)送單元還用于在發(fā)送P幀視頻圖像時,向網(wǎng)絡(luò)側(cè)發(fā)送用于表征所述P幀視頻圖像相對于上一幀視頻圖像中第一視頻圖像或第二視頻圖像的運動位移。
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,該裝置還包括視頻圖像接收單元,用于接收來自網(wǎng)絡(luò)側(cè)的I幀視頻圖像中的與第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像生成單元,用于根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,視頻圖像生成單元具體用于將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像。
14.根據(jù)權(quán)利要求9所述的裝置,其特征在于,該裝置還包括視頻圖像解碼單元,用于對所述第一視頻圖像以及所述宏塊進行解碼。
15.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述視頻圖像接收單元還用于接收P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移。
16.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述視頻圖像生成單元還用于根據(jù)所述一套運動向量,對上一幀的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。
17.—種視頻圖像接收裝置,其特征在于,該裝置包括視頻圖像接收單元,用于接收來自網(wǎng)絡(luò)側(cè)的I幀視頻圖像中的與第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;視頻圖像生成單元,用于根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,視頻圖像生成單元具體用于將所述第一視頻圖像中與第二視頻圖像相同的宏塊,與所述第二視頻圖像中與第一視頻圖像有差異的宏塊進行拼接,生成第二視頻圖像。
19.根據(jù)權(quán)利要求17所述的裝置,其特征在于,該裝置還包括視頻圖像解碼單元,用于對所述第一視頻圖像以及所述宏塊進行解碼。
20.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述視頻圖像接收單元還用于接收P幀視頻圖像中用于表征所述P幀視頻圖像相對于上一幀視頻圖像中的第一視頻圖像或第二視頻圖像的運動位移。
21.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述視頻圖像生成單元還用于根據(jù)所述一套運動向量,對上一幀的第一視頻圖像與第二視頻圖像進行運動預(yù)測補償,生成當(dāng)前幀的第一視頻圖像與第二視頻圖像。
22.一種視頻圖像發(fā)送系統(tǒng),其特征在于,包括視頻圖像發(fā)送方和視頻圖像接收方; 所述視頻圖像發(fā)送方,用于比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;以及當(dāng)發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè);所述視頻圖像接收方,用于接收所述視頻圖像發(fā)送方發(fā)送的I幀視頻圖像中的第一視頻圖像以及第二視頻圖像中與第一視頻圖像有差異的宏塊;根據(jù)所述第一視頻圖像以及所述宏塊生成所述第二視頻圖像。
全文摘要
本發(fā)明公開了一種視頻圖像發(fā)送方法、裝置及系統(tǒng),涉及通信技術(shù)領(lǐng)域,用以在現(xiàn)有H.263所要求的帶寬下,可靠有效地發(fā)送3D視頻。本發(fā)明提供的一種視頻圖像發(fā)送方法,應(yīng)用于視頻播放設(shè)備之間的3D視頻圖像發(fā)送,包括比較采集到的第一視頻圖像和第二視頻圖像,得到第二視頻圖像中與第一視頻圖像有差異的宏塊;在發(fā)送I幀視頻圖像時,將所述第一視頻圖像以及所述宏塊發(fā)送給網(wǎng)絡(luò)側(cè)。
文檔編號H04N7/50GK102595164SQ20121004594
公開日2012年7月18日 申請日期2012年2月27日 優(yōu)先權(quán)日2012年2月27日
發(fā)明者房穩(wěn) 申請人:中興通訊股份有限公司