專利名稱:面向實時音視頻流的字幕疊加系統的制作方法
技術領域:
[0001]本實用新型主要涉及到廣播電視制作設備領域,特指一種字幕疊加系統。
背景技術:
隨著電視技術的發展,電視字幕在電視節目制作中的作用也顯得越來越重要。早期的電視字幕是通過人手寫、手描,用黑白廣告色寫在黑紙上,然后用攝像機或飛點掃描幻燈機逐行、逐句拍攝,最后再把所拍的信號經限幅處理疊加在圖像上,該種方式由于其步驟繁瑣且字幕疊加效果差,已漸漸被淘汰。伴隨著計算機技術的迅速發展,字幕疊加技術也得到了進一步發展,變得越來越來自動化,疊加效果也愈來愈好,應用范圍也變得廣泛。目前,在網絡電視的業務應用中,通常會在機頂盒視頻播放期間往視頻上疊加提示性字幕,這種疊加常采用的方式是把需要顯示的字幕通過某種途徑發送到機頂盒,然后由機頂盒負責字幕實現的具體疊加過程。該種方法雖然成本不高,但由于需要機頂盒本身支持多種字庫、多種語言等,造成其在實現字幕疊加上具有很大的局限性,靈活性不夠;且該種方式下的字幕顯示方式比較簡單,疊加效果差,難以滿足用戶的實時字幕疊加的需求。有從業者提出以計算機為操作平臺的非線性編輯系統,其由于編輯精度高,疊加效果好,不存在預卷、時基誤差等優點,受到各大電視臺的青睞,被廣泛應用于電視節目的制作中。該非線性編輯系統通常由高性能的計算機、視頻壓縮卡和非編軟件等部件組成,其雖然具有編輯精度高、疊加效果好等優點,但由于其在正式編輯前,需要將錄像素材經過數字壓縮后形成數據流先存儲到計算機的硬盤中,編輯時再按編導人員的創作意圖運用非編軟件對所存儲的錄像素材進行編輯、添加字幕等處理,最后再輸出;整個處理過程占用時間較長,在對實時音視頻流進行字幕疊加方面存在一定局限。另一方面,由于非線性編輯系統在進行存儲錄像素材時,需要對錄像素材進行數字壓縮,如果采用低壓縮比進行壓縮后存儲,勢必需要更多的硬盤空間存儲錄像素材,增加硬件設備投入;而如果采用高壓縮比進行壓縮存儲,則又會給圖像帶來一定損耗。由上可知,非線性編輯系統同樣也存在著字幕的實時疊加局限性較大、成本較高等不足。
實用新型內容本實用新型要解決的技術問題就在于針對現有技術存在的技術問題,本實用新型提供一種結構簡單緊湊、成本低廉、操作簡便、可以實現字幕的實時疊加、滿足了電視前端在任意時刻對首視頻流進行字.置加需求的面向實時首視頻流的字.置加系統。為解決上述技術問題,本實用新型采用以下技術方案一種面向實時音視頻流的字幕疊加系統,包括字幕內容服務設備,用以對疊加的字幕信息腳本進行制作;字幕機,用以對實時音視頻流進行字幕疊加;所述字幕內容服務設備與字幕機相連并將制作好的字幕信息腳本發送給字幕機;[0011]編碼模塊,與字幕機相連,用以對疊加字幕信息后的視頻流數據進行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設備。作為本實用新型的進一步改進所述字幕機包括解碼模塊,用以對音視頻流進行解碼并獲得每幀圖像數據 ;字幕疊加模塊,包括解析單元和疊加單元,所述解析單元用以對字幕內容服務設備發送來的字幕信息腳本進行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;所述疊加單元用以將解析單元生成的字幕畫面疊加到視頻層上,并輸出至編碼模塊。所述解碼模塊中還包括一用以對前端傳送的音視頻流數據進行解碼的解碼單元。所述解析單元還包括一用以存儲字幕信息腳本的存儲器。所述解碼模塊和字幕疊加模塊為機頂盒主芯片。與現有技術相比,本實用新型的優點在于I、本實用新型面向實時音視頻流的字幕疊加系統,結構簡單、成本低廉,不用對音視頻流進行壓縮和存儲,直接在解碼后的視頻流上疊加字幕并編碼輸出,實現了字幕的實時疊加,滿足了電視前端在任意時刻對音視頻流進行字幕疊加的需求;且這種對音視頻流不經存儲直接實時疊加的方式還避免了存儲時造成的視頻圖像損耗和存儲設備投入;2、本實用新型中的字幕機可采用一個具有視頻解碼和字幕疊加功能的芯片完成子.置加功能,如機頂盒王芯片,成本相對降低;3、本實用新型將字幕信息融合在視頻流中,用戶端無需升級或更換設備,便可以直接顯示疊加字幕后的視頻信息,適用范圍廣。
圖I是本實用新型結構的框架示意圖。圖2是本實用新型的執行原理架構示意圖。圖3是本實用新型在具體應用實例中的工作流程示意圖。圖例說明10、字幕內容服務設備;20、字幕機;201、解碼模塊;202、字幕疊加模塊;2021、解析單元;2022、疊加單元;30、編碼模塊。
具體實施方式
以下將結合說明書附圖和具體實施例對本實用新型做進一步詳細說明。如圖I所示,本實用新型的面向實時音視頻流的字幕疊加系統,包括字幕內容服務設備10、字幕機20以及編碼模塊30。字幕內容服務設備10用以對疊加的字幕信息腳本進行制作,并將其發送給字幕機20。該字幕內容服務設備10可以為具有字幕編輯功能的設備,本實施例中,其為裝載有字幕編輯軟件的計算機。字幕機20用以對實時音視頻流進行字幕疊加,字幕機20包括解碼模塊201和字幕疊加模塊202。其中,解碼模塊201用以對音視頻流進行解碼并獲得每幀圖像數據;字幕疊加模塊202包括解析單元2021和疊加單元2022,解析單元2021用以對字幕內容服務設備10發送來的字幕信息腳本進行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;疊加單元2022用以將解析単元2021生成的字幕畫面疊加到視頻層上,即視頻圖像數據上,并輸出至編碼模塊30。編碼模塊30用以對字幕疊加后的每幀圖像數據進行重新編碼,該編碼模塊30可以為碼流生成器或編碼器;例如本實施例中,其可采用北京世紀鼎點軟件有限公司推出的PowerSmart編碼器去對字幕疊加后的每幀圖像數據進行重新編碼。本實施例中,解 碼模塊201中還包括一解碼單元(圖中未示),該解碼単元用以對前端傳送的音視頻流數據進行解碼。本實施例中,解析單元2021還包括一用以存儲字幕信息腳本的存儲器(圖中未示)。本實施例中,解碼模塊201和字幕疊加模塊202可采用機頂盒主芯片實現,例如,可采用海思的HI3100E芯片去實現對TS流中音視頻流數據的解碼,從而獲取到每幀視頻圖像數據以及進而對解碼后每幀視頻圖像數據進行字幕疊加等功能。由此可見,本實用新型為ー種通過利用機頂盒的OSD技術,在電視前端實現對實時音視頻流進行字幕疊加,且疊加速度快、成本低的字幕疊加系統。本實用新型相比于現有的非線性編輯系統,在達到字幕疊加目的的同時已大大降低了設備成本。參見圖2,本實用新型在工作吋,將攜帶原始音視頻信息的TS流送入字幕機20 ;首先字幕機20會對TS流中的視頻流數據進行解碼,以獲取每幀視頻圖像數據,同時,字幕機20中的字幕疊加模塊202對輸入的字幕信息腳本進行解析并獲得字幕信息,且進ー步將該字幕信息數據添加到OSD層上;其次,字幕疊加模塊202將添加字幕信息后的OSD層和視頻幀層相互疊加,進ー步形成新的每幀視頻圖像數據;最后重新將疊加后的每幀圖像數據進行重新編碼,并將編碼后的視頻流數據與其他TS流信息通過電視信號混合器等設備組合成新的混合音視頻流進行輸出。如圖3所示,為本實用新型在具體應用過程中的流程示意圖,其包括以下步驟步驟401 :字幕內容服務設備10對字幕信息腳本文件進行制作,并通過網ロ(或串ロ)將定義好字幕顯示效果的字幕信息腳本文件發送給字幕機20 ;其中,字幕信息腳本定義了顯示信息和控制關鍵字描述信息,上述顯示信息包括字幕文本,控制關鍵字描述信息包括字幕顯示位置、字幕語言、字體顔色、背景顔色、字體樣式以及滾動方向等。步驟402 :字幕機20將自字幕內容服務設備10處獲取的字幕信息腳本保存在存儲器中。進一歩,字幕疊加模塊202將字幕信息疊加到實時音視頻流上,具體實現過程如下步驟403 :解析単元2021實時從存儲器中讀取字幕信息腳本并對其進行解析,并將解析獲得的字幕信息添加到同屏顯示層上生成字幕畫面;步驟404 :疊加單元2022將解析単元2021生成的字幕畫面與經解碼模塊201解碼獲得的視頻圖像數據進行疊加;步驟405 ;編碼模塊30對疊加字幕信息后的視頻流數據進行重新編碼,進ー步該重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設備。以上僅是本實用新型的優選實施方式,本實用新型的保護范圍并不僅局限于上述實施例,凡屬于本實用新型思路下的技術方案均屬于本實用新型的保護范圍。應當指出,對 于本技術領域的普通技術人員來說,在不脫離本實用新型原理前提下的若干改進和潤飾,應視為本實用新型的保護范圍。
權利要求1.一種面向實時首視頻流的子.置加系統,其特征在于,包括 字幕內容服務設備(10),用以對疊加的字幕信息腳本進行制作; 字幕機(20),用以對實時音視頻流進行字幕疊加;所述字幕內容服務設備(10)與字幕機(20)相連并將制作好的字幕信息腳本發送給字幕機(20); 編碼模塊(30),與字幕機(20)相連,用以對疊加字幕信息后的視頻流數據進行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設備。
2.根據權利要求I所述的面向實時音視頻流的字幕疊加系統,其特征在于,所述字幕機(20)包括 解碼模塊(201 ),用以對音視頻流進行解碼并獲得每幀圖像數據; 字幕疊加模塊(202),包括解析単元(2021)和疊加單元(2022),所述解析単元(2021)用以對字幕內容服務設備(10)發送來的字幕信息腳本進行解析,且將獲得的字幕信息添加在OSD層上,生成字幕畫面;所述疊加単元(2022)用以將解析単元(2021)生成的字幕畫面疊加到視頻層上,并輸出至編碼模塊(30)。
3.根據權利要求2所述的面向實時音視頻流的字幕疊加系統,其特征在于所述解碼模塊(201)中還包括一用以對前端傳送的音視頻流數據進行解碼的解碼單元。
4.根據權利要求2所述的面向實時音視頻流的字幕疊加系統,其特征在于所述解析単元(2021)還包括一用以存儲字幕信息腳本的存儲器。
5.根據權利要求2所述的面向實時音視頻流的字幕疊加系統,其特征在于所述解碼豐旲塊(201)和子.置加ホ吳塊(202)為機頂盒王芯片。
專利摘要本實用新型公開了一種面向實時音視頻流的字幕疊加系統,包括字幕內容服務設備,用以對疊加的字幕信息腳本進行制作;字幕機,用以對實時音視頻流進行字幕疊加;所述字幕內容服務設備與字幕機相連并將制作好的字幕信息腳本發送給字幕機;編碼模塊,與字幕機相連,用以對疊加字幕信息后的視頻流數據進行重新編碼,并將重新編碼后的視頻流與其它TS流信息組合成新的混合音視頻流輸出至終端用戶設備。本實用新型具有結構簡單緊湊、成本低廉、操作簡便,可以實現字幕的實時疊加,滿足了電視前端在任意時刻對音視頻流進行字幕疊加的需求。
文檔編號H04N5/278GK202406198SQ201120558388
公開日2012年8月29日 申請日期2011年12月28日 優先權日2011年12月28日
發明者趙歡, 陳佐 申請人:湖南大學