視頻字幕文件生成方法、視頻生成方法、裝置及電子設備與流程

文檔序號：39707004發布日期：2024-10-22 12:51閱讀：4來源：國知局

導航： X技術> 最新專利>電子通信裝置的制造及其應用技術

本發明涉及視頻數據生成，尤其涉及視頻字幕文件生成方法、視頻生成方法、裝置及電子設備。

背景技術：

1、現有的視頻添加字幕的方法，是通過視頻剪輯軟件，在視頻軌道上對應的位置，手動輸入文本內容，并設置該文本內容展示的起始時間和終止時間，來制作視頻字幕，該方法效率低。

技術實現思路

1、本發明提供視頻字幕文件生成方法、裝置、設備及存儲介質，用以解決現有技術中視頻字幕制作效率低的缺陷，實現高效率制作視頻字幕。

2、本發明提供一種視頻字幕文件生成方法，包括：

3、獲取目標文本，對所述目標文本進行切割，得到多條字幕內容以及各個字幕內容間的間隔符號；

4、基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間；

5、基于所述字幕內容在視頻中的開始時間和結束時間生成字幕文件。

6、根據本發明提供的一種視頻字幕文件生成方法，所述基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間，包括：

7、獲取所述字幕內容對應的語音數據；

8、基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間。

9、根據本發明提供的一種視頻字幕文件生成方法，所述獲取所述字幕內容對應的語音數據，包括：

10、對所述字幕內容進行語音合成，得到所述字幕內容對應的語音數據；

11、或者，獲取所述目標文本對應的語音文件，對所述語音文件進行拆分，得到所述字幕內容對應的語音數據。

12、根據本發明提供的一種視頻字幕文件生成方法，所述基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間，包括：

13、獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長；

14、基于第n條所述字幕內容的結束時間、以及第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長，確定第n+1條所述字幕內容的開始時間；

15、基于第n+1條所述字幕內容的開始時間和第n+1條所述字幕內容對應的語音數據的時長，確定第n+1條所述字幕內容的結束時間；

16、其中，n為正整數。

17、根據本發明提供的一種視頻字幕文件生成方法，所述獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長，包括：

18、獲取第n條和第n+1條所述字幕內容之間的間隔符號的符號種類；

19、基于所述符號種類確定第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長。

20、本發明還提供一種視頻生成方法，包括：

21、獲取語音數據，將所述語音數據輸入至語音驅動算法模型中，獲取所述語音驅動算法模型輸出的唇動數據；

22、獲取所述語音數據對應的字幕文件，所述字幕文件是基于如上述任一項所述的視頻字幕文件生成方法生成的；

23、基于所述唇動數據驅動數字人動作，得到初始視頻文件；

24、將所述初始視頻文件、所述語音數據和所述字幕文件合成，得到目標視頻文件。

25、本發明還提供一種視頻字幕文件生成裝置，包括：

26、文本切割模塊，用于獲取目標文本，對所述目標文本進行切割，得到多條字幕內容以及各個字幕內容間的間隔符號；

27、時間確定模塊，用于基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間；

28、文件生成模塊，用于基于所述字幕內容在視頻中的開始時間和結束時間生成字幕文件。

29、本發明還提供一種視頻生成裝置，包括：語音獲取模塊，用于獲取語音數據，將所述語音數據輸入至語音驅動算法模型中，獲取所述語音驅動算法模型輸出的唇動數據；

30、字幕獲取模塊，用于獲取所述語音數據對應的字幕文件，所述字幕文件是基于如上述任一項所述的視頻字幕文件生成方法生成的；

31、驅動模塊，用于基于所述唇動數據驅動數字人動作，得到初始視頻文件；

32、合成模塊，用于將所述初始視頻文件、所述語音數據和所述字幕文件合成，得到目標視頻文件。

33、本發明還提供一種電子設備，包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，所述處理器執行所述程序時實現如上述任一種所述視頻字幕文件生成方法或實現如上述的視頻生成方法。

34、本發明還提供一種非暫態計算機可讀存儲介質，其上存儲有計算機程序，該計算機程序被處理器執行時實現如上述任一種所述視頻字幕文件生成方法或實現如上述的視頻生成方法。

35、本發明提供的視頻字幕文件生成方法、視頻生成方法、裝置及電子設備，將目標文本切割為字幕內容以及字幕內容間的間隔符號，基于間隔符號確定字幕內容在視頻中的開始時間和結束時間并生成字幕文件，不需要人工輸入每條字幕內容的開始時間和結束時間，可以實現基于輸入文本自動生成字幕文件，實現高效制作視頻字幕的效果。

技術特征：

1.一種視頻字幕文件生成方法，其特征在于，包括：

2.根據權利要求1所述的視頻字幕文件生成方法，其特征在于，所述基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間，包括：

3.根據權利要求2所述的視頻字幕文件生成方法，其特征在于，所述獲取所述字幕內容對應的語音數據，包括：

4.根據權利要求2所述的視頻字幕文件生成方法，其特征在于，所述基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間，包括：

5.根據權利要求4所述的視頻字幕文件生成方法，其特征在于，所述獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長，包括：

6.一種視頻生成方法，其特征在于，包括：

7.一種視頻字幕文件生成裝置，其特征在于，包括：

8.一種視頻生成裝置，其特征在于，包括：

9.一種電子設備，包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序，其特征在于，所述處理器執行所述程序時實現如權利要求1至5任一項所述視頻字幕文件生成方法或實現如權利要求6所述視頻生成方法。

10.一種非暫態計算機可讀存儲介質，其上存儲有計算機程序，其特征在于，所述計算機程序被處理器執行時實現如權利要求1至5任一項所述視頻字幕文件生成方法或實現如權利要求6所述視頻生成方法。

技術總結
本發明提供視頻字幕文件生成方法、視頻生成方法、裝置及電子設備，其中方法包括：獲取目標文本，對目標文本進行切割，得到多條字幕內容以及各個字幕內容間的間隔符號；基于字幕內容間的間隔符號確定字幕內容在視頻中的開始時間和結束時間；基于字幕內容在視頻中的開始時間和結束時間生成字幕文件。本發明可以基于輸入文本自動生成字幕文件，實現高效制作視頻字幕的效果。

技術研發人員：浦貴陽,潘航,吳興文,李英,張文靜
受保護的技術使用者：中移（杭州）信息技術有限公司
技術研發日：
技術公布日：2024/10/21

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：浦貴陽,潘航,吳興文,李英,張文靜
技術所有人：中移（杭州）信息技術有限公司
我是此專利的發明人

上一篇：一種全自動手挽帶一體機的出料機構的制作方法
上一篇：一種渦輪殼成品堆放架的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數字信號處理 2.傳感器技術及應用 3.機電一體化產品開發 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統開發
3、孫老師：1.振動信號時頻分析理論與測試系統設計 2.汽車檢測系統設計 3.汽車電子控制系統設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網絡及物聯網
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！