本發明涉及視頻數據生成,尤其涉及視頻字幕文件生成方法、視頻生成方法、裝置及電子設備。
背景技術:
1、現有的視頻添加字幕的方法,是通過視頻剪輯軟件,在視頻軌道上對應的位置,手動輸入文本內容,并設置該文本內容展示的起始時間和終止時間,來制作視頻字幕,該方法效率低。
技術實現思路
1、本發明提供視頻字幕文件生成方法、裝置、設備及存儲介質,用以解決現有技術中視頻字幕制作效率低的缺陷,實現高效率制作視頻字幕。
2、本發明提供一種視頻字幕文件生成方法,包括:
3、獲取目標文本,對所述目標文本進行切割,得到多條字幕內容以及各個字幕內容間的間隔符號;
4、基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間;
5、基于所述字幕內容在視頻中的開始時間和結束時間生成字幕文件。
6、根據本發明提供的一種視頻字幕文件生成方法,所述基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間,包括:
7、獲取所述字幕內容對應的語音數據;
8、基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間。
9、根據本發明提供的一種視頻字幕文件生成方法,所述獲取所述字幕內容對應的語音數據,包括:
10、對所述字幕內容進行語音合成,得到所述字幕內容對應的語音數據;
11、或者,獲取所述目標文本對應的語音文件,對所述語音文件進行拆分,得到所述字幕內容對應的語音數據。
12、根據本發明提供的一種視頻字幕文件生成方法,所述基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間,包括:
13、獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長;
14、基于第n條所述字幕內容的結束時間、以及第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長,確定第n+1條所述字幕內容的開始時間;
15、基于第n+1條所述字幕內容的開始時間和第n+1條所述字幕內容對應的語音數據的時長,確定第n+1條所述字幕內容的結束時間;
16、其中,n為正整數。
17、根據本發明提供的一種視頻字幕文件生成方法,所述獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長,包括:
18、獲取第n條和第n+1條所述字幕內容之間的間隔符號的符號種類;
19、基于所述符號種類確定第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長。
20、本發明還提供一種視頻生成方法,包括:
21、獲取語音數據,將所述語音數據輸入至語音驅動算法模型中,獲取所述語音驅動算法模型輸出的唇動數據;
22、獲取所述語音數據對應的字幕文件,所述字幕文件是基于如上述任一項所述的視頻字幕文件生成方法生成的;
23、基于所述唇動數據驅動數字人動作,得到初始視頻文件;
24、將所述初始視頻文件、所述語音數據和所述字幕文件合成,得到目標視頻文件。
25、本發明還提供一種視頻字幕文件生成裝置,包括:
26、文本切割模塊,用于獲取目標文本,對所述目標文本進行切割,得到多條字幕內容以及各個字幕內容間的間隔符號;
27、時間確定模塊,用于基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間;
28、文件生成模塊,用于基于所述字幕內容在視頻中的開始時間和結束時間生成字幕文件。
29、本發明還提供一種視頻生成裝置,包括:語音獲取模塊,用于獲取語音數據,將所述語音數據輸入至語音驅動算法模型中,獲取所述語音驅動算法模型輸出的唇動數據;
30、字幕獲取模塊,用于獲取所述語音數據對應的字幕文件,所述字幕文件是基于如上述任一項所述的視頻字幕文件生成方法生成的;
31、驅動模塊,用于基于所述唇動數據驅動數字人動作,得到初始視頻文件;
32、合成模塊,用于將所述初始視頻文件、所述語音數據和所述字幕文件合成,得到目標視頻文件。
33、本發明還提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述任一種所述視頻字幕文件生成方法或實現如上述的視頻生成方法。
34、本發明還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如上述任一種所述視頻字幕文件生成方法或實現如上述的視頻生成方法。
35、本發明提供的視頻字幕文件生成方法、視頻生成方法、裝置及電子設備,將目標文本切割為字幕內容以及字幕內容間的間隔符號,基于間隔符號確定字幕內容在視頻中的開始時間和結束時間并生成字幕文件,不需要人工輸入每條字幕內容的開始時間和結束時間,可以實現基于輸入文本自動生成字幕文件,實現高效制作視頻字幕的效果。
1.一種視頻字幕文件生成方法,其特征在于,包括:
2.根據權利要求1所述的視頻字幕文件生成方法,其特征在于,所述基于所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間,包括:
3.根據權利要求2所述的視頻字幕文件生成方法,其特征在于,所述獲取所述字幕內容對應的語音數據,包括:
4.根據權利要求2所述的視頻字幕文件生成方法,其特征在于,所述基于所述字幕內容對應的語音數據的時長以及所述字幕內容間的間隔符號確定所述字幕內容在視頻中的開始時間和結束時間,包括:
5.根據權利要求4所述的視頻字幕文件生成方法,其特征在于,所述獲取第n條和第n+1條所述字幕內容之間的間隔符號對應的符號時長,包括:
6.一種視頻生成方法,其特征在于,包括:
7.一種視頻字幕文件生成裝置,其特征在于,包括:
8.一種視頻生成裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至5任一項所述視頻字幕文件生成方法或實現如權利要求6所述視頻生成方法。
10.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至5任一項所述視頻字幕文件生成方法或實現如權利要求6所述視頻生成方法。