本發明涉及語音識別技術領域,具體涉及一種語料標注方法和裝置及終端。
背景技術:
語音識別技術有兩個關鍵資源,語音模型和聲學模型,其中聲學模型需要人工來標注語料內容,將標注后的語料內容作為訓練集進行訓練。為了提高識別率,可以根據語料內容進行分類,如:性別、年齡、噪聲類型等,整理之后進行有針對性的訓練,實現提高識別率的目的。
現有的語料標注方式多為本地標注,將語料發放給工作人員,工作人員新建文件用來記載音頻名稱及其對應的音頻內容文本。在標注的過程中,需要采用音頻播放器逐個播放語料音頻文件,然后工作人員找出播放的音頻對應的音頻名稱,再標注音頻名稱對應的文本內容。這種語料標注方式,時間成本高,工作人員需要花費大部分時間進行音頻語料與音頻名稱的匹配工作。本地保存不便于管理,多文件操作也降低了工作效率。
技術實現要素:
有鑒于此,本發明實施例提供了一種語料標注方法和裝置及終端,以解決現有技術語料標注的時間成本高、工作效率低的問題。
根據第一方面,本發明實施例提供了一種語料標注方法,適用于帶有顯示屏的終端,該語料標注方法包括:獲取并顯示批量語料列表,其中,所述批量語料列表包含音頻列表和文本列表,其中,所述音頻列表中的每一單元格對應所述文本列表中的一個單元格;在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻;接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,作為所述文本列表中所述目標音頻對應的單元格上標注的文本內容。
可選地,還包括:在接收到文件導出命令時,獲取標注有文本內容的批量語料列表對應的文件;導出所述標注有文本內容的批量語料列表對應的文件,其中,所述文件導出命令用于指示批量導出所述標注有文本內容的批量語料列表對應的文件。
可選地,所述在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻,包括:判斷是否存在選中所述音頻列表或者文本列表中單元格的操作;當存在所述選中所述音頻列表或者文本列表中單元格的操作時,查找所述音頻列表或者文本列表中被選中的單元格;播放所述被選中的單元格對應的音頻。
可選地,接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,包括:接收用于打開在所述文本列表中所述目標音頻對應的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預設文本內容,所述文本列表中的每一單元格對應一個下拉列表;接收通過鼠標輸入的用于從所述多個預設文本內容中選擇文本的選中命令,將所述選中命令所指示的文本內容標注在所述目標音頻對應的單元格上;或者,接收用于打開在所述文本列表中所述目標音頻對應的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預設文本內容,所述文本列表中的每一單元格對應一個下拉列表;接收通過鍵盤輸入的用于從所述多個預設文本內容中選擇文本的選中命令,確定所述選中命令所對應的文本內容,標注在所述目標音頻對應的單元格上。
可選地,在接收從多個預設文本內容中選中的所述目標音頻對應的文本內容之后,還包括:判斷是否存在選中所述文本列表中另一單元格的操作;當存在所述選中所述文本列表中另一單元格的操作時,保存所述文本列表中前一單元格上標注的文本內容。
根據第二方面,本發明實施例提供了一種語料標注裝置,適用于帶有顯示屏的終端,該語料標注裝置包括:第一獲取單元,用于獲取并顯示批量語料列表,其中,所述批量語料列表包含音頻列表和文本列表,其中,所述音頻列表中的每一單元格對應所述文本列表中的一個單元格;播放單元,用于在接收到用于指示所述音頻列表中目標音頻進行播放的音頻播放命令時,播放所述目標音頻;接收單元,用于接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,作為所述文本列表中所述目標音頻對應的單元格上標注的文本內容。
可選地,還包括:第二獲取單元,用于在接收到文件導出命令時,獲取標注有文本內容的批量語料列表對應的文件;導出單元,用于導出所述標注有文本內容的批量語料列表對應的文件,其中,所述文件導出命令用于指示批量導出所述標注有文本內容的批量語料列表對應的文件。
可選地,所述播放單元包括:判斷模塊,用于判斷是否存在選中所述音頻列表或者文本列表中單元格的操作;查找模塊,用于當存在所述選中所述音頻列表或者文本列表中單元格的操作時,查找所述音頻列表或者文本列表中被選中的單元格;播放模塊,用于播放所述被選中的單元格對應的音頻。
可選地,所述接收單元包括:第一接收模塊,用于接收用于打開在所述文本列表中所述目標音頻對應的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預設文本內容,所述文本列表中的每一單元格對應一個下拉列表;第二接收模塊,用于接收通過鼠標輸入的用于從所述多個預設文本內容中選擇文本的選中命令,將所述選中命令所指示的文本內容標注在所述目標音頻對應的單元格上;或者,第三接收模塊,用于接收用于打開在所述文本列表中所述目標音頻對應的單元格的下拉列表的命令,獲取所述下拉列表中的所述多個預設文本內容,所述文本列表中的每一單元格對應一個下拉列表;第四接收模塊,用于接收通過鍵盤輸入的用于從所述多個預設文本內容中選擇文本的選中命令,確定所述選中命令所對應的文本內容,標注在所述目標音頻對應的單元格上。
可選地,還包括:判斷單元,用于在接收從多個預設文本內容中選中的所述目標音頻對應的文本內容之后,判斷是否存在選中所述文本列表中另一單元格的操作;保存單元,用于當存在所述選中所述文本列表中另一單元格的操作時,保存所述文本列表中前一單元格上標注的文本內容。
根據第三方面,本發明實施例提供了一種/終端,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器執行第一方面或者第一方面的任意一種可選方式中所述的語料標注方法。
根據第四方面,本發明實施例提供了一種非暫態計算機可讀存儲介質,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令用于使所述計算機執行第一方面或者第一方面的任意一種可選方式中所述的語料標注方法。
根據第五方面,本發明實施例提供了一種計算機程序產品,所述計算機程序產品包括存儲在非暫態計算機可讀存儲介質上的計算程序,所述計算機程序包括程序指令,當所述程序指令被計算機執行時,使所述計算機執行第一方面或者第一方面的任意一種可選方式中所述的語料標注方法。
根據本發明實施例,通過采用批量語料列表,預先將音頻文件與其對應的待輸入內容的文本列表對應,這樣,用戶只需要在批量語料列表上觸發音頻播放并且標注相應的文本內容,終端進行音頻播放并且接收用戶標注的文本內容,即可完成語料的標注,無需花費時間進行音頻語料與音頻名稱的匹配,降低了語料標注的時間成本,提高了工作效率。
附圖說明
一個或多個實施例通過與之對應的附圖中的圖片進行示例性說明,這些示例性說明并不構成對實施例的限定,附圖中具有相同參考數字標號的元件表示為類似的元件,除非有特別申明,附圖中的圖不構成比例限制。,在附圖中:
圖1示出了根據本發明實施例的語料標注方法的流程圖;
圖2示出了本發明實施例的一種批量語料列表的示意圖;
圖3示出了本發明實施例的另一種批量語料列表的示意圖;
圖4示出了根據本發明另一實施例的語料標注方法的流程圖;
圖5示出了根據本發明又一實施例的語料標注方法的流程圖;
圖6示出了本發明實施例的又一種批量語料列表的示意圖;
圖7示出了根據本發明實施例的語料標注裝置的示意圖;
圖8示出了根據本發明另一實施例的語料標注裝置的示意圖;
圖9示出了根據本發明又一實施例的語料標注裝置的示意圖;
圖10是本發明實施例提供的執行語料標注方法的終端的硬件結構示意圖。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
本發明實施例的第一方面,提供了一種語料標注方法,該方法適用于帶有顯示屏的終端,由該終端來執行,如圖1所示,該方法包括:
步驟S101,獲取并顯示批量語料列表,其中,批量語料列表包含音頻列表和文本列表,其中,音頻列表中的每一單元格對應文本列表中的一個單元格。
本實施例中所述的批量語料列表為預先設置的,工作人員在進行執行語料標注任務時,直接從系統中提取相關任務,獲取任務對應的批量語料列表。也就是說,本發明實施例中,采用任務下發的方式向下分配語料標注任務。語料標注任務可以在網頁上執行,終端獲取到批量語料列表之后,再以網頁的形式顯示。
由于批量語料列表包含音頻列表和文本列表,并且音頻列表和文本列表上的單元格一一對應,音頻列表上的音頻可以直接觸發播放,以便于用戶(或者工作人員)進行標注。
步驟S102,在接收到用于指示音頻列表中目標音頻進行播放的音頻播放命令時,播放目標音頻。
終端上顯示出批量語料列表之后,用戶可以通過輸入裝置,例如,鼠標或者鍵盤等向終端輸入音頻播放命令,終端進行響應,播放相應的音頻。
步驟S103,接收從多個預設文本內容中選中的目標音頻對應的文本內容,作為文本列表中目標音頻對應的單元格上標注的文本內容。
用戶聽到終端播放的音頻文件之后,將所聽到內容標注在該音頻對應的文本列表的單元格上。終端接收用戶從多個預設文本內容中選中的文本內容,存儲在相應的單元格上,完成該音頻語料的標注。
根據本發明實施例,通過采用批量語料列表,預先將音頻文件與其對應的待輸入內容的文本列表對應,這樣,用戶只需要在批量語料列表上觸發音頻播放并且標注相應的文本內容,終端進行音頻播放并且接收用戶標注的文本內容,即可完成語料的標注,無需花費時間進行音頻語料與音頻名稱的匹配,降低了語料標注的時間成本,提高了工作效率。
圖2示出了本發明實施例的一種批量語料列表的示意圖。如圖2所示,其中,“音頻”一列表示上述的音頻列表,“更正”一列表示上述的文本列表。
圖3示出了本發明實施例的另一種批量語料列表的示意圖。該批量語料列表為從文本到語音(Text To Speech,簡稱為TTS)的標注,其中,“音頻”一列仍表示上述的音頻列表,“原文”一列表示對應的音頻對應的文本內容,“更正”一列仍表示上述的文本列表,但是該列表內所標注的為對應的音頻播放中無法聽清的內容,例如,音頻對應的文本內容為“2012/13賽季英超第12輪”,但是其中“12輪”無法聽清,則進行相應標注,該標注內容可以預置,然后供用戶進行選擇。
圖4示出了根據本發明另一實施例的語料標注方法的流程圖。該方法適用于帶有顯示屏的終端,由該終端來執行,如圖4所示,該方法包括:
步驟S401,獲取并顯示批量語料列表,其中,批量語料列表包含音頻列表和文本列表,其中,音頻列表中的每一單元格對應文本列表中的一個單元格。
步驟S402,在接收到用于指示音頻列表中目標音頻進行播放的音頻播放命令時,播放目標音頻。
步驟S403,接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,作為所述文本列表中所述目標音頻對應的單元格上標注的文本內容。
該實施例中,步驟S401至S403與圖1所示的步驟S101至S103相類似,具體參見上述描述。
本發明實施例中,用戶在進行語料標注的過程中,需要對每一個音頻文件進行標注,因此,上述步驟S402和步驟S403在語料標注任務執行完之前,終端反復執行的步驟。
步驟S404,在接收到文件導出命令時,獲取標注有文本內容的批量語料列表對應的文件。
步驟S405,導出標注有文本內容的批量語料列表對應的文件,其中,文件導出命令用于指示批量導出標注有文本內容的批量語料列表對應的文件。
本實施例中,文件導出命令為用戶輸入的,當其任務執行完成后,可以點擊終端上的文件導出命令,終端接收該命令之后,獲取標注有文本內容的皮料音量列表的文件,然后導出該文件。
根據本發明實施例,用戶在語料標注任務完成后,可以通過文件導出命令導出批量語料列表的文件,從而實現語料的批量標注和文件的導出,提高了工作效率。
可選地,在進行文件的導出過程中,用戶還可以選擇篩選條件,(如語料時間,是否標注,負責人等),導出所需的文件,進行分析統計。
圖5示出了根據本發明又一實施例的語料標注方法的流程圖。該方法適用于帶有顯示屏的終端,由該終端來執行,如圖5所示,該方法包括:
步驟S501,獲取并顯示批量語料列表,其中,批量語料列表包含音頻列表和文本列表,其中,音頻列表中的每一單元格對應文本列表中的一個單元格。
該實施例中,步驟S501與圖1所示的步驟S101相類似,具體參見上述描述。
步驟S502,判斷是否存在選中音頻列表或者文本列表中單元格的操作。
步驟S503,當存在選中音頻列表或者文本列表中單元格的操作時,查找音頻列表或者文本列表中被選中的單元格。
步驟S504,播放被選中的單元格對應的音頻。
本實施例中,以選中單元格作為觸發音頻播放的條件,其中,由于音頻列表與文本列表中的單元格一一對應,因此,單元格可以是音頻列表中的單元格,也可以是文本列表中單元格。也即是,根據活動單元格來觸發音頻播放,當活動單元格發生移動時,即,從目標單元格移動到下一個單元格時,則觸發下一個單元格對應的音頻文件進行播放
如圖2所示,當打開批量語料列表時,活動單元格默認在文本列表的第一個單元格中,此時,播放其對應的音頻文件,當活動單元格移動到第二個單元格時,則自動播放第二個單元格的音頻內容。
可選地,本發明實施例中,用戶還可以使用通過鼠標點擊或者快捷鍵輸入的方式控制音頻暫停播放,終端接收到相應的暫停命令之后,暫停當前播放的音頻。
步驟S505,接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,作為所述文本列表中所述目標音頻對應的單元格上標注的文本內容。
該實施例中,步驟S505與圖1所示的步驟S103相類似,具體參見上述描述。
根據本發明實施例,根據選中的單元格自動進行音頻播放,無需用戶進行點擊操作,提高了工作效率。
作為一種可選的實施方式,接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,包括:接收用于打開在文本列表中目標音頻對應的單元格的下拉列表的命令,獲取下拉列表中的多個預設文本內容,文本列表中的每一單元格對應一個下拉列表;接收通過鼠標輸入的用于從多個預設文本內容中選擇文本的選中命令,將選中命令所指示的文本內容標注在目標音頻對應的單元格上。
本發明實施例中,預先給文本列表中的每一單元格配置對應的一個下拉列表,該下拉列表中包含有可選的文本內容,用戶在進行語料標注時,可以直接通過鼠標從下拉列表中選擇相應的文本內容,然后點擊確認,也即是輸入選中命令,終端接收用戶選擇的文本內容標注在相應的位置,從而實現鼠標選擇快捷標注,進一步提高語料標注的效率。如圖6所示,當標注第一欄時,用戶使用鼠標點擊該單元格,調出下拉列表,終端接收該命令并輸出下拉列表供用戶選擇。
作為另一種可選的實施方式,接收從多個預設文本內容中選中的目標音頻對應的文本內容,包括:接收用于打開在文本列表中目標音頻對應的單元格的下拉列表的命令,獲取下拉列表中的多個預設文本內容,文本列表中的每一單元格對應一個下拉列表;接收通過鍵盤輸入的用于從多個預設文本內容中選擇文本的選中命令,確定選中命令所對應的文本內容,標注在目標音頻對應的單元格上。
與上述方案的區別在于,該實施例中,用戶可以用過預設設置的快捷鍵從下拉列表中選擇對應的文本內容,例如,通過“↑”、“↓”按鍵上下移動活動單元格,點擊回車鍵確認選中;或者,按照下拉列表的單元格數量,輸入相應的順序數值,比如下拉菜單中有5個句子,文字輸入1,則選中第1個句子。本發明實施例,通過采用預設的快捷鍵的方式選中文本內容進行標注,進一步提高文本標注的速度。
作為一種可選的實施方式,本發明實施例的語料標注方法,在接收從多個預設文本內容中選中的所述目標音頻對應的文本內容之后,還包括:判斷是否存在選中文本列表中另一單元格的操作;當存在選中文本列表中另一單元格的操作時,保存文本列表中前一單元格上標注的文本內容。
本實施例中,當目標音頻標注完對應的文本內容之后,如果活動單元格跳轉到其它的單元格,也即是選中其它的單元格,則目標音頻對應的文本內容自動保存,這樣,無需用戶進行手動保存,方便快捷。如圖2和圖3所示,“狀態”一列表示音頻對應的標注內容的存儲狀態,當標注完成之后,選中另一個單元格時,自動由“未保存”變為“已保存”狀態。
需要說明的是,本發明實施例中,用戶在進行語料標注時,可以通過鍵盤輸入命令,也可以通過鼠標輸入命令,或者采用鍵盤與鼠標結合的方式輸入命令。具體地,結合圖2和圖3分別進行說明。
圖2所示的批量語料列表可以采用全鍵盤標注,或者鍵盤與鼠標結合標注,全鍵盤標注意味在標注過程中只要通過鍵盤就可以實現標注語料。
使用該批量語料列表的標注中多為確定文字,通過快捷鍵進行選擇,標注過程如下:
1)領取任務后進入標注頁面,語料將自動播放,可通過快捷鍵(例如A鍵),控制音頻的播放暫停,焦點即活動單元格自動聚焦在第一個單元格中;
2)通過tab鍵或者方向右鍵移動焦點到下個單元格,可快捷鍵選中(如選擇第一個,則按下對應快捷鍵,回車)下拉列表中的內容,文字自動匹配,填充到對應位置,或者輸入文字進行標注,其中下拉列表的快捷鍵為數據庫配置,可進行變更;
3)焦點向右移動,上一條記錄自動保存,對應狀態由“未保存”變為“已保存”;
4)逐條標注,翻頁繼續。
圖3所述的批量語料列表可以采用全鼠標標注,具體地,該標注為TTS標注,其中文字已知,根據錄音標注無法聽清的文本內容。具體地:
1)進入標注頁面,點擊播放,對應的音頻自動播放;
2)使用鼠標選中文字,文字自動顯示在“更正”列,如果標選錯誤,點擊重置按鈕,填寫該條語料的備注內容;
3)標注一頁,在翻頁前,點擊保存按鈕,狀態由“未保存”轉為“已保存”,標注成功。
本發明實施例的第二方面,提供了一種語料標注裝置,適用于帶有顯示屏的終端,可以有該終端實現其功能,如圖7所示,該裝置包括:第一獲取單元701、播放單元702和接收單元703。
第一獲取單元701用于獲取并顯示批量語料列表,其中,批量語料列表包含音頻列表和文本列表,其中,音頻列表中的每一單元格對應文本列表中的一個單元格。
本實施例中所述的批量語料列表為預先設置的,工作人員在進行執行語料標注任務時,直接從系統中提取相關任務,第一獲取單元701獲取任務對應的批量語料列表。也就是說,本發明實施例中,采用任務下發的方式向下分配語料標注任務。語料標注任務可以在網頁上執行,第一獲取單元701獲取到批量語料列表之后,再以網頁的形式顯示。
由于批量語料列表包含音頻列表和文本列表,并且音頻列表和文本列表上的單元格一一對應,音頻列表上的音頻可以直接觸發播放,以便于用戶(或者工作人員)進行標注。
播放單元702用于在接收到用于指示音頻列表中目標音頻進行播放的音頻播放命令時,播放目標音頻。
語料標注裝置上顯示出批量語料列表之后,用戶可以通過輸入裝置,例如,鼠標或者鍵盤等向終端輸入音頻播放命令,語料標注裝置進行響應,播放單元702播放相應的音頻。
接收單元703用于接收從多個預設文本內容中選中的所述目標音頻對應的文本內容,作為所述文本列表中所述目標音頻對應的單元格上標注的文本內容。
用戶聽到播放單元702播放的音頻文件之后,將所聽到內容標注在該音頻對應的文本列表的單元格上。接收單元703接收用戶從多個預設文本內容中選中的文本內容,存儲在相應的單元格上,完成該音頻語料的標注。
根據本發明實施例,通過采用批量語料列表,預先將音頻文件與其對應的待輸入內容的文本列表對應,這樣,用戶只需要在批量語料列表上觸發音頻播放并且標注相應的文本內容,語料標注裝置進行音頻播放并且接收用戶標注的文本內容,即可完成語料的標注,無需花費時間進行音頻語料與音頻名稱的匹配,降低了語料標注的時間成本,提高了工作效率。
圖8示出了根據本發明另一實施例的語料標注裝置的示意圖。該裝置適用于帶有顯示屏的終端,由該終端來實現其功能,如圖8所示,該裝置包括:第一獲取單元701、播放單元702和接收單元703,還包括:第二獲取單元704和導出單元705。
第二獲取單元704用于在接收到文件導出命令時,獲取標注有文本內容的批量語料列表對應的文件。
導出單元705用于導出標注有文本內容的批量語料列表對應的文件,其中,文件導出命令用于指示批量導出標注有文本內容的批量語料列表對應的文件。
本實施例中,文件導出命令為用戶輸入的,當其任務執行完成后,可以點擊終端上的文件導出命令,終端接收該命令之后,獲取標注有文本內容的皮料音量列表的文件,然后導出該文件。
根據本發明實施例,用戶在語料標注任務完成后,可以通過文件導出命令導出批量語料列表的文件,從而實現語料的批量標注和文件的導出,提高了工作效率。
圖9示出了根據本發明又一實施例的語料標注裝置的示意圖。該裝置適用于帶有顯示屏的終端,由該終端來實現其功能,如圖9所示,該裝置包括:第一獲取單元701、播放單元702和接收單元703,其中,播放單元702包括:判斷模塊7021、查找模塊7022和播放模塊7023。
判斷模塊7021用于判斷是否存在選中音頻列表或者文本列表中單元格的操作。
查找模塊7022用于當存在選中音頻列表或者文本列表中單元格的操作時,查找音頻列表或者文本列表中被選中的單元格。
播放模塊7023用于播放被選中的單元格對應的音頻。
本實施例中,以選中單元格作為觸發音頻播放的條件,其中,由于音頻列表與文本列表中的單元格一一對應,因此,單元格可以是音頻列表中的單元格,也可以是文本列表中單元格。也即是,根據活動單元格來觸發音頻播放,當活動單元格發生移動時,即,從目標單元格移動到下一個單元格時,則觸發下一個單元格對應的音頻文件進行播放
如圖2所示,當打開批量語料列表時,活動單元格默認在文本列表的第一個單元格中,此時,播放其對應的音頻文件,當活動單元格移動到第二個單元格時,則自動播放第二個單元格的音頻內容。
作為一種可選的實施方式,接收單元包括:第一接收模塊,用于接收用于打開在文本列表中目標音頻對應的單元格的下拉列表的命令,獲取下拉列表中的多個預設文本內容,文本列表中的每一單元格對應一個下拉列表;第二接收模塊,用于接收通過鼠標輸入的用于從多個預設文本內容中選擇文本的選中命令,將選中命令所指示的文本內容標注在目標音頻對應的單元格上。
本發明實施例中,預先給文本列表中的每一單元格配置對應的一個下拉列表,該下拉列表中包含有可選的文本內容,用戶在進行語料標注時,可以直接通過鼠標從下拉列表中選擇相應的文本內容,然后點擊確認,也即是輸入選中命令,終端接收用戶選擇的文本內容標注在相應的位置,從而實現鼠標選擇快捷標注,進一步提高語料標注的效率。如圖6所示,當標注第一欄時,用戶使用鼠標點擊該單元格,調出下拉列表,終端接收該命令并輸出下拉列表供用戶選擇。
作為另一種可選的實施方式,接收單元包括:第三接收模塊,用于接收用于打開在文本列表中目標音頻對應的單元格的下拉列表的命令,獲取下拉列表中的多個預設文本內容,文本列表中的每一單元格對應一個下拉列表;第四接收模塊,用于接收通過鍵盤輸入的用于從多個預設文本內容中選擇文本的選中命令,確定選中命令所對應的文本內容,標注在目標音頻對應的單元格上。
與上述方案的區別在于,該實施例中,用戶可以用過預設設置的快捷鍵從下拉列表中選擇對應的文本內容,例如,通過“↑”、“↓”按鍵上下移動活動單元格,點擊回車鍵確認選中;或者,按照下拉列表的單元格數量,輸入相應的順序數值,比如下拉菜單中有5個句子,文字輸入1,則選中第1個句子。本發明實施例,通過采用預設的快捷鍵的方式選中文本內容進行標注,進一步提高文本標注的速度。
作為一種可選的實施方式,本發明實施例的語料標注裝置還包括:判斷單元,用于在接收從多個預設文本內容中選中的所述目標音頻對應的文本內容之后,判斷是否存在選中文本列表中另一單元格的操作;保存單元,用于當存在選中文本列表中另一單元格的操作時,保存文本列表中前一單元格上標注的文本內容。
本實施例中,當目標音頻標注完對應的文本內容之后,如果活動單元格跳轉到其它的單元格,也即是選中其它的單元格,則目標音頻對應的文本內容自動保存,這樣,無需用戶進行手動保存,方便快捷。如圖2和圖3所示,“狀態”一列表示音頻對應的標注內容的存儲狀態,當標注完成之后,選中另一個單元格時,自動由“未保存”變為“已保存”狀態。
圖10是本發明實施例提供的執行語料標注方法的終端的硬件結構示意圖,如圖10所示,該設備包括一個或多個處理器100以及存儲器200,圖10中以一個處理器100為例。
存儲器200存儲有可被至少一個處理器100執行的指令,指令被至少一個處理器100執行,以使至少一個處理器100執行本發明實施例所述的語料標注方法。
執行語料標注方法的設備還可以包括:輸入裝置300和輸出裝置400。
處理器100、存儲器200、輸入裝置300和輸出裝置400可以通過總線或者其他方式連接,圖100中以通過總線連接為例。
處理器100可以為中央處理器(Central Processing Unit,CPU)。處理器100還可以為其他通用處理器、數字信號處理器(Digital Signal Processor,DSP)、專用集成電路(Application Specific Integrated Circuit,ASIC)、現場可編程門陣列(Field-Programmable Gate Array,FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等芯片,或者上述各類芯片的組合。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。
存儲器200作為一種非暫態計算機可讀存儲介質,可用于存儲非暫態軟件程序、非暫態計算機可執行程序以及模塊,如本申請實施例中的語料標注方法對應的程序指令/模塊(例如,附圖7所示的第一獲取單元701、播放單元702和接收單元703)。處理器100通過運行存儲在存儲器200中的非暫態軟件程序、指令以及模塊,從而執行服務器的各種功能應用以及數據處理,即實現上述方法實施例的語料標注方法。
存儲器200可以包括存儲程序區和存儲數據區,其中,存儲程序區可存儲操作系統、至少一個功能所需要的應用程序;存儲數據區可存儲根據語料標注理裝置的使用所創建的數據等。此外,存儲器200可以包括高速隨機存取存儲器,還可以包括非暫態存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非暫態固態存儲器件。在一些實施例中,存儲器200可選包括相對于處理器100遠程設置的存儲器,這些遠程存儲器可以通過網絡連接至語料標注裝置。上述網絡的實例包括但不限于互聯網、企業內部網、局域網、移動通信網及其組合。
輸入裝置300可接收輸入的數字或字符信息,以及產生與語料標注裝置的用戶設置以及功能控制有關的鍵信號輸入。輸出裝置400可包括顯示屏等顯示設備。
所述一個或者多個模塊存儲在所述存儲器200中,當被所述一個或者多個處理器100執行時,執行如圖1-3所示的方法。
上述產品可執行本發明實施例所提供的方法,具備執行方法相應的功能模塊和有益效果。未在本實施例中詳盡描述的技術細節,具體可參見如圖1-3所示的實施例中的相關描述。
本發明實施例還提供了一種非暫態計算機存儲介質,所述計算機存儲介質存儲有計算機可執行指令,該計算機可執行指令可執行上述任意方法實施例中的語料標注方法。其中,所述存儲介質可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)、隨機存儲記憶體(Random Access Memory,RAM)、快閃存儲器(Flash Memory)、硬盤(Hard Disk Drive,縮寫:HDD)或固態硬盤(Solid-State Drive,SSD)等;所述存儲介質還可以包括上述種類的存儲器的組合。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件。基于這樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在計算機可讀存儲介質中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行各個實施例或者實施例的某些部分所述的方法。
雖然結合附圖描述了本發明的實施例,但是本領域技術人員可以在不脫離本發明的精神和范圍的情況下作出各種修改和變型,這樣的修改和變型均落入由所附權利要求所限定的范圍之內。