播放語速管理方法及裝置的制造方法

文檔序號：10727051閱讀：362來源：國知局

播放語速管理方法及裝置的制造方法
【專利摘要】本發明是關于一種播放語速管理方法及裝置，其中，方法包括：獲取待播放的TTS播放文本；判斷所述TTS播放文本所屬的目標領域；確定與所述目標領域對應目標播放語速；按照所述目標播放語速播放所述TTS播放文本。通過該技術方案，獲取待播放的TTS播放文本，并根據TTS播放文本所屬的目標領域為其確定對應的目標播放語速，從而按照目標播放語速播放TTS播放文本，這樣，不同的領域采用不同的語速播放，可以有針對性的進行播放，而不是所有文本都采用一種語速播放，從而保證用戶在任何場景下都可以聽清楚播放文本播放的內容，提升用戶的使用體驗。
【專利說明】
播放語速管理方法及裝置
技術領域
[0001 ]本發明涉及語音處理技術領域，尤其涉及一種播放語速管理方法及裝置。
【背景技術】
[0002] TTS是Text To Speech的縮寫，8卩"從文本到語音"，是人機對話的一部分，讓機器能夠說話。
[0003] 它是同時運用語言學和心理學的杰出之作，在內置芯片的支持之下，通過神經網絡的設計，把文字智能地轉化為自然語音流。TTS技術對文本文件進行實時轉換，轉換時間之短可以秒計算。在其特有智能語音控制器作用下，文本輸出的語音音律流暢，使得聽者在聽取信息時感覺自然，毫無機器語音輸出的冷漠與生澀感。
[0004] TTS是語音合成應用的一種，它將儲存于電腦中的文件，如幫助文件或者網頁，轉換成自然語音輸出。TTS不僅能幫助有視覺障礙的人閱讀計算機上的信息，更能增加文本文檔的可讀性。現在的TTS應用包括語音驅動的郵件以及聲音敏感系統，并常與聲音識別程序一起使用。

【發明內容】

[0005] 本發明實施例提供一種播放語速管理方法及裝置，用以實現智能化地管理TTS語音反饋的語速。
[0006] 根據本發明實施例的第一方面，提供一種播放語速管理方法，包括：
[0007] 獲取待播放的TTS播放文本；
[0008] 判斷所述TTS播放文本所屬的目標領域；
[0009] 確定與所述目標領域對應目標播放語速；
[0010] 按照所述目標播放語速播放所述TTS播放文本。
[0011] 在該實施例中，獲取待播放的TTS播放文本，并根據TTS播放文本所屬的目標領域為其確定對應的目標播放語速，從而按照目標播放語速播放TTS播放文本，這樣，不同的領域采用不同的語速播放，可以有針對性的進行播放，而不是所有文本都采用一種語速播放，從而保證用戶在任何場景下都可以聽清楚播放文本播放的內容，提升用戶的使用體驗。
[0012] 例如，當用戶駕駛汽車時，遇到有關【安全】的語音提示時，將使用【安全】領域的 TTS語速，較慢。
[0013] 當用戶收聽音樂，遇到【提醒】的語音提示時，將使用【提醒】領域的TTS語速，較快。
[0014] 當用戶收到語音口播的【廣告】語音提示時，將使用【廣告】領域的TTS語速，特別快。
[0015] 當用戶收到【普通】操作語音提示時，將使用【普通】領域的默認TTS語速，標準速度。
[0016] 在一個實施例中，所述判斷所述TTS播放文本所屬的目標領域，包括：
[0017] 獲取所述TTS播放文本中包含的關鍵字標簽；
[0018] 根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。
[0019] 在該實施例中，在每個TTS播放文本中，可以預設關鍵字標簽，以表示該TTS播放文本所屬的領域，這樣，方便根據關鍵字標簽，確定TTS播放文本所屬的領域。
[0020] 例如，一個TTS播放文本其屬于安全領域，則可以為其預設關鍵字標簽【安全】，從而方便快速的確定TTS播放文本的領域。
[0021 ]在一個實施例中，所述確定與所述目標領域對應目標播放語速，包括：
[0022]根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。
[0023]在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。如設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為 120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為 240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。這樣，可以根據預設的領域與預設的播放語速之間的對應關系，確定與目標領域對應目標播放語速。
[0024]在一個實施例中，所述方法還包括：
[0025]接收輸入的設置命令；
[0026] 根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。
[0027] 在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。如設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為 120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為 240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。
[0028]在一個實施例中，所述方法還包括：
[0029] 當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。
[0030] 在該實施例中，可以根據用戶輸入的語音命令，確定應該反饋的TTS播放文本。從而滿足用戶的播放需求。
[0031] 根據本發明實施例的第二方面，提供一種播放語速管理裝置，包括：
[0032] 獲取模塊，用于獲取待播放的TTS播放文本；
[0033]判斷模塊，用于判斷所述TTS播放文本所屬的目標領域；
[0034]第一確定模塊，用于確定與所述目標領域對應目標播放語速；
[0035] 播放模塊，用于按照所述目標播放語速播放所述TTS播放文本。
[0036] 在一個實施例中，所述判斷模塊包括：
[0037] 獲取子模塊，用于獲取所述TTS播放文本中包含的關鍵字標簽；
[0038] 領域確定子模塊，用于根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。
[0039] 在一個實施例中，所述第一確定模塊包括：
[0040] 語速確定子模塊，用于根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。
[0041 ] 在一個實施例中，所述裝置還包括：
[0042]接收模塊，用于接收輸入的設置命令；
[0043] 設置模塊，用于根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。
[0044] 在一個實施例中，所述裝置還包括：
[0045] 第二確定模塊，用于當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。
[0046] 應當理解的是，以上的一般描述和后文的細節描述僅是示例性和解釋性的，并不能限制本發明。
[0047] 本發明的其它特征和優點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發明而了解。本發明的目的和其他優點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。
[0048] 下面通過附圖和實施例，對本發明的技術方案做進一步的詳細描述。
【附圖說明】
[0049] 此處的附圖被并入說明書中并構成本說明書的一部分，示出了符合本發明的實施例，并與說明書一起用于解釋本發明的原理。
[0050] 圖1是根據一示例性實施例示出的一種播放語速管理方法的流程圖。
[0051] 圖2是根據一示例性實施例示出的一種播放語速管理方法中步驟S102的流程圖。 [0052]圖3是根據一示例性實施例示出的一種播放語速管理方法中步驟S103的流程圖。 [0053]圖4是根據一示例性實施例示出的另一種播放語速管理方法的流程圖。
[0054]圖5是根據一示例性實施例示出的另一種播放語速管理方法的流程圖。
[0055] 圖6是根據一示例性實施例示出的一種播放語速管理裝置的框圖。
[0056] 圖7是根據一示例性實施例示出的一種播放語速管理裝置中判斷模塊的框圖。
[0057] 圖8是根據一示例性實施例示出的一種播放語速管理裝置中第一確定模塊的框圖。
[0058]圖9是根據一示例性實施例示出的又一種播放語速管理裝置的框圖。
[0059]圖10是根據一示例性實施例示出的又一種播放語速管理裝置的框圖。
【具體實施方式】
[0060] 這里將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發明相一致的所有實施方式。相反，它們僅是與如所附權利要求書中所詳述的、本發明的一些方面相一致的裝置和方法的例子。
[0061] 圖1是根據一示例性實施例示出的一種播放語速管理方法的流程圖。該播放語速管理可應用于播放設備中，該播放設備可以是移動電話，計算機，數字廣播終端，消息收發設備，游戲控制臺，平板設備，醫療設備，健身設備，個人數字助理、車載播放器等任一具有語音播放功能的設備。如圖1所示，該方法包括步驟S101-S104:
[0062]在步驟S101中，獲取待播放的TTS播放文本；
[0063]在步驟S102中，判斷所述TTS播放文本所屬的目標領域；
[0064]在步驟S103中，確定與所述目標領域對應目標播放語速；
[0065] 在步驟S104中，按照所述目標播放語速播放所述TTS播放文本。
[0066] 在該實施例中，獲取待播放的TTS播放文本，并根據TTS播放文本所屬的目標領域為其確定對應的目標播放語速，從而按照目標播放語速播放TTS播放文本，這樣，不同的領域采用不同的語速播放，可以有針對性的進行播放，而不是所有文本都采用一種語速播放，從而保證用戶在任何場景下都可以聽清楚播放文本播放的內容，提升用戶的使用體驗。
[0067] 例如，當用戶駕駛汽車時，遇到有關【安全】的語音提示時，將使用【安全】領域的 TTS語速，較慢。
[0068] 當用戶收聽音樂，遇到【提醒】的語音提示時，將使用【提醒】領域的TTS語速，較快。
[0069] 當用戶收到語音口播的【廣告】語音提示時，將使用【廣告】領域的TTS語速，特別快。
[0070] 當用戶收到【普通】操作語音提示時，將使用【普通】領域的默認TTS語速，標準速度。
[0071] 圖2是根據一示例性實施例示出的一種播放語速管理方法中步驟S102的流程圖。 [0072] 如圖2所示，在一個實施例中，上述步驟S102可以包括步驟S201-S202:
[0073]在步驟S201中，獲取所述TTS播放文本中包含的關鍵字標簽；
[0074]在步驟S202中，根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。
[0075] 在該實施例中，在每個TTS播放文本中，可以預設關鍵字標簽，以表示該TTS播放文本所屬的領域，這樣，方便根據關鍵字標簽，確定TTS播放文本所屬的領域。
[0076] 例如，一個TTS播放文本其屬于安全領域，則可以為其預設關鍵字標簽【安全】，從而方便快速的確定TTS播放文本的領域。
[0077]圖3是根據一示例性實施例示出的一種播放語速管理方法中步驟S103的流程圖。 [0078] 如圖3所示，在一個實施例中，上述步驟S103可以包括步驟S301:
[0079] 在步驟S301中，根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。
[0080] 在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。如設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為 120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為 240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。這樣，可以根據預設的領域與預設的播放語速之間的對應關系，確定與目標領域對應目標播放語速。
[0081 ]圖4是根據一示例性實施例示出的另一種播放語速管理方法的流程圖。
[0082] 如圖4所示，在一個實施例中，上述方法還包括步驟S401-S402:
[0083]在步驟S401中，接收輸入的設置命令；
[0084]在步驟S402中，根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。
[0085] 在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。例如，如表1所示，設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。
[0086] 表 1
[0088]圖5是根據一示例性實施例示出的另一種播放語速管理方法的流程圖。
[0089]如圖5所示，在一個實施例中，在步驟S101之前，上述方法還包括步驟S501:
[0090]在步驟S501中，當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。
[0091] 在該實施例中，可以根據用戶輸入的語音命令，確定應該反饋的TTS播放文本。從而滿足用戶的播放需求。
[0092] 下述為本發明裝置實施例，可以用于執行本發明方法實施例。
[0093] 圖6是根據一示例性實施例示出的一種播放語速管理裝置的框圖，該裝置可以通過軟件、硬件或者兩者的結合實現成為播放設備的部分或者全部。如圖6所示，該播放語速管理裝置包括：
[0094]獲取模塊61，用于為獲取待播放的TTS播放文本；
[0095] 判斷模塊62,用于為判斷所述TTS播放文本所屬的目標領域；
[0096] 第一確定模塊63，用于為確定與所述目標領域對應目標播放語速；
[0097]播放模塊64，用于為按照所述目標播放語速播放所述TTS播放文本。
[0098] 在該實施例中，獲取待播放的TTS播放文本，并根據TTS播放文本所屬的目標領域為其確定對應的目標播放語速，從而按照目標播放語速播放TTS播放文本，這樣，不同的領域采用不同的語速播放，可以有針對性的進行播放，而不是所有文本都采用一種語速播放，從而保證用戶在任何場景下都可以聽清楚播放文本播放的內容，提升用戶的使用體驗。
[0099] 例如，當用戶駕駛汽車時，遇到有關【安全】的語音提示時，將使用【安全】領域的 TTS語速，較慢。
[0100] 當用戶收聽音樂，遇到【提醒】的語音提示時，將使用【提醒】領域的TTS語速，較快。
[0101] 當用戶收到語音口播的【廣告】語音提示時，將使用【廣告】領域的TTS語速，特別快。
[0102] 當用戶收到【普通】操作語音提示時，將使用【普通】領域的默認TTS語速，標準速度。
[0103] 圖7是根據一示例性實施例示出的一種播放語速管理裝置中判斷模塊的框圖。
[0104] 如圖7所示，在一個實施例中，所述判斷模塊62包括：
[0105] 獲取子模塊71，用于獲取所述TTS播放文本中包含的關鍵字標簽；
[0106] 領域確定子模塊72,用于根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。
[0107] 在該實施例中，在每個TTS播放文本中，可以預設關鍵字標簽，以表示該TTS播放文本所屬的領域，這樣，方便根據關鍵字標簽，確定TTS播放文本所屬的領域。
[0108] 例如，一個TTS播放文本其屬于安全領域，則可以為其預設關鍵字標簽【安全】，從而方便快速的確定TTS播放文本的領域。
[0109] 圖8是根據一示例性實施例示出的一種播放語速管理裝置中第一確定模塊的框圖。
[0110] 如圖8所示，在一個實施例中，所述第一確定模塊63包括：
[0111] 語速確定子模塊81，用于根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。
[0112] 在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。如設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為 120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為 240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。這樣，可以根據預設的領域與預設的播放語速之間的對應關系，確定與目標領域對應目標播放語速。
[0113] 圖9是根據一示例性實施例示出的又一種播放語速管理裝置的框圖。
[0114] 如圖9所示，在一個實施例中，上述裝置還包括：
[0115] 接收模塊91，用于接收輸入的設置命令；
[0116] 設置模塊92，用于根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。
[0117] 在該實施例中，用戶或者廠商可以預設多個領域，以及每個領域對應的播放語速。如設置領域包括【安全】、【提醒】、【廣告】、【普通】等領域，其中，【安全】領域對應的語速為 120-180字每分鐘，【普通】領域對應的語速為180-240字每分鐘，【提醒】領域對應的語速為 240-300字每分鐘，【廣告】領域對應的語速為300-360字每分鐘。
[0118] 圖10是根據一示例性實施例示出的又一種播放語速管理裝置的框圖。
[0119] 如圖10所示，在一個實施例中，上述裝置還包括：
[0120]第二確定模塊1001，用于當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。
[0121] 在該實施例中，可以根據用戶輸入的語音命令，確定應該反饋的TTS播放文本。從而滿足用戶的播放需求。
[0122] 本領域內的技術人員應明白，本發明的實施例可提供為方法、系統、或計算機程序產品。因此，本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且，本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質（包括但不限于磁盤存儲器和光學存儲器等）上實施的計算機程序產品的形式。
[0123] 本發明是參照根據本發明實施例的方法、設備（系統）、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器，使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0124] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品，該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0125] 這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上，使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理，從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0126] 顯然，本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣，倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內，則本發明也意圖包含這些改動和變型在內。
【主權項】
1. 一種播放語速管理方法，其特征在于，包括：獲取待播放的TTS播放文本；判斷所述TTS播放文本所屬的目標領域；確定與所述目標領域對應目標播放語速；按照所述目標播放語速播放所述TTS播放文本。2. 根據權利要求1所述的方法，其特征在于，所述判斷所述TTS播放文本所屬的目標領域，包括：獲取所述TTS播放文本中包含的關鍵字標簽；根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。3. 根據權利要求1所述的方法，其特征在于，所述確定與所述目標領域對應目標播放語速，包括：根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。4. 根據權利要求3所述的方法，其特征在于，所述方法還包括：接收輸入的設置命令；根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。5. 根據權利要求1所述的方法，其特征在于，所述方法還包括：當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。6. -種播放語速管理裝置，其特征在于，包括：獲取模塊，用于獲取待播放的TTS播放文本；判斷模塊，用于判斷所述TTS播放文本所屬的目標領域；第一確定模塊，用于確定與所述目標領域對應目標播放語速；播放模塊，用于按照所述目標播放語速播放所述TTS播放文本。7. 根據權利要求6所述的裝置，其特征在于，所述判斷模塊包括：獲取子模塊，用于獲取所述TTS播放文本中包含的關鍵字標簽；領域確定子模塊，用于根據所述關鍵字標簽，確定所述TTS播放文本所屬的目標領域。8. 根據權利要求6所述的裝置，其特征在于，所述第一確定模塊包括：語速確定子模塊，用于根據預設的領域與預設的播放語速之間的對應關系，確定與所述目標領域對應目標播放語速。9. 根據權利要求8所述的裝置，其特征在于，所述裝置還包括：接收模塊，用于接收輸入的設置命令；設置模塊，用于根據所述設置命令，設置預設的領域，以及與每個領域對應的播放語速。10. 根據權利要求6所述的裝置，其特征在于，所述裝置還包括：第二確定模塊，用于當接收到用戶輸入的語音命令時，確定與所述語音命令對應的待播放的TTS播放文本。
【文檔編號】G10L13/033GK106098057SQ201610412991
【公開日】2016年11月9日
【申請日】2016年6月13日公開號201610412991.3, CN 106098057 A, CN 106098057A, CN 201610412991, CN-A-106098057, CN106098057 A, CN106098057A, CN201610412991, CN201610412991.3
【發明人】周海
【申請人】北京云知聲信息技術有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：周海;
技術所有人：北京云知聲信息技術有限公司;
我是此專利的發明人

上一篇：音調線生成方法和裝置的制造方法
上一篇：一種語音新聞的處理方法、新聞服務器及系統的制作方法

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

可以調節語速的播放器相關技術

調節語速的播放器相關技術