基于智慧家庭平臺的音頻識別控制系統的制作方法

文檔序號：12368757閱讀：394來源：國知局

本發明涉及智慧家庭應用技術領域，尤其涉及一種基于智慧家庭平臺的音頻識別控制系統。

背景技術：

目前我國智慧家庭的建設與推進如火如荼，很多機構與企業花費重金在打造智慧家庭平臺，然而這些應用平臺要么自動控制要么離不開各類遙控器的控制，比如：遙控器的集中使用、手機APP的應用。人與智慧家庭平臺的交互沒有一種很好的方法，人們在智慧家庭中隨時要帶著手機或者遙控器，這樣的要求在一些家庭場景中是一種累贅或者是不現實的，因此基于智能音頻識別的控制系統應該是一個重要的技術發展方向。

所謂“音頻識別技術”，分為語音識別與聲紋識別，語音識別也被稱為自動語音識別(Automatic Speech Recognition，ASR)，其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入，例如按鍵、二進制編碼或者字符序列。聲紋識別也稱為說話人識別，有兩類，即說話人辨認和說話人確認。音頻識別技術所涉及的領域包括信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。

現在音頻識別系統，需要對于單個或者多個電子設備提供音頻識別能力模塊，不同的任務和應用會使用不同的語音識別或聲紋識別技術，難以達到運營級智慧家庭平臺的網元設計要求。

技術實現要素：

本發明要解決的技術問題是提供一種的基于智慧家庭平臺的音頻識別控制系統，能提供標準化的音頻識別分析算法封裝，提供標準的智能音頻識別能力調用的接口，使音頻識別能力提供標準化，使音頻識別分析算法能夠靈活替換。

為解決上述技術問題，本發明提供的基于智慧家庭平臺的音頻識別控制系統，其包括音頻管理服務器、音頻識別單元；

所述音頻識別單元，包括能力管理模塊、音頻識別模塊；

所述能力管理模塊，用于向所述音頻管理服務器發送注冊信息，并在注冊成功后上報音頻識別單元的能力集消息；

所述音頻識別模塊，在接收到一事件的應用策略后，啟動該事件的應用策略的相應音頻識別分析算法，并在啟動成功后發送啟動成功信息到智慧家庭平臺，然后根據該事件的應用策略，對智慧家庭平臺傳來的語音信號進行音頻識別，輸出識別結果到音頻管理服務器；

所述音頻管理服務器，包括音頻識別單元管理模塊、應用策略配置模塊、平臺接口模塊；

所述音頻識別單元管理模塊，用于接收音頻識別單元的注冊信息，接收已注冊音頻識別單元的能力上報，保存、管理、調度已注冊音頻識別單元的能力；

所述注冊信息，包括音頻識別單元的識別碼、音頻入口地址；

所述應用策略配置模塊，用于配置、保存事件的應用策略；

所述平臺接口模塊，當接收到智慧家庭平臺的某事件的音頻識別單元能力調用請求后，發送該事件的應用策略到相應音頻識別單元，并將該音頻識別單元的音頻入口地址反饋給智慧家庭平臺，并將該音頻識別單元傳來的識別結果轉發到智慧家庭平臺；

所述智慧家庭平臺，用于發送某事件的音頻識別單元能力調用請求到音頻管理服務器，并在接收到音頻識別單元的音頻入口地址及啟動成功信息，將該事件所對應語音信號按照所述音頻入口地址傳送到所述音頻識別單元。

較佳的，所述平臺接口模塊，還用于接受智慧家庭平臺的音頻識別單元能力查詢并反饋；接受智慧家庭平臺的應用策略查詢并反饋。

較佳的，所述能力管理模塊，包含一個或者多個音頻識別分析算法，并且能夠進行能力的添加與刪除。

較佳的，所述識別結果，包括身份識別類信息、數據獲取類信息。

較佳的，音頻識別單元的能力集消息，包含音頻識別單元的最大并行處理能力、音頻識別單元的音頻識別分析算法、音頻識別單元中各音頻識別分析算法之間的制約關系。

較佳的，音頻識別單元的能力集消息中，每一音頻識別分析算法的信息，包括該音頻識別分析算法的名稱、提供商。

較佳的，音頻識別單元的能力，包括語音識別、聲紋識別、音頻識別分析算法、多種算法的并行識別能力。

較佳的，基于智慧家庭平臺的音頻識別控制系統，還包括數據策略配置系統；

所述數據策略配置系統，用于配置智能控制策略，并下發到智慧家庭平臺。

較佳的，智慧家庭平臺，包括中央管理器、轉發單元、前端采集單元、家庭智能網關、應用控制服務器、客戶終端；

所述前端采集單元，在觸發條件滿足時，通過家庭智能網關向中央管理器發起一事件的智能業務調用請求；

所述中央管理器，接收到該事件的智能業務調用請求，向所述音頻管理服務器發送該事件的音頻識別單元能力調用請求；

所述中央管理器，收到音頻識別單元的啟動成功信息后，控制轉發單元向所述音頻識別單元發送該事件所對應的語音信號。

本發明的基于智慧家庭平臺的音頻識別控制系統，能提供標準化的音頻識別分析算法封裝，提供標準的智能音頻識別能力調用的接口，從而使智慧家庭平臺實現了對語音內所含信息的主動識別、策略下發，使音頻識別能力提供標準化，使音頻識別分析算法能夠靈活替換。

附圖說明

為了更清楚地說明本發明的技術方案，下面對本發明所需要使用的附圖作簡單的介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。

圖1是本發明的基于智慧家庭平臺的音頻識別控制系統一實施例示意圖；

圖2為本發明的基于智慧家庭平臺的音頻識別控制系統一實施例的音頻分析能力調用流程示意圖。

具體實施方式

下面將結合附圖，對本發明中的技術方案進行清楚、完整的描述，顯然，所描述的實施例是本發明的一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其它實施例，都屬于本發明保護的范圍。

實施例一

基于智慧家庭平臺的音頻識別控制系統，如圖1所示，包括音頻管理服務器IAM、音頻識別單元IAU；

所述音頻識別單元IAU，包括能力管理模塊、音頻識別模塊；

所述能力管理模塊，用于向所述音頻管理服務器IAM發送注冊信息，并在注冊成功后上報音頻識別單元IAU的能力集消息；

所述音頻識別模塊，在接收到一事件的應用策略后，啟動該事件的應用策略的相應音頻識別分析算法，并在啟動成功后發送啟動成功信息到智慧家庭平臺，然后根據該事件的應用策略，對智慧家庭平臺傳來的語音信號進行音頻識別，輸出識別結果到音頻管理服務器IAM；

所述音頻管理服務器IAM，包括音頻識別單元管理模塊、應用策略配置模塊、平臺接口模塊；

所述注冊信息，包括音頻識別單元IAU的識別碼、音頻入口地址；

所述應用策略配置模塊，用于進行事件的應用策略配置，保存用戶智能應用策略(例如，進行開關門的事件的應用策略配置為：當操作人提出開門指令時，音頻識別單元IAU先必須對操作人的聲音進行聲紋的識別判斷是否是家庭成員，在判斷是家庭成員的基礎上對操作人發出的指令語句進行識別，只有當操作人聲紋識別及語音指令詞句均識別無誤后，門才會自動開啟)；

所述平臺接口模塊，當接收到智慧家庭平臺的某事件的音頻識別單元能力調用請求后，發送該事件的應用策略到相應音頻識別單元IAU，并將該音頻識別單元IAU的音頻入口地址反饋給智慧家庭平臺，并將該音頻識別單元IAU傳來的識別結果轉發到智慧家庭平臺；

所述智慧家庭平臺，用于發送某事件的音頻識別單元能力調用請求到音頻管理服務器IAM，并在接收到音頻識別單元IAU的音頻入口地址及啟動成功信息后，將該事件所對應語音信號按照所述音頻入口地址傳送到所述音頻識別單元。

較佳的，所述平臺接口模塊，還用于接受智慧家庭平臺的音頻識別單元能力查詢并反饋；接受智慧家庭平臺的應用策略查詢并反饋。

較佳的，所述能力管理模塊，包含一個或者多個音頻識別分析算法，并且能夠進行能力的添加與刪除。

較佳的，所述識別結果，包括身份識別類信息、數據獲取類信息。

較佳的，音頻識別單元IAU的能力集消息，包含音頻識別單元IAU的最大并行處理能力、音頻識別單元IAU的音頻識別分析算法、音頻識別單元IAU中各音頻識別分析算法之間的制約關系。

較佳的，音頻識別單元IAU的能力集消息中，每一音頻識別分析算法的信息，包括該音頻識別分析算法的名稱、提供商。

較佳的，所述音頻識別單元IAU的能力，包括語音識別、聲紋識別、音頻識別分析算法、多種算法的并行識別能力。

實施例一的基于智慧家庭平臺的音頻識別控制系統，在基于智慧家庭平臺的基礎上，增加如下網元：音頻管理服務器IAM、音頻識別單元IAU。音頻管理服務器IAM與智慧家庭平臺實現信令交互，音頻識別單元IAU提供音頻識別能力，音頻識別單元IAU對來自智慧家庭平臺的語音信號進行音頻識別，并返回識別結果，音頻識別單元IAU具有自身能力集管理機制，并可向音頻管理服務器IAM上報。識別結果可用于智慧家庭平臺前端設備的智能控制，識別結果中的行為識別類信息在智慧家庭平臺中可以用作認證、登陸、確認身份的信息，識別結果中的數據獲取類信息在智慧家庭平臺中可以用作指令匹配、策略下發的依據等。

實施例一的基于智慧家庭平臺的音頻識別控制系統，如圖1所示，連接智慧家庭平臺的接口，包括音頻識別單元能力調用接口U1、音頻識別能力反饋接口U2、音頻流接口U3、音頻識別能力控制接口U4。

音頻識別單元能力調用接口(U1)，實現智慧家庭平臺對音頻識別系統的管理和能力調用，使用HTTP+XML協議；

音頻識別能力反饋接口U2，使用HTTP+XML協議；

音頻流接口U3，為音頻識別單元IAU從智慧家庭平臺獲取語音信號的接口，使用HTTP+XML協議；

音頻識別能力控制接口U4，傳送身份識別類信息、數據獲取類信息，使用HTTP+XML協議。

實施例一的基于智慧家庭平臺的音頻識別控制系統，利用音頻識別單元IAU封裝音頻識別分析算法，并向音頻管理服務器IAM注冊上報音頻識別能力；利用音頻管理服務器IAM管理音頻識別能力，對外(主要是智慧家庭平臺)提供標準化的智能音頻識別能力管理和調用接口；音頻識別單元IAU的識別結果通過音頻管理服務器IAM輸出到智慧家庭平臺；智慧家庭平臺可通過調用音頻識別單元IAU實現智能音頻識別能力，能夠有效地將智能音頻識別分析算法融入智慧家庭平臺；

實施例一的基于智慧家庭平臺的音頻識別控制系統，能提供標準化的音頻識別分析算法封裝，提供標準的智能音頻識別能力調用的接口，從而使智慧家庭平臺實現了對語音內所含信息的主動識別、策略下發，使音頻識別能力提供標準化，使音頻識別分析算法能夠靈活替換。

實施例二

根據實施例一，基于智慧家庭平臺的音頻識別控制系統，還包括數據策略配置系統DA；

所述數據策略配置系統DA，用于配置智能控制策略，并下發到智慧家庭平臺。

實施例二的基于智慧家庭平臺的音頻識別控制系統，數據策略配置系統(DA)接收智慧家庭平臺傳出的數據，可配置智能控制策略并下發到智慧家庭平臺，實現對智慧家庭平臺的智能控制策略的配置管理。具體智能控制策略配置，需利用客戶現有系統改進或按需為客戶構建。例如，出差策略的智能控制策略配置：操作人在數據策略配置系統DA上提前設定出差策略，如每天固定時間內窗戶開啟關閉，家庭燈光開啟關閉。事件觸發后，智慧家庭平臺會將出差策略的智能控制策略下發給家庭網關IFG，家庭網關IFG會對執行裝置(窗戶開關驅動裝置、家庭燈光開關)按出差策略的智能控制策略進行操作。

實施例三

根據實施例一的基于智慧家庭平臺的音頻識別控制系統，智慧家庭平臺包括中央管理器CMS、轉發單元ATDU、前端采集單元PU、家庭網關IFG、應用控制服務器ACS、客戶終端CU(例如：客戶的電腦、PAD)、網絡錄音存儲單元NRU；

所述前端采集單元，在觸發條件滿足時，通過家庭智能網關向中央管理器發起一事件的智能業務調用請求；

所述中央管理器，接收到該事件的智能業務調用請求，向所述音頻管理服務器發送該事件的音頻識別單元能力調用請求；

所述中央管理器，收到音頻識別單元的啟動成功信息后，控制轉發單元向所述音頻識別單元發送該事件所對應的語音信號。

實施例二的基于智慧家庭平臺的音頻識別控制系統的音頻分析能力調用流程如圖2所示：

前端采集單元PU觸發條件(定時、聯動等)滿足時，向智慧家庭平臺的中央管理器CMS發起該觸發條件所對應的事件的智能業務調用請求；

智慧家庭平臺的中央管理器CMS接收到該事件的智能業務調用請求，向音頻管理服務器IAM發送的該事件的音頻識別單元能力調用請求；

音頻管理服務器IAM接收到該事件的音頻識別單元能力調用請求,調度音頻識別資源，若有可用資源，則向相應的音頻識別單元IAU下發該事件的應用策略，并啟動音頻識別單元IAU的音頻識別分析功能，同時并將該音頻識別單元IAU的音頻入口地址入口反饋給智慧家庭平臺；

音頻識別單元IAU的音頻識別分析功能啟動后，反饋成功啟動的響應到智慧家庭平臺的中央管理器CMS；

智慧家庭平臺的中央管理器CMS收到音頻識別單元IAU的成功啟動響應后，為音頻識別單元IAU向轉發單元ATDU調度音頻媒體；

音頻識別單元IAU，接收音頻媒體并進行音頻識別分析，同時發送音頻識別分析開始通知到音頻管理服務器IAM；

音頻管理服務器IAM，將智能分析開始通知轉發到智慧家庭平臺的中央管理器CMS；

音頻識別單元IAU，接收音頻媒體并進行音頻識別分析，每當檢測到智能事件(包括智身份識別、數據識別等)，將智能事件發送到音頻管理服務器IAM；

音頻管理服務器IAM，將收到的智能事件轉發到智慧家庭平臺的中央管理器CMS。

例如：用戶識別發起：操作人員對前端采集單元PU下達指令，前端采集單元PU通過家庭網關IFG進行事件發起,家庭網關IFG向中央管理器CMS發起智能業務調用請求；中央管理器CMS向音頻管理服務器IAM發送事件的音頻識別單元能力調用請求；音頻管理服務器IAM向音頻識別單元IAU發送該事件的應用策略，并將該音頻識別單元IAU的音頻入口地址反饋給中央管理器CMS，中央管理器CMS該音頻識別單元IAU的音頻入口地址向家庭網關IFG反饋，并要求家庭網關IFG通過轉發單元ATDU向音頻識別單元IAU傳遞音頻媒體流；音頻識別單元IAU接受音頻媒體流后根據該事件的應用策略進行識別，識別結果匯報給音頻管理服務器IAM，音頻管理服務器IAM再反饋給中央管理器CMS；中央管理器CMS根據識別結果部署對應的策略，對家庭網關IFG進行策略下發，家庭網關IFG通過前端采集單元PU回饋操作人員：指令部署成功；家庭網關IFG根據中央管理器CMS策略進行后續的操作(包括：立即操作、延時操作、定時操作、周期性操作)。

以上所述僅為本發明的較佳實施例而已，并不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的范圍之內。

完整全部詳細技術資料下載

當前第1頁1 2 3