本發明屬于人機交互技術領域,尤其涉及一種機器人。
背景技術:
隨著人工智能行業的發展,語音交互已經比較普遍。在現有的機器人中通常使用語音識別技術進行語音交互。然而由于語音識別技術的性能受到許多因素的影響,如不同說話人的發音方式、說話方式、環境噪音、傳輸信道衰落等,導致現有機器人對語音的識別度較低。
故,有必要提出一種新的技術方案,以解決上述技術問題。
技術實現要素:
鑒于此,本發明實施例提供一種機器人,以解決現有機器人對語音的識別度較低的問題。
本發明實施例的第一方面,提供一種機器人,所述機器人包括:
處理器、麥克風陣列、語音處理模塊以及運動控制模塊,其中,所述麥克風陣列包括至少兩個麥克風;
所述處理器分別與所述語音處理模塊以及運動控制模塊連接;
所述麥克風陣列與所述語音處理模塊連接;
所述麥克風陣列,用于采集語音信息,并將所述語音信息發送給所述語音處理模塊;
所述語音處理模塊,用于對接收到的所述語音信息進行處理,并將處理后的所述語音信息發送給所述處理器;
所述處理器,用于在接收到所述語音信息后,根據所述語音信息控制所述運動控制模塊執行相應的操作。
本發明實施例與現有技術相比存在的有益效果是:本發明實施例通過采用包括處理器、麥克風陣列、語音處理模塊以及運動控制模塊的機器人,使得麥克風陣列采集語音信息,并將所述語音信息發送給所述語音處理模塊,所述語音處理模塊對接收到的所述語音信息進行處理,并將處理后的所述語音信息發送給所述處理器,所述處理器在接收到所述語音信息后,根據所述語音信息控制所述運動控制模塊執行相應的操作,進而提高了機器人的抗干擾能力和穩定性,解決了現有機器人對語音的識別度較低的問題。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例一提供的一種機器人的組成示意圖;
圖2是本發明實施例二提供的一種機器人的組成示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
實施例一:
圖1示出了本發明實施例一提供的一種機器人100的組成示意圖,為了便于說明,僅示出了與本發明實施例相關的部分,詳述如下:
如圖1所示,本發明實施例所提供的機器人100包括:處理器11、麥克風陣列12、語音處理模塊13以及運動控制模塊14。
其中,所述麥克風陣列12包括至少兩個麥克風。
所述處理器11分別與所述語音處理模塊13以及運動控制模塊14連接。
所述麥克風陣列12與所述語音處理模塊13連接。
所述麥克風陣列12,用于采集語音信息,并將所述語音信息發送給所述語音處理模塊13;
所述語音處理模塊13,用于對接收到的所述語音信息進行處理,并將處理后的所述語音信息發送給所述處理器11;
所述處理器11,用于在接收到所述語音信息后,根據所述語音信息控制所述運動控制模塊14執行相應的操作。
可選的,所述處理器11可以為單片機芯片或ARM芯片。所述運動控制模塊14可以包括電機驅動電路和電機,電機驅動電路按照控制邏輯為電機提供相應的驅動功率,使所述運動控制模塊執行相應的移動。
具體地,所述麥克風陣列12具有對遠場噪聲很強的抑制作用,在噪聲環境中具有良好的信號采集性。所述麥克風陣列12是指按照一定距離排列放置的一組麥克風,通過聲波抵達陣列中每個麥克風之間的微小時差的相互作用,麥克風陣列可以得到比單個麥克風更好的指向性。通過對麥克風信號的綜合處理,麥克風陣列12可以組合成所要求的強指向性麥克風,形成被稱為波束的指向特性。麥克風陣列12的波束可以經由電路或程序處理,使其指向聲源方向加強音頻采集效果,只接收說話人的聲音的同時抑制環境中的噪聲與干擾。較佳的,所述麥克風陣列12以兩個麥克風線性布局,麥克風間距為80mm。
在本發明實施例中,通過所述麥克風陣列12實現語音信號的采集,通過語音處理模塊13完成噪聲的濾除與語音信號的增強,降低了使用距離、環境噪聲等限制因素對語音信號的影響,從而實現了較好的語音識別。
可選的,所述處理器11還用于:
在接收到喚醒指令后,向用戶發送準備就緒的提示信息,并在接收到控制指令后,根據所述控制指令控制所述機器人執行相應的操作。
在本發明實施例中,可以通過多麥克風陣列接收較遠距離(3m內)用戶的語音指令信息,交互設計以及技術應用上提高了家庭環境娛樂的方便性以及可靠性。例如用戶可以問機器人說“小Q小Q”(可用戶自定義的喚醒命令),本系統回復“主人,我在呢”,用戶說“北京明天天氣怎么樣”,然后查詢數據庫中的內容,按實際天氣情況作出答復;甚至您可以在機器人播放音樂的嘈雜環境下說“小Q小Q”,本系統回復“主人,我在呢”,你說“音響聲音調小點”,然后機器人系統自動控制音量變小。之所以能夠在較遠距離和嘈雜環境中進行語音控制并且具有較好的識別率,取決于本機器人采用的多麥克風陣列特性以及較好交互方式。
本發明實施例通過專有的喚醒系統來實現交互行為的發起,極大程度提高了語音交互系統的對環境依賴性,交互邏輯簡單可靠,消除用戶適應語音識別節奏的難度,同時避免了識別時連續監聽對系統資源的要求和功耗負擔。本發明實施例結合技術現狀和家庭娛樂交互環境與特點全局考慮,設計出一種低成本且適合嵌入式系統機器人使用的一套語音交互系統,提高了系統的抗干擾能力以及穩定性,降低了使用難度。
可選的,所述語音處理模塊13包括:
信號調理模塊131以及麥克風陣列數據處理模塊132;
所述信號調理模塊131分別與所述麥克風陣列12和所述麥克風陣列數據處理模塊132連接;
所述信號調理模塊131,用于在接收到所述麥克風陣列12發送的語音信息后,對所述語音信息進行第一處理,并將第一處理后的語音信號發送給所述麥克風陣列數據處理模塊132;
所述麥克風陣列數據處理模塊132,用于在接收到所述第一處理后的語音信息后,對所述第一處理后的語音信息進行第二處理,并將第二處理后的語音信息發送給所述處理器11,以使得所述處理器11在接收到該語音信息后,根據該語音信息控制所述運動控制模塊14執行相應的操作。
在本發明實施例中,所述信號調理模塊131包括濾波電路和放大電路。所述麥克風陣列數據處理模塊132包括多通道AD采集、DSP數據處理和硬件中斷觸發。
具體的,多個麥克風形成的陣列采集語音信號然后對每路信號進行硬件濾波以及信號放大,該信號通過麥克風陣列數據處理模塊132,在其中包含AD采集轉換成數字信號,然后進行算法數據處理,最終的信號傳送到處理器11。
可選的,所述麥克風陣列數據處理模塊132的型號可以為科大訊飛XFM10211模塊。該模塊利用麥克風陣列的空域濾波特性,通過對喚醒人的角度定位,形成定向拾音波束,并對波束以外的噪聲進行抑制,以保證較高的錄音質量。主要有以下特性:2麥克風線性麥克風陣列;語音喚醒;回聲消除;語音打斷;去混響。其中,所述2麥克風線性麥克風陣列支持遠場拾音,所述遠場拾音是指運用遠場識別和降噪技術,使拾音距離達到3米。所述語音喚醒是指用戶通過說出關鍵詞(默認關鍵詞是“打開語音助手”),可以將模塊從休眠狀態喚醒,喚醒后,會有WAKE_UP標志位輸出。所述回聲消除是指在播放和錄音同時進行的場景,模塊通過回聲消除技術,可以將揚聲器的聲音屏蔽,只接收用戶的聲音。語音打斷:在設備播音時,仍然可以喚醒,實現打斷效果。
本發明實施例通過采用麥克風陣列采集語音信息,提高了機器人的抗干擾能力和穩定性,解決了現有機器人對語音的識別度較低的問題。
實施例二:
圖2示出了本發明實施例二提供的一種機器人的組成示意圖,為了便于說明,僅示出了與本發明實施例相關的部分,詳述如下:
如圖2所示,本發明實施例所示的機器人200與圖1所示的機器人100的區別之處在于本發明實施例所示的機器人200還包括:狀態采集模塊21、指示模塊22、無線模塊23、存儲模塊24、電源系統25以及數據庫服務器26。
其中,所述狀態采集模塊21與所述處理器11連接;
所述狀態采集模塊21用于采集所述機器人的狀態信息,并將所述狀態信息發送給所述處理器11。
具體地,所述狀態采集模塊21可以對所述機器人所在環境和一些交互信息進行檢測,加強其智能性,增強其可玩性,為其娛樂功能服務。
可選的,所述狀態采集模塊21包括:
溫度傳感器211、光敏傳感器212、加速度傳感器213、紅外傳感器214以及觸摸傳感器215。
所述溫度傳感器211,可以采用電阻式溫度傳感器,只要將其布置在電路板位置能表征室溫的地方,室溫的變化就會轉換成電阻變換,再通過A/D采集便可解析出溫度。
所述光敏傳感器212,通過光敏器件(如光敏三極管、光敏二極管、光敏電阻等)獲得光線的變化數據,獲得光敏信號,經處理后發送至處理器11。
所述加速度傳感器213,通過加速度芯片獲得返回x、y、z三軸的加速度數值,經處理后發送至處理器11。
所述紅外傳感器214,可以采用紅外線反射式傳感器,利用紅外線反射的原理,根據反射的強度來判定前方是否有障礙。在距離適中時測量精度很高。由于使用的是紅外線,所以抗干擾能力很強,能有效避免機器人在運動過程中碰撞問題。
所述觸摸傳感器215,通過觸摸片獲得觸摸電容的變化數據,進而獲得觸摸信息,經處理后發送至處理器11,可以作為和用戶互動的一種方式。
可選的,所述指示模塊22與所述處理器11連接;
所述指示模塊22,用于在接收到所述處理器11發送的指示信息后,根據所述指示信息執行相應的操作。
在本發明實施例中,所述指示模塊22包括LED驅動電路和LED。LED驅動電路以及LED可以實現燈光效果以及一些指示功能。
可選的,所述機器人200還可以包括提示模塊,所述提示模塊包括音頻放大電路和喇叭。音頻放大電路為喇叭提供相應的功率,使其將音頻信號還原出聲音,來完成提示音,語音回復等相應響應效果。
可選的,所述無線模塊23與所述處理器11連接。
在本發明實施例中,所述無線模塊23包括但不限于wifi模塊,用于實現互聯網的連接以及與數據庫服務器之間的通訊。
可選的,所述存儲模塊24與所述處理器11連接。
在本發明實施例中,所述存儲模塊24可以與所述處理器11組合形成主系統,所述存儲模塊24可以用于存儲所述處理器11接收到的數據或者處理的數據。其中,所述存儲模塊24可以為雙倍速率同步動態隨機存儲器(Double Data Rate,DDR)、FLASH存儲器、TF卡、SD卡等。
可選的,所述電源系統25與所述處理器11連接;
所述電源系統25,用于向所述處理器11供電。
具體地,所述電源系統25可以包括電池(如鋰電池)、充電電路和電壓轉換電路,以實現對整個機器人系統的供電。所述充電電路對電池進行充電,并提供充電電流限制、充電電壓管控、充電指示等相關的控制與指示。電壓轉換電路,通過電壓轉換電路,如LDO轉換電路,DC-DC轉換電路、PMU電源管理電路等,將輸入的電壓轉換成內部器件所需要的電壓。鋰電池可以采用常規的聚合物鋰電池。
可選的,所述數據庫服務器26與所述處理器11連接;
所述數據庫服務器26,用于在接收到所述處理器11發送的請求信息時,根據該請求信息向所述處理器11反饋相應的應答信息。
其中,所述數據庫服務器26作為機器人系統的后臺資源存儲著相應的內容數據。包括但不限于問答數據庫服務器,音頻曲目數據庫服務器,知識百科數據庫服務器等。
問答數據庫服務器可以根據用戶需要自行搭建,設計并編輯一定數量的對答數據內容,最終再通過用戶使用逐步積累。音頻曲目數據庫服務器可以采用與第三方音樂平臺(如QQ音樂,百度音樂等)進行合作,通過中轉機器人系統可以訪問授權的第三方音樂平臺的音樂內容。知識百科數據庫服務器也可以采用和已有成熟的數據庫來合作,使其提供豐富、優質的數據資源,如搜狗百科數據庫。基于以上服務器方案可以給用戶提供豐富的娛樂內容資源。
在本發明實施例的一種實際應用場景中,以用戶發起一次功能操作為例,首先用戶語音發起喚醒指令,如“小Q小Q”,系統的語音偵聽系統進行采集解析,判斷是否喚醒指令,如果是,置位中斷引腳,硬件中斷啟動交互系統,準備就緒后給出語音提示。同時根據喚醒指令的波束信息解析出發指令所處的位置,并啟動控制指令的偵聽。當用戶收到準備就緒提示時發出控制語音指令,如“唱一首劉德華的歌”,機器人通過多麥克風陣列采集到語音信息,進行增強與背景音濾除后,處理器進行語音識別,然后指令解析并轉換成控制信號通過運動控制模塊、指示模塊、提示模塊等完成相關的執行響應。本條指令“唱一首劉德華的歌”,系統會從數據庫中分類出劉德華的歌曲依次播放。機器人也可以通過觸摸、光敏等傳感器完成一些交互,如用戶觸摸或靠近,系統會通過傳感器檢測,啟動交互軟件,進行指令解析,最終進行執行反饋。例如,用靠近機器人,機器人開口“主人,我看到你了,陪我玩會吧”,增加了機器人的主動交互,提升智能性和趣味性。
所述領域的技術人員可以清楚地了解到,為描述的方便和簡潔,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模塊完成,即所述裝置的內部結構劃分成不同的功能模塊,上述功能模塊既可以采用硬件的形式實現,也可以采用軟件的形式實現。另外,各功能模塊的具體名稱也只是為了便于相互區別,并不用于限制本申請的保護范圍。
綜上所述,本發明實施例通過采用麥克風陣列采集語音信息,提高了機器人的抗干擾能力和穩定性,解決了現有機器人對語音的識別度較低的問題。
本領域普通技術人員還可以理解,實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,所述的程序可以在存儲于一計算機可讀取存儲介質中,所述的存儲介質,包括ROM/RAM、磁盤、光盤等。
以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發明的保護范圍之內。