專利名稱:口語仿真學習機的制作方法
技術領域:
本實用新型涉及一種視聽語音設備,尤其指一種模仿真人對話的口語仿真學習機。
背景技術:
磁帶語音復讀機是一種傳統的學習機,它在英語學習過程中可以反復聽某一個句子或某一個單詞的錄音,學習者跟隨朗讀,反復多次達到記憶的目的。這種復讀機解決了反復聽某一句錄音而不需要“倒帶”這樣繁瑣操作的問題,基本上可以讓學習者方便地聽錄音。
近期市面上陸續出現一種“數碼英語學習機”,這種學習機在保留磁帶復讀機跟讀、比讀等功能的基礎上,重點強調超強復讀,即可任意定義A、B兩點進行復讀。如市面上銷售的“愛國者英語學習機”就屬于這種學習機。還有一些產品在這種學習機的基礎上設置麥克風插口,使用者可外接麥克風,將自己跟讀的語音記錄下來,然后放錄音,學習者自己比對,調整發音。
以上兩種學習機的重點是在“聽”的概念上做文章,說的功能簡單,聽的內容只是機械的重復,使用者聽幾遍就沒有興趣再聽下去,學習起來比較枯燥,缺乏現實語境中的聽說訓練。
實用新型內容本實用新型的目的是要解決傳統學習機功能單一、沒有人機對話功能的技術問題,提出一種既能結合聽說功能,又能模擬真人對話的口語仿真學習機。
一般英語學習的重點在于如何掌握豐富的詞匯和在實際語言環境中的快速發揮訓練,包括單詞、語法、句型、語態、語調等的綜合運用。本實用新型提出的口語仿真學習機是一個帶有真人語音數據庫的隨身攜帶的學習工具,能夠隨機向學習者發問,一問一答實現人機語音對話,創造出與真人對話、交流的氛圍,而這種氛圍對詞匯鞏固和綜合運用能力鍛煉有著較好的效果。
本實用新型提出的口語仿真學習機包括微處理器,存儲器、液晶顯示器、輸入鍵盤、解碼器、數模轉換器、放大器、輸出耳機,還包括與微處理器連接的語音識別模塊和麥克風。所述的語音識別模塊可以由解碼器、模數轉換器、微控制器組成,也可以采用語音識別引擎加模數轉換器組成。
本實用新型能夠模仿真人對話的場景和氛圍,充分調動使用者的學習情緒,達到良好的學習效果。與傳統的學習機相比,本實用新型具有如下優點1.人機單詞對話,讓學習者輕松進行詞匯錘煉;2.人機語句對話,讓學習者身臨其境在各種語言環境模塊中游歷;3.對錯誤對話記錄進行隨機測驗,更符合學習者的需要;4.提高學習興趣,從而帶來良好的學習效果;5.體積小,易于隨身攜帶;6.成本與現有的數碼學習機相差不大,在價格上具有競爭優勢。
以下結合附圖和具體實施例對本實用新型進行詳細說明,其中
圖1是本實用新型的方框圖;圖2是本實用新型第一實施例的方框圖;圖3是本實用新型第一實施例的語音識別模塊電路圖;圖4是本實用新型第二實施例的方框圖。
具體實施方式
如
圖1所示,本實用新型包括微處理器1,存儲器2、液晶顯示器3、輸入鍵盤4、解碼器5、數模轉換器6、放大器7,輸出耳機8,還包括與微處理器1連接的音識別模塊9和輸入麥克風10。存儲器2可以采用大容量閃存、光盤或移動硬盤。顯示器3采用LCD液晶顯示器。語音識別模塊9是本實用新型的重點,其作用是接受麥克風10的輸入信號,并對其進行識別,微處理器1根據識別結果控制系統運行。
圖2是本實用新型的一個實施例。在該實施例中,語音識別模塊9由解碼器11、模數轉換器12、微控制器13組成。解碼器11通過接口電路連接微處理器1,接受由其傳來的數字語音信號,通過接口電路輸出給微控制器13。而麥克風語音經模數轉換器12轉換后,通過接口電路輸出給微控制器13。考慮成本因素,圖中微控制器13可采用89C51芯片,由其對麥克風輸入的語音和內存語音進行語音識別,最后將結果反饋給微處理器1,微處理器根據識別結果,控制系統運行。麥克風10的另一路語音直接送至耳機放大電路,作為輸入監聽。
本實用新型第一實施例的核心是對一句完整語音進行整體識別,譬如一個單詞或者一句話的語音,因此需要將相關語音文件預先存入存儲器2。
根據本實用新型功能需要,可以在某一時間段里通過液晶顯示器3交替顯示兩個不同內容的文本,也可以加裝另一塊液晶顯示器14,專門顯示“提示文本”,如圖2所示。
語音識別控制程序描述在任一人機對話程序中,當某一單詞或語句語音輸出完畢,麥克風10的輸入有效,當麥克風的語音輸入出現時,微控制器13開始以一定的取樣頻率(調試選定)對來自麥克風10的語音信號和來自微處理器1從存儲器2讀取的內存語音信號進行比較,同時把總的取樣次數進行計數,結果假設存于寄存器A,把取樣中二者差值大于預定值(調試選定)的取樣也進行計數,結果假設存于寄存器B,當麥克風的輸入語音結束時,微控制器13停止取樣,同時比較寄存器A和B中的數值,當比值位于預定值(調試選定)之內時,向微處理器1輸出一個執行下一命令的信號,否則輸出一個讀取存儲器中一個特定語音數據的信號,從耳機中輸出,譬如“請再重復一遍!”的語音文件,同時計數器復位,寄存器清零。當麥克風的語音再次出現時,微控制器重復取樣,直到能被識別的語音輸入或者按鍵中斷。
當用本實用新型第一實施例方案學習英文單詞時,首先,微處理器1從外存2中隨機或按照要求讀出一個單詞的中文(或英文)語音文件和文本文件,并分別送至解碼器5和液晶器3,語音文件經處理后從耳機輸出真人語音(即“問句”);語音信號輸出完畢時,麥克風輸入有效,系統等待麥克風的語音輸入;當麥克風信號出現(信噪比調試選定)時,微控制器13同時接受微處理器1從外存中讀出的該單詞譯文語音數據和來自麥克風語音數據,當語音輸入結束時,向微處理器1反饋比較結果,根據結果,微處理器要么執行下一“提問”命令,要么讀取一特定語音文件,并經耳機語音輸出,譬如“請再說一遍!”,以維持良好的對話氛圍,這時微控制器13會等待再一次語音輸入并執行,當然學習者可以隨時按鍵中斷;其中,在“問句”語音信號播放完畢后約三秒鐘(給學習者一個思考的空間),微處理器1讀出該單詞譯文文本文件,并送至液晶顯示器14,如圖2所示。液晶顯示器14也可以通過微處理器1軟件設計集成到液晶顯示器3中。
當用本實用新型第一實施例方案學習語句對話時,首先,微處理器1從存儲器2隨機或按照要求讀出(文件庫)某語境塊中某對話句組的“起始問句”的文本文件、語音文件,分別送至解碼器5和液晶顯示器3,語音文件經處理后從耳機中輸出真人語音;語音信號輸出完畢時,麥克風輸入有效,系統等待麥克風的語音輸入;當麥克風信號出現(信噪比調試選定)時,微控制器13同時接受微處理器1從外存中讀出該語句的“回答語句”語音數據和來自麥克風語音數據,當語音輸入結束時,向微處理器1反饋比較結果,根據結果,微處理器要么執行下一“提問”命令,要么讀取一特定語音文件,并經耳機語音輸出,譬如“請再說一遍!”,以維持良好的對話氛圍,這時微控制器13會等待再一次語音輸入并執行,當然學習者可以隨時按鍵中斷;其中,在“問句”語音信號播放完畢后約三秒鐘(給學習者一個思考的空間),微處理器1讀出“回答語句”文本文件,并送至液晶顯示器14。
圖3是本實用新型第一實施例的語音識別模塊電路圖。該電路中微處理器1采用雙口RAMCY7C133芯片、解碼器11采用TMS320C32芯片、存儲器2采用兩片單口存儲器61C256、微控制器13采用89C51芯片、模數轉換器12用ADS7832。CY7C133是16位數據總線、11位地址總線的高速2K×16CMOS雙端口靜態RAM,解碼器11通過它與微處理器1進行高速數據通信,微控制器13是模塊的核心,是一片性價比較高的8位單片機。當檢測到麥克風語音輸入時,它通過控制總線的程序讀(PSEN)信號線,控制模數轉換器12的轉換啟動,以及控制微處理器1的“對話答句”語音文件的讀取操作,位于兩片兩個結果61C256中的取樣結果,在微控制器13的讀取命令下,同時送至其PO口和P1口,并進行比較、識別,識別比較的過程如前所述的“控制程序描述”。
圖4是本實用新型的第二個實施例,本方案的核心是對一句語音(一個單詞或者一句話)進行關鍵詞識別,因此,必須在存儲器2中植入一個語音識別引擎,如IBM提供的語音識別引擎,即ASR(Automatic SpeechRecognization),又稱語音識別系統。在該實施例中,語音識別模塊9包括A/D模數轉換器及相關的接口電路,麥克風的10的語音一路經模數轉換器15送給微處理器1控制的語音識別引擎識別,另一路直接送至音頻放大器7,作為輸入監聽。
語音識別程序描述在人機對話程序中,當某一單詞或語句語音輸出完畢時,麥克風輸入有效,系統等待麥克風語音輸入;當麥克風語音輸入出現時,微處理器1同時對從外存中讀出該語句的“回答語句”語音數據和來自麥克風語音數據進行關鍵詞識別,分別對識別的關鍵詞數和不被識別的關鍵詞數進行計數,當語音輸入結束時,微控制器停止識別,同時比較兩個計數結果,當比值位于預定值(調試選定)之內時,微處理器1則執行下一命令,否則輸出一個讀取存儲器中一個特定語音數據的信號,從耳機中輸出,譬如“請再重復一遍!”的語音文件,并從耳機語音輸出,譬如“請再重復一遍!”的語句,同時計數器復位,寄存器清零。當麥克風的語音再次出現時,微處理器重復執行識別操作,直到識別通過或者按鍵中斷。
本實用新型存儲器2中的語音文件及文本文件庫設計如下1、包括單詞庫和對話語句庫,前者包含每個單詞及釋義的中英文文本數據和每個單詞的中英文語音數據,后者包含每個語句中英文文本數據和語音數據。
2、文本數據采用PC機常用的文件系統管理,語音數據采用壓縮格式的音頻格式。
3、單詞庫和對話語句庫可以針對不同水平的使用者進行等級分類,如初中水平、高中水平、大學四級水平、大學六級水平等。
4、對話語句庫由若干個語言環境塊組成,每個語言環境塊由若干個對話語句組構成,一個定義的語言環境塊可以包括若干個內容相關的對話句組,例如定義為高中英語水平的“機場接機”的語言環境塊,可以包括這些對話句組與出租車司機的對話(去機場),與咨詢臺小姐的對話(在機場),與客人間的對話(在出口),與客人的對話(在返程路上),與前臺小姐的對話(在入住酒店)。當然,與客人間的對話,是與一個陌生人的對話,所以又可以邏輯組合到其他的語境塊中;當然與出租車司機的對話句組又可以有不同的版本。
5、微處理器1會把每次按鍵中斷的句子或單詞分別記錄下來,在一個小程序里,學習者可以接受機器再次反復的隨機測驗,每次測驗時模塊都給正確回答計數,當該單詞或語句成功接受3次(可任意定義)回答后,系統自動將該單詞或語句從錯誤記錄里刪除。
本實用新型存儲器2中的本實用新型還可以集成其他功能,如復讀、跟讀、MP3播放器等功能,在遵循相關存儲協議規范時,整個設備還可以作為個人電腦的一個大容量移動存儲設備使用。
權利要求1.一種口語仿真學習機,包括微處理器(1)、存儲器(2)、液晶顯示器(3)、按鍵面板(4)、解碼器(5)、數模轉換器(6)、放大器(7)、耳機(8),其特征在于,還包括語音識別模塊(9)和麥克風(10)。
2.如權利要求1所述的口語仿真學習機,其特征在于所述的語音識別模塊(9)包括解碼器(11),模數轉換器(12)和微控制器(13)。
3.如權利要求1所述的口語仿真學習機,其特征在于存儲器(2)內嵌套有語音識別引擎,所述的語音識別模塊(9)由與微處理(1)相連的模數轉換器(15)組成。
4.如權利要求1所述的口語仿真學習機,其特征在于麥克風(10)的信號除輸出給語音識別模塊(9)外,還輸出給耳機監聽電路。
5.如權利要求1所述的口語仿真學習機,其特征在于還設有一個與微處理器(1)相連的,用于顯示“回答提示文本”的液晶顯示器(14)。
6.如權利要求1所述的口語仿真學習機,其特征在于微處理器(1)設有一個通過通信線與個人電腦進行通信的接口。
專利摘要一種口語仿真學習機,包括微處理器(1),與微處理器(1)連接的存儲器(2)、液晶顯示器(3)、輸入鍵盤(4)、解碼器(5)、模數轉換器(6)、放大器(7)和耳機(8),其特征在于還包括與微處理器(1)連接的語音識別模塊(9)和麥克風(10)。本實用新型提出的口語仿真學習機是一個模仿帶有真人語音數據庫的隨身攜帶的學習工具,能夠隨機向學習者發問,一問一答實現人機語音對話,創造出與真人對話交流的氛圍。
文檔編號G09B7/00GK2755698SQ200420102510
公開日2006年2月1日 申請日期2004年12月6日 優先權日2004年12月6日
發明者聶鑒強 申請人:聶鑒強