專利名稱:一種帶有語言復讀功能的計算機及其實現方法
技術領域:
本發明涉及一種帶有語言復讀功能的計算機及其實現方法,它屬于計算機應用領域。
背景技術:
語言復讀機為人們提供了學習語言的有利工具,它在訓練人們的發音與聽力能力方面尤為突出。語言復讀機的優點很多,在此不一一列舉;但是,它的缺點也是非常明顯的,如它是通過用戶自己的辨別水平來判斷、辨別自己的發音與標準發音所存在的差異的,對于如何評價發音的標準沒有一個量化的指標,且是因人而異沒有一個統一的標準;另外,語音復讀機的材料來源主要是磁帶,它是一種物理的介質,同時其成本比較高。
隨著網絡的發展,網絡上的資料極為豐富,同時也以較廉價,傳播也非常迅速。目前,在網絡上也有很多的共享軟件與商業軟件來模擬語言復讀機的功能,但其主要是在操作系統的平臺下作為應用軟件的方式提供,對于一般的用戶,其使用有一定的門檻。
發明內容
鑒于上述原因,本發明的目的是提供一種帶有語言復讀功能的計算機。
本發明的另一目的是提供一種通過計算機實現語言復讀功能的方法,該方法根據頻譜分析提示用戶在發音方面的差異性,同時提供一個糾正發音差異的可視化界面。
為實現上述目的,本發明采取以下設計方案一種帶有語言復讀功能的計算機,其特征在于它包括計算機和附加在計算機主機上的可實現語言復讀功能的硬件部分;該硬件部分主要由啟動語言復讀功能的啟動裝置、控制模塊和音頻編解碼芯片構成;所述啟動裝置的信號輸出端通過計算機主機板接口直接與計算機主板相連;所述控制模塊是一個軟硬件結合的模塊,它實際上是一存儲有控制程序的內存,它直接與計算機的CPU數據輸入/輸出口相連,借助計算機CPU強大的計算與處理能力執行其內部的控制程序;所述音頻編解碼芯片的音頻信號輸入口直接與外部音頻信號輸入源相連,音頻編解碼芯片的數據輸入/輸出口與所述控制模塊的I/O口以及語音輸出設備相連。
所述啟動裝置為一遙控器和一遙控器接收板;遙控器上設置有用來進行操作命令輸入的功能鍵;遙控器接收板用來接收遙控器發出的操作命令,其信號輸出端通過計算機主機板接口直接與計算機主板相連。
所述啟動裝置還可以為一啟動快捷鍵,該快捷鍵的信號端通過計算機主機板接口直接與計算機主板相連。
所述控制模塊主要包括啟動子程序模塊、文件轉化子程序模塊、語音分析/輸出子程序模塊、可視化分析/顯示子程序模塊、用戶動作操作子程序模塊、配置設置子程序模塊和學習方法選擇子程序模塊。
一種利用計算機實現語言復讀功能的方法,其特征在于它包括以下步驟1、將各種格式的媒體文件轉化成基準語音數據文件;2、系統配置的設置;通過控制模塊中的用戶動作操作子程序模塊、配置設置子程序模塊和學習方法選擇子程序模塊設置語言復讀功能的啟動方式、學習方式以及音頻方式;3、將用戶的跟讀語音信號轉化成用戶跟讀語音數據文件;4、對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析并進行比對、判斷;通過控制模塊中的語音分析/輸出子程序模塊對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析,比對頻譜分析結果;5、顯示比較結果。
圖1為本發明實現語言復讀功能硬件部分系統結構示意2為本發明遙控器面板設置3為本發明遙控器接收板與計算機主機板的連接關系4為本發明實現語言復讀功能的軟件模塊的總體模塊5為本發明啟動語言復讀軟件模塊的程序框6為本發明語音處理模塊流程7為本發明自動與手動設置程序框8為本發明語音分析程序程序框圖
具體實施例方式
本發明是基于現有計算機硬件而設計的,它充分利用了計算機本身強大的計算與處理能力,在現有計算機硬件基礎上增加了可實現語言復讀功能的部分,從而使計算機可以實現語言復讀、識別發音差異、提供糾正發音差異的可視化界面。
如圖1所示,本發明在現有計算機的基礎上增加了可實現語言復讀功能的硬件和軟件部分。其硬件部分主要由遙控器1、遙控器接收板2、控制模塊3和音頻編解碼芯片4構成。
遙控器1是用來進行命令輸入的,其按鍵設置如圖2所示。遙控器接收板2用來接收遙控器1發出的控制命令,其信號輸出端通過COM2或IR或USB或1394等主機板接口直接與計算機相連,如圖3所示;并通過與計算機CPU相連的控制模塊3進行進程的控制。
遙控器1和遙控器接收板2的主要功能是啟動語言復讀功能模式。為簡便起見,本發明還可以通過設置快捷鍵方式啟動語言復讀功能模塊。
控制模塊3是一個軟硬件結合的模塊,它實際上是一存儲有控制程序的內存,它直接與計算機的CPU相連,借助于計算機CPU強大的計算與處理能力,通過音頻編解碼芯片4對麥克風、耳機或者其它音響設備進行管理,同時還可以通過一定的外設來導入音頻文件,例如DISC,U盤,移動硬盤,磁帶等介質。控制模塊3在對輸入的語音信號進行管理的同時還通過音頻編解碼芯片4將語音信號輸出。對于硬件而言,控制模塊3是通過主板MIC口、音頻編解碼芯片4輸入音頻信號,并對其進行錄制,比如錄制成MP3的文件。之后,控制模塊3通過對音頻文件進行解析,轉換成音頻數據,然后,進行語言復讀的功能處理。
如圖4所示,存儲在控制模塊3中用來實現語言復讀功能的控制程序主要包括啟動子程序模塊31、文件轉化子程序模塊32、語音分析/輸出子程序模塊33、可視化分析/顯示子程序模塊34、用戶動作操作子程序模塊35、配置設置子程序模塊36和學習方法選擇子程序模塊37。
無論用戶通過何種途徑得到音頻文件,不論其格式如何,控制模塊3中的文件轉化子程序模塊32都將其文件內容轉換為流媒體,這樣就可以直接對數據進行處理。用戶還可以通過配置設置子程序模塊36和學習方法選擇子程序模塊37進行語言復讀的設置,比如用戶選了一種學習方法,那么對于整個學習過程中可能就是按照該種學習方法來組織;同時可以針對學習方法的設置來選擇不同學習方法。另外,用戶如果不想進行語言復讀自動的流程,其可以直接通過用戶動作操作子程序模塊35進行設置從而得到個性化的復讀流程。語音分析/輸出子程序模塊33和可視化分析/顯示子程序模塊34可以針對語音進行分析得出可供用戶參考、評判自己發音是否標準的可視化界面,這是在傳統的語音復讀的基礎上進行了應用的擴展。
本發明是在計算機實現家電模式的基礎上進行設計的。對于該模式的設計可以參考其他幾個專利,申請號為02117258.7《基于單功能模式啟動的遙控裝置》,申請號為02100654.7《單功能模式啟動的方法》。
本發明在計算機系統中實際上集成了兩個模式一個是正常操作系統,例如微軟公司的視窗系列操作系統;另一個是為實現語言復讀功能的模式,該模式實際上是在嵌入操作系統上進行裁減與功能設計而形成的功能定義模式。在該功能模式下,本發明設計成可以隨時開關機的形式,給用戶提供一個功能明確,使用簡單的形式。本發明利用硬件觸發與BIOS與CPU之間通訊來實現正常操作系統與語言復讀功能模式不同的啟動方式。如圖5所示,當計算機上電后,BIOS會自動判讀開機信號的來源。如果是系統開機,BIOS初始化自動引導正常的操作系統;反之,控制模塊3中的啟動子程序模塊31會自動引導語言復讀功能模塊。
本發明控制軟件模塊主要完成語音數據處理、功能設置、語音分析和學習信息管理。
語音分析/輸出子程序模塊33主要完成對數據流的處理,語言復讀、跟讀以及語音的分析。如圖6所示,該子程序模塊主要完成將麥克風所導入的語音信號轉化為文件存放在硬盤中,同時將文件解析成數據形式存在在內存中設置的緩沖區中,作為對數據進行語言復讀等功能的應用。同時經過處理后轉化成語音輸出,完成對語音數據的分析與處理。通過對語音數據的分析,我們可以人為設置多種調節速度,滿足用戶的需求。
如圖7所示,本發明在配置設置子程序模塊36和學習方法選擇子程序模塊37中設計了音頻設置與學習方法設置功能,保證下次使用時保持原樣的設計。例如對于學習方法我們可以設置為“傳統聽說讀寫背誦”,逆向法,瘋狂英語,韓國鄭氏《千萬別學英語》等多種學習方法,對于市面上所出現的學習方法,本發明均可以根據其實現方式進行模塊的擴充。
對于音頻設置,我們通過引導模式來進行用戶的使用測試。通過對計算機CODEC,音量設置,外部音響或者耳機,麥克風的檢測來引導用戶進行設置,首先在硬件上做好準備。
本發明人為的通過設置配置文件的方式進行語言復讀功能的設置,這樣人們可以通過遙控器或者遙控接收板上的“自動”按鍵,實現按照事先設置好的配置程序進行練習。例如設置復讀的時間長短,復讀的句子數,聲音的播放速度,設置的單詞數,跟讀的時間(這主要是根據所跟讀內容時間的長短×系數,如系數可以從1-10之間取值,這樣用戶可以根據自身的水平進行系數的修正)。
對于一般的復讀機而言,對于語音的分析主要是根據個人自我的感覺來表明學習效果。因而在客觀上還是存在很大的差異。如圖8所示,本發明語音分析/輸出子程序模塊33是通過對原始數據和用戶跟讀數據分別進行頻譜分析,比對兩個頻譜分析結果來分析、判斷用戶發音是否標準、正確,再通過可視化分析/顯示子程序模塊34顯示比對、分析結果。可視化就是指通過對基準發音的頻譜與用戶跟讀發音的頻譜進行比較,通過分析找出對于某個單詞或者句子發音的錯誤,讓用戶自動定位。本發明通過對基準數據源以及用戶跟讀數據的頻譜分析,同時設置一個懲罰函數來框定數值的差異性,并通過波形的相似性描述跟讀的效果。
總之,本發明利用計算機實現語言復讀功能的方法,具體包括以下步驟1、將各種格式的媒體文件轉化成基準語音數據格式文件;2、系統配置的設置;通過控制模塊中的用戶動作操作子程序模塊、配置設置子程序模塊和學習方法選擇子程序模塊設置語言復讀功能的啟動方式、學習方式以及音頻方式;3、將用戶的跟讀語音信號轉化成用戶跟讀語音數據格式文件;4、對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析并進行比對、判斷;通過控制模塊中的語音分析/輸出子程序模塊對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析,比對頻譜分析結果;5、顯示比較結果。
另外,本發明在計算機的語言復讀的模式下,還可以設計一個管理模塊,來實時記錄學習的效果與學習計劃,有效地提醒用戶學習。
本發明在計算機硬件的基礎上只增加或者不增加成本的基礎上集成了語言復讀機功能,有效的將媒介源從磁帶擴充到音樂文件,這樣可以大大增加數據源,提供人們的學習能力。本發明在集硬件復讀機的基礎上拓展了數據源,同時通過對英語等學習方法的提煉,為用戶提供手動和自動的語言復讀功能,在保留操作簡單的基礎上很好的利用了家庭計算機的功能,以低成本實現了人們的某些需求。更重要的是,本發明通過對標準源數據和用戶跟讀數據的頻譜分析判斷,判斷用戶發音是否標準,并提供可視化的界面糾正用戶的發音,為用戶提供一個科學的測試工具。
本發明同時也提供了一種計算機單功能的應用模式,有效的將家電與計算機結合。
權利要求
1.一種帶有語言復讀功能的計算機,其特征在于它包括計算機和附加在計算機主機上的可實現語言復讀功能的硬件部分;該硬件部分主要由啟動語言復讀功能的啟動裝置、控制模塊和音頻編解碼芯片構成;所述啟動裝置的信號輸出端通過計算機主機板接口直接與計算機主板相連;所述控制模塊是一個軟硬件結合的模塊,它實際上是一存儲有控制程序的內存,它直接與計算機的CPU數據輸入/輸出口相連,借助計算機CPU強大的計算與處理能力執行其內部的控制程序;所述音頻編解碼芯片的音頻信號輸入口直接與外部音頻信號輸入源相連,音頻編解碼芯片的數據輸入/輸出口與所述控制模塊的I/O口以及語音輸出設備相連。
2.根據權利要求1所述的一種帶有語言復讀功能的計算機,其特征在于所述啟動裝置為一遙控器和一遙控器接收板;所述遙控器上設置有用來進行操作命令輸入的功能鍵;所述遙控器接收板用來接收遙控器發出的操作命令,其信號輸出端通過計算機主機板接口直接與計算機主板相連。
3.根據權利要求1所述的一種帶有語言復讀功能的計算機,其特征在于所述啟動裝置為一啟動快捷鍵,該快捷鍵的信號端通過計算機主機板接口直接與計算機主板相連。
4.根據權利要求1所述的一種帶有語言復讀功能的計算機,其特征在于所述控制模塊主要包括啟動子程序模塊、文件轉化子程序模塊、語音分析/輸出子程序模塊、可視化分析/顯示子程序模塊、用戶動作操作子程序模塊、配置設置子程序模塊和學習方法選擇子程序模塊。
5.一種利用計算機實現語言復讀功能的方法,其特征在于它包括以下步驟(1)、將各種格式的媒體文件轉化成基準語音數據文件;(2)、系統配置的設置;通過控制模塊中的用戶動作操作子程序模塊、配置設置子程序模塊和學習方法選擇子程序模塊設置語言復讀功能的啟動方式、學習方式以及音頻方式;(3)、將用戶的跟讀語音信號轉化成用戶跟讀語音數據文件;(4)、對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析并進行對比、判斷;通過控制模塊中的語音分析/輸出子程序模塊對基準語音數據文件和用戶跟讀語音數據文件分別進行頻譜分析,比對頻譜分析結果;(5)、顯示比較結果。
全文摘要
本發明公開了一種帶有語言復讀功能的計算機及其實現方法。它包括計算機和附加在計算機主機上的可實現語言復讀功能的軟硬件部分。其硬件部分主要由啟動語言復讀功能的啟動裝置、控制模塊和音頻編解碼芯片構成,主要完成啟動、選擇、設置、操作計算機語言復讀功能,并將各種格式的媒體存儲在計算機中。本發明實現語言復讀功能的方法是1.將各種格式的媒體文件轉化成基準語音數據格式文件;2.進行系統配置的設置;3.將用戶的跟讀語音信號轉化成用戶跟讀語音數據格式文件;4.通過控制模塊中的語音分析/輸出子程序模塊對基準語音數據和用戶跟讀語音數據分別進行頻譜分析,比對頻譜分析結果,判斷跟讀是否準確、發音是否正確;5.顯示比較結果。
文檔編號G06F13/00GK1512387SQ0215991
公開日2004年7月14日 申請日期2002年12月27日 優先權日2002年12月27日
發明者胡建鋒, 李學文 申請人:聯想(北京)有限公司