一種英語口語朗讀考試評分方法
【專利摘要】本發明公開了一種英語口語朗讀考試評分方法,包括如下步驟:步驟一、使用錄音設備獲取應試者口語朗讀語音信息;步驟二、對所述采集的語音信號進行預處理,得到經預處理的語音信號;步驟三、對所述經預處理的語音信號進行語音特征參數提取,得到所述采集的語音信號的語音特征參數;步驟四、利用所述語音特征參數對所述采集的語音信號與標準語音信號進行比較,分別得到準確度分值、語速分值、重音分值、音量分值;步驟五、對準確度分值、語速分值、重音分值、音量分值進行加權相加,得到最終評分數值。本發明檢測準確度高,可靠性好,減輕了人為評分的勞動強度,降低了評分人員主觀因素對分數的影響。
【專利說明】
-種英語口語朗讀考試評分方法
技術領域
[0001] 本發明設及語音識別技術領域,特別設及一種英語口語朗讀考試評分方法。
【背景技術】
[0002] 隨著人們對英語口語的重視逐漸加強,目前,口語測試己經成為大多數英語水平 考試的重要組成部分。口語考試規模的日益增大使大量考生的口語數據需要進行評分,運 需要大量的人力資源。人工評分是傳統的評分方法,但有很多不易解決的問題,如評分員資 源短缺、人工評測成本高、評分較主觀,即使是同一個評分者對相同的樣本,在不同的時間 受各種條件的影響也可能評出不同的分數。尤其是對超大規模的評測,人工評測已難W滿 足其需求。因此,一種能夠客觀地、可批量化處理的機器評分方法是目前所急需的。
[0003] 英語口語考試中的一個常見的題型是段落朗讀。在此題型中,考生被要求大聲朗 讀一段語段,語段的長度通常不少于100個單詞。該題型由于朗讀的文本固定,因此相對于 其他題型,更適于使用機器進行自動批量評分。
【發明內容】
[0004] 本發明的目的是提供一種英語口語朗讀考試評分方法,通過對口語考試的朗讀題 錄音樣本進行分析,提取多個評分因素并加權后得到最終評分結果,評分過程快速可靠。
[0005] 本發明提供的技術方案為:
[0006] -種英語口語朗讀考試評分方法,包括如下步驟:
[0007] 步驟一、使用錄音設備獲取應試者口語朗讀語音信息;
[000引步驟二、對所述采集的語音信號進行預處理,得到經預處理的語音信號;
[0009] 步驟Ξ、對所述經預處理的語音信號進行語音特征參數提取,得到所述采集的語 音信號的語音特征參數;
[0010] 步驟四、利用所述語音特征參數對所述采集的語音信號與標準語音信號進行比 較,分別得到讀音準確率分值、語速分值、重音分值、音量分值;
[0011] 步驟五、對讀音準確率、基頻、音量及語速分值進行加權相加,得到最終評分數值。
[0012] 優選的是,步驟一中,還包括將獲取的應試者的模擬語音信號轉換為數字信號,轉 換時的采樣頻率為SIfflz。
[0013] 優選的是,步驟二中,所述預處理包括加重、分帖、加窗及端點檢測。
[0014] 優選的是,采用漢明窗對語音信號進行加窗處理。
[001引優選的是,采用雙Π 限端點檢現蛇進行端點檢測。
[0016] 優選的是,步驟四中,讀音準確率、基頻、音量及語速評分公式如下:
[0017]
[001引其中,S1,S2,S3,S4分別為讀音準確率、重音、音量及語速分值;山,cb,d3,cU分別為讀 音準確率、基頻、音量及語速特征與標準語音差異距離;a, b為常數。
[0019] 優選的是,所述差異距離采用歐幾里徳距離。
[0020] 優選的是,步驟五中,最終評分數值為:
[0021] S= WiS1+W2S2+W3S3+?4S4
[0022] 其中,ωι,02, 03, c〇4分別代表讀音準確率、重音、音量及語速的權重。
[0023] 本發明的有益效果是:本發明提供的英語口語朗讀考試評分方法,通過對準確度、 語速、重音、音量四個方面對口語考試應試者進行評判,檢測準確度高,可靠性好,減輕了人 為評分的勞動強度,降低了評分人員主觀因素對分數的影響。
【附圖說明】
[0024] 圖1為本發明所述的英語口語朗讀考試評分方法流程圖。
【具體實施方式】
[0025] 下面結合附圖對本發明做進一步的詳細說明,W令本領域技術人員參照說明書文 字能夠據W實施。
[0026] 如圖1所示,本發明提供了一種英語口語朗讀考試評分方法,包括如下步驟:
[0027] 步驟一 S110、獲取應試者朗讀語音數據。
[0028] 在應試者進行朗讀時,使用錄音設備對應試者的朗讀語音進行錄制和儲存。由于 應試者的語音信號為模擬信號,需要進行數字化采樣處理。由于一般人的語音頻率在4KHZ W下,只有當采樣頻率大于信號中最大頻率的2倍時,采樣之后的數字信號才能夠較為完整 的表達原始語音信號中的有效信息。因此,本發明中采樣頻率為81(化。
[0029] 步驟二S120、對所述采集的語音信號進行預處理,得到經預處理的語音信號;
[0030] 在對語音信號進行分析和處理之前,必須對其進行加重、分帖、加窗及端點檢測等 預處理操作。運些操作的目的是消除由于人類發生氣管本身和語音信號采集設備的高次諧 波失真、高頻、混疊等因素對語音信號質量的影響。語音預處理影響著語音特征提取的結 果,更平滑均勻的語音信號可為語音特征提取提供更優質的參數,從而提高語音處理質量。
[0031] 預加重:
[0032] 受口鼻福射和聲口激勵的影響,語音信號的平均功率譜高頻端大約在SOOHzW上 按6地/oct(倍頻程)衰減。因此,在對語音信號進行分析之前,一般采用一個6地/oct的高頻 提升預加重數字濾波器來提升語音信號的高頻部分,使得語音信號的頻譜變得平坦,能用 同樣的信噪比求低頻到高頻整個頻帶的頻譜。濾波響應函數為:
[0033] Η(ζ) = 1-0.95ζ_ι
[0034] 則預加重處理后的結果y(n)可W由輸入的語音信號χ(η)表示為:
[0035] y(n) =x(n)-〇. 95x(n-l) 〇
[0036] 分帖:
[0037] 語音信號具有時變特性,但由于發聲器官的慣性運動,可W認為在一個短時間范 圍內(一般為10~30ms),語音信號基本保持不變即相對穩定,因而可W將其看作是一個準 穩態過程,即語音信號具有短時平穩性。因此,語音信號的分析和處理通常建立在"短時性" 的基礎上,即采用"短時分析",對語音信號流進行分帖處理。一般每秒的帖數有
[00;3 引
[0039] 分帖可W采用連續方式或者交疊方式。由于語音信號之間具有相關性,本文采用 半帖交疊方式進行分帖。因此對于整體的語音信號而言,分析出的是由每一帖特征參數組 成的特征參數時間序列。
[0040] 加窗:
[0041] 為加強語音信號中抽樣η附近的語音波形、減弱波形的其余部分,在分帖處理之后 還要對其進行加窗處理。對語音信號的各個短段進行加窗處理,相當于對各個短段進行某 種運算或者變換,具體計算公式如下:
[0042]
[0043] 其中Τ[]表示某種變換,線性的或者非線性的都可W,s(n)為輸入語音信號序列, Qn是所有各段經過處理后得到的一個時間序列。
[0044] 最常用的窗函數包括漢明窗(化mming)、矩形窗和漢寧窗(化nning),其定義分別 為:
[0045] (1)漢明窗
[0051]矩形窗的主瓣較窄,具有較高的頻率分辨率,但也由于其具有較高的旁瓣容易導 致相鄰諧波之間的干擾比較嚴重,相鄰諧波間隔內有時疊加有時抵消而產生嚴重泄露。漢 明窗是最為普遍使用的,可W得到比矩形窗平滑得多的頻譜。本發明采用漢明窗對語音信 號進行加窗處理。
[0化2]端點檢測:
[0053]語音信號端點檢測是語音識別過程中的一個關鍵環節,其目標是自動檢測出語音 信號的端點(即起始點及結束點),其算法的優劣將直接影響到語音識別性能的好壞。準確 地確定出語音信號的起始點和結束點,才能對有用的語音信號進行存儲和處理。實驗表明, 短時能量和短時平均過零率雙口限端點檢測法能夠比較準確地檢測出有效語音的端點,也 是目前比較常用有效的端點檢測方法。雙口限比較法W短時能量E和短時平均過零率Z作為 特征,有效結合E和Z的優點,能更準確地檢測出語音信號的端點,不僅可W排除無聲段的噪 聲干擾,還能降低系統的處理時間,提高系統處理的實時性,從而提高語音信號的處理性 能。本發明采用該方法進行端點檢測。
[0054] 步驟^S130、對所述經預處理的語音信號進行語音特征參數提取。
[0055] 語音信號特征參數提取就是去除與語音處理無關緊要的冗余信息,對語音信號進 行分析處理。原始語音信號不僅數據量十分大,而且由于發聲人的不同、發聲響度、長度等 原因而存在太多干擾語義的信息,因此不適合直接用于語音處理。特征參數的好壞會直接 影響到語音處理性能,合適的特征提取方法會帶來更佳的結果。所W需要對原始語音信號 進行特征參數提取,最理想的語音特征只描述語義信息,語音數據總量也小。
[0056] 語音的時域特征主要有語音的基音周期、短時(平均)過零率和短時(平均)能量。 語音的頻率特征主要有快速傅立葉變換(Fast Fourier Transformation,FFT)頻譜系數、 線性預測系數化inear Prediction Coefficient,LPC)、線性預測倒譜系數化inear Prediction C邱strum Coefficient,LPCC)和梅爾頻率倒譜系數(MelRrequency C邱s1:;r皿 Coefficient,MFCC)等。實驗表明,基于聲道的LPCC特征參數與基于聽覺特性的MFCC特征參 數都是將語音從時域變換到倒譜域上,都能較好地表征語音特征。其不同點在于:LPCC基于 發聲模型,利用線性預測編碼技術求倒譜系數;MFCC基于聽覺模型,W語音通過該模型(濾 波器組)的輸出為聲學特征,直接通過離散傅立葉變換(DT巧進行變換。
[0057] 步驟四S140、利用所述語音特征參數對所述采集的語音信號與標準語音信號進行 比較,分別得到準確度分值、語速分值、重音分值、音量分值。
[0058] 在獲取語音特征參數后,與標準語音進行比對,求出兩者的相似度,并將相似度轉 換為具體的分數。
[0059] 將提取的語音特征參數與標準語音參數從四個方面進行比對,運四個方面分別 為:
[0060] (1)音量強度曲線,即語音信號的振幅大小來表示語音的音量特征;
[0061] (2)基頻軌跡曲線,即語音的音高的起伏,也就是重音位置;
[0062] (3)發聲急緩變化,即語音的語速的變化;
[0063] (4)讀音準確率,即語音信號經辨識后得出的每個音素的正確率,表示語音內容。
[0064] 針對音素讀音準確率、重音、音量及語速等單一特征進行評判,其公式如下:
[00 化]
[006引其中,S1,S2,S3,S4分別為讀音準確率、重音、音量及語速分值;山,cb,d3,cU分別為讀 音準確率、基頻、音量及發聲急緩變化特征差異差異距離,運里使用的是歐幾里徳距離;a, b 為常數。
[0067] 運樣我們就可W將兩音素間某個特征的差異程度轉成0到100之間的分數,只要設 定好兩組的di及對應的Si,即可從中求出a和b。
[0068] 步驟五S150、對讀音準確率、基頻、音量及語速分值進行加權相加,得到最終評分 數值:
[0069] S = ω 1S1+ ω 2S2+ ω 3S3+ ω 4S4
[0070] 其中,ωι,《2,《3, ω4分別代表四個評分參數的權重。經由大量的實驗,可W求出 運四項參數的權重,也可W由權重的比例得知四項評分參數對于英文評分的重要性。ωι, 02, 03, C〇4也可W由人為進行設定。
[0071]盡管本發明的實施方案已公開如上,但其并不僅僅限于說明書和實施方式中所列 運用,它完全可W被適用于各種適合本發明的領域,對于熟悉本領域的人員而言,可容易地 實現另外的修改,因此在不背離權利要求及等同范圍所限定的一般概念下,本發明并不限 于特定的細節和運里示出與描述的圖例。
【主權項】
1. 一種英語口語朗讀考試評分方法,其特征在于,包括如下步驟: 步驟一、使用錄音設備獲取應試者口語朗讀語音信息; 步驟二、對所述采集的語音信號進行預處理,得到經預處理的語音信號; 步驟三、對所述經預處理的語音信號進行語音特征參數提取,得到所述采集的語音信 號的語音特征參數; 步驟四、利用所述語音特征參數對所述采集的語音信號與標準語音信號進行比較,分 別得到讀音準確率分值、語速分值、重音分值、音量分值; 步驟五、對讀音準確率、重音、音量及語速分值進行加權相加,得到最終評分數值。2. 根據權利要求1所述的英語口語朗讀考試評分方法,其特征在于,步驟一中,還包括 將獲取的應試者的模擬語音信號轉換為數字信號,轉換時的采樣頻率為8KHz。3. 根據權利要求1所述的英語口語朗讀考試評分方法,其特征在于,步驟二中,所述預 處理包括加重、分幀、加窗及端點檢測。4. 根據權利要求3所述的英語口語朗讀考試評分方法,其特征在于,采用漢明窗對語音 信號進行加窗處理。5. 根據權利要求3所述的英語口語朗讀考試評分方法,其特征在于,采用雙門限端點檢 測法進行端點檢測。6. 根據權利要求1所述的英語口語朗讀考試評分方法,其特征在于,步驟四中,讀音準 確率、基頻、音量及語速評分公式如下:其中,S1,S2,S3,S4分別為讀音準確率、重音、音量及語速分值;cU,d2,d 3,d4分別為讀音準 確率、重音、音量及語速特征與標準語音差異距離;a,b為常數。7. 根據權利要求6所述的英語口語朗讀考試評分方法,其特征在于,所述差異距離采用 歐幾里徳距離。8. 根據權利要求7所述的英語口語朗讀考試評分方法,其特征在于,步驟五中,最終評 分數值為: s = ω 1S1+ CO 2S2+ ω 3S3+ CO 4S4 其中,(01,(02,(03,(0 4分別代表讀音準確率、重音、音量及語速的權重。
【文檔編號】G10L15/18GK105825852SQ201610346130
【公開日】2016年8月3日
【申請日】2016年5月23日
【發明人】姜華, 程迎新, 顧艷, 李雪芹, 胡帥, 劉學豐, 叢巖, 項睿
【申請人】渤海大學