客觀題智能閱卷方法及系統的制作方法
【專利摘要】本發明公開了一種客觀題智能閱卷方法及系統,該方法包括:獲取答題卡圖像;對所述答題卡圖像進行灰度化處理,得到灰度圖;根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到答題區域子圖像;提取所述子圖像中各選項的填涂特征,所述填涂特征用于描述單個選項的填涂程度;基于統計模型及所述填涂特征對所述選項進行識別,得到所述選項的填涂程度得分;根據所述選項的填涂程度得分確定填涂的選項。利用本發明,可以提升選項答案判定的準確度。
【專利說明】
客觀題智能閱卷方法及系統
技術領域
[0001] 本發明設及信息處理技術領域,具體設及一種客觀題智能閱卷方法及系統。
【背景技術】
[0002] 隨著計算機科學與技術的發展,自動化信息處理能力得到了顯著的提高。教育模 式也一步步向信息自動化方向發展,自動閱卷系統的出現將人從繁重的機械勞動中解放出 來,如對客觀題的批閱。通過機器進行閱卷有利于教師對學生的成績做出客觀公正的評價, 并且自動閱卷的結果容易保存、統計和查詢。現有的自動閱卷系統對客觀題的答案進行判 定時,主要根據答題卡選項區域填涂的前景與背景像素比例來判定選項是否被填涂。所述 方法對答題卡的質量要求較高,當答題卡的紙質較差時,會嚴重影響當前選項答案的判定; 同時不同的設備由于性能上的差異,采集到的答題卡圖像在清晰度上也會有所不同,使用 現有方法很難排除所述干擾進行選項答案的判定;此外,現有方法對用戶的填涂方法要求 也較為嚴格,如果用戶在一次考試中有的選項填涂程度較重,有的填涂程度較輕,傳統方法 在填涂程度較輕的地方容易出現誤判,從而降低整個閱卷系統的識別準確率。
【發明內容】
[0003] 本發明實施例提供一種客觀題智能閱卷方法及系統,提升選項答案判定的準確 度。
[0004] 為此,本發明實施例提供如下技術方案:
[0005] 一種客觀題智能閱卷方法,包括:
[0006] 獲取答題卡圖像;
[0007] 對所述答題卡圖像進行灰度化處理,得到灰度圖;
[0008] 根據答題卡模板參數對所述灰度圖的答題區域進行分割,,得到答題區域子圖 像;
[0009] 提取所述子圖像中各選項的填涂特征,所述填涂特征用于描述單個選項的填涂程 度;
[0010] 基于統計模型及所述填涂特征對所述選項進行識別,得到所述選項的填涂程度得 分;
[0011] 根據所述選項的填涂程度得分確定填涂的選項。
[0012] 優選地,所述獲取答題卡圖像包括:
[0013] 利用光標閱讀設備、或者高拍儀、或者移動終端設備獲取答題卡圖像。
[0014] 優選地,所述答題區域子圖像包括:準考證號填涂區域子圖像、身份證號填涂區域 子圖像、及客觀題選項填涂區域子圖像。
[0015] 優選地,所述方法還包括:
[0016] 在根據答題卡模板參數對所述灰度圖的答題區域進行分割之前,對所述灰度圖進 行二值化處理,得到二值化圖;
[0017] 對所述二值化圖進行模糊檢測和/或圖像校正。
[0018] 優選地,所述對所述二值化圖進行模糊檢測包括:
[0019] 對所述二值化圖進行模糊處理;
[0020] 根據模糊前后邊緣的前景比例計算所述二值化圖的模糊度;
[0021] 如果所述模糊度小于設定的模糊度闊值,則執行根據答題卡模板參數對所述灰度 圖的答題區域進行分割的步驟;否則拒識所述答題卡圖像。
[0022] 優選地,所述對所述二值化圖進行圖像校正包括:
[0023] 根據答題卡模板定位塊及所述二值化圖中的定位塊建立映射關系;
[0024] 根據所述映射關系對所述二值化圖進行圖像校正;
[0025] 如果校正后的二值化圖滿足要求,則根據所述映射關系對所述二值化圖對應的灰 度圖進行圖像校正,然后執行根據答題卡模板參數對校正后的灰度圖的答題區域進行分割 的步驟;否則拒識所述答題卡圖像。
[00%] 優選地,所述方法還包括:
[0027] 在提取所述子圖像中各選項的填涂特征之前,對所述子圖像進行二值化處理,得 到二值化子圖;
[0028] W標準答題卡布局中選項位置為基準,對所述二值化子圖中各選項填涂區域進行 修正,得到修正后的二值化子圖;
[0029] 根據修正后的二值化子圖修正所述子圖像中各選項的位置。
[0030] 優選地,所述方法還包括:對所述二值化子圖中各選項填涂區域進行修正之前,濾 除所述二值化子圖中的邊框線。
[0031] 優選地,所述填涂特征包括W下一種或多種特征:前景特征、屬性特征、均值特征、 對比度特征、形狀投影特征、HAAR特征;
[0032] 提取所述子圖像中當前選項的前景特征包括:
[0033] 在所述子圖像對應的修正后的二值化子圖中確定當前選項前景外接矩形區域;
[0034] 計算所述外接矩形區域中的前景像素數;
[0035] 計算所述前景像素數與所述子圖像的像素數的比值,并將該比值作為所述當前選 項的前景特征;
[0036] 所述屬性特征包括水平屬性特征和垂直屬性特征,提取所述子圖像中當前選項的 屬性特征包括:
[0037] 計算所述子圖像的面積及像素均值;
[0038] 統計當前選項區域中水平方向相隔設定距離的兩個點的像素值都大于所述像素 均值的像素點對數Ni,并統計當前選項區域中垂直方向相隔設定距離的兩個點的像素值都 大于所述像素均值的像素點對數成;
[0039] 計算所述像素點對數Ni與所述子圖像的面積的比值,并將該比值作為所述當前選 項的水平屬性特征;
[0040] 計算所述像素點對數成與所述子圖像的面積的比值,并將該比值作為所述當前選 項的垂直屬性特征;
[0041] 提取所述子圖像中當前選項的均值特征包括:
[0042] 在所述子圖像中獲取當前選項的外接矩形區域;
[0043] 計算所述外接矩形區域像素均值;
[0044] 對所述外接矩形區域像素均值進行規整,得到所述當前選項的均值特征;
[0045] 提取所述子圖像中當前選項的對比度特征包括:
[0046] 確定所述子圖像的背景像素闊值;
[0047] 根據所述背景像素闊值確定所述子圖像中的背景像素點;
[0048] 計算所述背景像素點的像素均值;
[0049] 根據所述背景像素點的像素均值與所述子圖像中所有像素值的差值,得到像素差 值圖;
[0050] 統計所述像素差值圖中當前選項區域像素值大于設定闊值的像素的均值;
[0051] 對所述均值進行規整,得到所述當前選項的對比度特征;
[0052] 所述形狀投影特征包括向上投影特征和向下投影特征;提取所述子圖像中當前選 項的形狀投影特征包括:
[0053] 計算所述子圖像對應的修正后的二值化子圖中當前選項區域每一列從頂部開始 到第一個前景點像素的距離投影及每一列從底部開始到第一個前景點像素的距離投影,得 到當前選項區域的上投影圖像和下投影圖像;
[0054] 分別對所述上投影圖像和下投影圖像進行區間化,得到當前選項區域的上投影區 間及下投影區間; 陽化5] 獲取各投影區間內的像素值;
[0056] 對所述投影區間內的像素值求和,得到所述投影區間的區間特征;
[0057] 將各上投影區間的區間特征的集合作為當前選項的上投影特征,并將各下投影區 間的區間特征的集合作為當前選項的下投影特征;
[005引提取所述子圖像中當前選項的HAAR特征包括:
[0059] 將當前選項的區域作為整個HAAR特征的區域,計算所述當前選項的水平線特征 和垂直線特征。
[0060] 優選地,所述方法還包括:
[0061] 從所述子圖像上提取全局特征,所述全局特征包括同類對比度特征和異類對比度 特征;
[0062] 基于所述全局特征計算各選項的填涂程度得分;
[0063] 根據基于所述全局特征計算得到的所述選項的填涂程度得分,對基于統計模型識 別得到的所述選項的填涂程度得分進行修正,得到修正后的所述選項的填涂程度得分;
[0064] 所述根據所述選項的填涂程度得分確定填涂的選項具體為:根據修正后的所述選 項的填涂程度得分確定填涂的選項。
[00化]一種客觀題智能閱卷系統,包括:
[0066] 圖像獲取模塊,用于獲取答題卡圖像;
[0067] 預處理模塊,用于對所述答題卡圖像進行灰度化處理,得到灰度圖;
[0068] 分割模塊,用于根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到答 題區域子圖像;
[0069] 填涂特征提取模塊,用于提取所述子圖像中各選項的填涂特征,所述填涂特征用 于描述單個選項的填涂程度;
[0070] 識別模塊,用于基于統計模型及所述填涂特征對所述選項進行識別,得到所述選 項的填涂程度得分;
[0071] 答案判定模塊,用于根據所述選項的填涂程度得分確定填涂的選項。
[0072] 優選地,所述圖像獲取模塊為:光標閱讀設備、或者高拍儀、或者移動終端設備。
[0073] 優選地,所述系統還包括:
[0074] 第一二值化處理模塊,用于在所述分割模塊根據答題卡模板參數對所述灰度圖的 答題區域進行分割之前,對所述灰度圖進行二值化處理,得到二值化圖;
[0075] 模糊檢測模塊,用于對所述二值化圖進行模糊檢測;和/或
[0076] 圖像校正模塊,用于對所述二值化圖進行圖像校正。
[0077] 優選地,所述模糊檢測模塊,具體用于對所述二值化圖進行模糊處理,并根據模糊 前后邊緣的前景比例計算所述二值化圖的模糊度;在所述模糊度小于設定的模糊度闊值 時,觸發所述分割模塊根據答題卡模板參數對所述灰度圖的答題區域進行分割;否則確定 拒識所述答題卡圖像。
[0078] 優選地,所述圖像校正模塊,具體用于根據答題卡模板定位塊及所述二值化圖中 的定位塊建立映射關系,根據所述映射關系對所述二值化圖進行圖像校正;并在校正后的 二值化圖滿足要求時,根據所述映射關系對所述二值化圖對應的灰度圖進行圖像校正,然 后觸發所述分割模塊根據答題卡模板參數對校正后的灰度圖的答題區域進行分割;否則確 定拒識所述答題卡圖像。 陽0巧]優選地,所述系統還包括:
[0080] 第二二值化處理模塊,用于在所述填涂特征提取模塊提取所述子圖像中各選項的 填涂特征之前,對所述子圖像進行二值化處理,得到二值化子圖;
[0081] 局部修正模塊,用于W標準答題卡布局中選項位置為基準,對所述二值化子圖中 各選項填涂區域進行修正,得到修正后的二值化子圖;
[0082] 選項位置修正模塊,用于根據修正后的二值化子圖修正所述子圖像中各選項的位 置。
[0083] 優選地,所述系統還包括:
[0084] 濾除干擾模塊,用于在所述局部修正模塊對所述二值化子圖中各選項填涂區域進 行修正之前,濾除所述二值化子圖中的邊框線。
[00化]優選地,所述填涂特征提取模塊包括W下任意一個或多個單元:
[0086] 前景特征提取單元,用于提取所述子圖像中各選項的前景特征;
[0087] 屬性特征提取單元,用于提取所述子圖像中各選項的屬性特征;
[0088] 均值特征提取單元,用于提取所述子圖像中各選項的均值特征;
[0089] 對比度特征提取單元,用于提取所述子圖像中各選項的對比度特征;
[0090] 形狀投影特征提取單元,用于提取所述子圖像中各選項的形狀投影特征;
[0091] HAAR特征提取單元,用于提取所述子圖像中各選項的HAAR特征。
[0092] 優選地,所述系統還包括:
[0093] 全局特征提取模塊,用于從所述子圖像上提取全局特征,所述全局特征包括同類 對比度特征和異類對比度特征;
[0094] 計算模塊,用于基于所述全局特征計算各選項的填涂程度得分;
[0095] 得分修正模塊,用于根據基于所述全局特征計算得到的所述選項的填涂程度得 分,對基于統計模型識別得到的所述選項的填涂程度得分進行修正,得到修正后的所述選 項的填涂程度得分;
[0096] 所述答案判定模塊,具體用于根據所述得分修正模塊修正后的所述選項的填涂程 度得分確定填涂的選項。
[0097] 本發明實施例提供的客觀題智能閱卷方法及系統,基于統計模型的方法對每個選 項的填涂程度進行判定,可W有效解決采集到的答題卡圖像清晰度不一致問題,及用戶在 一次考試中對每個選項填涂程度不一致問題;有效提升客觀題閱卷的準確度。
[0098] 本發明實施例的方案對答題卡的質量要求較低,可W處理紙質答題卡或印刷情況 不理想的答題卡。
【附圖說明】
[0099] 為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明中記載的一 些實施例,對于本領域普通技術人員來講,還可W根據運些附圖獲得其他的附圖。 陽100] 圖1是本發明實施例客觀題智能閱卷方法的流程圖; 陽101] 圖2是本發明實施例中分割后的答題區域子圖像示例之一; 陽102] 圖3是本發明實施例中分割后的答題區域子圖像示例之二; 陽103] 圖4是本發明實施例中答題區域修正前后效果對比圖;
[0104] 圖5是本發明實施例中選項A填涂前的灰度圖、二值化圖、向上投影圖及向下投影 圖;
[0105] 圖6是本發明實施例中選項A填涂后的灰度圖、二值化圖、向上投影圖及向下投影 圖;
[0106] 圖7是本發明實施例中HAAR特征示意圖; 陽107] 圖8是本發明實施例中選項A的灰度圖及水平線特征模板和垂直線特征模板; 陽10引圖9是本發明實施例中全局特征示例圖; 陽109] 圖10是本發明實施例客觀題智能閱卷系統的一種結構示意圖;
[0110]圖11是本發明實施例客觀題智能閱卷系統的另一種結構示意圖; 陽111] 圖12是本發明實施例客觀題智能閱卷系統的另一種結構示意圖。
【具體實施方式】
[0112] 為了使本技術領域的人員更好地理解本發明實施例的方案,下面結合附圖和實施 方式對本發明實施例作進一步的詳細說明。
[0113] 如圖1所示,是本發明實施例客觀題智能閱卷方法的流程圖,包括W下步驟:
[0114] 步驟101,獲取答題卡圖像。
[0115] 答題卡圖像的獲取可W采用光標閱讀設備進行掃描,或者采用高拍儀、移動終端 等設備進行拍照獲取。
[0116] 步驟102,對所述答題卡圖像進行灰度化處理,得到灰度圖。
[0117] 需要說明的是,在實際應用中,在進行后續對所述灰度圖的答題區域進行分割之 前,還可進一步對所述灰度圖進行模糊檢測及圖像校正,拒識掉模糊程度較大的圖像w及 異常的圖像,W保證閱卷識別的準確性。
[0118] 模糊檢測及圖像校正是根據所述灰度圖對應的二值化圖進行的,因此,在本發明 另一實施例中,還可進一步包括W下步驟:
[0119] 在根據答題卡模板參數對所述灰度圖的答題區域進行分割之前,對所述灰度圖進 行二值化處理,得到二值化圖;然后對所述二值化圖進行模糊檢測和/或圖像校正。
[0120] 圖像的二值化處理就是將圖像上的像素點的灰度值設置為0或255, W將整個圖 像呈現出明顯的黑白效果,即將256個亮度等級的灰度圖像通過適當的闊值選取而獲得仍 然可W反映圖像整體和局部特征的二值化圖像。 陽121] 另外,還可W根據圖像局部灰度特性來自適應地選取闊值對圖像進行二值化處 理,即局部自適應闊值二值化方法。具體地,根據預先設定的二值化窗口大小,將圖像分為 不重疊的圖像塊,根據每個圖像塊像素的均值和標準差計算得到每個圖像塊的二值化闊 值,根據所述闊值將每個圖像塊二值化,得到二值化后的答題卡圖像。
[0122] 在進行模糊檢測時,可W首先對所述二值化圖進行模糊處理,利用圖像模糊前后 邊緣的前景比例來判斷圖像的模糊程度。一般清晰圖像模糊前后圖像邊緣的前景比例較 大,而模糊圖像模糊前后圖像邊緣的前景比例較小。根據運一特性,設置相應的模糊度闊 值,可W拒識掉模糊度大于該闊值的答題卡圖像。在實際應用中,對于拒識掉的運部分答 題,可W由人工完成閱卷。 陽123] 在進行圖像校正時,可W根據答題卡模板定位塊及所述二值化圖中的定位塊建立 映射關系;然后根據所述映射關系對所述二值化圖進行圖像校正。
[0124] 具體地,可W首先對所述二值化圖進行定位檢測,找到所述二值化圖中與模板定 位塊形狀相符合的定位塊建立映射關系,然后根據所述映射關系對出現傾斜、旋轉等問題 的二值化圖像進行校正,校正過程中如果出現W下情況之一,確認校正后的二值化圖不滿 足要求,對其可W拒識,否則還需要根據所述映射關系對所述二值化圖對應的灰度圖進行 圖像校正,然后執行后續對所述灰度圖的答題區域進行分割的步驟,而且此時分割的對象 是校正后的灰度圖: 陽125] (1)2個W上定位塊被遮擋;
[01%] (2)2個W上定位塊被涂改嚴重,大小形狀發生了變化; 陽127] (3)定位塊旁邊增加形狀大小與定位塊相似的人工涂改塊; 陽12引 (4)校正后的圖像不完整。
[0129] 當然,還可W有其它一些應該拒識的情況,在此不再一一列舉。
[0130] 需要說明的是,在實際應用中,可W先進行模糊檢測,然后再進行圖像校正,也可 W反之,對此本發明實施例不做限定,但通常可W優選先進行模糊檢測,一旦檢測到模糊, 后續的圖像校正就不需要再進行,因為圖像校正的操作遠比模糊檢測的操作復雜。 陽131 ] 步驟103,根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到答題區域 子圖像。
[0132] 具體地,可W根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到答題 區域的子圖像的灰度圖。通常,所述答題區域子圖像可W包括:準考證號填涂區域子圖像、 身份證號填涂區域子圖像、及客觀題選項填涂區域子圖像。
[0133] 如圖2、圖3所示,為分割后的答題區域子圖像的灰度圖,其中,圖2為準考證選項 區域實例圖,圖3為客觀題選項區域實例圖。
[0134] 進一步地,為了防止由于答題卡印刷問題造成的定位塊位置錯誤,導致圖像校正 后獲取到的選項填涂位置不一定準確,還可對圖像中的答題區域進行局部修正。
[0135] 具體地,首先對答題區域子圖像進行二值化,得到二值化后的子圖像;然后在所述 子圖像上濾除邊框線,消除所述邊框線對答題區域的干擾,即根據水平或垂直連續前景點 的數目是否達到闊值來濾除邊框線,所述闊值可W根據經驗確定,濾除邊框時將前景點置0 即可;最后,W標準答題卡布局中選項位置為基準,進行答題區域的局部修正,具體修正時, 需要對各選項填涂區域整體進行局部捜索,如對選項區域的上下前后8個像素進行捜索, 步長為2 ;選擇前景點最多的位置作為最終選項的位置,得到每個選項填涂區域修正后的 位置參數。如圖4所示為答題區域修正前后效果對比圖。
[0136] 步驟104,提取所述子圖像中各選項的填涂特征,所述填涂特征用于描述單個選項 的填涂程度。
[0137] 在提取子圖像中各選項的填涂特征時,首先要獲取所述選項的位置。為了進一步 保證各選項位置的準確性,在本發明方法另一實施例中,還可W在步驟104前,對各子圖像 中各選項的位置進行修正,W得到更準確的選項位置,進而使提取的填涂特征更準確。具體 地,可W首先對所述子圖像進行二值化處理,得到二值化子圖;然后W標準答題卡布局中選 項位置為基準,對所述二值化子圖中各選項填涂區域進行修正,得到修正后的二值化子圖; 最后根據修正后的二值化子圖修正所述子圖像中各選項的位置。
[0138] 所述填涂特征具體可W包括W下一種或多種特征:前景特征、屬性特征、均值特 征、對比度特征、形狀投影特征、HAAR特征。下面對運幾種特征的提取方式分別進行詳細說 明。 陽139] (1)前景特征
[0140] 在所述子圖像對應的修正后的二值化子圖中獲取各選項區域,為了防止填涂范圍 超過選項區域,可W在當前選項區域的基礎上,上下左右各擴展多個像素,如擴展2個像 素。在所述當前選項區域中計算前景像素數與整個子圖像像素數的比值,將所述比值作為 自IJ景特化,用Χι表不。 陽141] (2)屬性特征
[0142] 所述屬性特征包括水平屬性特征和垂直屬性特征。 陽143] 首先計算整個子圖像的面積S及像素均值μ,然后統計整個子圖像中水平方向相 隔距離為d的兩個點的像素值都大于μ的像素點對數Ni,及整個子圖像中垂直方向相隔距 離為d的兩個點的像素值都大于μ的像素點對數成,所述距離d指兩個像素點相隔的像素 點數,一般根據經驗確定,如3。水平屬性特征值X2和垂直屬性特征X 3的計算方法如下:
[0146] 0)均值特征 陽147] 在所述子圖像中獲取當前選項區域,計算所述當前選項區域像素均值μ 1,對像素 均值進行規整后,即可得到均值特征Χ4,如下式所示:
[0148]
陽149] (4)對比度特征
[0150] 首先提取所述子圖像的背景像素點,將所述像素點值從小到大進行排序,在像素 值大于設定值(比如200)的像素點中選取一定比例(比如10% )的像素點,按照從大到小 的順序選取,計算選取像素點的平均值μ 2,將μ 2作為提取背景像素點的闊值,將大于μ 2 的像素點作為背景像素點,小于μ2的像素點作為前景像素點;然后計算提取到的背景像素 點的均值μ3;隨后,計算將所述均值μ 3減去所述子圖像中所有像素值,得到一個像素差值 圖;最后,統計差值圖中當前選項區域的像素值大于闊值的像素的均值μ4,所述闊值一般 根據經驗設定,比如為50,對所述均值μ 4進行規整,得到對比度特征X
[0151]
陽152] (5)形狀投影特征 陽153] 形狀投影特征包括向上投影特征和向下投影特征,如圖5所示為選項A填涂前的 灰度圖、二值化圖、向上投影圖及向下投影圖,圖6所示為選項A填涂后的灰度圖、二值化 圖、向上投影圖及向下投影圖。
[0154] 首先在所述子圖像對應的修正后的二值化子圖中,計算當前選項區域每一列從頂 部開始到第一個前景點像素的距離投影及每一列從底部開始到第一個前景點像素的距離 投影,得到上投影圖像和下投影圖像;然后根據預先設置的區間數m對得到的投影圖像進 行區間化,得到各區間內的像素值;最后對所述像素值求和得到每個區間的區間特征,所述 投影圖像區間化的計算如下式所示: 陽1巧]
[0156] 其中,d為區間大小,為當前選項區域寬度的前景像素點數。
[0157] 投影特征是區間特征的集合,第i個上投影特征P及第i個下投影特征q 1的計算 如下:
陽160] 其中,il和id分別表示第i個投影區間的開始索引和結束索引,曰1,和b 1,分別表 示第i個上投影區間內第j個像素值和第i個下投影區間內第j個像素值,則上投影特征 P= {pi,P2…PnJ,下投影特征Q=站,化…q"J。
[0161] (6)HAAR 特征
[0162] HAAR特征,是計算機視覺領域一種常用的特征描述算子。目前常用的HAAR特征 有邊緣特征和線特征,如圖7所示。邊緣特征有4種:X方向,y方向,X傾斜方向,y傾斜方 向;線特征有8種。每一種特征的計算都是由黑色填充區域的像素值之和與白色填充區域 的像素值之和的差值計算出來的,運個差值就是所謂的HAAR特征的特征值。
[0163] 在本發明實施例中,可W選用水平線特征和垂直線特征。在計算特征值時,采用兩 個HAAR線特征模板,即水平線特征模板和垂直線特征模板來描述當前選項的水平或垂直 灰度變化,本案所用線特征模板白色部分像素數與黑色部分像素數相等,用K表示。將線 特征模板中的白色區域像素值之和減去黑色區域像素值之和作為相應的HAAR特征。具體 地,將當前選項區域(對選項區域進行周邊擴展)作為整個HAAR特征的區域,例如圖8中 選項A的第一個線特征(垂直HAAR線特征)的計算如下:將當前選項區域分成垂直條狀4 等份,中間兩份代表黑色區域,外邊兩份代表白色區域,即將當前選項區域兩邊2等份區域 所有像素和相加,再減去中間2等份區域的所有像素值之和作為垂直HAAR特征值。
[0164] 再如圖8所示,為選項A的灰度圖及水平線特征模板和垂直線特征模板,相應線 特征模板的特征值計算方法如下式所示,即為白色部分像素值的和減去黑色部分像素值的 和。 陽1佑I
陽166] 其中,Li和L2分別表示水平線特征模板特征值和垂直線特征模板特征值,a 1表示 白色部分第1個像素點值,bk表示黑色部分第k個像素點值;所述特征值越大,表示灰度變 化越小,特征值越小,表示灰度變化越大。 陽167] 步驟105,基于統計模型及所述填涂特征對所述選項進行識別,得到所述選項的填 涂程度得分。
[0168] 所述統計模型可W為一種或多種模型的線性組合,所述統計模型的訓練與現有模 型的訓練類似,如 SVM(Suppo;rt Vector Machine)、決策樹、D順值eep 化ural 化tworks), GMM(Gaussian Mix1:ure Model)等。
[0169] 在基于統計模型對選項答案進行識別時,輸入為當前選項的填涂特征,輸出為當 前選項的填涂程度得分Τι。 陽170] W SVM為例,使用線性核函數進行模型訓練,得到模型參數W和b的取值,如下式 所示。利用模型參數W和b的取值,計算當前選項填涂程度得分T1。
[0171] T1 = WX+b
[0172] 其中,W是權重系數向量,b是偏移向量,W和b可W通過離線收集大量數據進行訓 練得到,X為當前選項的特征向量,比如X = Ixi,而,如X"馬,P,Q,Li,Lz}。
[0173] 需要說明的是,所述統計模型可W預先通過收集大量數據訓練得到,所述訓練數 據包含采用多種不同設備獲取到的大量不同質紙及不同印刷的答題卡答題信息。此外,針 對特殊考試,所述統計模型還可W通過有針對性的收集數據進行訓練得到。
[0174] 步驟106,根據所述選項的填涂程度得分確定填涂的選項。
[0175] 根據選項填涂程度得分T1,對選項答案進行判定,具體如下式所示: 陽 176]
[0177] 其中,Jw表示第e題,第V個選項的識別結果,1表示當前選項是填涂的,0表示當 前選項是未填涂的,τ為填涂程度闊值,一般根據經驗取值。
[0178] 本發明實施例提供的客觀題智能閱卷方法,基于統計模型的方法對每個選項的填 涂程度進行判定,可W有效解決采集到的答題卡圖像清晰度不一致問題,及用戶在一次考 試中對每個選項填涂程度不一致問題;有效提升客觀題閱卷的準確度。
[0179] 本發明實施例的方案對答題卡的質量要求較低,可W處理紙質答題卡或印刷情況 不理想的答題卡。
[0180] 由于基于統計模型的方法在模型訓練時使用的特征都是針對單個選項填涂程度 的描述,因此,為了從總體上更準確地判定每個選項的答案,在本發明另一實施例中,還可 W使用全局特征對基于統計模型方法得到的填涂程度得分進行修正,得到修正后的填涂程 度得分,然后再根據修正后的填涂程度得分進行選項答案的判定,具體過程如下: 陽181] (1)從子圖像(灰度圖)上提取全局特征,所述全局特征包括同類對比度特征及異 類對比度特征,具體如下: 陽182] 所述同類對比度特征是指子圖像中不同題目的相同選項間的對比度,如圖9左圖 框內選項。所述同類對比度越大,表示選項的填涂程度越大,計算方法下式所示: 陽 183]
[0184] 其中,Xgi為同類對比度特征,μ 1為當前選項區域像素均值,Mmaxi和Mmi。進個子圖 像內與當前選項相同的選項像素均值的最大值和最小值,如圖9左圖,像素均值的最大值 和最小值為1到5題中所有選項A的像素均值中的最大值和最小值。為了防止上式的分母 為0,增加了一個很小的數ε,其取值可W是0.0001。
[0185] 所述異類對比度特征是指子圖像中同一題中所有選項間的對比度,如圖9右圖框 內選項。所述異類對比度越大,表示選項的填涂程度越大,計算方法如下式所示: 陽 186]
陽187] 其中,Xg2為當前選項的異類對比度特征,Mm,x2和Mmi"2同一題內所有選項像素均值 的最大值和最小值,如圖9右圖中,像素均值的最大值和最小值為選項A、B、C、D像素均值 的最大值和最小值。
[0188] (2)基于提取的全局特征計算當前選項的填涂程度得分T2,計算方法如下式所 示: 陽1例 了2= a*x gi+b*x姑 陽190] 其中,a和b為全局特征系數,且a+b = l,0<a<l,0<b< 1,具體取值根據經 驗獲取。通過全局特征的描述可W準確識別出當前選項的擦除涂痕。 陽191] (3)根據全局特征對當前選項填涂程度的得分,對基于統計模型方法得到的填涂 程度得分進行修正,修正后的得分為T,具體計算如下式所示: 陽 192] T =曰 *Τι+β *了2
[0193] 其中,α和β為填涂程度得分的權重系數,具體取值根據經驗獲取,本案α = β 二 0· 5d
[0194] (4)根據修正后的選項填涂程度得分Τ,對選項答案進行判定,判定方法與Τι類 似。
[0195] 通過上述對基于統計模型識別得到的所述選項的填涂程度得分的修正,進而根據 修正后的填涂程度得分進行選項答案的判定,可w進一步提升選項答案判定的準確度。
[0196] 相應地,本發明實施例還提供一種客觀題智能閱卷系統,如圖10所示,是該系統 的一種結構示意圖。 陽197] 在該實施例中,所述系統包括:
[0198] 圖像獲取模塊901,用于獲取答題卡圖像;
[0199] 預處理模塊902,用于對所述答題卡圖像進行灰度化處理,得到灰度圖; 陽200] 分割模塊903,用于根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到 答題區域子圖像; 陽201] 填涂特征提取模塊904,用于提取所述子圖像中各選項的填涂特征,所述填涂特征 用于描述單個選項的填涂程度; 陽202] 識別模塊905,用于基于統計模型及所述填涂特征對所述選項進行識別,得到所述 選項的填涂程度得分; 陽203]答案判定模塊906,用于根據所述選項的填涂程度得分確定填涂的選項。 陽204] 上述圖像獲取模塊901具體可W使用光標閱讀設備、或者高拍儀、或者移動終端 設備等。 陽205] 需要說明的是,在實際應用中,本發明實施例的系統還可進一步對所述灰度圖進 行模糊檢測和/或圖像校正,拒識掉模糊程度較大的圖像W及異常的圖像,W保證閱卷識 別的準確性,模糊檢測及圖像校正的過程是在二值化圖中進行的。相應地,在所述系統中設 置第一二值化處理模塊、模糊檢測模塊和/或圖像校正模塊(未圖示)。其中: 陽206] 第一二值化處理模塊,用于在分割模塊903根據答題卡模板參數對所述灰度圖的 答題區域進行分割之前,對所述灰度圖進行二值化處理,得到二值化圖。 陽207] 模糊檢測模塊用于對所述二值化圖進行模糊檢測,具體可W先對所述二值化圖進 行模糊處理,然后根據模糊前后邊緣的前景比例計算所述二值化圖的模糊度;并在所述模 糊度小于設定的模糊度闊值時,觸發所述分割模塊根據答題卡模板參數對所述灰度圖的答 題區域進行分割;否則確定拒識所述答題卡圖像。
[0208] 圖像校正模塊用于對所述二值化圖進行圖像校正,具體可W根據答題卡模板定位 塊及所述二值化圖中的定位塊建立映射關系,根據所述映射關系對所述二值化圖進行圖像 校正;并在校正后的二值化圖滿足要求時,根據所述映射關系對所述二值化圖對應的灰度 圖進行圖像校正,然后觸發所述分割模塊根據答題卡模板參數對校正后的灰度圖的答題區 域進行分割的步驟;;否則確定拒識所述答題卡圖像。 陽209] 在本發明實施例中,所述填涂特征用于描述單個選項的填涂程度,具體可W包括 W下一種或多種特征:前景特征、屬性特征、均值特征、對比度特征、形狀投影特征、HAAR特 征。
[0210] 相應地,上述填涂特征提取模塊904可W包括W下任意一個或多個單元: 陽211] 前景特征提取單元,用于提取所述子圖像中各選項的前景特征;
[0212] 屬性特征提取單元,用于提取所述子圖像中各選項的屬性特征;
[0213] 均值特征提取單元,用于提取所述子圖像中各選項的均值特征;
[0214] 對比度特征提取單元,用于提取所述子圖像中各選項的對比度特征;
[0215] 形狀投影特征提取單元,用于提取所述子圖像中各選項的形狀投影特征;
[0216] HAAR特征提取單元,用于提取所述子圖像中各選項的HAAR特征。
[0217] 上述各特征提取單元提取相應特征的具體實現方式可W參照前面本發明方法實 施例中的描述,在此不再寶述。
[0218] 本發明實施例提供的客觀題智能閱卷系統,基于統計模型的方法對每個選項的填 涂程度進行判定,可W有效解決采集到的答題卡圖像清晰度不一致問題,及用戶在一次考 試中對每個選項填涂程度不一致問題;有效提升客觀題閱卷的準確度。
[0219] 本發明實施例的方案對答題卡的質量要求較低,可W處理紙質答題卡或印刷情況 不理想的答題卡。
[0220] 上述填涂特征提取模塊904在提取所述子圖像中各選項的填涂特征時,首先要獲 取各選項的位置。為了進一步保證各選項位置的準確性,在本發明系統另一實施例中,還可 提供對局部修正功能。相應地,如圖11所示,所述系統還包括W下各模塊: 陽221 ] 第二二值化處理模塊111,用于在填涂特征提取模塊904提取所述子圖像中各選 項的填涂特征之前,對所述子圖像進行二值化處理,得到二值化子圖; 陽222] 局部修正模塊112,用于W標準答題卡布局中選項位置為基準,對所述二值化子圖 中各選項填涂區域進行修正,得到修正后的二值化子圖; 陽223] 選項位置修正模塊113,用于根據修正后的二值化子圖修正對應的子圖像中各選 項的位置。
[0224] 該實施例的系統還可進一步包括濾除干擾模塊(未圖示),用于在所述局部修正 模塊112對所述二值化子圖中各選項填涂區域進行修正之前,濾除所述二值化子圖中的邊 框線,W排除邊框線對選項區域的干擾。
[0225] 本發明實施例提供的客觀題智能閱卷系統,可W有效防止由于答題卡印刷問題造 成的定位塊位置錯誤、進而導致圖像校正后獲取到的選項填涂位置不一定準確的情況,進 一步提升客觀題閱卷的準確度。
[0226] 如圖12所示,是本發明實施例客觀題智能閱卷系統的另一種結構示意圖。 陽227] 與圖10所示實施例不同的是,在該實施例中,所述系統還包括W下各模塊:
[0228] 全局特征提取模塊907,用于從所述子圖像上提取全局特征,所述全局特征包括同 類對比度特征和異類對比度特征; 陽229] 計算模塊908,用于基于所述全局特征計算各選項的填涂程度得分; 陽230] 得分修正模塊909,用于根據基于所述全局特征計算得到的所述選項的填涂程度 得分,對基于統計模型識別得到的所述選項的填涂程度得分進行修正,得到修正后的所述 選項的填涂程度得分; 陽231 ] 相應地,在該實施例中,答案判定模塊906可W根據得分修正模塊909修正后的所 述選項的填涂程度得分確定填涂的選項。 陽232] 需要說明的是,在該實施例中,所述系統也可W進一步包括上述第二二值化處理 模塊111,局部修正模塊112,選項位置修正模塊113。 陽233] 本發明實施例的客觀題智能閱卷系統,通過上述對基于統計模型識別得到的所述 選項的填涂程度得分的修正,進而根據修正后的填涂程度得分進行選項答案的判定,可W 進一步提升選項答案判定的準確度。
[0234] 本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。w上所描述的系 統實施例僅僅是示意性的,其中所述作為分離部件說明的模塊可W是或者也可W不是物理 上分開的,作為單元顯示的部件可W是或者也可W不是物理單元,即可W位于一個地方,或 者也可W分布到多個網絡單元上。可W根據實際的需要選擇其中的部分或者全部模塊來實 現本實施例方案的目的。而且,其中的一些模塊所提供的功能也可W由軟件來實現,一些模 塊可W與現有的設備(比如個人電腦、平板電腦、手機)中的相同功能模塊共用。本領域普 通技術人員在不付出創造性勞動的情況下,即可W理解并實施。
[0235] W上對本發明實施例進行了詳細介紹,本文中應用了【具體實施方式】對本發明進行 了闡述,W上實施例的說明只是用于幫助理解本發明的方法及系統;同時,對于本領域的 一般技術人員,依據本發明的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所 述,本說明書內容不應理解為對本發明的限制。
【主權項】
1. 一種客觀題智能閱卷方法,其特征在于,包括: 獲取答題卡圖像; 對所述答題卡圖像進行灰度化處理,得到灰度圖; 根據答題卡模板參數對所述灰度圖的答題區域進行分割,,得到答題區域子圖像; 提取所述子圖像中各選項的填涂特征,所述填涂特征用于描述單個選項的填涂程度; 基于統計模型及所述填涂特征對所述選項進行識別,得到所述選項的填涂程度得分; 根據所述選項的填涂程度得分確定填涂的選項。2. 根據權利要求1所述的方法,其特征在于,所述獲取答題卡圖像包括: 利用光標閱讀設備、或者高拍儀、或者移動終端設備獲取答題卡圖像。3. 根據權利要求1所述的方法,其特征在于,所述答題區域子圖像包括:準考證號填涂 區域子圖像、身份證號填涂區域子圖像、及客觀題選項填涂區域子圖像。4. 根據權利要求1所述的方法,其特征在于,所述方法還包括: 在根據答題卡模板參數對所述灰度圖的答題區域進行分割之前,對所述灰度圖進行二 值化處理,得到二值化圖; 對所述二值化圖進行模糊檢測和/或圖像校正。5. 根據權利要求4所述的方法,其特征在于,所述對所述二值化圖進行模糊檢測包括: 對所述二值化圖進行模糊處理; 根據模糊前后邊緣的前景比例計算所述二值化圖的模糊度; 如果所述模糊度小于設定的模糊度閾值,則執行根據答題卡模板參數對所述灰度圖的 答題區域進行分割的步驟;否則拒識所述答題卡圖像。6. 根據權利要求4所述的方法,其特征在于,所述對所述二值化圖進行圖像校正包括: 根據答題卡模板定位塊及所述二值化圖中的定位塊建立映射關系; 根據所述映射關系對所述二值化圖進行圖像校正; 如果校正后的二值化圖滿足要求,則根據所述映射關系對所述二值化圖對應的灰度圖 進行圖像校正,然后執行根據答題卡模板參數對校正后的灰度圖的答題區域進行分割的步 驟;否則拒識所述答題卡圖像。7. 根據權利要求1所述的方法,其特征在于,所述方法還包括: 在提取所述子圖像中各選項的填涂特征之前,對所述子圖像進行二值化處理,得到二 值化子圖; 以標準答題卡布局中選項位置為基準,對所述二值化子圖中各選項填涂區域進行修 正,得到修正后的二值化子圖; 根據修正后的二值化子圖修正所述子圖像中各選項的位置。8. 根據權利要求7所述的方法,其特征在于,所述方法還包括:對所述二值化子圖中各 選項填涂區域進行修正之前,濾除所述二值化子圖中的邊框線。9. 根據權利要求7所述的方法,其特征在于,所述填涂特征包括以下一種或多種特征: 前景特征、屬性特征、均值特征、對比度特征、形狀投影特征、HAAR特征; 提取所述子圖像中當前選項的前景特征包括: 在所述子圖像對應的修正后的二值化子圖中確定當前選項前景外接矩形區域; 計算所述外接矩形區域中的前景像素數; 計算所述前景像素數與所述子圖像的像素數的比值,并將該比值作為所述當前選項的 前景特征; 所述屬性特征包括水平屬性特征和垂直屬性特征,提取所述子圖像中當前選項的屬性 特征包括: 計算所述子圖像的面積及像素均值; 統計當前選項區域中水平方向相隔設定距離的兩個點的像素值都大于所述像素均值 的像素點對數Ni,并統計當前選項區域中垂直方向相隔設定距離的兩個點的像素值都大于 所述像素均值的像素點對數N2; 計算所述像素點對數K與所述子圖像的面積的比值,并將該比值作為所述當前選項的 水平屬性特征; 計算所述像素點對數N2與所述子圖像的面積的比值,并將該比值作為所述當前選項的 垂直屬性特征; 提取所述子圖像中當前選項的均值特征包括: 在所述子圖像中獲取當前選項的外接矩形區域; 計算所述外接矩形區域像素均值; 對所述外接矩形區域像素均值進行規整,得到所述當前選項的均值特征; 提取所述子圖像中當前選項的對比度特征包括: 確定所述子圖像的背景像素閾值; 根據所述背景像素閾值確定所述子圖像中的背景像素點;; 計算所述背景像素點的像素均值; 根據所述背景像素點的像素均值與所述子圖像中所有像素值的差值,得到像素差值 圖; 統計所述像素差值圖中當前選項區域像素值大于設定閾值的像素的均值; 對所述均值進行規整,得到所述當前選項的對比度特征;; 所述形狀投影特征包括向上投影特征和向下投影特征;提取所述子圖像中當前選項的 形狀投影特征包括: 計算所述子圖像對應的修正后的二值化子圖中當前選項區域每一列從頂部開始到第 一個前景點像素的距離投影及每一列從底部開始到第一個前景點像素的距離投影,得到當 前選項區域的上投影圖像和下投影圖像; 分別對所述上投影圖像和下投影圖像進行區間化,得到當前選項區域的上投影區間及 下投影區間; 獲取各投影區間內的像素值; 對所述投影區間內的像素值求和,得到所述投影區間的區間特征; 將各上投影區間的區間特征的集合作為當前選項的上投影特征,并將各下投影區間的 區間特征的集合作為當前選項的下投影特征; 提取所述子圖像中當前選項的HAAR特征包括: 將當前選項的區域作為整個HAAR特征的區域,計算所述當前選項的水平線特征和垂 直線特征。10.根據權利要求1至9任一項所述的方法,其特征在于,所述方法還包括: 從所述子圖像上提取全局特征,所述全局特征包括同類對比度特征和異類對比度特 征; 基于所述全局特征計算各選項的填涂程度得分; 根據基于所述全局特征計算得到的所述選項的填涂程度得分,對基于統計模型識別得 到的所述選項的填涂程度得分進行修正,得到修正后的所述選項的填涂程度得分; 所述根據所述選項的填涂程度得分確定填涂的選項具體為:根據修正后的所述選項的 填涂程度得分確定填涂的選項。11. 一種客觀題智能閱卷系統,其特征在于,包括: 圖像獲取模塊,用于獲取答題卡圖像; 預處理模塊,用于對所述答題卡圖像進行灰度化處理,得到灰度圖; 分割模塊,用于根據答題卡模板參數對所述灰度圖的答題區域進行分割,得到答題區 域子圖像; 填涂特征提取模塊,用于提取所述子圖像中各選項的填涂特征,所述填涂特征用于描 述單個選項的填涂程度; 識別模塊,用于基于統計模型及所述填涂特征對所述選項進行識別,得到所述選項的 填涂程度得分; 答案判定模塊,用于根據所述選項的填涂程度得分確定填涂的選項。12. 根據權利要求11所述的系統,其特征在于,所述圖像獲取模塊為:光標閱讀設備、 或者高拍儀、或者移動終端設備。13. 根據權利要求11所述的系統,其特征在于,所述系統還包括: 第一二值化處理模塊,用于在所述分割模塊根據答題卡模板參數對所述灰度圖的答題 區域進行分割之前,對所述灰度圖進行二值化處理,得到二值化圖; 模糊檢測模塊,用于對所述二值化圖進行模糊檢測;和/或 圖像校正模塊,用于對所述二值化圖進行圖像校正。14. 根據權利要求13所述的系統,其特征在于, 所述模糊檢測模塊,具體用于對所述二值化圖進行模糊處理,并根據模糊前后邊緣的 前景比例計算所述二值化圖的模糊度;在所述模糊度小于設定的模糊度閾值時,觸發所述 分割模塊根據答題卡模板參數對所述灰度圖的答題區域進行分割;否則確定拒識所述答題 卡圖像。15. 根據權利要求13所述的系統,其特征在于, 所述圖像校正模塊,具體用于根據答題卡模板定位塊及所述二值化圖中的定位塊建立 映射關系,根據所述映射關系對所述二值化圖進行圖像校正;并在校正后的二值化圖滿足 要求時,根據所述映射關系對所述二值化圖對應的灰度圖進行圖像校正,然后觸發所述分 割模塊根據答題卡模板參數對校正后的灰度圖的答題區域進行分割;否則確定拒識所述答 題卡圖像。16. 根據權利要求11所述的系統,其特征在于,所述系統還包括: 第二二值化處理模塊,用于在所述填涂特征提取模塊提取所述子圖像中各選項的填涂 特征之前,對所述子圖像進行二值化處理,得到二值化子圖; 局部修正模塊,用于以標準答題卡布局中選項位置為基準,對所述二值化子圖中各選 項填涂區域進行修正,得到修正后的二值化子圖;; 選項位置修正模塊,用于根據修正后的二值化子圖修正所述子圖像中各選項的位置。17. 根據權利要求16所述的系統,其特征在于,所述系統還包括: 濾除干擾模塊,用于在所述局部修正模塊對所述二值化子圖中各選項填涂區域進行修 正之前,濾除所述二值化子圖中的邊框線。18. 根據權利要求16所述的系統,其特征在于,所述填涂特征提取模塊包括以下任意 一個或多個單元: 前景特征提取單元,用于提取所述子圖像中各選項的前景特征; 屬性特征提取單元,用于提取所述子圖像中各選項的屬性特征; 均值特征提取單元,用于提取所述子圖像中各選項的均值特征; 對比度特征提取單元,用于提取所述子圖像中各選項的對比度特征; 形狀投影特征提取單元,用于提取所述子圖像中各選項的形狀投影特征; HAAR特征提取單元,用于提取所述子圖像中各選項的HAAR特征。19. 根據權利要求11至18任一項所述的系統,其特征在于,所述系統還包括: 全局特征提取模塊,用于從所述子圖像上提取全局特征,所述全局特征包括同類對比 度特征和異類對比度特征; 計算模塊,用于基于所述全局特征計算各選項的填涂程度得分; 得分修正模塊,用于根據基于所述全局特征計算得到的所述選項的填涂程度得分,對 基于統計模型識別得到的所述選項的填涂程度得分進行修正,得到修正后的所述選項的填 涂程度得分; 所述答案判定模塊,具體用于根據所述得分修正模塊修正后的所述選項的填涂程度得 分確定填涂的選項。
【文檔編號】G06K9/54GK105989347SQ201510091479
【公開日】2016年10月5日
【申請日】2015年2月28日
【發明人】吳愛紅, 鄧宏平, 竺博, 魏思, 胡國平, 胡郁, 劉慶峰
【申請人】科大訊飛股份有限公司