人臉識別模型訓練方法和裝置的制造方法
【技術領域】
[0001]本公開涉及通信技術領域,尤其涉及一種人臉識別模型訓練方法和裝置。
【背景技術】
[0002]人臉識別是指利用分析比較人臉視覺特征信息進行身份鑒別的計算機技術。在人臉識別的過程,主要包括人臉圖像的匹配和識別過程,就是將提取到的待識別的人臉特征與已得到的存儲在數據庫中的人臉特征模板進行匹配,根據相似程度對人臉圖像的身份信息進行判斷。因此,能夠提取到準確而豐富的人臉特征對于人臉識別的結果具有重要影響。
[0003]目前,大多的人臉特征提取方法為人工特征的提取,比如:尺度不變特征轉換(Scale-1nvariant feature transform, SIFT)特征、局部二值模式(Local BinaryPatterns,LBP)特征、梯度直方圖(Histogram of Oriented Gradient,HoG)特征等。基于上述人工特征提取方法提取的人臉特征,進行分類器的學習訓練,從而得到各種人臉識別模型,采用這些人臉識別模型能夠進行人臉圖像的識別處理。
【發明內容】
[0004]本公開提供一種人臉識別模型訓練方法和裝置,用以實現對人臉識別模型的優化。
[0005]根據本公開實施例的第一方面,提供一種人臉識別模型訓練方法,包括:
[0006]獲取原始人臉識別模型,所述原始人臉識別模型是使用第一訓練樣本集對卷積神經網絡進行訓練后得到的,所述原始人臉識別模型中包括N層特征系數,N多2 ;
[0007]獲取第二訓練樣本集,并確定第二訓練樣本集中的各樣本人臉圖像對應的第一原始分類標號,所述各樣本人臉圖像是存儲于云端人臉相冊中的人臉圖像;
[0008]采用所述原始人臉識別模型的前Μ層特征系數對所述第二訓練樣本集中的各樣本人臉圖像進行編碼,獲得編碼后的第二訓練樣本集;其中,所述編碼后的第二訓練樣本集中包括與各樣本人臉圖像分別對應的各編碼后特征向量以及與各編碼后特征向量分別對應的第一原始分類標號,Ν多Μ多1 ;
[0009]根據所述編碼后的第二訓練樣本集對所述原始人臉識別模型的后N-Μ層特征系數進行訓練,獲得訓練后的后N-Μ層特征系數。
[0010]通過上述方案,為了對使用第一訓練樣本集對卷積神經網絡進行訓練后得到的包括Ν層特征系數的原始人臉識別模型進行優化,首先獲得不同于傳統第一訓練樣本集的第二訓練樣本集。其中,構成第一訓練樣本集中的各樣本人臉圖像是通過隨機在網絡上搜索得到的各人臉圖像,樣本噪聲較大;而第二訓練樣本集中的各樣本人臉圖像是存儲于云端人臉相冊中的人臉圖像,樣本比較干凈。由于第二訓練樣本集中各樣本人臉圖像涉及到用戶隱私,為了保護用戶隱私的同時采用第二訓練樣本集對原始人臉識別模型進行優化訓練,首先為每個樣本人臉圖像進行標記即為每個樣本人臉圖像分配一個分類標號,進而采用原始人臉識別模型的前Μ層特征系數對第二訓練樣本集中的各樣本人臉圖像進行編碼,即提取各樣本人臉圖像的前Μ層特征系數,從而經編碼和分類標號標記的各樣本人臉圖像不會泄露對應的用戶隱私。最后,以各編碼后特征向量即經Μ層特征系數編碼的各樣本人臉圖像以及與各編碼后特征向量分別對應的分類標號為輸入,對原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得訓練后的后Ν-Μ層特征系數,從而獲得由原Μ層特征系數和訓練后的后Ν-Μ層特征系數構成的優化后的人臉識別模型。由于優化后的人臉識別模型是基于干凈的訓練樣本訓練獲得的,更加準確、可靠。
[0011]可選的,所述根據所述編碼后的第二訓練樣本集對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得訓練更新后的后Ν-Μ層特征系數,包括:
[0012]對所述編碼后的第二訓練樣本集中的各編碼后特征向量進行隨機分批處理,獲得各批訓練樣本子集;
[0013]依次以每批訓練樣本子集對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得經全部各批訓練樣本子集訓練后得到的后Ν-Μ層特征系數。
[0014]其中,所述依次以每批訓練樣本子集對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,包括:
[0015]依次以當前一批訓練樣本子集中的各編碼后特征向量為輸入,迭代執行如下處理,直到所述全部各批訓練樣本子集都被執行為止:
[0016]對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,得到與所述當前一批訓練樣本子集中的各編碼后特征向量分別對應的第一輸出分類標號;
[0017]根據預設距離度量方式,確定所述當前一批訓練樣本子集中的各編碼后特征向量分別對應的第一原始分類標號與對應的第一輸出分類標號間的距離;
[0018]根據各所述距離,確定所述當前一批訓練樣本子集對應的分類誤差率;
[0019]若所述分類誤差率大于預設閾值,則調整經所述當前一批訓練樣本子集中的各編碼后特征向量對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練后得到的后Ν-Μ層特征系數;
[0020]更新所述當前一批訓練樣本子集為所述當前一批訓練樣本子集的下一批訓練樣本子集。
[0021]其中,所述預設距離度量方式包括采用如下任一種距離的距離度量方式:
[0022]歐式距離、馬氏距離、切比雪夫距離、余弦距離。
[0023]通過該分批迭代的方式對原始人臉識別模型的后Ν-Μ層特征系數進行訓練,使得訓練樣本隨機性較強,并且避免反復調整后Ν-Μ層特征系數,使得訓練效率得到提高。
[0024]進一步地,所述依次以每批訓練樣本子集對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得經全部各批訓練樣本子集訓練后得到的后Ν-Μ層特征系數之后,所述方法還包括:
[0025]獲取測試樣本集,并確定測試樣本集中的各測試人臉圖像對應的第二原始分類標號,所述測試樣本集中的各測試人臉圖像與所述第二訓練樣本集中的各樣本人臉圖像不同;
[0026]根據所述測試樣本集對更新后的人臉識別模型進行準確度測試,確定所述更新后的人臉識別模型的準確度,所述更新后的人臉識別模型中包括所述前Μ層特征系數和所述經全部各批訓練樣本子集訓練后得到的后Ν-Μ層特征系數。
[0027]其中,所述根據所述測試樣本集對更新后的人臉識別模型進行準確度測試,確定所述更新后的人臉識別模型的準確度,包括:
[0028]分別將所述各測試人臉圖像輸入到所述更新后的人臉識別模型中,獲得所述更新后的人臉識別模型輸出的各測試人臉圖像分別對應的第二輸出分類標號;
[0029]根據預設距離度量方式,確定所述各測試人臉圖像對應的第二原始分類標號與對應的第二輸出分類標號間的距離;
[0030]根據各所述距離,確定所述更新后的人臉識別模型的準確度。
[0031]通過采用上述測試樣本集對訓練獲得的更新人臉識別模型進行準確度測試,能夠及時發現該人臉識別模型的性能優劣。
[0032]進一步地,所述根據各所述距離,確定所述更新后的人臉識別模型的準確度之后,還包括:
[0033]若所述準確度小于預設準確度閾值,則迭代執行如下處理,直到達到最大迭代次數或準確度大于預設準確度閾值為止:
[0034]更新所述第二訓練樣本集;
[0035]根據更新后的第二訓練樣本集對前一次迭代對應的更新后人臉識別模型中的后N-M層特征系數進行訓練,得到本次迭代對應的更新后人臉識別模型;
[0036]根據更新的測試樣本集對本次迭代對應的更新后人臉識別模型進行準確度測試,確定對應的準確度。
[0037]進一步地,所述方法還包括:
[0038]確定各次迭代對應的準確度中的最大準確度;
[0039]確定與所述最大準確度對應的更新后人臉識別模型為目標人臉識別模型。
[0040]通過多次迭代訓練、測試的過程,能夠保證獲得的目標人臉識別模型具有最佳的準確性。
[0041]根據本公開實施例的第二方面,提供一種人臉識別模型訓練裝置,包括:
[0042]第一獲取模塊,被配置為獲取原始人臉識別模型,所述原始人臉識別模型是使用第一訓練樣本集對卷積神經網絡進行訓練后得到的,所述原始人臉識別模型中包括N層特征系數,N彡2 ;
[0043]第二獲取模塊,被配置為獲取第二訓練樣本集,并確定第二訓練樣本集中的各樣本人臉圖像對應的第一原始分類標號,所述各樣本人臉圖像是存儲于云端人臉相冊中的人臉圖像;
[0044]編碼模塊,被配置為采用所述原始人臉識別模型的前Μ層特征系數對所述第二訓練樣本集中的各樣本人臉圖像進行編碼,獲得編碼后的第二訓練樣本集;其中,所述編碼后的第二訓練樣本集中包括與各樣本人臉圖像分別對應的各編碼后特征向量以及與各編碼后特征向量分別對應的第一原始分類標號,Ν多Μ多1 ;
[0045]訓練模塊,被配置為根據所述編碼后的第二訓練樣本集對所述原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得訓練后的后Ν-Μ層特征系數。
[0046]通過上述方案,為了對使用第一訓練樣本集對卷積神經網絡進行訓練后得到的包括Ν層特征系數的原始人臉識別模型進行優化,首先獲得不同于傳統第一訓練樣本集的第二訓練樣本集。其中,構成第一訓練樣本集中的各樣本人臉圖像是通過隨機在網絡上搜索得到的各人臉圖像,樣本噪聲較大;而第二訓練樣本集中的各樣本人臉圖像是存儲于云端人臉相冊中的人臉圖像,樣本比較干凈。由于第二訓練樣本集中各樣本人臉圖像涉及到用戶隱私,為了保護用戶隱私的同時采用第二訓練樣本集對原始人臉識別模型進行優化訓練,首先為每個樣本人臉圖像進行標記即為每個樣本人臉圖像分配一個分類標號,進而采用原始人臉識別模型的前Μ層特征系數對第二訓練樣本集中的各樣本人臉圖像進行編碼,即提取各樣本人臉圖像的前Μ層特征系數,從而經編碼和分類標號標記的各樣本人臉圖像不會泄露對應的用戶隱私。最后,以各編碼后特征向量即經Μ層特征系數編碼的各樣本人臉圖像以及與各編碼后特征向量分別對應的分類標號為輸入,對原始人臉識別模型的后Ν-Μ層特征系數進行訓練,獲得訓練后的后Ν-Μ層特征系數,從而獲得由原