,對第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行分類標(biāo)號即上述第一原始分類標(biāo)號的配置。該分類標(biāo)號用于區(qū)分各不同的樣本人臉圖像,相當(dāng)于給每個(gè)樣本人臉圖像分配一個(gè)編號。
[0106]值得說明的是,對于同一個(gè)人,第二訓(xùn)練樣本集中可能包含有其多張樣本人臉圖像,可以將對應(yīng)于同一個(gè)人的各樣本人臉圖像設(shè)置相同的分類標(biāo)號。
[0107]通過對各樣本人臉圖像進(jìn)行分類標(biāo)號設(shè)置,這樣在對原始人臉識別模型進(jìn)行訓(xùn)練時(shí),通過比較輸入分類標(biāo)號與輸出分類標(biāo)號來確定人臉識別模型的分類結(jié)果是否正確,不會泄露對應(yīng)的樣本人臉圖像對應(yīng)的是誰這樣的用戶隱私信息。
[0108]在步驟103中,采用所述原始人臉識別模型的前Μ層特征系數(shù)對所述第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行編碼,獲得編碼后的第二訓(xùn)練樣本集。
[0109]其中,所述編碼后的第二訓(xùn)練樣本集中包括與各樣本人臉圖像分別對應(yīng)的各編碼后特征向量以及與各編碼后特征向量分別對應(yīng)的第一原始分類標(biāo)號,Ν多Μ多1。
[0110]在步驟104中,根據(jù)所述編碼后的第二訓(xùn)練樣本集對所述原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練,獲得訓(xùn)練后的后N-Μ層特征系數(shù)。
[0111]本實(shí)施例中,為了避免用戶隱私數(shù)據(jù)的泄露,除了上述分類標(biāo)號之外,還對第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行編碼處理,以基于編碼后的第二訓(xùn)練樣本集對原始人臉識別模型進(jìn)行訓(xùn)練,以優(yōu)化原始人臉識別模型。
[0112]具體來說,采用原始人臉識別模型的前Μ層特征系數(shù)對第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行編碼,獲得編碼后的第二訓(xùn)練樣本集。其中,采用原始人臉識別模型的前Μ層特征系數(shù)對第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行編碼,相當(dāng)于提取各樣本人臉圖像中的前Μ層特征系數(shù)。本實(shí)施例中,Ν多Μ多1,一般來說,為了更好地保證用戶隱私的同時(shí)降低處理負(fù)載,Μ取2或3。
[0113]第二訓(xùn)練樣本集中的各樣本人臉圖像經(jīng)上述Μ層特征系數(shù)編碼后,得到對應(yīng)的各特征向量,稱為編碼后特征向量。由于每個(gè)樣本人臉圖像具有上述第一原始分類標(biāo)號,從而,經(jīng)編碼處理后的各編碼后特征向量也對應(yīng)有個(gè)第一原始分類標(biāo)號。
[0114]經(jīng)過上述編碼處理后,以編碼后的第二訓(xùn)練樣本集對原始人臉識別模型的后Ν-Μ層特征系數(shù)進(jìn)行訓(xùn)練,即保持前Μ層特征系數(shù)不變,以各編碼后特征向量以及與各編碼后特征向量分別對應(yīng)的第一原始分類標(biāo)號為輸入,對原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練,獲得訓(xùn)練后的后N-Μ層特征系數(shù)。從而,優(yōu)化后的人臉識別模型包括原始人臉識別模型的前Μ層特征系數(shù)以及訓(xùn)練后的后N-Μ層特征系數(shù)。
[0115]本實(shí)施例中,為了對使用第一訓(xùn)練樣本集對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練后得到的包括Ν層特征系數(shù)的原始人臉識別模型進(jìn)行優(yōu)化,首先獲得不同于傳統(tǒng)第一訓(xùn)練樣本集的第二訓(xùn)練樣本集。其中,構(gòu)成第一訓(xùn)練樣本集中的各樣本人臉圖像是通過隨機(jī)在網(wǎng)絡(luò)上搜索得到的各人臉圖像,樣本噪聲較大;而第二訓(xùn)練樣本集中的各樣本人臉圖像是存儲于云端人臉相冊中的人臉圖像,樣本比較干凈。由于第二訓(xùn)練樣本集中各樣本人臉圖像涉及到用戶隱私,為了保護(hù)用戶隱私的同時(shí)采用第二訓(xùn)練樣本集對原始人臉識別模型進(jìn)行優(yōu)化訓(xùn)練,首先為每個(gè)樣本人臉圖像進(jìn)行標(biāo)記即為每個(gè)樣本人臉圖像分配一個(gè)分類標(biāo)號,進(jìn)而采用原始人臉識別模型的前Μ層特征系數(shù)對第二訓(xùn)練樣本集中的各樣本人臉圖像進(jìn)行編碼,即提取各樣本人臉圖像的前Μ層特征系數(shù),從而經(jīng)編碼和分類標(biāo)號標(biāo)記的各樣本人臉圖像不會泄露對應(yīng)的用戶隱私。最后,以各編碼后特征向量即經(jīng)Μ層特征系數(shù)編碼的各樣本人臉圖像以及與各編碼后特征向量分別對應(yīng)的分類標(biāo)號為輸入,對原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練,獲得訓(xùn)練后的后N-Μ層特征系數(shù),從而獲得由原Μ層特征系數(shù)和訓(xùn)練后的后N-Μ層特征系數(shù)構(gòu)成的優(yōu)化后的人臉識別模型。由于優(yōu)化后的人臉識別模型是基于干凈的訓(xùn)練樣本訓(xùn)練獲得的,更加準(zhǔn)確、可靠。
[0116]本公開實(shí)施例中,在采用編碼后的第二訓(xùn)練樣本集對原始人臉識別模型的后Ν-Μ層特征系數(shù)進(jìn)行訓(xùn)練的過程中,可以依次將每個(gè)編碼后特征向量和對應(yīng)的分類標(biāo)號輸入到原始人臉識別模型中,根據(jù)原始人臉識別模型輸出的分類標(biāo)號與輸入的分類標(biāo)號之間的誤差來確定是否需要調(diào)整當(dāng)前的后N-Μ層特征系數(shù)。但是,這樣的訓(xùn)練方式往往可能存在這樣的問題:根據(jù)前一個(gè)樣本調(diào)整后的后N-Μ層特征系數(shù),很可能根據(jù)后一個(gè)樣本再向相反的趨勢調(diào)整,這樣導(dǎo)致需要頻繁地調(diào)整后N-Μ層特征系數(shù)。
[0117]為此,本公開實(shí)施例提供了一種分批迭代進(jìn)行后N-Μ層特征系數(shù)的訓(xùn)練、調(diào)整的方式:
[0118]具體來說,對編碼后的第二訓(xùn)練樣本集中的各編碼后特征向量進(jìn)行隨機(jī)分批處理,獲得各批訓(xùn)練樣本子集;
[0119]依次以每批訓(xùn)練樣本子集對原始人臉識別模型的后Ν-Μ層特征系數(shù)進(jìn)行訓(xùn)練,獲得經(jīng)全部各批訓(xùn)練樣本子集訓(xùn)練后得到的后N-Μ層特征系數(shù)。
[0120]下面結(jié)合圖3所示實(shí)施例,對上述分批迭代訓(xùn)練過程進(jìn)行介紹。
[0121]圖3是根據(jù)一示例性實(shí)施例示出的一種人臉識別模型訓(xùn)練方法實(shí)施例二的流程圖,如圖3所示,上述步驟104可以通過如下具體的分批迭代處理方式實(shí)現(xiàn):
[0122]在步驟201中,對所述編碼后的第二訓(xùn)練樣本集中的各編碼后特征向量進(jìn)行隨機(jī)分批處理,獲得各批訓(xùn)練樣本子集。
[0123]本實(shí)施例中,假設(shè)編碼后的第二訓(xùn)練樣本集中包含了 10000個(gè)樣本人臉圖像對應(yīng)的編碼后特征向量,將這些編碼后特征向量分為100個(gè)批次,每批100個(gè)樣本。由于這10000個(gè)編碼后特征向量中可能存在表征同一個(gè)人的多個(gè)編碼后特征向量,為了更好地保證訓(xùn)練效果,每個(gè)批次的100個(gè)編碼后特征向量是從這10000個(gè)編碼后特征向量中隨機(jī)選取的,以大大降低表征同一個(gè)人的多個(gè)編碼后特征向量被劃分到一個(gè)批次中的概率。
[0124]進(jìn)而,依次以當(dāng)前一批訓(xùn)練樣本子集中的各編碼后特征向量為輸入,迭代執(zhí)行如下處理,直到所述全部各批訓(xùn)練樣本子集都被執(zhí)行為止:
[0125]在步驟202中,以當(dāng)前一批訓(xùn)練樣本子集中的各編碼后特征向量為輸入,對所述原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練,得到與所述當(dāng)前一批訓(xùn)練樣本子集中的各編碼后特征向量分別對應(yīng)的第一輸出分類標(biāo)號。
[0126]在步驟203中,根據(jù)預(yù)設(shè)距離度量方式,確定所述當(dāng)前一批訓(xùn)練樣本子集中的各編碼后特征向量分別對應(yīng)的第一原始分類標(biāo)號與對應(yīng)的第一輸出分類標(biāo)號間的距離。
[0127]在步驟204中,根據(jù)各所述距離,確定所述當(dāng)前一批訓(xùn)練樣本子集對應(yīng)的分類誤差率,確定所述分類誤差率是否大于預(yù)設(shè)閾值,若是,則執(zhí)行步驟205,否則直接執(zhí)行步驟206。
[0128]在步驟205中,調(diào)整經(jīng)所述當(dāng)前一批訓(xùn)練樣本子集中的各編碼后特征向量對所述原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練后得到的后N-Μ層特征系數(shù)。
[0129]在步驟206中,更新所述當(dāng)前一批訓(xùn)練樣本子集為所述當(dāng)前一批訓(xùn)練樣本子集的下一批訓(xùn)練樣本子集。
[0130]在步驟206之后,繼而重新執(zhí)行步驟202。
[0131]針對當(dāng)前一批訓(xùn)練樣本子集來說,逐一將其中的各編碼后特征向量輸入到原始人臉識別模型中,分別得到經(jīng)分類輸出的分類標(biāo)號,即各第一輸出分類標(biāo)號。
[0132]可以理解的是,各第一輸出分類標(biāo)號與對應(yīng)的各第一原始分類標(biāo)號會存在一定的誤差??梢愿鶕?jù)諸如歐式距離、馬氏距離、切比雪夫距離、余弦距離等預(yù)設(shè)距離度量方式,分別計(jì)算各第一原始分類標(biāo)號與對應(yīng)的各第一輸出分類標(biāo)號間的距離。
[0133]進(jìn)而,可以將計(jì)算獲得的各距離與預(yù)設(shè)距離閾值進(jìn)行比較,確定大于預(yù)設(shè)距離閾值的距離數(shù)量占當(dāng)前一批訓(xùn)練樣本子集包含的樣本數(shù)量的比例,即確定當(dāng)前一批訓(xùn)練樣本子集對應(yīng)的分類誤差率。如果該當(dāng)前一批訓(xùn)練樣本子集對應(yīng)的分類誤差率大于預(yù)設(shè)閾值,說明當(dāng)前一批訓(xùn)練樣本子集訓(xùn)練獲得的后N-Μ層特征系數(shù)不理想,需要進(jìn)行調(diào)整,可以采用梯度下降法等方式進(jìn)行后N-Μ層特征系數(shù)的調(diào)整。調(diào)整之后,以下一批訓(xùn)練樣本子集為輸入,重復(fù)上述訓(xùn)練過程。如果當(dāng)前一批訓(xùn)練樣本子集對應(yīng)的分類誤差率小于預(yù)設(shè)閾值,則說明當(dāng)前一批訓(xùn)練樣本子集訓(xùn)練獲得的后N-Μ層特征系數(shù)比較理想,不需要進(jìn)行調(diào)整,可以直接以下一批訓(xùn)練樣本子集為輸入,重復(fù)上述訓(xùn)練過程,直到所有批次的訓(xùn)練樣本子集都執(zhí)行完畢為止。
[0134]從而,通過上述分批迭代訓(xùn)練方式,最后獲得了經(jīng)全部各批訓(xùn)練樣本子集訓(xùn)練后的后N-Μ層特征系數(shù)。從而,基于訓(xùn)練結(jié)果,更新原始人臉識別模型為更新后人臉識別模型,即更新后的人臉識別模型中包括原始人臉識別模型的前Μ層特征系數(shù)以及訓(xùn)練獲得的后N-Μ層特征系數(shù)。
[0135]本實(shí)施例中,通過隨機(jī)分批、迭代訓(xùn)練方式,對原始人臉識別模型的后N-Μ層特征系數(shù)進(jìn)行訓(xùn)練,使得訓(xùn)練樣本隨機(jī)性較強(qiáng),并且避免反復(fù)調(diào)整后N-Μ層特征系數(shù),使得訓(xùn)練效率得到提尚。
[0136]經(jīng)過上述的基于少噪聲的編碼后第二訓(xùn)練樣本集對原始人臉識別模型的后Ν-Μ層特征系數(shù)進(jìn)行訓(xùn)練的訓(xùn)練過程,得到的訓(xùn)練后的后N-Μ層特征系數(shù)應(yīng)該會更佳準(zhǔn)確,但是,其準(zhǔn)確性究竟如何,還需要進(jìn)行測試過程才能最終確定。因此,結(jié)合如圖4所示的實(shí)施例,介紹對更新后的人臉識別模型的測試過程。
[0137]圖4是根據(jù)一示例性實(shí)施例示出的一種人臉識別模型訓(xùn)練方法實(shí)施例三的流程圖,如圖4所示,在上述步驟104之后,還包括如下測試的步驟:
[0138]在步驟301中,獲取測試樣本集,并確定測試樣本集中的各測試人臉圖像對應(yīng)的第二原始分類標(biāo)號。
[0139]其中,該測試樣本集中的各測試人臉圖像與上述第二訓(xùn)練樣本集中的各樣本人臉圖像不同。
[0140]本實(shí)施例中,測試樣本集中的各測試人臉圖像與上述第二訓(xùn)練樣本集中的各樣本人臉圖像相同,都是存在于云端人臉相冊中的人臉圖像。但是,為了保證測試的準(zhǔn)確可靠,該測試樣本集與第二訓(xùn)練樣本集中不具有相同的人臉圖像。
[0141]同樣的,為了保證測試樣本集中各測試人臉圖像對應(yīng)的用戶的用戶隱私,為各測試人臉圖像設(shè)置分類標(biāo)號即第二原始分類標(biāo)號。
[0142]其中,上述更新后的人臉識別模型即是經(jīng)分批、迭代訓(xùn)練后對原