一種基于魯棒多平面支持向量機(jī)的圖像識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)視覺和圖像識(shí)別技術(shù)領(lǐng)域,特別是涉及一種基于魯棒多平面支 持向量機(jī)的圖像識(shí)別方法及裝置。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)技術(shù)和智能化的不斷發(fā)展,圖像識(shí)別與分類已經(jīng)發(fā)展成為計(jì)算機(jī)視覺 與模式識(shí)別研宄中的重要研宄課題之一。圖像識(shí)別通過(guò)計(jì)算機(jī)將紙質(zhì)圖像數(shù)字化,結(jié)合圖 像分析與描述,獲取圖像特征,在圖像檢索、人臉識(shí)別和機(jī)器人等研宄領(lǐng)域中有著重大的意 義,一旦研宄成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。但是抽取圖像特征的過(guò)程 具有一定難度,到目前為止,圖像識(shí)別方法距實(shí)用要求還有一定距離。目前,大部分研宄工 作集中在處理圖像特征提取和識(shí)別問(wèn)題,且也已取得一定的成果。但是真實(shí)世界中的圖像 (例如人臉圖像、手寫體等)通常包含噪音、數(shù)據(jù)破壞、數(shù)據(jù)缺失等問(wèn)題,因此如何有效減少 數(shù)據(jù)中的噪音或異類對(duì)圖像特征提取和圖像識(shí)別結(jié)果的不利影響需要進(jìn)一步深入探討。
[0003] 近年來(lái),鑒于傳統(tǒng)支持向量機(jī)(SVM)的優(yōu)越性能和泛化能力,被廣泛應(yīng)用于數(shù)據(jù) 分類和圖像識(shí)別等領(lǐng)域。但是SVM只輸出一個(gè)超平面,對(duì)一些特殊分布的數(shù)據(jù)(如X0R) 處理效果較差。鑒于此,近年來(lái)基于多平面的支持向量機(jī)學(xué)習(xí)技術(shù)被廣泛關(guān)注。最具代表 性的多平面 SVM 學(xué)習(xí)方法有 GEPSVM(Generalized Proximal SVM)、TWSVM(TWIN SVM)和 MVSVM(Multi-weight Vector Projection SVM)等。但是目前的多平面SVM方法均基于傳 統(tǒng)的2-范數(shù)距離度量,對(duì)數(shù)據(jù)中噪音非常敏感。另外,MVSVM還會(huì)受模型最優(yōu)參數(shù)選擇的 困擾,且泛化特征值分析過(guò)程易遭遇奇異性問(wèn)題。
[0004] 因此,本發(fā)明提出一種將1-范數(shù)度量應(yīng)用于多平面支持向量機(jī)的圖像識(shí)別方法 及裝置,通過(guò)對(duì)訓(xùn)練樣本進(jìn)行魯棒的判別學(xué)習(xí),優(yōu)化得到最具鑒別性的魯棒線性分類器,對(duì) 圖像數(shù)據(jù)中可能包含的噪音或異類數(shù)據(jù)具有較強(qiáng)的魯棒性和抗干擾性,且延續(xù)了多平面支 持向量的優(yōu)點(diǎn)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種基于魯棒多平面支持向量機(jī)的圖像識(shí)別方法及裝置,目 的在于解決現(xiàn)有技術(shù)中容易受到噪聲干擾、易因參數(shù)選擇造成誤差以及學(xué)習(xí)系統(tǒng)不穩(wěn)定等 問(wèn)題。
[0006] 為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種基于魯棒多平面支持向量機(jī)的圖像識(shí)別方 法,包括:
[0007] 將測(cè)試圖像向魯棒線性分類器進(jìn)行投影,獲取所述測(cè)試圖像對(duì)應(yīng)各個(gè)類別的第一 投影特征;其中,所述魯棒線性分類器中的投影向量為通過(guò)對(duì)訓(xùn)練樣本集中的多個(gè)樣本圖 像進(jìn)行訓(xùn)練,將1-范數(shù)度量應(yīng)用于多平面支持向量機(jī),緊湊類內(nèi)散度矩陣與分離類間散度 矩陣,確定得到的魯棒投影最優(yōu)向量;
[0008] 將訓(xùn)練樣本集中的樣本圖像的均值向所述魯棒線性分類器進(jìn)行投影,獲取所述訓(xùn) 練樣本集均值在各個(gè)類別的第二投影特征;
[0009] 分別計(jì)算各個(gè)類別的第一投影特征與對(duì)應(yīng)類別的第二投影特征的距離;
[0010] 將所述距離的最小值所對(duì)應(yīng)的類別確定為所述測(cè)試圖像的類別。
[0011] 可選地,所述魯棒線性分類器中的投影向量為通過(guò)對(duì)訓(xùn)練樣本集中的多個(gè)樣本圖 像進(jìn)行訓(xùn)練,將1-范數(shù)度量應(yīng)用于多平面支持向量機(jī),緊湊類內(nèi)散度矩陣與分離類間散度 矩陣,確定得到的魯棒投影最優(yōu)向量包括:
[0012] 建立基于1-范數(shù)度量的多平面支持向量機(jī)分類器模型;
[0013] 對(duì)樣本圖像進(jìn)行學(xué)習(xí),確定以使類內(nèi)距離最小且類間距離最大的魯棒投影最優(yōu)向 量。
[0014] 可選地,所述建立基于1-范數(shù)度量的多平面支持向量機(jī)分類器模型包括:
[0015] 獲取預(yù)設(shè)的圖像數(shù)據(jù)向量集合X= [Χι,χ2,···,Χν] e RnXN,所述集合包括:有 類別標(biāo)簽的訓(xùn)練樣本集\= [X PX2,...,X1] e Rnxl以及無(wú)類別標(biāo)簽的測(cè)試樣本集Xu= [Xl,X2,…,xu] e Rnxu,且滿足樣本數(shù)量l+u = N ;
[0016] 所述訓(xùn)練樣本集包括兩個(gè)類別的樣本集,A類樣本集A;, = [X1,X2,e Xi 以及為B類樣本集Xb =[.?,…,.vje e X,,且滿足訓(xùn)練樣本數(shù)量Ijl2= 1。
[0017] 可選地,所述對(duì)樣本圖像進(jìn)行學(xué)習(xí),確定以使類內(nèi)距離最小且類間距離最大的魯 棒投影最優(yōu)向量包括:
[0018] 通過(guò)迭代優(yōu)化,對(duì)魯棒投影最優(yōu)向量&、W2的值不斷更新,使得F (W1)、F(W2)的目 標(biāo)函數(shù)值最大;在F(W1)、F (W2)最大化到趨于不變時(shí),對(duì)應(yīng)的Wp W2為魯棒投影最優(yōu)向量;
[0019] 其中 ,W1 = arg max F (w ),W11W1 = I,w 2 = arg max F (w 2),W21W2 = 1,
η是圖像數(shù)據(jù)樣本的維度,N是樣本的數(shù)量,WjPw2為所需求得的魯棒投影最優(yōu)向量 W1E RnX1,w2e RnX1,la、1,分別為兩類樣本的數(shù)量,Xi為樣本集合中的單個(gè)樣本,I卜I I 1 為1-范數(shù)度量,F(xiàn)(W1)的分母為實(shí)現(xiàn)類內(nèi)距離最小、分子為實(shí)現(xiàn)類間距離最大。
[0020] 本發(fā)明提供了一種基于魯棒多平面支持向量機(jī)的圖像識(shí)別裝置,包括:
[0021] 第一獲取模塊,用于將測(cè)試圖像向魯棒線性分類器進(jìn)行投影,獲取所述測(cè)試圖像 對(duì)應(yīng)各個(gè)類別的第一投影特征;其中,所述魯棒線性分類器中的投影向量為通過(guò)訓(xùn)練模塊 對(duì)訓(xùn)練樣本集中的多個(gè)樣本圖像進(jìn)行訓(xùn)練,將1-范數(shù)度量應(yīng)用于多平面支持向量機(jī),確定 得到的魯棒投影最優(yōu)向量;
[0022] 第二獲取模塊,將訓(xùn)練樣本集中的樣本圖像的均值向所述魯棒線性分類器進(jìn)行投 影,獲取所述訓(xùn)練樣本集均值在各個(gè)類別的第二投影特征;
[0023] 計(jì)算模塊,用于分別計(jì)算各個(gè)類別的第一投影特征與對(duì)應(yīng)類別的第二投影特征的 距離;
[0024] 確定模塊,用于將所述距離的最小值所對(duì)應(yīng)的類別確定為所述測(cè)試圖像的類別。
[0025] 可選地,所述訓(xùn)練模塊包括:
[0026] 建立模型單元,用于建立基于1-范數(shù)度量的多平面支持向量機(jī)分類器模型;
[0027] 確定單元,用于對(duì)樣本圖像進(jìn)行學(xué)習(xí),確定以使類內(nèi)距離最小且類間距離最大的 魯棒投影最優(yōu)向量。
[0028] 可選地,所述建立模型單元用于建立基于1-范數(shù)度量的多平面支持向量機(jī)分類 器模型包括:
[0029] 所述建立模型單元具體用于獲取預(yù)設(shè)的圖像數(shù)據(jù)向量集合X = [Xl,x2, . . .,xN] e RnXN,所述集合包括:有類別標(biāo)簽的訓(xùn)練樣本集\ = 匕1,&,...,叉1]£1^1以及無(wú)類別標(biāo)簽的測(cè)試樣本集乂 11=[叉1,&,...,\]£1^'且滿足 樣本數(shù)量1+u = N ;
[0030] 所述訓(xùn)練樣本集包括兩個(gè)類別的樣本集,A類樣本集Κ.η.λ·:,.....Yje/r" eX£ 以及為8類樣本集1=[.\-|,.\-:,...,.%]£/?";1/:£.丫,.,且滿足訓(xùn)練樣本數(shù)量1 1+12=1。
[0031] 可選地,所述確定單元用于對(duì)樣本圖像進(jìn)行學(xué)習(xí),確定以使類內(nèi)距離最小且類間 距離最大的魯棒投影最優(yōu)向量包括:
[0032] 所述確定單元具體用于通過(guò)迭代優(yōu)化,對(duì)魯棒投影最優(yōu)向量^、《2的值不斷更新, 使得F (W1)、F (W2)的目標(biāo)函數(shù)值最大;在F (W1)、F (W2)最大化到趨于不變時(shí),對(duì)應(yīng)的~《2為 魯棒投影最優(yōu)向量;
[0033] 其中,W1 = arg max F (w 丄),W11W1 = I,w 2 = arg max F (w 2),W21W2 = 1,
η是圖像數(shù)據(jù)樣本的維度,N是樣本的數(shù)量,^和《2為所需求得的魯棒投影最優(yōu)向量, W1E RnX1,w2e RnX1,la、1,分別為兩類樣本的數(shù)量,Xi為樣本集合中的單個(gè)樣本,I卜I I 1 為1-范數(shù)度量,F(xiàn)(W1)的分母為實(shí)現(xiàn)類內(nèi)距離最小、分子為實(shí)現(xiàn)類間距離最大。
[0034] 可選地,所述訓(xùn)練模塊還包括:
[0035] 訓(xùn)練預(yù)處理單元,用于對(duì)提取到的樣本圖像進(jìn)行預(yù)處理操作。
[0036]