本發(fā)明涉及大數(shù)據(jù)領(lǐng)域,具體涉及基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法。
背景技術(shù):
隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)的興起,全球范圍內(nèi)數(shù)據(jù)量迅猛增長,大數(shù)據(jù)時(shí)代己經(jīng)來臨。伴隨著大數(shù)據(jù)的產(chǎn)生,其在現(xiàn)代社會(huì)和經(jīng)濟(jì)活動(dòng)中發(fā)揮著極其重要的作用。
大數(shù)據(jù)基本都是基于云計(jì)算,在這其中,數(shù)據(jù)的分析以及檢索技術(shù),是整個(gè)大數(shù)據(jù)領(lǐng)域的關(guān)鍵支撐技術(shù)。大規(guī)模數(shù)據(jù)給傳統(tǒng)的多媒體研究,尤其是基于圖像的應(yīng)用和研究帶來了新的挑戰(zhàn)和機(jī)遇。
可信計(jì)算是在計(jì)算和通信系統(tǒng)中廣泛使用基于硬件安全模塊支持下的可信計(jì)算平臺(tái),以提高系統(tǒng)整體的安全性。信息安全具有四個(gè)側(cè)面:設(shè)備安全、數(shù)據(jù)安全、內(nèi)容安全與行為安全。行為安全包括:行為的機(jī)密性、行為的完整性、行為的真實(shí)性等特征??尚庞?jì)算為行為安全而生。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)上述問題,本發(fā)明提供基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法。
本發(fā)明的目的采用以下技術(shù)方案來實(shí)現(xiàn):
基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,其特征是,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記;
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類;
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類;
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果;每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,…,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Yfi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
本發(fā)明的有益效果為:通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
附圖說明
利用附圖對(duì)本發(fā)明作進(jìn)一步說明,但附圖中的實(shí)施例不構(gòu)成對(duì)本發(fā)明的任何限制,對(duì)于本領(lǐng)域的普通技術(shù)人員,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)以下附圖獲得其它的附圖。
圖1是基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法的示意圖。
具體實(shí)施方式
結(jié)合以下實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述。
實(shí)施例1:基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記,例如將一張圖片和對(duì)這張圖片的說明信息視為來源相同,并作對(duì)應(yīng)標(biāo)記。這里所指的來源相同,一般是指在在同一時(shí)間接收到的來自同一網(wǎng)絡(luò)地址的圖像信息和非圖像信息。
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類。
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類。
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果。關(guān)鍵詞的相關(guān)度計(jì)算,可以按照順序、同字符數(shù)量等標(biāo)準(zhǔn)來計(jì)算,這類計(jì)算方法在現(xiàn)有技術(shù)中已經(jīng)很成熟,在此不再詳述。
每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,…,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
在本實(shí)施例的基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法中,通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;T1=0.95,T2=0.78,檢索精度提高了50%,檢索速度提高了1%;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
實(shí)施例2:基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記,例如將一張圖片和對(duì)這張圖片的說明信息視為來源相同,并作對(duì)應(yīng)標(biāo)記。這里所指的來源相同,一般是指在在同一時(shí)間接收到的來自同一網(wǎng)絡(luò)地址的圖像信息和非圖像信息。
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類。
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類。
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果。關(guān)鍵詞的相關(guān)度計(jì)算,可以按照順序、同字符數(shù)量等標(biāo)準(zhǔn)來計(jì)算,這類計(jì)算方法在現(xiàn)有技術(shù)中已經(jīng)很成熟,在此不再詳述。
每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,…,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
在本實(shí)施例的基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法中,通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;T1=0.95,T2=0.78,檢索精度提高了50%,檢索速度提高了1%;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
實(shí)施例3:基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記,例如將一張圖片和對(duì)這張圖片的說明信息視為來源相同,并作對(duì)應(yīng)標(biāo)記。這里所指的來源相同,一般是指在在同一時(shí)間接收到的來自同一網(wǎng)絡(luò)地址的圖像信息和非圖像信息。
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類。
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類。
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果。關(guān)鍵詞的相關(guān)度計(jì)算,可以按照順序、同字符數(shù)量等標(biāo)準(zhǔn)來計(jì)算,這類計(jì)算方法在現(xiàn)有技術(shù)中已經(jīng)很成熟,在此不再詳述。
每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,…,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
在本實(shí)施例的基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法中,通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;T1=0.95,T2=0.78,檢索精度提高了50%,檢索速度提高了1%;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
實(shí)施例4:基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記,例如將一張圖片和對(duì)這張圖片的說明信息視為來源相同,并作對(duì)應(yīng)標(biāo)記。這里所指的來源相同,一般是指在在同一時(shí)間接收到的來自同一網(wǎng)絡(luò)地址的圖像信息和非圖像信息。
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類。
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類。
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果。關(guān)鍵詞的相關(guān)度計(jì)算,可以按照順序、同字符數(shù)量等標(biāo)準(zhǔn)來計(jì)算,這類計(jì)算方法在現(xiàn)有技術(shù)中已經(jīng)很成熟,在此不再詳述。
每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,…,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
在本實(shí)施例的基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法中,通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;T1=0.95,T2=0.78,檢索精度提高了50%,檢索速度提高了1%;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
實(shí)施例5:基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法,包括以下步驟:
(1)由云服務(wù)器獲取信息數(shù)據(jù),將圖像信息和非圖像信息進(jìn)行分類后,分別儲(chǔ)存到圖像數(shù)據(jù)庫和非圖像數(shù)據(jù)庫中,并將來源相同的圖像信息和非圖像信息作標(biāo)記,例如將一張圖片和對(duì)這張圖片的說明信息視為來源相同,并作對(duì)應(yīng)標(biāo)記。這里所指的來源相同,一般是指在在同一時(shí)間接收到的來自同一網(wǎng)絡(luò)地址的圖像信息和非圖像信息。
(2)將非圖像數(shù)據(jù)庫按照預(yù)先設(shè)定的多個(gè)關(guān)鍵詞劃分為多個(gè)第一子數(shù)據(jù)庫,同時(shí)按照所述關(guān)鍵詞對(duì)非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)的所述第一子數(shù)據(jù)庫中,未匹配到關(guān)鍵詞的非圖像信息單獨(dú)劃分為一類。
(3)將圖像數(shù)據(jù)庫按照所述關(guān)鍵詞劃分為多個(gè)第二子數(shù)據(jù)庫,并對(duì)圖像信息根據(jù)與其來源相同的非圖像信息進(jìn)行分類,分別儲(chǔ)存到對(duì)應(yīng)所述第二子數(shù)據(jù)庫中,無來源相同標(biāo)記的圖像信息,或者其對(duì)應(yīng)的非圖像信息未匹配到關(guān)鍵詞的圖像信息單獨(dú)劃分為一類。
(4)當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),按照輸入的關(guān)鍵詞與預(yù)先設(shè)定的關(guān)鍵詞的相關(guān)度排序依次在各個(gè)第一字?jǐn)?shù)據(jù)庫和第二子數(shù)據(jù)庫中分別進(jìn)行檢索,并分別輸出圖像數(shù)據(jù)和非圖像數(shù)據(jù)的檢索結(jié)果。關(guān)鍵詞的相關(guān)度計(jì)算,可以按照順序、同字符數(shù)量等標(biāo)準(zhǔn)來計(jì)算,這類計(jì)算方法在現(xiàn)有技術(shù)中已經(jīng)很成熟,在此不再詳述。
每個(gè)第二子數(shù)據(jù)庫的圖像檢索中還提供了通過輸入查詢圖像Ip來檢索相似圖像的功能,該功能由以下步驟實(shí)現(xiàn):
(1-1)采用SIFT特征對(duì)圖像局部區(qū)域進(jìn)行描述;
(1‐2)基于單詞包的圖像表示:
a.采用基于單詞包模型對(duì)局部特征進(jìn)行量化,設(shè)由M個(gè)局部特征向量組成的樣本空間X={x1,…,xM},以無監(jiān)督方式快速聚類生成初始視覺碼本,采用最近鄰策略建立局部特征xj與相對(duì)應(yīng)的視覺單詞的映射關(guān)系,j=1,…,M;
b.設(shè)碼本空間中包含N個(gè)視覺單詞,則任一圖像表示為高維稀疏向量{w1,…,wN},wi表示視覺單詞i的權(quán)值,i=1,...,N;
式中,表示該圖像中視覺單詞i出現(xiàn)的次數(shù),ti表示圖像數(shù)據(jù)庫中視覺單詞i出現(xiàn)的總次數(shù),fi表示圖像數(shù)據(jù)庫中包含視覺單詞i的圖像數(shù)目;
對(duì)權(quán)值wi進(jìn)行歸一化處理,令∑iδi=1,此時(shí)任一圖像的高維稀疏向量表示為{δ1,…,δN};
c.對(duì)于任意兩幅圖像p和q,定義兩幅圖像之間的第一視覺相似度S(p,q):
S(p,q)越大,表明兩幅圖像越接近;
(5)對(duì)計(jì)算結(jié)果進(jìn)行可信評(píng)估。
優(yōu)選地,其特征是,步驟(4)還包括:
(1‐3)基于特征組合的圖像表示:
a、將包含一個(gè)具有較大尺度的主特征和由這個(gè)主特征空間覆蓋的若干個(gè)具有較小尺度的元素特征的集合定義為特征組合,給定任一圖像P,抽取其包含的特征組合集其中,Cl=(Zl,Yl);
式中,Cl表示第l個(gè)特征組合,Zl為第l個(gè)特征組合的主特征,Yl為第l個(gè)特征組合的一組元素特征,Zl和Yl滿足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl對(duì)應(yīng)的局部空間區(qū)域完全被主特征Cl的局部空間覆蓋,a(·)表示覆蓋空間區(qū)域的面積;
b、對(duì)于任意兩個(gè)特征組合Cf(Zf,Yf)和Cg(Zg,Yg),定義兩個(gè)特征組合的第二視覺相似度R:
當(dāng)cos(Zf,Zg)>T1時(shí):
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)T1≥cos(Zf,Zg)>T2時(shí):
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
當(dāng)cos(Zf,Zg)≤T2時(shí):
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示兩個(gè)特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征數(shù);
(1‐4)圖像檢索:對(duì)于給定的查詢圖像Ip,首先提取其特征組合集,將每個(gè)特征的主特征映射到視覺單詞,找出包含該視覺單詞的數(shù)據(jù)庫圖像Iq,計(jì)算其與查詢圖像的相似度距離,通過將相似度距離與設(shè)定閾值比較,完成圖像檢索;
所述的相似度距離采用以下公式計(jì)算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示兩幅圖像的第一視覺相似度度量,maxR(Ip,Iq)表示對(duì)兩幅圖像的所有特征組合進(jìn)行第二視覺相似度度量的最大值。
優(yōu)選地,所述可信評(píng)估包含以下步驟:
步驟1:定義用于評(píng)估的各項(xiàng)可信屬性,可信屬性是分類的,可信屬性可以向下分解為子屬性;
步驟2:對(duì)于每項(xiàng)可信屬性或子屬性,提煉出對(duì)它的評(píng)價(jià)指標(biāo),可以用這些評(píng)價(jià)指標(biāo)從不同的側(cè)面對(duì)可信屬性或子屬性進(jìn)行評(píng)價(jià);
步驟3:對(duì)于每項(xiàng)可信屬性或子屬性,定義出對(duì)它的評(píng)價(jià)標(biāo)準(zhǔn),評(píng)價(jià)標(biāo)準(zhǔn)分為四級(jí):優(yōu)、良、中、差,評(píng)價(jià)標(biāo)準(zhǔn)是基于評(píng)價(jià)指標(biāo)的,即根據(jù)每個(gè)評(píng)價(jià)指標(biāo)的取值組合來決定可信屬性或子屬性達(dá)到了哪一級(jí)評(píng)價(jià)標(biāo)準(zhǔn);
步驟4:在開展可信評(píng)估活動(dòng)之前,根據(jù)評(píng)估重點(diǎn)的不同,形成不同可信評(píng)估模板,并基于此模板開展可信評(píng)估活動(dòng),從而使得可信評(píng)估更有針對(duì)性,評(píng)估的結(jié)果更精確。
在本實(shí)施例的基于可信云計(jì)算的信息大數(shù)據(jù)分析支撐方法中,通過關(guān)鍵詞和標(biāo)記的運(yùn)用,預(yù)先將數(shù)據(jù)庫劃分為多個(gè)子數(shù)據(jù)庫,檢索時(shí)先在相關(guān)度高的子數(shù)據(jù)庫中進(jìn)行檢索,減少了計(jì)算量,提高了運(yùn)算速度;基于單詞包表示圖像時(shí),提出了加權(quán)表示和第一視覺相似度,減少了時(shí)間開銷;基于特征組合表示圖像時(shí),利用了局部特征之間的空間包含關(guān)系,提出將相關(guān)的局部特征組合在一起以增強(qiáng)其視覺表達(dá)能力;該特征組合不但具有良好的尺度和旋轉(zhuǎn)不變性,而且還能夠自然地利用各特征元素之間的相對(duì)位置信息進(jìn)行局部幾何校驗(yàn),剔除可能存在的錯(cuò)誤匹配,以提高圖像檢索的準(zhǔn)確率;特征量化以及組合表達(dá)大幅地提高了檢索的精度;T1=0.95,T2=0.78,檢索精度提高了50%,檢索速度提高了1%;保護(hù)了指定的數(shù)據(jù)存儲(chǔ)區(qū),防止敵手實(shí)施特定類型的物理訪問;賦予了所有在計(jì)算平臺(tái)上執(zhí)行的代碼以證明它在一個(gè)未被篡改環(huán)境中運(yùn)行的能力,從廣義的角度,可信計(jì)算平臺(tái)為網(wǎng)絡(luò)用戶提供了一個(gè)更為寬廣的安全環(huán)境,它從安全體系的角度來描述安全問題,確保用戶的安全執(zhí)行環(huán)境,突破被動(dòng)防御打補(bǔ)丁方式。
最后應(yīng)當(dāng)說明的是,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)本發(fā)明保護(hù)范圍的限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明作了詳細(xì)地說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的實(shí)質(zhì)和范圍。