一種圖像識別方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種圖像識別系統(tǒng)和方法。在圖像識別客戶端識別圖像的基本屬性,同時將已經(jīng)識別元素以及前端要識別請求要素組合成識別文件;圖像識別控制服務(wù)器獲取客戶端發(fā)送的識別文件以及原始圖像數(shù)據(jù),根據(jù)識別內(nèi)容對將要識別的圖像以及要識別的要求,將識別文件以及原始圖像數(shù)據(jù)分發(fā)到不同的圖像識別服務(wù)器上,圖像識別服務(wù)器根據(jù)識別要求對指定圖像進行進一步識別。采用本發(fā)明所述的方法和系統(tǒng)實現(xiàn)將圖像識別過程分級化,從而可有效的利用客戶端和服務(wù)器的計算資源。
【專利說明】一種圖像識別方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計算機圖像處理、模式識別、移動通信等交叉【技術(shù)領(lǐng)域】,具體涉及一種圖像識別方法和系統(tǒng)。
【背景技術(shù)】
[0002]現(xiàn)有的圖像識別一般采用OCR技術(shù),該技術(shù)可以有效的分辨出圖像中的文字信息,并識別速度較快,占用資源較少,而對圖像中的人物等進行識別速度較慢,并占用系統(tǒng)資源的較多。當前利用移動終端對圖像數(shù)據(jù)采集后的處理方式主要有兩種,一種是直接子移動終端通過圖像識別軟件對圖像中各種要素進行信息抽取,然后結(jié)合采集該圖片的相關(guān)屬性信一塊存儲到數(shù)據(jù)庫或文件中。另一種方式是將采集的照片直接通過無線網(wǎng)絡(luò)等方式上傳到后臺服務(wù)器,利用后臺服務(wù)器高性能的資源對圖像實施圖像識別。第一種處理方式主要存在的問題是客戶端進行圖像采集的過程效率較低。由于圖像識別軟件是個占用系統(tǒng)資源比較高,這樣在采集的流程環(huán)節(jié),由于在圖像識別環(huán)節(jié)耗時比較大,影響了后面對數(shù)據(jù)屬性相關(guān)的采集。第二種處理方式的重點是將圖像識別環(huán)節(jié)放到后臺,可以有效提高采集的流程。但這種完全將圖像識別環(huán)節(jié)放到后臺方式,勢必使得移動終端不能實時的獲取部分需要的數(shù)據(jù),占用網(wǎng)絡(luò)資源比較大。即,其首先需要將圖片通過網(wǎng)絡(luò)上傳到后臺的服務(wù)器,同時在后臺服務(wù)器完成識別工作后,又通過網(wǎng)絡(luò)將提取后的信息發(fā)送到客戶端。同時,在這種模式下,還存在的問題就是需要將同該圖片關(guān)聯(lián)的信息都要和圖片一塊發(fā)送到后臺,這就是需要解決圖片和其關(guān)聯(lián)信息的數(shù)據(jù)同步問題。
[0003]隨著移動終端的發(fā)展,實時在線數(shù)據(jù)采集的應(yīng)用越來越廣泛。在數(shù)據(jù)采集環(huán)節(jié)中,對圖像數(shù)據(jù)的采集及識別是經(jīng)常面臨的技術(shù)問題,同時,由于移動終端的硬件及環(huán)境的影響,快速的識別出所采集元素中的各要素為實際中所經(jīng)常碰到的問題。
【發(fā)明內(nèi)容】
[0004]針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種圖像識別方法、裝置和系統(tǒng)。實現(xiàn)對圖像的分層分級識別,利用客戶端識別圖像的一部分元素,并將識別后的信息以及針對該圖片的其它一些采集數(shù)據(jù)信息按規(guī)則XML組合后再打包到文件中,形成新的文件,然后將該新的文件傳遞到后臺控制服務(wù)器和后臺服務(wù)器,由圖像識別控制服務(wù)器根據(jù)要識別的圖像特性再分發(fā)到不同的識別服務(wù)器進行對應(yīng)的信息識別,從而實現(xiàn)圖像信息的分層分階段獲取,可有效的利用客戶端的性能。
[0005]為達到以上目的,本發(fā)明采用的技術(shù)方案是:一種圖像識別系統(tǒng),該圖像識別系統(tǒng)包括:至少一個圖像識別客戶端,圖像識別客戶端,用于識別圖像的基本屬性,同時將已經(jīng)識別元素以及前端要識別請求要素組合成文件;一圖像識別控制服務(wù)器,獲取客戶端發(fā)送的識別文件以及原始圖像數(shù)據(jù),根據(jù)識別內(nèi)容對將要識別的圖像以及要識別的要求,將識別文件以及原始圖像數(shù)據(jù)分發(fā)到不同的圖像識別服務(wù)器上;至少一個圖像識別服務(wù)器,根據(jù)識別要求對指定圖像進行進一步識別。優(yōu)選地,所述基本屬性包括文字和/或數(shù)字。[0006]進一步,所述圖像識別控制服務(wù)器依據(jù)圖像識別客戶端設(shè)備的不同,發(fā)送不同的策略指令,使得客戶端能夠完成多級的識別處理。圖像識別服務(wù)器對于識別完成狀態(tài)可拉平處理,即不同的客戶端完成識別不一樣,在圖像識別服務(wù)器端補全,達成一致的識別效果。
[0007]本發(fā)明還提供一種圖像識別系統(tǒng),包括一發(fā)送端和一接收端,其特征在于:所述發(fā)送端包括:一圖像識別單元,用于識別圖像的基本屬性;一圖像文件組合單元,對所述圖像識別單元已經(jīng)識別的圖像基本屬性進行編碼組合,同原始圖像進行整合;一文件傳輸發(fā)送單元,將經(jīng)圖像文件組合單元整合后的文件傳輸至接收端;所述接收端包括,一文件分解單元,將接收到的文件進行分解,分離出原始圖像和已經(jīng)識別的圖像基本屬性;以及一圖像繼續(xù)識別單元,對原始圖像的未識別的信息進行識別。所屬基本屬性為文字和/或數(shù)字。
[0008]更進一步,所述圖像文件組合單元對原始圖像進行整合進一步包括將所述識別出的圖像基本信息以XML格式表示,并重新組合到新的文件中。所述圖像文件組合單元進一步將XML文件按字節(jié)流方式寫入到原始文件的頭部形成新的文件,同時在新的文件中標示出XML文件的長度,便于后面的分離操作。所述新的文件包括一文件頭,用于存儲XML信息,所述文件頭由頭標志、XML文件長度、XML內(nèi)容組成。
[0009]本發(fā)明還提供一種圖像識別的方法,該方法包括:步驟一、對圖像的基本屬性進行識別;步驟二、對已經(jīng)識別的圖像基本屬性進行編碼組合,并同原始圖像進行整合;步驟三,將整合后的文件傳輸;步驟四,接收傳輸?shù)奈募?,并對接收到的文件進行分解,分離出原始圖像和已經(jīng)識別的圖像基本屬性;步驟五,對原始圖像的未識別的信息進行識別。
[0010]優(yōu)選地,所述步驟二中對原始圖像進行整合的步驟包括:將所述識別出的圖像基本信息以XML格式表示,將XML文件格式添加到原始文件頭中,形成新的文件。
[0011]進一步,所述步驟五中對接收到的文件進行分解包括:首先,讀取XML文件到內(nèi)存中,其次,計算XM L文件的長度XMLLength ;第三,讀取原始圖像文件到內(nèi)存中,并計算原始圖像的長度ImageLength ;第四,建立新的內(nèi)存空間對象大小,該大小為XMLLength+ImageLength+size (unsigned char)+size (int)字節(jié)長度,其中size()用于判斷數(shù)據(jù)類型長度;第五,將文件頭標志、XML大小、以及XML文件按字節(jié)復(fù)制到上述新建的內(nèi)存空間中;第六,將原始圖像的所有字節(jié)都拷貝到上述新建的內(nèi)存空間中,該原始圖像的數(shù)據(jù)為追加形式的拷貝,不覆蓋文件頭標志、XML大小、以及XML文件的數(shù)據(jù);第七,將上述新建的內(nèi)存空間中的數(shù)據(jù)輸出至新的文件。
[0012]更進一步,所述對接收到的文件進行分解的步驟進一步包括:首先,讀取文件到內(nèi)存,其次,判斷文件標識是否符合要求,若符合要求則獲取XML文件的長度XMLLength ;第三,建立新的XML內(nèi)存空間,用于存放提取的XML文件,從文件流的flag+size (int)位置開始提取XMLLength長的字節(jié)的數(shù)據(jù)到上述新建的XM L內(nèi)存空間中,上述flag為文件標識的長度,其中sizeO用于判斷數(shù)據(jù)類型長度;第四,將上述XML內(nèi)存塊中的數(shù)據(jù)轉(zhuǎn)換成XML格式;第五,建立新的圖片內(nèi)存空間,將接收的文件中剩余部分的字節(jié)拷貝到該新建的圖片內(nèi)存空間中,并將其轉(zhuǎn)換為與原始圖像相同的圖片格式。
[0013]本發(fā)明的效果在于:在客戶端資源比較低的情況下可有效的利用不同的資源的性能;并且,將第一次識別的元素再反向打包到圖片文件中,一方面增加了圖像網(wǎng)絡(luò)傳輸?shù)陌踩?,另一方面避免了圖片和相關(guān)屬性信息以及已經(jīng)識別信息的分割,同時也避免了后臺的重復(fù)識別工作。服務(wù)器可依據(jù)客戶端圖像識別設(shè)備的不同,發(fā)送不同的策略指令,使得客戶端能夠完成多級的識別處理,可支持客戶端效率最大化或者識別最大化。服務(wù)器端對于識別完成狀態(tài)可拉平處理,即不同的客戶端完成識別不一樣,在服務(wù)器端補全,達成一致的識別效果。
【專利附圖】
【附圖說明】
[0014]圖1是本發(fā)明提供的圖像識別系統(tǒng)的示意圖;
[0015]圖2是本發(fā)明所述圖像識別系統(tǒng)的結(jié)構(gòu)圖;
[0016]圖3是本發(fā)明對圖像基本屬性進行識別的流程圖;
[0017]圖4是本發(fā)明對XML和原始圖像組合的原理圖;
[0018]圖5是本發(fā)明對XML文件和原始圖像文件進行組合的流程圖;
[0019]圖6是本發(fā)明對組合文件進行分離的流程圖;
[0020]圖7是本發(fā)明提供的圖像識別的方法示意圖。
【具體實施方式】
[0021]下面結(jié)合附圖和【具體實施方式】對本發(fā)明作進一步描述。
[0022]如圖1所示,本發(fā)明的第一實施方式提供一種圖像識別系統(tǒng)。該圖像識別系統(tǒng)包括;
[0023]一圖像識別客戶端,圖像識別客戶端,用于識別圖像的基本屬性,同時將已經(jīng)識別元素以及前端要識別請求要素組合成文件;優(yōu)選地,所述基本屬性包括文字和/或數(shù)字。
[0024]一圖像識別控制服務(wù)器,獲取客戶端發(fā)送的識別文件以及原始圖像數(shù)據(jù),根據(jù)識別內(nèi)容對將要識別的圖像以及要識別的要求,將識別文件以及原始圖像數(shù)據(jù)分發(fā)到不同的圖像識別服務(wù)器上。
[0025]至少一個圖像識別服務(wù)器,根據(jù)識別要求對指定圖像進行進一步識別。
[0026]本發(fā)明的第二實施方式提供一種圖像識別系統(tǒng),參見圖2,該系統(tǒng)包括發(fā)送端I和接收端2,所述發(fā)送端I包括:一圖像識別單元,用于圖像基本屬性的識別,所述基本屬性包括文字和/或數(shù)字;一圖像文件組合單元,該單元對所述圖像識別單元已經(jīng)識別的圖像進行編碼組合,并同原始圖像進行整合;一文件傳輸發(fā)送單元,將經(jīng)圖像文件組合單元整合后的文件傳輸至接收端。
[0027]所述接收端2包括一文件分解單元,將接收到的文件進行分解,分離出原始圖像和已經(jīng)解析的圖像內(nèi)容數(shù)據(jù);以及一圖像繼續(xù)識別單元,用于對原始圖像的其它未識別的信息進行識別。
[0028]為了更清楚地說明本發(fā)明的宗旨,以下對上述第一實施方式和第二實施方式進行進一步解釋。由于移動終端(發(fā)送端的一種實施方式)一般內(nèi)存和處理器的速度比服務(wù)器要低,因此可以考慮利用移動終端對圖像中耗時比較低,占用資源比較低的元素進行識別,主要文字信息,數(shù)字信息內(nèi)容,即圖像基本屬性。而對圖像中其它比較復(fù)雜的元素(如人臉圖像等)通過后臺服務(wù)(接收端的一種實施方式)來實現(xiàn)識別。
[0029]在本發(fā)明的基于第二實施方式的第三實施方式中,為了避免后臺服務(wù)對前臺已經(jīng)識別的元素重新進行識別,可以將已經(jīng)識別的元素通過XML格式標志出來并重新組合到圖像文件中,這樣后臺根據(jù)指定的規(guī)則定義就可以直接解析出要識別的元素,而將重要工作的都放在圖像其它部分的識別性能上。這樣可有效的考慮到終端資源低但對部分內(nèi)容又有顯示的需要的需求,而又充分的利用后臺高性能將復(fù)雜部分進行實現(xiàn)并又不需要將前臺已經(jīng)實現(xiàn)的部分重復(fù)識別工作。
[0030]更進一步,圖像識別控制服務(wù)器可依據(jù)客戶端圖像識別設(shè)備的不同,發(fā)送不同的策略指令,使得客戶端能夠完成多級的識別處理,可支持客戶端效率最大化或者識別最大化。一個更為優(yōu)選的實施方式中,圖像識別服務(wù)器端對于識別完成狀態(tài)可拉平處理,即不同的客戶端完成識別不一樣,在服務(wù)器端補全,達成一致的識別效果。
[0031]進一步參見附圖3,在第一層圖像(以JPG、PNG圖像為例,但本領(lǐng)域的技術(shù)人員應(yīng)當能夠想到更多圖片格式,例如BMP、GIF、TIFF等)識別中,主要對圖片中基本的屬性信息進行識別。例如,對身份證圖像而言,主要信息是身份證號碼,姓名,性別,民族等圖像基本屬性。在移動終端(或者其它具有識別功能的客戶端)對上述信息進行識別后,將這些信息按XML規(guī)則格式進行組裝,此封裝的目的是為了在后面第二層圖像識別過程中便于快速的處理。對XML的規(guī)則,按以下非限制性的XML方式進行該XML樣式表達如下(如身份證):
[0032]
【權(quán)利要求】
1.一種圖像識別系統(tǒng),該圖像識別系統(tǒng)包括:至少一個圖像識別客戶端,圖像識別客戶端用于識別圖像的基本屬性,同時將已經(jīng)識別元素以及前端要識別請求要素組合成文件;一圖像識別控制服務(wù)器,獲取客戶端發(fā)送的識別文件以及原始圖像數(shù)據(jù),根據(jù)識別內(nèi)容對將要識別的圖像以及要識別的要求,將識別文件以及原始圖像數(shù)據(jù)分發(fā)到不同的圖像識別服務(wù)器上;至少一個圖像識別服務(wù)器,根據(jù)識別要求對指定圖像進行進一步識別。
2.如權(quán)利要求1所述的圖像識別系統(tǒng),其特征是,所述基本屬性包括文字和/或數(shù)字。
3.如權(quán)利要求1所述的圖像識別系統(tǒng),其特征是,所述圖像識別控制服務(wù)器依據(jù)圖像識別客戶端設(shè)備的不同,發(fā)送不同的策略指令,使得客戶端能夠完成多級的識別處理。
4.如權(quán)利要求1、2或3所述的圖像識別系統(tǒng),其特征是,圖像識別服務(wù)器對于識別完成狀態(tài)可拉平處理,即不同的客戶端完成識別不一樣,在圖像識別服務(wù)器端補全,達成一致的識別效果。
5.一種圖像識別系統(tǒng),包括一發(fā)送端和一接收端,其特征在于:所述發(fā)送端包括:一圖像識別單元,用于識別圖像的基本屬性;一圖像文件組合單元,對所述圖像識別單元已經(jīng)識別的圖像基本屬性進行編碼組合,同原始圖像進行整合;一文件傳輸發(fā)送單元,將經(jīng)圖像文件組合單元整合后的文件傳輸至接收端;所述接收端包括,一文件分解單元,將接收到的文件進行分解,分離出原始圖像和已經(jīng)識別的圖像基本屬性;以及一圖像繼續(xù)識別單元,對原始圖像的未識別的信息進行識別。
6.如權(quán)利要求5所述的圖像識別系統(tǒng),其特征是,所屬基本屬性為文字和/或數(shù)字。
7.如權(quán)利要求6所述的 圖像識別系統(tǒng),其特征是,所述圖像文件組合單元對原始圖像進行整合進一步包括將所述識別出的圖像基本信息以XML格式表示,并重新組合到新的文件中。
8.如權(quán)利要求7所述的圖像識別系統(tǒng),其特征是,所述圖像文件組合單元進一步將XML文件按字節(jié)流方式寫入到原始文件的頭部形成新的文件,同時在新的文件中標示出XML文件的長度。
9.如權(quán)利要求8所述的圖像識別系統(tǒng),其特征是,所述新的文件包括一文件頭,用于存儲XML信息,所述文件頭由頭標志、XML文件長度、XML內(nèi)容組成。
10.一種圖像識別的方法,該方法包括:步驟一、對圖像的基本屬性進行識別;步驟二、對已經(jīng)識別的圖像基本屬性進行編碼組合,并同原始圖像進行整合;步驟三,將整合后的文件傳輸;步驟四,接收傳輸?shù)奈募?,并對接收到的文件進行分解,分離出原始圖像和已經(jīng)識別的圖像基本屬性;步驟五,對原始圖像的未識別的信息進行識別。
11.如權(quán)利要求10所述的圖像識別方法,其特征是,所述步驟二中對原始圖像進行整合的步驟包括:將所述識別出的圖像基本信息以XML格式表示,將XML文件格式添加到原始文件頭中,形成新的文件。
12.如權(quán)利要求10所述的圖像識別方法,其特征是:所述步驟五中對接收到的文件進行分解包括:首先,讀取XML文件到內(nèi)存中,其次,計算XML文件的長度XMLLength ;第三,讀取原始圖像文件到內(nèi)存中,并計算原始圖像的長度ImageLength ;第四,建立新的內(nèi)存空間對象大小,該大小為 XMLLength+ImageLength+size (unsigned char) +size (int)字節(jié)長度,其中sizeO用于判斷數(shù)據(jù)類型長度;第五,將文件頭標志、XML大小、以及XML文件按字節(jié)復(fù)制到上述新建的內(nèi)存空間中;第六,將原始圖像的所有字節(jié)都拷貝到上述新建的內(nèi)存空間中,該原始圖像的數(shù)據(jù)為追加形式的拷貝,不覆蓋文件頭標志、XML大小、以及XML文件的數(shù)據(jù);第七,將上述新建的內(nèi)存空間中的數(shù)據(jù)輸出至新的文件。
13.如權(quán)利要求12所述的圖像識別方法,其特征是,所述對接收到的文件進行分解的步驟進一步包括:首先,讀取文件到內(nèi)存,其次,判斷文件標志是否符合要求,若符合要求則獲取XML文件的長度XMLLength ;第三,建立新的XML內(nèi)存空間,用于存放提取的XML文件,從文件流的flag+size (int)位置開始提取XMLLength長的字節(jié)的數(shù)據(jù)到上述新建的XML內(nèi)存塊中,上述flag為文件標志的長度,其中sizeO用于判斷數(shù)據(jù)類型長度;第四,將上述XML內(nèi)存塊中的數(shù)據(jù)轉(zhuǎn)換成XML格式;第五,建立新的圖片內(nèi)存空間,將接收的文件中剩余部分的字節(jié)拷貝到 該新建的圖片內(nèi)存空間中,并將其轉(zhuǎn)換為與原始圖像相同的圖片格式。
【文檔編號】G06F17/30GK103455786SQ201210169473
【公開日】2013年12月18日 申請日期:2012年5月28日 優(yōu)先權(quán)日:2012年5月28日
【發(fā)明者】李欣, 余兵, 戎濱, 鄭佳棟, 曹五豐 申請人:北京山海經(jīng)緯信息技術(shù)有限公司, 方正國際軟件(北京)有限公司