圖像四邊形識(shí)別的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種圖像四邊形識(shí)別的方法,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成;記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。本發(fā)明還公開了一種實(shí)現(xiàn)上述方法的圖像四邊形識(shí)別的裝置。本發(fā)明使得用戶進(jìn)行批量操作時(shí),對(duì)圖像四邊形識(shí)別的方法能夠適應(yīng)特定的操作環(huán)境,提高了圖像四邊形識(shí)別的準(zhǔn)確性,減少了用戶的手動(dòng)操作,方便了用戶的使用。
【專利說明】圖像四邊形識(shí)別的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像處理的方法,尤其是一種圖像四邊形識(shí)別的方法。本發(fā)明還涉及一種圖像處理的裝置,尤其是一種圖像四邊形識(shí)別的裝置。
【背景技術(shù)】
[0002]隨著技術(shù)的發(fā)展,圖像已經(jīng)成為人們傳遞信息的重要媒介,而圖像處理技術(shù)已成為一項(xiàng)必不可少的工具,幫助人們進(jìn)行圖像的采集和使用。圖像四邊形識(shí)別是指對(duì)圖像中的四邊形輪廓進(jìn)行識(shí)別,然后可以根據(jù)識(shí)別得到的四邊形,將四邊形的部分內(nèi)容與其它部分進(jìn)行分離,以決定保留其中一部分圖像的圖像處理技術(shù)。這種技術(shù)目前已經(jīng)被廣泛的使用。例如,用戶可以用手機(jī)拍攝名片,然后手機(jī)對(duì)名片內(nèi)容進(jìn)行識(shí)別,將名片中的聯(lián)系信息存入手機(jī)的通訊錄。為了使得名片的識(shí)別更加準(zhǔn)確,人們已經(jīng)采用了圖像四邊形識(shí)別技術(shù)將拍攝得到的名片從圖片中識(shí)別后進(jìn)行切邊處理,只保留名片區(qū)域的圖像,而將其它背景圖像去除,然后對(duì)名片區(qū)域的圖像進(jìn)行四邊形拉伸處理,得到矩形的名片圖像,然后對(duì)矩形的名片圖像進(jìn)行文字識(shí)別。被經(jīng)過上述處理之后的名片圖像,大大的克服了由于拍攝角度和攝像頭的鏡頭造成的失真,從而提高了識(shí)別的準(zhǔn)確率。再例如,現(xiàn)在人們可以通過用智能手機(jī)拍攝文件的方式對(duì)文件進(jìn)行掃描,而不需要去使用掃描儀。手機(jī)拍攝到文件后,使用四邊形識(shí)別技術(shù)將拍攝的文件從圖像的背景中提取出來,然后拉伸成文件原來的尺寸,例如A4紙張大小。
[0003]然而,在上述的應(yīng)用中,圖像的處理一般是先通過計(jì)算機(jī)自動(dòng)識(shí)別圖像中名片或文件的邊界,如圖1中,在圖像中識(shí)別出四邊形邊界ABCD,然后由用戶檢查是否需要對(duì)這些邊界進(jìn)行調(diào)整,再對(duì)邊界內(nèi)的部分圖像進(jìn)行提取和拉伸,如圖2中,將圖1中的四邊形邊界ABCD拉伸成矩形,并將矩形邊界ABCD提取進(jìn)行其它的處理。然而,名片、文件以及背景中的圖案很可能會(huì)影響計(jì)算機(jī)自動(dòng)識(shí)別邊界的結(jié)果。例如,名片中如果有一條直線,如圖1和圖2中的線條EF,這條直線可能就會(huì)被識(shí)別成邊界中的一條邊,從而將四邊形邊界識(shí)別為ABFE。再例如,文件中如果有表格,該表格的外框可能就會(huì)被直接識(shí)別為文件的邊界。再例如,如果背景中有一些線條,這些線條也可能會(huì)被識(shí)別為邊界的一部分。這些圖案對(duì)自動(dòng)識(shí)別的干擾越多,就會(huì)造成邊界識(shí)別的準(zhǔn)確率越低,而隨后用戶進(jìn)行調(diào)整的操作量就會(huì)越多。尤其在用戶需要使用智能手機(jī)批量進(jìn)行名片識(shí)別或者文件掃描的情況下,就會(huì)為用戶帶來大量的人工操作,非常的不方便。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是提供一種圖像四邊形識(shí)別的方法,以及實(shí)現(xiàn)這種圖像四邊形識(shí)別的方法所采用的圖像四邊形識(shí)別的裝置,能夠在進(jìn)行批量處理時(shí)提高圖像四邊形識(shí)別的準(zhǔn)確性,減少用戶的手動(dòng)操作,方便用戶的使用。
[0005]為解決上述技術(shù)問題,本發(fā)明圖像四邊形識(shí)別的方法的技術(shù)方案是,包括以下步驟: 步驟一,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成;
步驟二,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
[0006]本發(fā)明還提供了一種實(shí)現(xiàn)上述圖像四邊形識(shí)別的方法所采用的圖像四邊形識(shí)別的裝置,其技術(shù)方案是,基于計(jì)算機(jī)系統(tǒng),包括
第一識(shí)別部件,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成;
圖像特征采集部件,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
第二識(shí)別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
[0007]本發(fā)明通過上述技術(shù)方案,使得用戶進(jìn)行批量操作時(shí),對(duì)圖像四邊形識(shí)別的方法能夠適應(yīng)特定的操作環(huán)境,從而高效的完成圖像的四邊形識(shí)別,提高了圖像四邊形識(shí)別的準(zhǔn)確性,減少了用戶的手動(dòng)操作,方便了用戶的使用。
【專利附圖】
【附圖說明】
[0008]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明:
圖1和圖2為現(xiàn)有的圖像四邊形識(shí)別的方法的示意圖。
[0009]圖3、圖4和圖5為本發(fā)明圖像四邊形識(shí)別的方法的實(shí)施例示意圖。
[0010]圖6為圖像四邊形識(shí)別的裝置的示意圖。
【具體實(shí)施方式】
[0011]本發(fā)明公開了一種圖像四邊形識(shí)別的方法,包括以下步驟:
步驟一,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成;
步驟二,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
[0012]用戶在以拍攝方式獲取文件或名片的電子格式時(shí),通常會(huì)在一些比較固定的環(huán)境中,例如自己的辦公室的桌子上,或者家里的桌子上,在這些環(huán)境中拍攝文件或名片時(shí),拍攝得到的圖像一般都會(huì)有類似的背景。再有時(shí),用戶拍攝的一套文件有很多張,或者一次性處理多個(gè)人的名片,因此可能會(huì)一次性拍攝多張文件或名片,而在進(jìn)行這樣的多張拍攝時(shí),拍攝得到的圖像也會(huì)有高度相似的背景。另外,對(duì)于一些格式文件,其文件上也會(huì)有一些特征,從而使得這些文件的圖像也會(huì)有高度相似性。
[0013]用戶使用本發(fā)明所提供的圖像切邊處理的方法,首先對(duì)第一張圖像作為第一圖像進(jìn)行四邊形識(shí)別處理,如圖1所示,將圖1中的四邊形ABCD進(jìn)行四邊形識(shí)別,該四邊形識(shí)別可以通過計(jì)算機(jī)系統(tǒng)自動(dòng)進(jìn)行,有時(shí)圖像上會(huì)有一些干擾導(dǎo)致計(jì)算機(jī)系統(tǒng)自動(dòng)進(jìn)行的四邊形識(shí)別發(fā)生錯(cuò)誤,例如圖1所示的圖像中有線條EF,會(huì)造成計(jì)算機(jī)系統(tǒng)將四邊形識(shí)別為ABFE或者CDEF,因此該四邊形識(shí)別也可以由用戶手動(dòng)進(jìn)行操作以選擇要進(jìn)行切邊的四邊形,還可以由計(jì)算機(jī)系統(tǒng)自動(dòng)識(shí)別與用戶手動(dòng)操作相結(jié)合的方式,由用戶對(duì)計(jì)算機(jī)系統(tǒng)自動(dòng)識(shí)別的結(jié)果進(jìn)行調(diào)整,進(jìn)行對(duì)四邊形ABCD的四邊形識(shí)別。用戶對(duì)第一張圖像進(jìn)行四邊形識(shí)別,得到相應(yīng)的處理結(jié)果,如圖2所示的矩形ABCD。此外,計(jì)算機(jī)系統(tǒng)記錄了上述四邊形識(shí)別中,四邊形AB⑶邊界處的圖像特征,作為第一圖像特征。
[0014]此后,用戶對(duì)其它圖像作為第二圖像進(jìn)行處理,此時(shí)計(jì)算機(jī)系統(tǒng)在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像進(jìn)行或者優(yōu)先進(jìn)行四邊形識(shí)別。如圖3所示,計(jì)算機(jī)系統(tǒng)在第二圖像中搜索到四邊形A’ B’ C’ D’邊界處的圖像特征與所述第一圖像特征相符,因此將四邊形A’ B’ C’ D’進(jìn)行識(shí)別,或者優(yōu)先選擇四邊形A’ B’ C’ D’作為待識(shí)別的四邊形,等待用戶的確認(rèn)后作為識(shí)別結(jié)果,然后如圖4所示,可以將四邊形A’ B’ C’ D’提取出來并進(jìn)行拉伸等其它操作。由于只有四邊形A’ B’ C’ D’邊界處的圖像特征與所述第一圖像特征相符,而一些干擾圖像特征例如線條E’ F’處的圖像特征與第一圖像特征不相符,因此不會(huì)將線條E’ F’錯(cuò)誤的認(rèn)為是待提取四邊形的邊界,從而提高了四邊形識(shí)別處理的準(zhǔn)確性。
[0015]本發(fā)明中,所述第一圖像和第二圖像可以一次性獲取,也可以分多次獲取。獲取的方式可以是直接接收所述第一圖像和第二圖像的文件,也可以是通過拍攝等方式生成第一圖像和第二圖像的文件等。例如,用戶可以一次性接收或者拍攝多個(gè)圖像,然后對(duì)其中一個(gè)圖像作為第一圖像進(jìn)行四邊形識(shí)別,并記錄相應(yīng)的第一圖像特征,之后根據(jù)該第一圖像特征對(duì)其它的圖像進(jìn)行四邊形識(shí)別處理?;蛘?,用戶還可以在以后另行接收或者拍攝其它的圖像,根據(jù)先前已經(jīng)記錄的第一圖像特征,對(duì)后來節(jié)后或者拍攝的圖像進(jìn)行四邊形識(shí)別處理。
[0016]本發(fā)明中,所述第一圖像可以是一個(gè)圖像,也可以是多個(gè)圖像。如果所述第一圖像包括多個(gè)圖像,則在步驟二中記錄對(duì)每個(gè)第一圖像進(jìn)行四邊形識(shí)別時(shí)第一圖像的識(shí)別邊界處的第一圖像特征,步驟三中在第二圖像中搜索與其中一個(gè)第一圖像特征相符的第二圖像的識(shí)別邊界。所述步驟三中,在第二圖像中搜索與指定的第一圖像特征相符的第二圖像的識(shí)別邊界,或者在第二圖像中搜索與任意第一圖像特征相符的第二圖像的識(shí)別邊界。例如,用戶在辦公室的桌子和家中的桌子分別拍攝了不同的第一圖像并進(jìn)行了四邊形識(shí)別,計(jì)算機(jī)系統(tǒng)中記錄了上述不同的第一圖像各自所對(duì)應(yīng)的第一圖像特征。以后,用戶再拍攝新的第二圖像,如果新的第二圖像有符合辦公室或家中所獲取的第一圖像對(duì)應(yīng)的任意第一圖像特征的識(shí)別邊界,則根據(jù)該第一圖像特征對(duì)新的第二圖像進(jìn)行四邊形識(shí)別?;蛘?,用戶知道新的第二圖像的拍攝地點(diǎn),例如是在辦公室的桌子上,用戶可以指定辦公室桌子拍攝的第一圖像所對(duì)應(yīng)的第一圖像特征,然后根據(jù)該第一圖像特征對(duì)第二圖像進(jìn)行四邊形識(shí)別。
[0017]所述第二圖像可以包括一個(gè)或多個(gè)圖像;如果所述第二圖像包括多個(gè)圖像,則重復(fù)步驟三對(duì)每個(gè)第二圖像進(jìn)行處理。
[0018]所述第一圖像特征包括以下五種中的至少一種:
識(shí)別邊界在圖像上的位置,可以在第二圖像的相應(yīng)位置上尋找是否有識(shí)別邊界,進(jìn)行四邊形識(shí)別。
[0019]識(shí)別邊界至少一側(cè)的圖案,例如,所拍攝的文件背景上有特定的圖案,通過這些圖案可以識(shí)別圖像上哪部分是背景,哪部分是文件;或者所拍攝的文件是格式文件,上面有特定的底紋圖案,這樣也可以通過特定的底紋圖案區(qū)別背景部分和文件部分。
[0020]識(shí)別邊界至少一側(cè)的顏色,例如,所拍攝的文件背景有特定的顏色,例如在桌子上拍攝文件,桌面的顏色可以作為區(qū)分圖像中背景部分和文件部分的依據(jù);或則所拍攝的文件也有特定的顏色,也可以作為區(qū)別圖像中背景部分和文件部分的依據(jù)。
[0021]識(shí)別邊界兩側(cè)色彩的對(duì)比度,在某一個(gè)環(huán)境下拍攝文件,文件部分的圖像色彩與背景部分的色彩會(huì)有特定的對(duì)比度,將此作為第一圖像特征也可以將文件部分與背景部分區(qū)分開。
[0022]識(shí)別邊界的線條形狀參數(shù),例如對(duì)一本書的內(nèi)容進(jìn)行拍攝,如圖5所示,翻開的書的輪廓形狀相對(duì)比較固定,對(duì)這些輪廓線條的形狀參數(shù),例如線條的曲率、線條曲線的極值以及增減趨勢(shì),作為第一圖像特征,從而確定第二圖像中相似的輪廓線條,作為四邊形識(shí)別邊界。
[0023]本發(fā)明還公開了一種實(shí)現(xiàn)上述圖像四邊形識(shí)別的方法所采用的圖像四邊形識(shí)別裝置,如圖6所示,基于計(jì)算機(jī)系統(tǒng),該計(jì)算機(jī)系統(tǒng)包括個(gè)人電腦、智能手機(jī)和平板電腦等,包括:
第一識(shí)別部件,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成;
圖像特征采集部件,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
第二識(shí)別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
[0024]本發(fā)明通過上述技術(shù)方案,使得用戶進(jìn)行批量操作時(shí),對(duì)圖像四邊形識(shí)別的方法能夠適應(yīng)特定的操作環(huán)境,從而高效的完成圖像的四邊形識(shí)別,提高了圖像四邊形識(shí)別的準(zhǔn)確性,減少了用戶的手動(dòng)操作,方便了用戶的使用。
[0025]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用以限定本發(fā)明的實(shí)質(zhì)技術(shù)內(nèi)容范圍,本發(fā)明的實(shí)質(zhì)技術(shù)內(nèi)容是廣義的定義于申請(qǐng)的權(quán)利要求范圍中,任何他人完成的技術(shù)實(shí)體或方法,若是與申請(qǐng)的權(quán)利要求范圍所定義的完全相同,也或是一種等效的變更,均將被視為涵蓋于該權(quán)利要求范圍之中。
【權(quán)利要求】
1.一種圖像四邊形識(shí)別的方法,其特征在于,包括以下步驟: 步驟一,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成; 步驟二,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征; 步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
2.根據(jù)權(quán)利要求1所述的圖像四邊形識(shí)別的方法,其特征在于,還包括一次性或者分多次獲取第一圖像和第二圖像的步驟。
3.根據(jù)權(quán)利要求1所述的圖像四邊形識(shí)別的方法,其特征在于,所述第一圖像包括一個(gè)或多個(gè)圖像;如果所述第一圖像包括多個(gè)圖像,則在步驟二中記錄對(duì)每個(gè)第一圖像進(jìn)行四邊形識(shí)別時(shí)第一圖像的識(shí)別邊界處的第一圖像特征,步驟三中在第二圖像中搜索與其中一個(gè)第一圖像特征相符的第二圖像的識(shí)別邊界。
4.根據(jù)權(quán)利要求3所述的圖像四邊形識(shí)別的方法,其特征在于,所述步驟三中,在第二圖像中搜索與指定的第一圖像特征相符的第二圖像的識(shí)別邊界,或者在第二圖像中搜索與任意第一圖像特征相符的第二圖像的識(shí)別邊界。
5.根據(jù)權(quán)利要求1所述的圖像四邊形識(shí)別的方法,其特征在于,所述第二圖像包括一個(gè)或多個(gè)圖像;如果所述第二圖像包括多個(gè)圖像,則重復(fù)步驟三對(duì)每個(gè)第二圖像進(jìn)行處理。
6.根據(jù)權(quán)利要求1所述的圖像四邊形識(shí)別的方法,其特征在于,所述第一圖像特征包括以下幾種中的至少一種:識(shí)別邊界在圖像上的位置,識(shí)別邊界至少一側(cè)的圖案,識(shí)別邊界至少一側(cè)的顏色,識(shí)別邊界兩側(cè)色彩的對(duì)比度,識(shí)別邊界的線條形狀參數(shù)。
7.一種實(shí)現(xiàn)權(quán)利要求1-6中任意一項(xiàng)所述的圖像四邊形識(shí)別的方法所采用的圖像四邊形識(shí)別裝置,其特征在于,基于計(jì)算機(jī)系統(tǒng),包括 第一識(shí)別部件,對(duì)第一圖像進(jìn)行四邊形識(shí)別,該四邊形識(shí)別中識(shí)別邊界的確定是通過自動(dòng)方式或手動(dòng)方式兩種中的至少一種來完成; 圖像特征采集部件,記錄對(duì)所述第一圖像進(jìn)行四邊形識(shí)別時(shí)四邊形的識(shí)別邊界處的圖像特征,并將該圖像特征作為第一圖像特征; 第二識(shí)別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識(shí)別邊界,并根據(jù)該相符的第二圖像的識(shí)別邊界對(duì)所述第二圖像中相應(yīng)的四邊形進(jìn)行識(shí)別處理或者優(yōu)先進(jìn)行識(shí)別處理。
【文檔編號(hào)】G06T7/00GK104408427SQ201410709428
【公開日】2015年3月11日 申請(qǐng)日期:2014年12月1日 優(yōu)先權(quán)日:2014年12月1日
【發(fā)明者】陳鵬淵 申請(qǐng)人:上海合合信息科技發(fā)展有限公司