專利名稱:垃圾傳真過濾器的制作方法
技術領域:
本發明涉及傳真設備領域,尤其涉及到傳真設備中垃圾傳真圖像的處理。
相關領域傳真設備一直是僅次于電話的商業通信的第二大主要方式。當前,在世界范圍內已經開發出超過八千五百萬種傳真設備,并且超過5億到10億個傳真電話號已經被廣為散布。因此,直接銷售產業以其將電話和電子郵件用作直接廣告模式的相同方式來將傳真圖像結合成用于大眾廣播銷售信息的一種手段也就不足為怪了。
在過去,印刷介質用作直接銷售產業部分的自發大眾廣告的主要形式。通常被稱作“垃圾郵件”,自發印刷銷售材料可以成批傳遞到有巨大選擇性的接收者手中,而不論該接收者是否要求該銷售信息。由于百分之一到二的響應比例,垃圾郵件已經成為產生新的銷售渠道的有效工具。但是,垃圾郵件的接收者通常對收到垃圾郵件很惱火。此外,對于重要的“郵筒”來說,發送垃圾郵件的郵資是很昂貴的。因此,直接銷售產業一直在尋找用于傳遞自發銷售材料的等效但相對廉價的形式。
由于將電子郵件發送到大量的目標接收者手中是無需郵資的,因此電子郵件的出現已經對直接銷售者提供了很多必要的緩和。此外,自發電子郵件的傳遞可以是瞬間的事情,并且自發電子郵件可以包括對產品或服務信息的嵌入式超鏈接,從而有助于提高對“郵筒”的響應比例。但是,在印刷媒體的世界中,通常被稱為“垃圾”的自發電子郵件對于世界范圍的用戶來說仍然是一種煩惱。結果,“垃圾過濾器”的整個家庭手工業已經出現,它的任務就是要除掉垃圾。
類似于電子郵件,傳真媒體仍然是一種用于廣播銷售的大眾媒體。但是不同于電子郵件,用戶用傳真媒體來接收垃圾是有真實成本的。具體地,單單是垃圾傳真圖像不僅消耗紙張和墨粉資源,而且還占用本來可用于發送流出傳真或者是接收合法流入傳真的電信帶寬。在聯合王國中,估計每個英國公司每年在傳真方面要支出超過三百七十六英鎊的垃圾成本。在美國,估計每年在傳真方面的垃圾成本高達九十億美元!對主題垃圾傳真已經展開嚴肅而激烈的爭論,密蘇里州已經成功地依照1991年的電話用戶保護法案(下文稱之為“TCPA”)的227款對兩家最大的垃圾傳真組織提出指控,該項訴訟受到了阿拉斯加、阿肯色、加州、卡洛拉多、康涅狄格、佛羅里達、愛達荷、伊利諾伊、愛荷華、肯塔基、馬里蘭、密歇根、明尼蘇達、新墨西哥、俄勒岡、南達科他、德克薩斯、佛蒙特、西弗吉尼亞各州和哥倫比亞特區的支持。值得注意的是,TCPA的227款規定“向電話傳真機發送自發廣告”是非法的。
但是,本訴訟的結果還沒有得以解決,并且該訴訟的被告人站在聯邦憲法所提供的商業言論自由的角度上對TCPA是否符合憲法的性質提出了置疑,TCPA的227款的實施有待進一步裁決。具體地,在交換傳真數據時不再需要同時存在兩部電話傳真機。實際上,ITU-T推薦標準T.37已經說明可在電話傳真機缺失的情況下通過因特網來傳送傳真圖像。
值得注意,雖然垃圾過濾器在電子郵件領域是有效的,但是在傳真領域中還沒有得到應用。具體地,電子郵件不同于傳真圖像在于幾種獨特而重要的方式。由其值得注意,電子郵件可以文本可讀格式,即通常是MIME格式而傳送。結果,垃圾過濾器可直接基于電子郵件中文本的性質、內容和結構上其作用。更具體地,垃圾過濾器可以找出指示垃圾存在的特定單詞的產生。通過比較,傳真圖像是以光柵化(rasterized)圖像格式傳輸,這種格式除了以黑白或彩色像素之外是無法得到解釋的。因此,電子郵件垃圾過濾器技術在傳真領域仍然無效,并且已經考慮了其它的方案。
幾種技術,雖然沒有直接針對垃圾,但是可認為是對垃圾傳真問題提供了初步的方案。例如,在美國專利號.5,999,600中Dong-Myong Shin的“FACSIMILEMAIL SYSTEM AND METHOD FOR CONTROLLING THE SAME”,通過DTMF信號提供的口令可以限制“字面信息”的傳送,其中通過DTMF所提供的口令與預存的口令不匹配。作為另一個示例,在美國專利申請公開US 2002/0191226 A1的“CALL-SCREENING DEVICE FOR A FACSIMILE MACHINE”中,來電的電話號與電話號的數據庫相比較,以確定是否建立起通過其可傳送傳真數據的電話連接。有趣的是,在美國專利號.6,553,494中Randal Glass的“METHOD ANDAPPARATUS FOR APPLYING AND VERIFYING A BIOMETRIC-BASED DIGITALSIGNATURE TO AN ELECTRONIC DOCUMENT”,結合到文檔中的生物計量數據可由接收者用于驗證文檔。
更具體地參照傳真領域,市場上已經推出了幾種傳真特定反垃圾技術,例如,GFI軟件公司已經開發出GFI FAXmakerTM生產線,其中傳真可通過普通的電子郵件用戶來收發。作為GFI FAXmaker產品的一部分,提供了一種“垃圾傳真過濾器”,通過它,基于垃圾傳真發送者的電話號,垃圾傳真可被“自動刪除”。具體地,與被人工確定為垃圾傳真的傳真的發送者相關聯的電話號數據庫可用作鑒別依次收到的傳真。
通過比較,美國俄亥俄州辛辛那提的MMFM通信軟件公司生產了FaxEverywhereTM產品,其中被人工確定的垃圾傳真可被標記為“垃圾”。一旦被標記,可將所標記的傳真的內容與隨后接收到的傳真相比,以識別垃圾。其中所接收到的傳真的百分之九十五(95%)與被標記為垃圾的存儲的傳真的光柵化圖像相匹配,則可斷定接收到的傳真是垃圾。因此,Fax Everywhere產品可以看作是人工輔助垃圾傳真檢測處理器,但它缺少自學習或預清空垃圾鑒別能力。
還有,僅僅是將傳真圖像與存儲在垃圾傳真圖像存儲庫中的圖像相比較是一項資源密集且耗時的過程。更重要的是,在必需人工確定垃圾的垃圾檢測和封鎖系統中,一旦垃圾被人工識別為,特別是在高容量的傳真環境(其中廣播垃圾傳真的單個示例可以達到單個“郵筒”中的數千個終端用戶手中)中是如此的話,就會“做出”“損害”。因此,希望能夠以自學習、且無需人工介入的方式動態地檢測垃圾傳真。
發明內容
本發明目的在于針對有關傳真領域中的自發傳真圖像(下文稱為“垃圾傳真”)傳送的技術缺陷,并且提供用于過濾垃圾傳真的新穎而非明顯的方法,系統和裝置,以便在檢測到垃圾傳真試圖進入傳真輸出設備之后將傳真圖像自動識別為垃圾傳真。重要的是,不同于本領域中已知的常規垃圾傳真減少和消除技術,并非對傳真影像的光柵化形式進行直接的處理以檢測出垃圾傳真。而是將傳真影像的光柵化形式變換成非光柵化的表達,以便無需像現有技術情形中消耗非必要的系統資源以及經歷耗時的像素比較那樣,而便于檢測到垃圾傳真。更重要的是,本發明是一種動態的、自學習系統,它無需為避免垃圾傳真郵筒的微弱效果而對垃圾進行預先的人工標記。
依照本發明而配置出的垃圾傳真過濾器包括配置成以將光柵化傳真圖像變換成傳真圖像的非光柵化表達的傳真變換處理器。非光柵化表達可包括基于數字、基于文本、基于向量或這類其它的圖像數據表達,包括多頁形成傳真圖像、多個黑白像素形成傳真圖像以及傳真圖像的色彩強度。垃圾傳真過濾器可包括基于垃圾傳真的特征和非垃圾傳真的特征的資料庫。最后,垃圾傳真過濾器可包括配置成將由傳真變換處理器所產生的傳真圖像的非光柵化表達與資料庫中的特征相比較、以檢測出垃圾傳真過濾器中的垃圾傳真的比較器。
值得注意,垃圾傳真過濾器可選擇性包括結合到傳真變換處理器的光學字符識別(OCR)處理器。OCR處理器可配置成用于將光柵化傳真圖像轉換成光柵化傳真圖像的文本式表達。垃圾傳真過濾器還可選擇性包括結合到傳真變換處理器的邊緣銳化過濾器。該邊緣銳化過濾器還可配置成對光柵化傳真圖像產生限定光柵化傳真圖像的強化邊緣的中間影像。因此,對于中間影像中的強化邊緣可以計算出一組向量。
另一種選擇就是,垃圾傳真過濾器可包括結合到傳真變換處理器的模糊過濾器。并且將穩健散列(robust hash)處理器配置成對光柵化傳真圖像的模糊形式產生一穩健散列值。最后,垃圾傳真過濾器可選擇性包括用于在光柵化傳真圖像一區域中檢測多個選中像素的色彩值的裝置。基于檢測到的色彩值,變換處理器可用至少一個數字值(表示單個光柵化傳真圖像的多個黑像素以及單個光柵化傳真圖像中的多個白像素)對每個光柵化傳真圖像進行數字解碼。
用于過濾垃圾傳真的方法包括將來自候選傳真圖像中的光柵化形式變換為一個或多個非光柵化形式;將候選傳真圖像的非光柵化形式對照諸如垃圾傳真特征或已知為非垃圾傳真特征的各種傳真特征做出測試;并且確定該候選傳真圖像是垃圾傳真(其中順利地測試出候選傳真圖像具有至少一項已知垃圾傳真的特征)。在這一點上,當傳真圖像的變換顯示出其中一項或多項垃圾的特征超過一閾值水平時,則該傳真圖像可被斷定為垃圾。簡單地,當傳真圖像的變換顯示出其中一項或多項非垃圾的特征超過一閾值水平時,則該傳真圖像可被斷定為非垃圾。
變換步驟可包括將候選傳真圖像在光學字符處理器中進行處理以將候選傳真圖像轉換成文本的步驟。或者,變換步驟包括強化候選傳真圖像中的邊緣的步驟;并且計算出強化邊緣的一組向量的步驟。又或者,變換步驟可包括使候選傳真圖像模糊;并且對模糊的候選傳真圖像產生穩健散列值。最后,還或者,變換步驟可包括對候選傳真圖像中一區域檢測多個選中像素的色彩值。可用至少一個數字值(表示單個光柵化傳真圖像的多個黑像素以及單個光柵化傳真圖像中的多個白像素)對候選傳真圖像依次進行數字解碼。
重要的是,測試步驟包括將特征施加到變換中以產生結果的步驟。具體地,可將該變換與選中的各特征進行比較以確定該變換是否滿足特征標準的閾值水平。每次比較都會產生一個評分。當評分超過了閾值水平的對應評分時,則加權該評分,并且將各比較的加權評分求和。該求和可產生用于確定該候選傳真圖像是合法傳真還是垃圾傳真的最終結果。
重要地,通過產生對候選圖像是垃圾傳真還是合法的在線動態決定,可以避免垃圾傳真郵筒的成本上的影像,因為本發明在性質上是預測式的。此外,在本發明中,傳真圖像的非光柵化表達代替傳真圖像的光柵化形式來對垃圾傳真的確定進行處理,就避免了延遲和計算資源的過度消耗。最后,因為本發明結合了可標識垃圾傳真的特征的資料庫,本發明可以自學習,即被標識的垃圾傳真的特征可以用作調整和改進資料庫的內容。
在下面的描述中將會對本發明的其它方面進行部分地陳述,并且這些方面從該描述中將會部分地明顯,或者可從本發明的實踐中得知。由所附權利要求中特別指出的元件和結合的手段可以實現并獲得本發明各方面。可以理解,前述一般性的描述和后續詳細的描述僅是示例性和解釋性的,并非對如權利要求所要求的本發明構成限制。
結合到該說明書中并構成其部分的附圖示出了本發明的各實施例,并且與描述一起用作解釋本發明的原理。在此示出的實施例是當前較佳的,但是可以理解,本發明不限于本文所示的各種裝置和設備,其中圖1是依照本發明設想而配置的垃圾傳真過濾器的示意圖;圖2是示出圖1垃圾傳真過濾器過濾垃圾處理的流程圖;圖3是示出對照已知垃圾傳真特征的資料庫來進行候選傳真影像測試處理的框圖;以及圖4是示出圖1的傳真圖像變換處理器的多個較佳配置的框圖。
具體實施例方式
本發明是一種垃圾傳真過濾器系統、方法和裝置。依照發明裝置,垃圾傳真過濾器可以通過將候選影像的非光柵化變換表達與已知傳真特征的資料庫相比較來對候選傳真影像進行處理。當候選傳真影像的變換足以顯示在資料庫中存儲的傳真特征指示該傳真是垃圾時,則候選傳真可被斷定為垃圾,并且可對該候選傳真進行相應的處理。此外,資料庫可以由候選影像所提供的附加數據點進行調整。但是,當候選傳真影像不足以顯示在資料庫中存儲的垃圾特征時,則候選傳真可被斷定為合法的,并且可對該候選傳真進行相應的處理。
圖1是依照發明設想而配置的垃圾傳真過濾器120的示意圖。垃圾傳真過濾器120可結合到傳真輸出設備170上,并可包括傳真變換處理器130和比較器140。比較器140可結合到能夠存儲已知傳真特征160的數據組的垃圾資料庫150。已知傳真特征160包括垃圾傳真特征和非垃圾傳真特征之一或兩者都包括。垃圾傳真特征可包括有關垃圾特征的非光柵化數據,諸如傳真傳輸的典型頁面長度、色彩強度、傳真變換中的基本圖案等。類似地,非垃圾傳真特征可包括有關合法傳真特征的非光柵化數據,諸如傳真傳輸的典型頁面長度、色彩強度、傳真變換中的基本圖案等。
現在回到圖1,可以由垃圾傳真過濾器120接收到光柵化傳真圖像110。對于本領域一般技術人員可以理解,通過光柵化,傳真影像可包括通常以幾種標準化格式中的一種標準格式進行存儲的光柵化表達,例如,僅例舉出TIFF格式、JBIG格式和JPEG格式。傳真圖像110可在傳真變換處理器130中被變換成傳真圖像110的諸如定義傳真圖像110的一組向量的一項或多項非光柵化表達,該過程在此處被稱為變換180。或者,傳真變換處理器130可以減少傳真圖像110的光柵化形式成為已解碼的數字表達或者數字穩健散列。又或者,傳真變換處理器130可通過光學字符識別處理將傳真圖像110的光柵化形式轉換成文本形式。
在任何情形中,一旦傳真變換處理器130產生出一個或多個傳真圖像的非光柵化變換180,則所產生的變換180可在比較器140中進行處理。具體地,比較器140可將變換180之一與存儲在資料庫150中的已知垃圾特征組160相比較。當變換的傳真圖像180顯示出資料庫150中的一項或多項垃圾特征組160時,可將傳真圖像110標識為垃圾傳真的示例并對其做出相應的處理,例如丟棄、隔離等。否則,垃圾傳真過濾器120將允許通過諸如傳真印刷機或傳真路由器的傳真輸出設備170對傳真圖像110進行進一步的傳真輸出處理。重要的是,當傳真圖像110被確定為垃圾時,傳真圖像110的特征可進入到資料庫150中以進一步改進和調整已知的垃圾特征組160。
在更具體的圖示中,圖2是示出圖1的垃圾傳真過濾器對垃圾傳真圖像進行過濾處理的流程圖。從框210開始,接收候選光柵化傳真圖像,用于進一步處理。在框215,候選圖像可以變換成非光柵化表達。框215的變換處理無需不限于任何一種類型的變形。在這一點上,圖4是示出圖1的傳真圖像變換處理器的多個較佳配置的框圖。
如圖4所示,變換處理410通過使用四個示出的方法至少之一來產生傳真圖像的非光柵化形式,但是示出的方法絕非表示用于產生傳真圖像的變形、非光柵化形式的方法的唯一方法,而是在圖像處理領域的一般技術人員看來,存在用于將已產生的光柵圖像變換成非光柵圖像的多種技術。在如圖4所示的本發明中,示出了四種這樣的示例性的方法。
在如框420示出的本發明的一方面,邊緣銳化過濾器可應用到光柵化圖像上以產生具有限定原始傳真圖像的強化邊緣的中間圖像。對該這些邊緣可以產生出各種向量。所產生的向量組可被存儲為光柵化圖像的唯一表達。或者,在框430中,可計算出光柵化圖像的某一區域中的相對的色彩強度,以用唯一的強度向量對光柵化圖像進行數字編碼。例如,可以在傳真圖像中計算出白像素和黑像素的數量,或者可以計算出光柵化圖像某一區域中的白對黑像素的比例,以對該區域產生出唯一的強度比例。光柵化圖像本身可以被分成一個或多個區域,一般技術人員注意到具有較多的區域可以產生更高的生成獨有亮度比例的可能性,但同時也增加了對多個區域計算出相對亮度所需的處理量。
在第三種情形中,在框440中,可以通過將光柵化圖像經過模糊過濾器來將光柵化圖像變模糊。因此將諸如眾所周知的MD-5穩健散列應用到已模糊的圖像,以對該圖像產生唯一的穩健散列值。最后,在框450中,可通過OCR對圖像進行處理,以產生一組文本單詞和符號。可對該符號進行諸如通過貝葉斯分析的符號間相關性的預處理。在該情形中,當圖像的文本表達與其它類似的變換的圖像相比時,當同一相關性存在于兩個已變換的圖像中時,可認為存在著匹配。
現在回到圖2,一旦候選傳真圖像變換到非光柵化形式,在框220中,可檢索到第一組已知垃圾特征,諸如傳真傳送中的圖案的典型色彩強度、垃圾傳真圖像內的典型圖像向量、某一單詞或詞組的出現,頁面的典型數量等。在決定框225中,已變換的表達可與第一組垃圾特征相比較,以確定候選圖像是否顯示了由第一組所定義的特征。如果是,在框240中,加權結果,以表明該組的相對重要性。在框245中,可用組的加權評分對總的評分進行求和,并且通過決定框230進行繼續處理。
在決定框230中,在候選圖像中仍然有多組要經過測試的垃圾特征,在框235中,將檢索出下一組垃圾特征,并且在框225到245中重復原處理。一旦沒有要采用的垃圾特征組,則在決定框250中可確定總的評分求和是否超過了一閾值。如果沒有,則在框265中,在將候選圖像處理為可允許的傳真傳送。否則,如果總的評分求和超過了一閾值,則在框255中候選的圖像被標定為垃圾傳真。此外,在框260中,可以用候選傳真中所呈現的非光柵化圖像數據對資料庫中的垃圾特征組進行重新調整。
重要的是,可以通過如在資料庫內定義的垃圾不同特征的用戶可配置加權來執行確定候選圖像是否是垃圾。為此,圖3是示出可能的垃圾的標識處理的框圖。如圖3所示,候選傳真圖像的非光柵化變換310可在一個或多個垃圾測試320中同時進行處理。每個垃圾測試320可將一組垃圾特征應用到非光柵化變換,以確定非光柵化變換是否顯示出用戶可配置閾值內的測試特征。作為一示例,一示例性測試可包括在傳真傳送中的頁面數量。當頁面計數超過了五頁,可以推斷出候選的傳真滿足了示例性測試的標準。
一般技術人員可以理解,在確認候選傳真圖像是否是垃圾的總體評估中,并非同等考慮所有的垃圾測試320。相應的,可根據垃圾測試320的重要性加權340每個結果330。可對照閾值350對權重總和350進行評估,以確定候選圖像是垃圾傳真還是合法傳真。
可在硬件、軟件、或硬件和軟件的結合中實現本發明。本發明方法和系統可在一個計算機系統的中央化模式下實施,也可以在其中不同的元件分散在數臺互聯的計算機系統的分散模式下實施。適于執行本文所描述的方法的任何計算機系統或其它裝置都適于執行在此描述的功能。
硬件和軟件的典型結合可以是具有計算機程序(當程序被下載并執行時,可控制計算機系統使之可以執行在此描述的方法)的通用計算機系統。本發明還可嵌入到計算機程序產品中,該產品包括所有能夠實現在此描述的方法的特征,并且當它被載入到計算機系統之后,就能夠執行這些方法。
在本內容中的計算機程序或應用是指一套指令可以任何語言、代碼或注釋的任何表達式,該指令旨在使得具有信息處理能力的系統直接執行特定的功能或在下面一個或兩個功能之后執行特定功能a)到另一種語言、代碼或注釋的變換;b)在不同實質形式中的重現。顯著地,本發明可以嵌入到其它的特定形式中而脫離其精神和基本屬性,并且因此可參考下述權利要求,而非前述說明書來指示本發明的范圍。
權利要求
1.一種垃圾傳真過濾器,包括傳真變換處理器,被配置成將光柵化傳真圖像變換成傳真圖像的非光柵化表達;傳真特征的資料庫,包括從垃圾特征和非垃圾特征所構成的組中選擇的至少一個傳真特征;以及比較器,被配置成將由所述傳真變換處理器所產生的傳真圖像的非光柵化表達與所述傳真特征的至少之一作比較,以用垃圾傳真過濾器檢測垃圾傳真。
2.如權利要求1所述的垃圾傳真過濾器,其特征在于,所述資料庫包括從由多個傳真傳送頁面、傳真圖像強度以及傳真圖像圖案所組成的組中選擇的各個傳真特征。
3.如權利要求1所述的垃圾傳真過濾器,還包括光學字符識別處理器,它與所述傳真變換處理器相耦合并被配置成將所述光柵化傳真圖像轉換成所述光柵化傳真圖像的文本式表達。
4.如權利要求1所述的垃圾傳真過濾器,還包括邊緣銳化過濾器,它與所述傳真變換處理器相耦合并被配置成產生所述光柵化傳真圖像的中間影像,所述中間影像包括具有限定所述光柵化傳真圖像的強化邊緣的圖像;以及用于對所述中間影像中的所述強化邊緣計算一組向量的裝置。
5.如權利要求1所述的垃圾傳真過濾器,還包括與所述傳真變換處理器相耦合的模糊過濾器;以及穩健散列處理器,被配置成產生所述光柵化傳真圖像的模糊形式的穩健散列值穩健散列。
6.如權利要求1所述的垃圾傳真過濾器,還包括檢測在所述光柵化傳真圖像的某一區域中選擇的像素的色彩值的裝置;以及用表明單個光柵化傳真圖像中的多個黑像素和所述單個光柵化傳真圖像中的多個白像素的至少一個數字值對所述各個光柵化傳真圖像的每一個進行數字編碼的裝置。
7.一種過濾垃圾傳真的方法,所述方法包括如下步驟將候選傳真圖像的光柵化形式變換成非光柵化形式;對照從由垃圾特征和非垃圾特征所構成的組中選擇的至少一個傳真特征,來測試所述候選傳真圖像的非光柵化形式;以及當所述候選傳真圖像順利地測試為與所述傳真特征的至少之一相違背時,則將所述候選傳真圖像標識為垃圾傳真。
8.如權利要求7所述的方法,其特征在于,所述變換步驟包括用光學字符識別處理器處理所述候選傳真圖像以將所述候選傳真圖像轉換成文本的步驟。
9.如權利要求7所述的方法,其特征在于,所述變換步驟包括如下步驟強化所述候選傳真圖像中的邊緣;以及對所述已強化邊緣計算一組向量。
10.如權利要求7所述的方法,其特征在于,所述變換步驟包括如下步驟使所述候選傳真圖像模糊;以及對所述已模糊的候選傳真圖像產生穩健散列值。
11.如權利要求7所述的方法,其特征在于,所述變換步驟包括如下步驟檢測在所述候選傳真圖像的某一區域中選擇的像素的色彩值;以及用表明單個光柵化傳真圖像的多個黑像素和所述單個光柵化傳真圖像中的多個白像素的至少一個數字值,對所述光柵化傳真圖像進行數字編碼。
12.如權利要求7所述的方法,其特征在于,所述測試步驟包括如下步驟將所選擇的所述特征應用于所述候選傳真圖像的所述非光柵化形式以產生測試結果;加權所選擇的所述測試結果;以及集合所述加權測試結果以產生所述測試的結果。
13.如權利要求7所述的方法,還包括如下步驟建立每個所述特征的閾值,在這些閾值上所述候選圖像被評分為已顯示每個所述特征;加權超過所述閾值的相應分值的每個評分;以及將所述加權評分相加以產生所述測試步驟的結果。
14.一種具有存儲其上的用于過濾垃圾傳真的計算機程序的機器可讀存儲,所述計算機程序包括使所述機器執行如下步驟的指令例程集將候選傳真圖像的光柵化形式變換成非光柵化形式;對照從由垃圾特征和非垃圾特征構成的組中選擇的至少一個傳真特征,來測試所述候選傳真圖像的非光柵化形式;以及當所述候選傳真圖像順利地測試為與所述傳真特征的至少之一相違背時,則將所述候選傳真圖像標識為垃圾傳真。
15.如權利要求14所述的機器可讀存儲,其特征在于,所述變換步驟包括用光學字符識別處理器處理所述候選傳真圖像以將所述候選傳真圖像轉換成文本的步驟。
16.如權利要求14所述的機器可讀存儲,其特征在于,所述變換步驟包括如下步驟強化所述候選傳真圖像中的邊緣;以及對所述已強化邊緣計算一組向量。
17.如權利要求14所述的機器可讀存儲,其特征在于,所述變換步驟包括如下步驟使所述候選傳真圖像模糊;以及對所述已模糊的候選傳真圖像產生穩健散列值。
18.如權利要求14所述的機器可讀存儲,其特征在于,所述變換步驟包括如下步驟檢測在所述候選傳真圖像的某一區域中選擇的像素的色彩值;以及用表明單個光柵化傳真圖像的多個黑像素以及所述單個光柵化傳真圖像中的多個白像素的至少一個數字值,對所述候選傳真圖像進行數字編碼。
19.如權利要求14所述的機器可讀存儲,其特征在于,所述測試步驟包括如下步驟將所選擇的所述特征應用于所述候選傳真圖像的所述非光柵化形式以產生測試結果;加權所選擇的所述測試結果;以及結合所述加權測試結果以產生所述測試的結果。
20.如權利要求14所述的機器可讀存儲,還包括如下步驟建立每個所述特征的閾值,在這些閾值上所述候選圖像被評分為已顯示每個所述特征;加權超過所述閾值的對應分值的每個評分;以及將所述加權評分相加以產生所述測試步驟的結果。
21.一種過濾垃圾傳真的方法,所述方法包括如下步驟對照已知垃圾傳真的特征,測試候選傳真圖像的非光柵化形式;以及當所述候選傳真圖像順利地測試為與所述已知垃圾傳真的所述特征的至少之一相符時,則將所述候選傳真圖像標識為垃圾傳真。
22.一種過濾垃圾傳真的方法,所述方法包括如下步驟對照已知垃圾傳真的特征,測試候選傳真圖像的非光柵化形式;以及當所述候選傳真圖像順利地測試為與所述已知垃圾傳真的所述特征的至少之一不相符時,則將所述候選傳真圖像標識為合法傳真。
23.一種過濾垃圾傳真的方法,所述方法包括如下步驟對照已知垃圾傳真的特征,測試候選傳真圖像的非光柵化形式;以及當所述候選傳真圖像順利地測試為與已知垃圾傳真的所述特征的至少之一相符時,則向所述候選傳真圖像賦予所述候選傳真圖像是垃圾傳真的概率。
全文摘要
依照本發明配置的垃圾傳真過濾器包括配置成將光柵化傳真圖像變換成傳真圖像的非光柵化表達的傳真變換處理器。垃圾傳真過濾器還包括已知垃圾特征的資料庫。最后,該垃圾傳真過濾器還包括比較器,它配置成將由傳真變換處理器所產生的傳真圖像的非光柵化表達與資料庫中的特征相比,以便垃圾傳真過濾器檢測出垃圾傳真。
文檔編號G06F15/00GK1918894SQ200480026222
公開日2007年2月21日 申請日期2004年8月8日 優先權日2003年8月8日
發明者A·艾爾-賈茲阿, W·哈特姆特, A·普恩特, A·諾拉斯科 申請人:弗奈利股份有限公司