專利名稱:一種漢字視力表視標的選擇方法
技術領域:
本發明涉及漢字視力表視標的選擇方法。
背景技術:
視力表是眼科診斷中最重要的工具之一。通過視力的測量一方面可以了解眼部的健康狀況,另一方面可以了解被檢者對日常閱讀文字的分辨能力。目前,在眼科臨床的視力檢查中,作為視力表的視標有文盲E、字母及數字等。在許多以英語為第一語言的國家,英國標準字母和Sloan字母及數字較為通用。在國內則以文盲E為視標的視力表在臨床的視力測試中應用最為廣泛。這些視標設計的基本原理一致每一個筆畫占整個視標高度的1/5,在設計距離,每個筆畫所對應的視角為1弧分;視標的增率采用幾何級數。由于人們獲取信息的最重要方式,是通過閱讀來實現的,用被檢者熟悉的文字來評估視力,則可以直接而充分地了解被檢者閱讀該種文字字體大小的閾值。因而,要獲得被檢者辨認漢字的真正閾值,應該選用漢字作為視標。在以往設計的漢字視力表中,有以下兩類一類漢字視力表的特點是將漢字的筆畫加粗,使每一筆畫占據1/5漢字高度。由于該視標采用了漢字,且包含了撇和捺結構,比文盲E多了斜向筆畫,在一定程度上提高了國內檢測被檢者閱讀漢字字體大小的閾值的精確度。但是,這種經過加工后的漢字視標完全不同于日常讀物中的漢字,所以其檢測結果與實際視力之間不可避免地存在著偏差。另一類是以筆畫數、字頻、字形等因素作為可視性的主要參考因素,但是,據有關研究可知,即使是具有相同筆畫數的漢字,對視覺系統并不一定具有相同的視覺刺激。由于視標之間具有均一的可視性是視力表設計中的重要原則,因此,有必要選擇具有均一可視性的漢字作為同一張漢字視力表的視標。
發明內容
本發明的目的在于為克服現有技術的不足而提供一種漢字視力表視標的選擇方法,通過該方法選擇的漢字視標具有更均一的可視性,使用該方法選擇的漢字視標制作的漢字視力表能夠更加準確地檢測被檢者閱讀漢字字體大小的閾值。
為了實現上述目的,本發明公開了一種漢字視力表視標的選擇方法,其特征在于包含以下步驟 1)從常用的、筆畫數段最集中漢字中選取足夠個數的漢字; 2)將所選漢字用圖像處理軟件保存為統一的圖片格式; 3)分析每個漢字的空間頻率成分,并將其結果表示為不同空間頻率成分的二維分布,即頻譜能量分布圖; 4)對所有被上述初選漢字的各空間頻率的頻譜能量求均值,以此作為參照值,采用聚類分析將漢字圖像進行聚類,從中選取與頻譜能量均值相似的一組漢字; 5)從上一步驟選出的漢字中選取同時具備橫向、垂直、斜向和弧形的筆畫的漢字作為漢字視力表視標。
與現有技術相比較,本發明的有益效果是由于漢字屬于表意文字,具有文字和圖像雙重特性,因而,漢字識別服從圖形辨認的一般規律。現代視覺研究表明,人眼視覺系統對視覺圖形信息的處理具有空間頻率(即視標粗密程度)通道分析特征,這些“通道”具有帶通濾波特性,即每個通道只對空間頻率中某一特定頻段有最佳反應。而通道的選擇是自下而上地由圖像的信號來決定,并非由觀察者自上而下地進行選擇。也就是說,圖形的空間頻率是決定視覺信息處理的重要變量。在應用光學中,空間頻率是指每毫米所具有的光柵數,單位為線/毫米。在視覺研究領域中,它是指單位視角內明暗條紋重復出現的周期數,或正弦狀濃淡變化的重復次數,單位周/度(cyclesper degree of visual angle,cpd)。一般而言,漢字字體大小相同時,筆畫數越多,其空間頻率越高;而筆畫數相同時,字體大小越小,其空間頻率越高,即使是字體大小相同,具有相同筆畫數的漢字,其空間頻率特性未必相同,因此,具有相同筆畫數的漢字對視覺系統并不一定具有相同的視覺刺激,而在本發明的漢字視力表視標的選擇方法中,除了考慮筆畫數、字頻、字形等因素外,還通過對漢字圖像進行空間頻率成分分析,從中選擇出各空間頻率的頻譜能量均值相似的漢字作為視標,更符合人眼視覺系統對漢字識別、辨認的一般規律,因此較以往漢字視標選擇的方法更客觀、科學,通過該方法選擇漢字字標的漢字視力表能夠更加準確地檢測被檢者辨認漢字大小的閾值。
下面將結合附圖及具體實施例對本發明做進一步詳細說明。
圖1(a)是八畫漢字中“杯”字的BMP圖片; 圖1(b)是“杯”字的頻譜能量分布圖; 圖1(c)是“杯”字的各空間頻率成分的一維分布圖; 圖2是所選的40個中筆畫漢字的各空間頻率的頻譜能量均值圖; 圖3是漢字圖像的相似性及相互關系圖(注歐式距離=圖中的數字*1013); 圖4為4張漢字圖像的各空間頻率成分的一維分布圖; 圖5為A組10個漢字視標的字體大小-辨認準確率擬合曲線; 圖6為A組頻譜能量均值圖,誤差線代表標準差; 圖7為B組10個漢字視標的頻譜能量均值圖,誤差線代表標準差; 圖8為A、B兩組漢字閾值大小的均值圖,誤差線代表標準差。
圖9為兩對比度漢字近視力表(少筆畫); 圖10為兩對比度漢字近視力表(中筆畫);
具體實施例方式 根據統計,常用漢字中筆畫數絕大部分集中在7-9畫,即集中在中筆畫范圍,本實施例中從2500個常用漢字中選出該筆畫數段中所有的漢字共計172個。鑒于每個漢字視標的選擇過程相同,在本具體實施例中僅以8畫中筆畫數漢字“杯”為例。如圖1所示,首先將“杯”字保存為統一的圖片格式,即同樣大小的圖片,字面在圖片中所占面積的大小相同,可以通過Adobe Photoshop7.1或其他圖像處理軟件將漢字保存為BMP或其他格式,如jpg格式等,(字的大小為300×300pixels,圖片大小為900X900 pixels)(圖1a),然后,導入圖像,用二維矩陣z=f(x,y)表示圖像的灰度,再采用快速傅立葉變換算法對圖像進行傅立葉變換,使圖像從灰度分布空間變換到頻率分布空間,輸出圖像的頻率分布圖及數據,并將其結果表示為不同空間頻率成分的二維分布,即頻譜能量分布圖(1b),所謂的“頻譜能量”是指在不同空間頻率下所含成分強度的相對分布,頻譜能量分布圖上我們看到的明暗不一的亮點,實際上圖像上某一點與鄰域點差異的強弱,即梯度的大小,也即該點的頻率的大小,可以這么理解,圖像中的低頻部分指低梯度的點,高頻部分相反。圖中白色程度代表能量分布,即越白表示能量越強,表明了該漢字在該區空間頻率下的成分越多,圖1b則表示在水平方向有更多的空間頻率成分。上述空間頻率成分分析過程可以采用利用傅里葉頻譜分析原理開發的MATLAB程序在計算機上進行;接著對所有具有相同空間頻率不同方位的成分取均值,并得到各空間頻率成分的一維分布圖1(c)。圖中表示在1.65和1.98cpl頻率段具有較高的能量分布。按上述過程和方式對其余的初選漢字進行空間頻率成分分析,然后分別對所有的初選漢字的各空間頻率的頻譜能量求均值,如圖2所示,以此作為參照值,采用聚類分析將漢字圖像進行聚類。在聚類分析中,最常用的就是距離的相似性,其中,比較常用的是歐式距離平方和歐式距離(Euclidean distance)。因為歐氏距離可以比較好地描述知覺過程中的心理相似性,因此我們把漢字圖像灰度矩陣間的歐氏距離作為度量相似性的指標。兩個圖像灰度矩陣間的歐式距離定義如下 如果xi和yi數值接近,相似程度高,歐氏距離就比較小;如果它們數值相差大,相似程度低,則歐氏距離會比較大。以圖3中的4幅漢字圖像為例,各圖像間的歐式距離如圖4所示,“府”、“揮”和“禿”三者之間的歐式距離小,它們各自和“順”之間的歐式距離大。通過聚類分析后,從中選取與各空間頻率的頻譜能量均值相似的一組漢字40個。由于理想的視標應該同時具備橫向、垂直、斜向和弧形的筆畫,因此,在上漢字中選擇出盡可能同時包含橫、豎、撇、捺和弧形結構(至少包含橫、豎、撇和弧形結構或包含橫、豎、捺和弧形結構)的漢字作為漢字視力表的備選視標,共20個,即覺、孩、鄭、怪、秀、際、構、擾、怎、轉、腎、炊、擇、染、秋、賀、軟、祝、項、保。圖10為選用其中十個漢字視標制作的兩對比度漢字近視力表(中筆畫)。
為了適合少年兒童使用,適應他們的識字水平,可以選用筆畫數較少(少筆畫)的漢字作為漢字視標,如筆畫數段集中在2-4畫的漢字,通過上述相同的方法和步驟,最后選出“文、毛、又、五、尺、才、天、長、木、片、衛、不、斤、欠、萬、勻、友、刀、父、月”等20個漢字作為漢字視力表的備選視標。圖9為選用其中十個漢字視標制作的兩對比度漢字近視力表(少筆畫)。
下面將用經過本方法選出的漢字視力表視標與現有的漢字閱讀視力表視標做比較,對比兩組各自視標之間的可視性。其中A組視標是通過經過本方法選出的各空間頻率所對應的頻譜能量相似的10個漢字(孩、鄭、怪、構、腎、擇、染、秋、軟、祝);B組是從現有的漢字閱讀視力表中隨機取得的10個漢字(四、九、老、年、你、走、把、我、請、因)。通過比較每組漢字的頻譜能量和閾值大小驗證組內漢字圖像各空間頻率所對應的頻譜能量的差異對漢字間閾值大小的影響,說明作為同一張漢字視力表的視標具有相似空間頻率特性的重要性。
比較方法 分別將A組和B組的10個視標進行傅里葉頻譜分析,獲取每組漢字各空間頻率所對應的頻譜能量均值和標準差。
分別以所選的A組和B組的10個漢字視標的平均視敏度閾值為參考值,將每個漢字制作6種字體大小的漢字圖片。呈現順序為從字體小到大呈現,每種字體大小中每個字分別呈現10次。被試者坐在距離顯示器3m處,讓其盡量辨認屏幕上出現的每個漢字,待被試說出所看到的漢字后即切換到下一張漢字圖片,實驗中予適當休息。實驗結束后統計每個漢字圖片在不同字體大小時的辨認準確率,每個漢字辨認準確率=說對的個數×100%/10。
選28名被試者對每個字不同字體大小時的辨認準確率的平均值,并用心理物理學研究常用的韋伯函數(Weibull function)進行擬合,得到字體大小——辨認正確率曲線。其擬合方程為P=1-(1-γ)e-(x/tb)β,P指的是辨認正確率,γ是猜測可能率(因為被試者未被告知被測的字是哪些字,且漢字總體數目龐大,故其猜測可能性近似于0),x代表的是視標的大小(以其整體高度所對應的視角來表示,單位分),β是擬合后所得心理物理學曲線的斜率,tb是指在曲線上臨界正確率63.2%(當x=tb時所得的P值)所對應的視標大小。漢字擬合曲線見圖5。從tb值的含義可知tb值越大,則欲達到相同的辨認準確率所需要的視標越大,即該字的易讀性越小,反之亦然。通過上述擬合函數獲取A組和B組的每個漢字的閾值大小,閾值大小定義為每個漢字被辨認的正確率為63.2%時所對應的視標大小,字體大小以point(pt)表示。
A、B兩組各空間頻率所對應的頻譜能量的標準差采用配對t檢驗。
比較結果如下 1、A組10個漢字各空間頻率的頻譜能量的標準差見表1和圖6; 表1.A組10個漢字的頻譜能量均值和標準差
B組10個漢字各空間頻率的頻譜能量的標準差表見表2和圖7。
表2B組10個漢字各空間頻率成分所對應的頻譜能量均值和標準差
由上兩表數據可知,A組的標準差比B組的小,兩者之間差異有統計學意義(t(13)=3.194,p<0.01)。
2、A組和B組漢字的閾值大小和標準差見表3; 表3.A組和B組漢字的閾值大小
A、B兩組均值和標準差見圖8。
由以上圖表可知,A組10個漢字間的各空間頻率的頻譜能量分布相似,說明A組所有漢字對視覺系統具有相似的視覺刺激;而B組10個漢字各空間頻率的頻譜能量標準差大,說明B組10個漢字對視覺系統具有不同的刺激。通過漢字認知的心理物理學測試發現A組漢字間具有非常相似可視性;而B組漢字間可視性的相似性低。這說明漢字視標間具有相似空間頻率特性是保證視標之間具有相似可視性的重要因素。因此,通過漢字圖像的傅里葉頻譜分析,以漢字圖像的各空間頻率的頻譜能量相似作為篩選視標的主要原則,不僅反映了視覺的生理特點,而且符合了視覺系統具有的傅里葉頻譜分析特性。因此,這個方法應用于漢字視標的篩選具有重要的意義。
權利要求
1、一種漢字視力表視標的選擇方法,其特征在于包含以下步驟
1)從常用的、筆畫數段最集中漢字中選取足夠個數的漢字;
2)將所選漢字用圖像處理軟件保存為統一的圖片格式;
3)分析每個漢字的空間頻率成分,并將其結果表示為不同空間頻率成分的二維分布,即頻譜能量分布4)對所有被上述初選漢字的各空間頻率的頻譜能量求均值,以此作為參照值,采用聚類分析將漢字圖像進行聚類,從中選取與頻譜能量均值相似的一組漢字;
5)從上一步驟選出的漢字中選取同時具備橫向、垂直、斜向和弧形的筆畫的漢字作為漢字視力表視標。
全文摘要
本發明涉及漢字視力表視標的選擇方法。本方法通過先將漢字轉化為圖片格式后進行空間頻率成分分析,然后對各空間頻率的頻譜能量求均值,并采用聚類分析將漢字圖像進行聚類,選取與頻譜能量均值相似的一組漢字,從中選取同時具備橫向、垂直、斜向和弧形的筆畫的漢字作為漢字視力表視標。在本發明的漢字視力表視標的選擇方法中,除了考慮筆畫數、字頻、字形等因素外,還通過對漢字圖像進行空間頻率成分分析,從中選擇出各空間頻率的頻譜能量均值相似的漢字作為視標,更符合人眼視覺系統對漢字識別、辨認的一般規律,使用該方法選擇的漢字視標制作的漢字視力表能夠更加準確地檢測被檢者閱讀漢字字體大小的閾值。
文檔編號A61B3/02GK101313843SQ20081006312
公開日2008年12月3日 申請日期2008年7月11日 優先權日2008年7月11日
發明者王晨曉, 賀極蒼, 帆 呂, 佳 瞿 申請人:溫州醫學院眼視光研究院