專利名稱:一種基于灰色理論的乏信息測量數據粗大誤差判別方法
技術領域:
本發明屬于計量測試領域,具體涉及一種基于灰色理論的乏信息測量數據粗大誤差判別方法,該方法涉及到數據建模、數據處理、粗大誤差剔除等方面,用于測量數據誤差處理,適用于數據樣本量小,分布不確定的粗大誤差判別。
背景技術:
在測量過程中,不可避免的存在誤差。粗大誤差又稱粗差,指在同一測量條件下多次測量同一量值時,其中的最大值或最小值等個別數據明顯偏離它所屬樣本的其他數據,超出在規定條件下預期的誤差。含有粗大誤差的測量值稱為異常值,也稱離群值和壞值。粗大誤差產生的原因可能是人員操作、讀數或記錄時的過失,以及數據復制和計算處理是 所出現的過失和錯誤,也可能是采樣環境的變化的部分數據與原先樣本的模型不符合造成的。在進行數據處理過程中,如果將正常數據當作異常值予以剔除,會減少有用的信息,會造成測量精度偏高的假象;反之,如果對混有異常值的數據未加剔除,必然造成測量數據結果與實際不符合。因此在測量過程中,一旦發現異常值就應該在記錄中予以剔除,對測量數據中異常值的合理判斷和處理,是獲得正確測量結果的一個重要前提條件。通常,異常值剔除多采用以下兩類方法第一類方法是采用統計方法,按一定的準則判別而剔除會歪曲測量結果的異常數據;第二類,則采用可避免或抑制異常值影響的測量結果及其不確定度的穩健估計。基于統計學理論的集中常用粗大誤差統計判別準則主要包括奈爾(Nair)準則、格拉布斯(Grubbs)準則、3 σ準則、Dixon準則。在實際的測量過程中,粗大誤差的判別是非常重要和復雜的。例如,在一些破壞性實驗中,不僅測量數據少,而且其概率分布通常是未知的。在這種情況下,用經典統計學的方法研究問題是相當困難的。針對這種小樣本數據提出了新的解決方法,如王中宇等提出利用灰色累加方法確定一個包羅區域,王廣林在此基礎上改進算法。柯宏發提出了基于GM(1,1)精度檢驗的粗大誤差剔除方法。李登輝研究了基于測量信息論的小樣本數據粗大誤差剔除方法。吳維勇將小波理論應用到了數據粗大誤差處理方面。
發明內容
本發明的目的在于提供一種基于灰色理論的乏信息測量數據粗大誤差判別方法,它針對測量數據樣本量較少,數據分布不明確的特點,構建了一種描述少數據的模型,根據相應的判定法則,實現粗大誤差的判別。本發明采用的技術方案如下一種基于灰色理論的乏信息測量數據粗大誤差判別方法,其特征在于該方法包括如下步驟步驟一、將采集到的乏信息測量數據序列進行預處理,按由小到大排序;步驟二、利用灰色累加方法得到乏信息測量數據灰色包羅線;步驟三、采用灰色判別法則判定測量數據是否含粗大誤差;步驟四、利用灰色GM(1,I)動態模型獲取乏信息測量數據預測值;
步驟五、重復步驟二、三、四,直至測量數據中粗大誤差全部被判別。其中,步驟二所述的灰色包羅線的獲取,具體實現過程如下首先將η個測量數據從小到大排序,其序列為χ(0)= {χ(0) (1),χ(0) (2),…,χ(0) (η),...} (I)對Χ(°)作累加生成,得到測得值累加數列χ(1)x(l)(k) = f^xm(i) (k = l,2,-,n)(2)
=1測得值累加曲線以兩條曲線來包羅,由于測量數據的中值最有可能是最大距離值Amax,取測量次數的中值P作為下包絡曲線的轉折點;另外考慮測量數據有一定程度的變··化,將最大距離值Λ max增加h倍,取常數h為3. 75,其中
_ | /2當η是偶數時
P {( + I)/2 當η是奇數時(3)下包絡曲線方程為
- Δ
xk - h ~—■ k \< k < ηXiIik) = < _(4)
xk - h 丨!mx {n-l ) ρ < /c < "η-ρ取通過坐標原點(0,0)和測量列累加終點(η,χω (η))的直線為上包絡曲線,該參考直線方程為λ二⑷=丄x(1)(n)k =[丄X·ν(0)(i)]k = xk (k = I, 2,...,η) (5)
ηη Ι=1式中]f為測量數據的均值。其中,步驟三所述的灰色包羅粗大誤差判別準則,具體實現過程如下該測量數列如果都滿足條件xZ(k) < xn)(k) < xZ(k),I 彡 k 彡 η (6)則認定測量數據中不含有粗大誤差,反之則含有。其中,步驟四所述的灰色GM(1,I)動態模型的建立,具體實現過程如下設升序排列后的數據序列為x(°) = {x(°) (1),x(°) (2),…,χ(0) (η),···},以序列的前η項作為系統的零時刻序列,η為時刻序列長度,構建系統零時刻的灰色模型;零時刻數據序列為X(l(°) = {x0(0)⑴,Χ(ι(°)⑵,…,Χ(ι(°) (η) I,則其對應的一次累加生成序列為x0(1) = {χ0⑴⑴,X0⑴(2),…,x0(1) (n)} (7)式中,== 1,2,-",n,其緊鄰均值生成序列為
i=lz0(1) = {z0(1) (2),z0(1) (3),... ζ0(1) (η)} (8)式中,C)=金(I·/)(幻+ χβ(1吩-l)),k = 2,3,…,n,零時刻灰色微分方程為x0(0) (k)+a0z0⑴(k) = b0(9)由式(9)可得,零時刻灰色微分方程的時間響應序列為
權利要求
1.一種基于灰色理論的乏信息測量數據粗大誤差判別方法,其特征在于該方法包括如下步驟 步驟一、將采集到的乏信息測量數據序列進行預處理,按由小到大排序; 步驟二、利用灰色累加方法得到乏信息測量數據灰色包羅線; 步驟三、采用灰色判別法則判定測量數據是否含粗大誤差; 步驟四、利用灰色GM(1,1)動態模型獲取乏信息測量數據預測值; 步驟五、重復步驟二、三、四,直至測量數據中粗大誤差全部被判別。
2.根據權利要求I所述的一種基于灰色理論的乏信息測量數據粗大誤差判別方法,其特征在于步驟二所述的灰色包羅線的獲取,具體實現過程如下 首先將η個測量數據從小到大排序,其序列為
3.根據權利要求I所述的一種基于灰色理論的乏信息測量數據粗大誤差判別方法,其特征在于步驟三所述的灰色包羅粗大誤差判別準則,具體實現過程如下 該測量數列如果都滿足條件XiIL ⑷ < -V1)⑷ < X1IL (分),I ≤ k≤ η (6) 則認定測量數據中不含有粗大誤差,反之則含有。
4.根據權利要求I所述的一種基于灰色理論的乏信息測量數據粗大誤差判別方法,其特征在于步驟四所述的灰色GM(1,I)動態模型的建立,具體實現過程如下 設升序排列后的數據序列為x(°) = {x(0) (1),x(°) (2),…,x(°) (n),…},以序列的前η項作為系統的零時刻序列,η為時刻序列長度,構建系統零時刻的灰色模型;零時刻數據序列為xQ(°) = Ixtl(°)⑴,xQ(°)⑵,…,xQ(°) (η)},則其對應的一次累加生成序列為 χ0ω = {x0(1) (I),χ0(1) (2),…,χ0ω (η)} (7) 式中,
全文摘要
本發明提供一種基于灰色理論的乏信息測量數據粗大誤差判別方法,該方法的步驟為一、將采集到的乏信息測量數據序列進行預處理,按由小到大排序;二、利用灰色累加方法得到乏信息測量數據灰色包羅線;三、采用灰色判別法則判定測量數據是否含粗大誤差;四、利用灰色GM(1,1)動態模型獲取乏信息測量數據預測值;五、重復步驟二、三、四,直至測量數據中粗大誤差全部被判別。本發明能實現概率分布未知,小樣本量等乏信息特征的測量數據粗大誤差的有效判別,測量數據中粗大誤差的有效剔除,保證了測量結果的準確性。本方法合理簡單,計算簡便,大大提高了計算速度,在快速,在線測量方面具有很好的推廣應用價值。
文檔編號G06F17/10GK102945222SQ201210439870
公開日2013年2月27日 申請日期2012年11月6日 優先權日2012年11月6日
發明者王中宇, 王倩, 王巖慶, 李強 申請人:北京航空航天大學