本發(fā)明涉及信號及參數(shù)估計領(lǐng)域,具體涉及一種利用噪聲提高穩(wěn)健估計量性能的方法。
背景技術(shù):
在信號估計及檢測問題中,我們常常假設(shè)總體服從某一種或某一類分布,在這個基礎(chǔ)上選定最優(yōu)的準(zhǔn)則設(shè)計相應(yīng)的估計量及檢驗統(tǒng)計量。但實際上,在測量活動中由于脈沖噪聲的影響會導(dǎo)致接收或者觀測到的數(shù)據(jù)中產(chǎn)生異常值。例如在室外無線移動通信信道中,會受到電力線路中切換開關(guān)的瞬態(tài)噪聲或者汽車點火的脈沖噪聲干擾;在雷達(dá)和聲吶系統(tǒng)中,受到自然的或者人造的電磁和聲波的脈沖干擾;在地理位置估計與跟蹤時,常因為建筑物和樹木等的障礙,導(dǎo)致測量數(shù)據(jù)中產(chǎn)生異常值。在信號估計中,這樣的脈沖噪聲使得大量的觀測數(shù)據(jù)存在部分“異常數(shù)據(jù)”,使得假設(shè)的理想分布模型產(chǎn)生偏差,在這樣的情況下,最優(yōu)準(zhǔn)則下的估計量難以實現(xiàn),并且傳統(tǒng)的統(tǒng)計方法受個別異常數(shù)據(jù)的影響較大,穩(wěn)健估計技術(shù)正式在這種背景下產(chǎn)生。穩(wěn)健的估計量要求:在假定的觀測分布模型下,估值應(yīng)與經(jīng)典估計的相同,或有微小的差別;當(dāng)假設(shè)的分布模型與實際的理論分布模型有較小差異時,其估值仍應(yīng)是接近最優(yōu)的;即使假定模型與實際模型有較大偏差,估值也是可用的。因此,穩(wěn)健估計追求的是從實際出發(fā)的有效估計。為了進(jìn)一步提高穩(wěn)健估計量的性能,利用噪聲特性提高估計性能是本發(fā)明的主要技術(shù)思路。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是如何克服現(xiàn)有技術(shù)的不足,提供一種利用噪聲提高穩(wěn)健估計量的性能的方法。
為實現(xiàn)上述目的采用的技術(shù)方案是:在含異常數(shù)據(jù)的樣本中加入隨機噪聲,能夠提高穩(wěn)健估計量的性能,其包括以下步驟:
1、初始化參數(shù):記錄含有異常值的樣本觀測數(shù)據(jù)x={x1,x2,...,xn}及其長度n,預(yù)估參考參數(shù)θ。
2、建立位置參數(shù)模型:xi=θ+wi,i=1,2,...,n,wi是具有概率密度函數(shù)為fw的厚尾分布或者污染分布的背景噪聲;
確定噪聲w的分布模型,選擇合適的穩(wěn)健m-估計量
3、假設(shè)噪聲w的分布符合厚尾的對稱分布模型
3.1選擇無偏的穩(wěn)健m-估計量,其對應(yīng)的得分函數(shù)為ψ;
3.2將l個選定的具有得分函數(shù)ψ的m-估計量并聯(lián),構(gòu)成并聯(lián)子系統(tǒng),每個估計單元具有相同的輸入觀測值xi,對輸入觀測值xi中加入獨立同分布的噪聲ηil后,對l個估計量的輸出計算統(tǒng)計平均,建立最終的估計統(tǒng)計量:
3.3此系統(tǒng)估計量的mse指標(biāo)偏差為零,計算此估計量的方差相對于未加噪聲η時的最大似然估計量的方差之比作為估計量的漸近效率:
3.4利用
4、假設(shè)噪聲w是不對稱的污染分布模型,其概率密度函數(shù)定義為:
fw(x)=(1-ε)f0(x;θ)+εq(x),
其中:f0(x)為給定的中心概率密度函數(shù),q(x)為不對稱的污染概率密度函數(shù),污染比例為ε。
4.1選擇有界的得分函數(shù)ψ對應(yīng)的m-估計量,ψ函數(shù)的界為s,設(shè)定樣本長度n足夠大,估計量的mse的方差漸近為零,考慮估計量的最大漸近偏差bε;
4.2在每個觀測數(shù)據(jù)中加入噪聲η后,計算混合噪聲z=w+η的中心概率密度函數(shù)
特別的對于中值估計量(具有得分函數(shù)ψ(x)=sgn(x))的最大漸近偏差為:
4.3最優(yōu)的噪聲水平為dopt=argminbε,在此噪聲水平下可以得到最大漸近偏差的最小值。
本發(fā)明的有益效果是:利用隨機共振相關(guān)理論,在觀測數(shù)據(jù)中加具有特定分布的隨機噪聲,在對稱分布的背景噪聲下,會提高并聯(lián)穩(wěn)健估計系統(tǒng)的漸近效率;在不對稱分布的污染模型背景噪聲下,會有效降低穩(wěn)健估計量的最大漸近偏差,本發(fā)明進(jìn)一步提高了含有異常數(shù)據(jù)下的穩(wěn)健估計量的性能。
附圖說明
圖1是穩(wěn)健估計量并聯(lián)系統(tǒng)示意圖。
圖2是本發(fā)明估計量的漸近效率在不同并聯(lián)陣列數(shù)目下隨噪聲水平的變化曲線圖。
圖3是本發(fā)明在最優(yōu)加性噪聲水平下和不加噪聲情況下估計量的漸近效率隨估計量的參數(shù)的變化曲線圖。
圖4是本發(fā)明估計量的最大漸近偏差隨噪聲水平的變化曲線圖。
具體實施方式
為了進(jìn)一步提高含有異常數(shù)據(jù)情況下的穩(wěn)健估計量的性能,將信號隨機共振的理論,應(yīng)用于信號估計領(lǐng)域,充分利用噪聲而非消除噪聲,通過在觀測數(shù)據(jù)中加噪聲,進(jìn)一步提高穩(wěn)健估計量的性能。這是本發(fā)明的主要技術(shù)思路。
下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)介紹:
利用噪聲提高穩(wěn)健估計的方法,具體步驟如下:
(1)記錄含有異常值的樣本觀測數(shù)據(jù)及其長度n,設(shè)定待估參數(shù)θ,樣本點數(shù)n,建立如下模型
xi=θ+wi,i=1,2,...,n
其中,
wi是相互獨立并具有相同的厚尾分布或者污染分布的背景噪聲,具有概率密度函數(shù)fw。
(2)在fw是對稱分布的假設(shè)下,選擇無偏的m-估計量構(gòu)成如圖1所示的并聯(lián)子系統(tǒng),在每個觀測數(shù)據(jù)xi中加入獨立同分布的噪聲ηil后送到每個單元m-估計器,單元估計器的輸入數(shù)據(jù)變?yōu)椋?/p>
yil=θ+wi+ηil=θ+zil,l=1,2,…,l,i=1,2,…,n。
(3)將所有m-估計量的輸出求和,得到整個系統(tǒng)的估計量:
(4)所加噪聲ηil的概率密度分布fη為對稱分布時,由系統(tǒng)估計量
它是關(guān)于噪聲水平d的函數(shù)。
(5)利用
(6)在噪聲是非對稱分布的假設(shè)下,其概率密度函數(shù)假設(shè)為:
fw(x)=(1-ε)f0(x;θ)+εq(x),
其中:f0(x)為給定的中心概率密度函數(shù),q(x)為非對稱的污染概率密度函數(shù),污染比例為ε。并且樣本長度n足夠大時,選擇有界的得分函數(shù)ψ對應(yīng)的m-估計量,ψ函數(shù)的界為s。
(7)在每個觀測數(shù)據(jù)中加入隨機噪聲η,其具有概率密度fη,計算混合噪聲z=w+η的中心概率密度函數(shù)
(8)通過dopt=argminbε,得到最大漸近偏差具有最小值的最優(yōu)噪聲水平dopt。加入具有最優(yōu)噪聲水平dopt的噪聲,會大大減小估計量的最大漸近偏差。
實驗結(jié)果
(一)背景噪聲為對稱分布
(1)設(shè)定背景噪聲的概率密度函數(shù)為厚尾的柯西分布
這里假設(shè)柯西分布的位置參數(shù)為零,尺度參數(shù)σ=1。選擇m-估計量為bisquare估計量,具有如下的得分函數(shù):
這里選擇估計量的參數(shù)γ=1。
加入噪聲水平為d的對稱均勻分布噪聲ηil后,圖2給出了并聯(lián)系統(tǒng)的估計量的漸近效率
(2)固定并聯(lián)估計量數(shù)量l=1000,圖3給出了在最優(yōu)的均勻分布噪聲水平dopt下,漸近效率
(二)背景噪聲為不對稱分布
(1)假設(shè)背景噪聲為不對稱的污染分布模型,其中主體參數(shù)分布為對稱的高斯混合分布:
污染分布q(x)為點質(zhì)量分布,即
ψ(x)=sgn(x);
(2)加入分叉噪聲
上述實施例只是為了說明本發(fā)明的技術(shù)構(gòu)思及特點,其目的是在于讓本領(lǐng)域內(nèi)的普通技術(shù)人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實施,并不能以此限制本發(fā)明的保護范圍。凡是根據(jù)本發(fā)明內(nèi)容的實質(zhì)所作出的等效的變化或修飾,都應(yīng)涵蓋在本發(fā)明的保護范圍內(nèi)。