基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法
【專利摘要】本發(fā)明所涉及的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,從動態(tài)系統(tǒng)隨時間進行而產(chǎn)生的實時狀態(tài)數(shù)據(jù)中選取正常狀態(tài)時的數(shù)據(jù);基于相似性距離排序方法對正常狀態(tài)樣本數(shù)據(jù)進行排序,并選取符合條件的樣本數(shù)據(jù)組成正常狀態(tài)樣本數(shù)據(jù)庫;將動態(tài)系統(tǒng)中任一時間點產(chǎn)生的一組數(shù)據(jù)與樣本庫中的每一個樣本進行相似性計算,產(chǎn)生一組相似權(quán)重值;根據(jù)相似權(quán)重值及系統(tǒng)狀態(tài)確定規(guī)則,評估在此時間點該系統(tǒng)的狀態(tài)。在實時狀態(tài)數(shù)據(jù)中,選取樣本數(shù)量在狀態(tài)向量變量數(shù)的3倍至4倍區(qū)間;其中所述狀態(tài)向量變量數(shù)為需要監(jiān)測的參數(shù)點的數(shù)據(jù),如此確定的樣本數(shù)量可以使相似性建模評估系統(tǒng)狀態(tài)時,魯棒性靈敏度相對折中,評估值準確性高。
【專利說明】基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識別、軟件開發(fā)領(lǐng)域,主要應(yīng)用于發(fā)電站、化工工業(yè)等監(jiān)控預(yù)警領(lǐng)域。
【背景技術(shù)】
[0002]隨著20世紀40年代計算機的出現(xiàn)以及50年代人工智能的興起,人們希望用計算機來代替或擴展人類的部分腦力勞動。
[0003]伴隨著各種隨身設(shè)備、互聯(lián)網(wǎng)和云計算、云存儲等技術(shù)的發(fā)展,在工廠設(shè)備的計算機自動監(jiān)控系統(tǒng)中,所有的數(shù)據(jù)都可以被記錄,包括設(shè)備本身的技術(shù)數(shù)據(jù)、設(shè)備運行的軌跡數(shù)據(jù)、設(shè)備工作時的環(huán)境數(shù)據(jù)等,數(shù)據(jù)的收集呈現(xiàn)出大爆炸的狀態(tài)。如何挖掘利用這些海量的數(shù)據(jù),面臨著技術(shù)上的挑戰(zhàn)。
[0004]從使用的角度來看,大數(shù)據(jù)還面臨其他因素的挑戰(zhàn)。由于各種數(shù)據(jù)的準確性不能夠直觀地得出,會導(dǎo)致數(shù)據(jù)價值大大降低。在工業(yè)設(shè)備實時數(shù)據(jù)采集的過程中,一些無法確定的因素也影響了數(shù)據(jù)的準確性。
[0005]由此計算機模式識別在20世紀60年代初迅速發(fā)展并成為一門新學科。模式識別(Pattern Recognition)是指對表征事物或現(xiàn)象的各種形式(數(shù)值、文字和邏輯關(guān)系)的信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。模式識別又常稱作模式分類,從處理問題的性質(zhì)和解決問題的方法等角度,模式識別分為有監(jiān)督的分類(Supervised Classification)和無監(jiān)督的分類(Unsupervised Classification)兩種。二者的主要差別在于,各實驗樣本所屬的類別是否預(yù)先已知。一般說來,有監(jiān)督的分類往往需要提供大量已知類別的樣本,但在實際操作過程中,存在一定困難的。
[0006]當模式識別、大數(shù)據(jù)處理等技術(shù)主要應(yīng)用于發(fā)電站、化工工業(yè)等監(jiān)控預(yù)警領(lǐng)域時,樣本數(shù)量的大小將會直接影響模型對實時系統(tǒng)評估的魯棒性,同時對模型估計的精確度、靈敏度也有相當?shù)挠绊?,因此對于樣本如何壓縮提取,很多方法難以在顧及魯棒性的同時考慮模型的精確度、靈敏度。
【發(fā)明內(nèi)容】
[0007]為解決上述問題,本發(fā)明公開一種基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,即從動態(tài)系統(tǒng)隨時間進行而產(chǎn)生的實時狀態(tài)數(shù)據(jù)中選取正常狀態(tài)時的數(shù)據(jù);基于相似性距離排序方法對正常狀態(tài)樣本數(shù)據(jù)進行排序,并選取符合條件的樣本數(shù)據(jù)組成正常狀態(tài)樣本數(shù)據(jù)庫;將動態(tài)系統(tǒng)中任一時間點產(chǎn)生的一組數(shù)據(jù)與樣本庫中的每一個樣本進行相似性計算,產(chǎn)生一組相似權(quán)重值;根據(jù)相似權(quán)重值及系統(tǒng)狀態(tài)確定規(guī)則,評估在此時間點該系統(tǒng)的狀態(tài)。
[0008]一般從實際情況取出的正常狀態(tài)樣本數(shù)量N,比建立狀態(tài)樣本數(shù)據(jù)庫所需要的樣本數(shù)量M多很多,因而選取數(shù)據(jù)的方案對最后系統(tǒng)狀態(tài)評估有很大的影響,故本發(fā)明涉及的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,根據(jù)魯棒性、精確性的要求確定模型中正常狀態(tài)下的樣本數(shù)量。
[0009]本發(fā)明所涉及的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,采用以下步驟來解決【背景技術(shù)】中存在的技術(shù)問題:
1、確定取數(shù)的數(shù)量。在實時狀態(tài)數(shù)據(jù)中,選取樣本數(shù)量在狀態(tài)向量變量數(shù)的3倍至4倍區(qū)間;其中所述狀態(tài)向量變量數(shù)為需要監(jiān)測的參數(shù)點的數(shù)據(jù),如此確定的樣本數(shù)量可以使相似性建模評估系統(tǒng)狀態(tài)時,魯棒性靈敏度相對折中,評估值準確性高。
[0010]2、由于樣本空間中每一變量數(shù)量級不同,變化范圍也不同,所以要將樣本向量進行歸一化處理。比如將向量x=[,,...]中各數(shù)值進行歸一化,歸一化后的值重新賦值給X,χ=[,,…]。數(shù)據(jù)歸一化處理方式有:
(1)、可以將每一變量的所有值相加,將此和值作為I處理,每一變量歸一化后的值為該值除以和值。
[0011]
【權(quán)利要求】
1.一種基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,從動態(tài)系統(tǒng)隨時間進行而產(chǎn)生的實時狀態(tài)數(shù)據(jù)中選取正常狀態(tài)時的數(shù)據(jù);基于相似性距離排序方法對正常狀態(tài)樣本數(shù)據(jù)進行排序,并選取符合條件的樣本數(shù)據(jù)組成正常狀態(tài)樣本數(shù)據(jù)庫;其特征在于:將動態(tài)系統(tǒng)中任一時間點產(chǎn)生的一組數(shù)據(jù)與樣本庫中的每一個樣本進行相似性計算,產(chǎn)生一組相似權(quán)重值;根據(jù)相似權(quán)重值及系統(tǒng)狀態(tài)確定規(guī)則,評估在此時間點該系統(tǒng)的狀態(tài)。
2.如權(quán)利要求1所述的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,其特征在于:在實時狀態(tài)數(shù)據(jù)中,選取正常狀態(tài)時的數(shù)據(jù),數(shù)量在狀態(tài)向量變量數(shù)的3倍至4倍區(qū)間;其中所述狀態(tài)向量變量數(shù)為需要監(jiān)測的參數(shù)點的數(shù)據(jù)。
3.如權(quán)利要求1所述的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,其特征在于:樣本向量依據(jù)相似性大小排序后,取第一個與最后一個樣本向量作為正常狀態(tài)數(shù)據(jù)庫的兩個向量;其中所述狀態(tài)向量變量數(shù)為需要監(jiān)測的參數(shù)點的數(shù)據(jù); 在剩下N-2個向量中,取(M-2)個樣本向量即為狀態(tài)數(shù)據(jù)庫中剩下的數(shù)據(jù),方法為:設(shè)m為(N-2) / (M-2)的整數(shù)部分,從第一個數(shù)開始,取第m+1,2m+l...個樣本向量,取至第(M-2) *m+l個樣本向量,總共M個樣本向量組成正常狀態(tài)樣本數(shù)據(jù)庫。
4.如權(quán)利要求1所述的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,其特征在于:樣本向量相似性距離計算方式包括
5.如權(quán)利要求1所述的基于樣本相似性排序建模實時評估系統(tǒng)狀態(tài)的方法,其特征在于:將樣本向量進行歸一化處理;歸一化的處理方式包括: 將每一變量的所有值相加,將此和值作為I處理,每一變量歸一化后的值為該值除以和值:
【文檔編號】G06Q10/04GK103440537SQ201310407396
【公開日】2013年12月11日 申請日期:2013年9月10日 優(yōu)先權(quán)日:2013年9月10日
【發(fā)明者】周偉寧, 陳言, 羅林發(fā) 申請人:上海白丁電子科技有限公司