本發明屬于智能樓宇微網用電技術領域,涉及一種智能樓宇微網用電行為的識別方法。
背景技術:
隨著智能電網的不斷建設和發展,用戶用電數據逐漸積累成大數據,雖然這些用電大數據中看似十分混亂,但是卻隱藏著用戶用電行為方式,并且數據之間也存在著一定聯系。對散亂的海量數據進行挖掘并識別出用戶用電行為類型,可以幫助電網了解用戶的個性化、差異化服務需求,為電網對智能樓宇微網用電負荷調度提供依據和參考,進而促進居民生活節約用電減少費電行為。
目前,一些研究人員將用戶用電負荷分解為基本負荷和季節性負荷,采用基于自適應模糊c均值聚類算法對用戶基本負荷和季節性負荷進行聚類分析,但是在實際應用中某些用戶使用用電總負荷一樣,然而基本負荷和所用設備也不盡相同,進行用戶用電行為不能做到高精度識別分類;另外其他學者采用熵權法計算用戶用電特征信息熵和權重,然后在通過聚類算法對用戶進行聚類分析,但是該方法不能從總體上計算用戶用電行為的概率,在判斷用戶用電行為準確性上存在著不足。
核主元分析法是一種非線性數據處理方法,核主元分析法在主元分析的基礎上借助核函數來完成非線性變換,將原始數據映射到高維線性特征空間,在特征空間中利用主元分析方法進行特征提取。與其他非線性主元分析方法相比,核主元分析法具有標準主元分析簡單的特點,求解過程中沒有非線性優化,只需利用線性代數求解特征值問題,目前已經在入侵檢測、圖像處理、過程監控、故障診斷等領域得到了成功應用。多變量多尺度樣本熵在多變量隨機序列的mmse值在高尺度上急劇下降,而多變量混沌序列在高尺度上仍具有很高的mmse結果,自其提出以來,mmse已在物理、生理等多種領域中獲得應用。模糊c-均值算法,是大數據應用最廣泛的模糊聚類方法之一,該算法的優點是理解簡單,收斂速度快,局部搜索能力強,適用于大型數據集。本發明在模糊c均值聚類模型中引入多變量多尺度樣本熵權的權重,從而提高模型的精確度和降低算法運行時間。
技術實現要素:
針對上述智能樓宇微網用電大數據中用電設備電氣特征參數提取,對用戶用電行為進行識別判定,本發明公開了一種智能樓宇微網用電行為的識別方法,該方法通過對智能樓宇微網用電數據采集終端獲的用電大數據進行家用電器設備負荷特征參數提取,特征分析選擇及權重計算,便可以降低特征維度,從而提高模糊聚類分析模型的精確度和降低算法運行時間,該方法有效的識別出用戶用電行為。
本發明的特點首先是對通過wifi樓宇微網用電數據采集終端獲得用電大數據進行標準化處理,然后對預處理后的數據樣本運用核主元分析法提取各用電器設備的負荷特征參數,不同的用電器設備用電功率、電壓、電流等各不相同并表現出不同的特征。從用電數據樣本中區分各用電設備,具體提取電氣特征參數包括:電壓諧波特征、電流諧波特征、電流諧波畸變率、功率曲線特征、啟動時產生的負荷和啟動時間的特征、溫度、濕度、空氣指數等特征參數;然后利用多變量多尺度樣本熵權方法確定用戶各用電行為特征的環境因素和不同用電設備的貢獻率(即為模糊c-均值聚類的各影響因素的特征權重),最后通過模糊c均值聚類法對獲得的特征數據組進行聚類分析,提高了用戶用電行為識別的準確性和快速性。
本發明的具體通過如下方案實現:
1)通過wifi用戶采集終端模塊獲取智能樓宇微網用電設備用電大數據,主要包括:實時電壓、電壓有效值、實時電流、電流有效值、實時功率、功率因數、啟動電壓和電流、啟動時產生的負荷、啟動時間、用電設備的溫度等大數據;通過各傳感器監測外界環境數據,主要包括:環境溫度、環境濕度、空氣指數、風速、氣壓、用戶用電習慣、用戶生活水平等數據。
2)對上述步驟1)中所獲得的各個用電設備的用電數據進行預處理,并對不同屬性數據構建子陣xi,進而對采集到的用電大數據構建出數據增廣矩陣x(m):
然后按列分解成(n+1)個子陣,即包含n+1個設備的用電數據。
3)運用核主元分析法提取各用電設備特征向量組集t(n),其中特征向量組集矩陣包括電壓、電流、電壓諧波特征、電流諧波特征、電流諧波畸變率、有功功率、無功功功率、功率曲線特征、功率因數、啟動時產生的負荷、啟動時間的特征、溫度、濕度、空氣指數。
核主元分析模型把預處理后的用電數據矩陣x(n)經過核函數一一映射到更高維度的特征空間,在特征空間內對輸入用電數據的各子陣進行線性核主元分析,并提取用電器設備的非線性特征參數,獲取各用電器設備識別能力強的主要特征參數。
4)利用相關性分析模塊對步驟3所得到的特征數據組集采用多變量多尺度樣本熵法計算熵權。
將步驟3)中提取的狀態量的特征參數進行標準化并獲得時間序列向量xm={xm1,xm2,...,xmn,…,xmn},m=1,2,…,m,m代表不同通道獲得的特征狀態量,n為檢測數據的數量。根據尺度因子τ對各特征狀態量時間序列進行粗粒變換,由式(2)得不同尺度的時間序列
式中1≤i≤n/τ,對m個狀態量粗粒化后的時間序列yim進行多維時延嵌入重構,得復合延遲向量:
式中d=[d1,d2,…,dm,…,dm]是嵌入維數向量,λ=[λ1,λ2,…,λm,…,λm]是時間間隔向量用于壓縮監測狀態量的數據,
由式(4)得每一個向量與所有向量
由式(5)計算得不同距離
式中r為兩兩向量之間相似性系數。
根據式(6)計算不同狀態量之間的相似概率
根據式(7)計算得智能微網多通道監測數據的多變量多尺度樣本熵權值為
在一定的智能微網用戶用電行為條件下同一時間的多變量多尺度樣本熵權權重ma越高,該用電行為對應的多通道數據復雜度和相關性越強,進而確定用電行為特征的環境因素和不同用電設備貢獻率。
4)利用多變量多尺度樣本熵權的模糊c-均值聚類算法建立多變量多尺度樣本熵權的模糊c均值聚類模型,根據此模型進行智能樓宇微網用電行為進行分類識別
多變量多尺度樣本熵權的模糊c-均值聚類模型將經過步驟3)核主元分析提取的各用電設備狀態量的特征向量組數據樣本劃分為若干個模糊類,通過多變量多尺度樣本熵權的模糊c-均值聚類模型,根據上述步驟4)求得的多變量多尺度樣本熵權ma確定各影響因素的貢獻率,增加可分性好的屬性權重,并運用模糊c-均值聚類算法得到的最優聚類中心、各個特征屬性的熵值和權重、隸屬度矩陣;通過模糊c均值聚類模型并引入多變量多尺度樣本熵權權重不斷迭代步驟完成對用電行為進行聚類識別。
本發明提出的基于核主元分析和多變量多尺度樣本熵權模糊c-均值聚類的智能樓宇微網用電行為識別方法具有以下優良的效果:
1)通過智能樓宇微網多通道用電信息實時采集平臺獲取各個用電設備用電大數據,充分考慮了多變量因素對用戶用電行為的影響,提高了用戶用電行為識別的準確度。
2)運用核主元分析方法在特征提取方面的優勢,對智能樓宇微網用戶用電行為的影響因素進行處理,并提取各影響因素的特征數據。
3)利用多變量多尺度樣本熵權方法確定用戶各用電行為特征的環境因素和不同用電設備貢獻率,基于上述所求的多變量多尺度樣本熵權貢獻率作為模糊c-均值聚類的各影響因素的特征權重,提高了模糊c-均值聚類結果的準確性和快速性。
附圖說明
圖1是本發明智能樓宇微網用電行為識別方法的結構框圖
圖2是本發明智能樓宇微網用電行為識別方法的原理框圖。
具體實施方式
以下結合附圖和具體實施過程對本發明進一步的說明。
如圖1所示通過智能樓宇微網用電數據采集終端和環境各傳感器監測獲得用電大數據;然后對獲得數據進行預處理(數據整合、數據填充、特征規范化);利用核主元分析法對預處理后的數據樣本提取各用電設備的負荷特征參數,不同的用電器設備用電功率、電壓、電流等各不相同并表現出不同的特征,進而可以從提取的用電數據特征中區分各用電設備;然后利用多變量多尺度樣本熵權方法確定用戶各用電行為特征的環境因素和不同用電設備的貢獻率(即為模糊c-均值聚類的各影響因素的特征權重);最后通過模糊c均值聚類法對獲得的特征數據組進行聚類分析,提高了用戶用電行為識別的準確性和快速性。
如圖2所示本發明的智能樓宇微網用電行為的識別方法的具體實施過程如下:
1)智能樓宇微網用電設備和環境因素的大數據采集
通過wifi用戶采集終端模塊獲取智能樓宇微網用電設備用電大數據,主要包括:實時電壓、電壓有效值、實時電流、電流有效值、實時功率、功率因數、啟動電壓和電流、啟動時產生的負荷、啟動時間、用電設備的溫度等大數據;通過各傳感器監測外界環境數據,主要包括:環境溫度、環境濕度、空氣指數、風速、氣壓、用戶用電習慣、用戶生活水平等數據。
2)針對上述步驟1)獲得的數據進行預處理,主要包括對原始數據中用戶用電若干特征的數據缺失(為空值)或明顯異常的數據(如用電量為負數)進行數據填充;對原始數據進行數據規范化處理。
對各個用電設備的用電數據建立組成子陣xi,進而對采集到的用電設備用電大數據構建出數據增廣矩陣x(m)
然后按列分解成m個子陣,即包含m個設備的用電數據,p為用電設備的狀態量。
3)利用核主元分析法對經步驟2)預處理后的數據提取各用電設備特征向量組集t(k),其中特征向量組集矩陣包括電壓有效值、電流有效值、電壓諧波特征、電流諧波特征、電流諧波畸變率、有功功率、無功功功率、功率曲線特征、功率因數、啟動電壓和電流、啟動時產生的負荷、啟動時間的特征、用電設備溫度等。
核主元分析法是主元特征分析的非線性推廣,通過一個非線性變換ф,將輸入數據空間中的m個子陣的樣本xi(k=1,2,…,,m),映射到高維特征空間f中,得到高維空間的樣本點ф(x1),ф(x2),…,ф(xm),然后在高維空間使用主元分析提取更好的可分性的非線性主元特征,實現非線性數據降維,進而實現各用電設備特征參數的提取,獲取各用電設備分類的主要特征向量組集。
根據式(1)數據預處理得到的增廣矩陣x(m),然后按列分解成(m+1)個子陣,然后計算每個子陣各自的核矩陣(k1,k2,…,km+1)
映射后數據的協方差矩陣cf為:
其中ф是映射函數,s是個狀態量數據個數,
根據式(3)對cf進行特征分解并標準化特征向量
求解式(3)中的特征值λ(λ≥0)和特征向量v,并將映射后的每個樣本與式(3)做內積處理,進而有
式(4)中的v可用線性組合表示如下:
其中αi是相關系數,將(2),(5)帶入式(3)中得:
定義對稱核矩陣k為:
因k是對稱矩陣,上式可簡化為:
sλα=kα(8)
本發明選擇高斯徑向基核函數即:
通過上述的求解,可得到所要求的的特征值和特征向量,歸一化特征向量,確定各子陣的主元數目,取li的最大值l作為主元數目,根據式(10)計算各個子陣特征向量vi(i=1,2,…,p)在各自特征空間上的投影,即得各子陣的主元矩陣(t1,t2,…,tm),
進而通過核主元分析所提取的各用電設備特征向量組數據為(t1,t2,…,tm)
4)利用相關性分析模塊對步驟3所得到的特征數據組集采用多變量多尺度樣本熵法計算熵權,在一定的智能微網用戶用電行為條件下同一時間的多變量多尺度樣本熵權權重ma越高,該用電行為對應的多通道數據復雜度和相關性越強,進而確定用電行為特征的環境因素和不同用電設備貢獻率。
將步驟3)中提取的狀態量的特征數據參數進行標準化,并進行時間序列向量tm={tm1,tm2,...,tmn,…,tmn},m=1,2,…,m,m代表不同通道獲得的特征狀態量,n為獲得特征數據的數量。根據尺度因子τ對各特征狀態量時間序列進行粗粒變換,由式(11)得不同尺度的時間序列
其中1≤i≤n/τ,對m個狀態量粗粒化后的時間序列yim進行多維時延嵌入重構,得復合延遲向量:
其中d=[d1,d2,…,dm,…,dm]是嵌入維數向量,λ=[λ1,λ2,…,λm,…,λm]是時間間隔向量用于壓縮監測狀態量的數據,
由式(13)得每一個向量
由式(14)計算得不同距離
式中r為兩兩向量之間相似性系數。
根據式(15)計算不同狀態量之間的相似概率
根據(16)式計算得智能微網多通道監測數據的多變量多尺度樣本熵權值為
5)利用模糊c-均值聚類算法建立模糊c-均值聚類模型,然后運用該模型識別用戶用電行為:
根據上述步驟3)得到的智能樓宇微網各用電設備特征向量組數據矩陣
fcm算法的目標函數建立如下:
本發明引入拉格朗日乘子的目標函數如下:
其中,
模糊聚類第j組樣本的聚類中心選擇
通過不斷迭代調整使目標函數小于類別區分精度ε,進而完成對所有智能樓宇微網用戶用電行為的識別分類。
本發明構建的基于核主元分析和多變量多尺度樣本熵權模糊c-均值聚類相結合的智能樓宇微網用戶用電行為識別模型訓練實施步驟如下:
step1選取wifi智能樓宇微網用電數據采集終端和環境各傳感器監測獲得用電樣本大數據,并對樣本數據進行數據預處理。
step2對各個用電設備的用電數據建立組成子陣xi,利用公式(1)對經過預處理后的用電設備用電大數據構建出數據增廣矩陣x(m)。
step3利用式(9)計算各個子陣核矩陣(k1,k2,…,km+1),并根據式(2)進行中心化得(k*1,k*2,…,k*m+1)。
step4根據式(8)分別對各個中心化后子陣的核矩陣進行特征分解,并標準化特征量α。
step5根據式(10)計算各個子陣特征向量在各自特征空間上的投影,得到各個子陣的主元矩陣
step6利用式(16)多變量多尺度樣本熵權算法計算用戶用電行為特征的環境因素和用電設備的多變量多尺度貢獻率ma。
step7確定用電行為類的個數c,初始化聚類中心v0、模糊權重指數n和隸屬度矩陣u0
step8將聚類中心vj和step6求得的多變量多尺度影響因素的貢獻率ma帶入公式(19)得到新的隸屬度矩陣uij。
step9將上述得到的隸屬度矩陣uij和step6求得的多變量多尺度影響因素的貢獻率ma帶入式(20)得到新的聚類中心vj。
step10根據式(18)計算目標函數值,通過不斷迭代調整使目標函數小于類別區分精度ε>0,并計算相鄰兩聚類中心的距離e,若原聚類中心與更新后的聚類中心之間的距離e小于ε,則迭代停止,否則轉至step8。
通過上述步驟不斷迭代,運用核主元分析法和多變量多尺度熵權模糊c-均值聚類模型進而可以精準的完成對智能樓宇微網用戶用電行為的識別。