光伏功率異常數據的識別方法
【技術領域】
[0001]本發明屬于電力系統新能源發電領域。尤其涉及一種在光伏功率數據含有高比例 異常數據的條件下,光伏功率異常數據的識別方法。
【背景技術】
[0002] 準確可信的光伏功率時間序列數據是光伏發電性能分析、功率預測等工作的基 礎。然而很多光伏電站現場采集的功率數據質量較差,極大阻礙了這些數據的信息挖掘和 深化應用。產生光伏功率異常數據的原因眾多,如通信故障、設備異常、人為限電等,其中人 為限電導致的光伏功率數據異常問題在我國尤為嚴重。高比例的光伏功率異常數據會對光 伏功率和光資源波動性研究、光伏功率與輻照度、溫度等因素之間真實規律的提取造成不 利影響,直接利用現場數據會降低光伏功率預測模型的精度和有效性,也會對光伏電站的 運行管理、電網的運營調度產生不利影響。因此需要進行光伏功率高比例異常數據識別。
[0003] 進行光伏功率異常數據識別的難點在于準確把握光伏功率數據的強隨機性、分散 性等特性及我國光伏數據含高比例異常數據的實際情況。現有方法多依賴對組件狀態的檢 測,如根據組件溫度和工作電壓關系篩選異常數據,需要對工作電壓進行檢測,但是現階段 我國缺少光伏組件層級的數據,且在光伏發電性能分析和光伏功率預測中更關注場站層面 的異常數據。
[0004] 然而,現有方法不能完全適應我國光伏實際情況;對光伏功率分布的某個概率密 度函數假定,如利用3-sigma原則進行異常數據識別,按這類假定,各個輻照度區間內光伏 功率的分布規律是相互獨立的,但是實際上若輻照度和光伏功率是兩個具有關聯性的隨機 變量,各個輻照度區間內的功率分布規律也不是獨立的,若進行獨立處理不符合實際規律, 使得在實際應用中對異常數據的識別能力有限;簡單異常識別規則的制定,采用規則識別 的方法,一方面過分依賴于經驗規律,另一方面未考慮光伏功率與主要影響因素的相關關 系,使得在實際應用中識別效果欠佳;較少針對高比例異常數據問題,限電、設備故障等因 素導致光伏功率數據含異常數據比例高,在實際應用中,高比例異常數據會導致統計分析 結果偏離真實情況,使得異常數據誤識別率高。
【發明內容】
[0005] 綜上所述,確有必要提供一種能夠適應我國數據以光伏場站級數據類型為主、異 常數據比例高特點的異常數據識別方法。
[0006] -種光伏功率異常數據的識別方法,包括以下步驟:利用光伏電站輻照度和光伏 功率實測數據,擬合輻照度-光伏功率Copula函數參數;根據Copula函數描述輻照度和光伏 功率這兩個隨機變量的相關關系建立概率功率曲線;通過輻照度-光伏功率散點圖,總結異 常數據點特征建立異常數據判別準則;基于Copula函數和異常數據判別準則,識別篩選異 常數據,建立新數據集;以及若有異常數據被識別,在剔除異常數據后重復以上步驟,對新 數據集繼續進行識別;若無,則直接利用判別準則和概率功率曲線,識別原始數據集中異常 數據。
[0007] 相對于現有技術,本發明將輻照度和光伏功率作為兩個隨機變量,利用Copula函 數描述兩隨機變量的相關關系,建立概率功率曲線,根據實測數據的觀察建立異常數據判 別準則,并針對異常數據比例高的特點,通過反復進行減少原數據集中異常數據對輻照度-功率之間真實規律發現的干擾。該方法易于操作、具有普適性,不需要復雜的優化計算,切 合我國光伏數據以場站級數據為主、異常數據比例高等實際特點。
【附圖說明】
[0008] 圖1為本發明提供的光伏功率異常數據的識別方法的流程圖。
[0009]圖2為本發明提供的光伏功率異常數據的識別方法的流程框圖。
[0010]圖3為甘肅某光伏電站輻照度-功率散點及異常數據類型示意圖。
【具體實施方式】
[0011]下面根據說明書附圖并結合具體實施例對本發明的技術方案進一步詳細表述。
[0012] 請參閱圖1及圖2,本發明提供的光伏功率異常數據的識別方法包括以下步驟: 步驟S10,利用光伏電站輻照度和光伏功率實測數據,擬合輻照度-光伏功率Copula函 數參數; 步驟S20,根據Copula函數描述輻照度和光伏功率這兩個隨機變量的相關關系建立概 率功率曲線; 步驟S30,通過輻照度-光伏功率散點圖,總結異常數據點特征建立異常數據判別準則; 步驟S40,基于Copula函數和異常數據判別準則,識別篩選異常數據,建立新數據集;以 及 步驟S50,若有異常數據被識別,在剔除異常數據后跳轉至步驟S10,對新數據集繼續進 行識別;若無,則直接利用判別準則和概率功率曲線,識別原始數據集中異常數據。
[0013] 在步驟S10中,所述輻照度-光伏功率Copula函數參數可通過以下步驟得到: 步驟S11,獲取光伏電站輻照度和功率實測數據,進行數據歸一化操作,篩選已標記的 錯誤數據; 步驟S12,利用統計分析得到光伏功率P的累積概率分布函數巧〇)和輻照度R的累積 概率分布函數&0); 步驟S13,結合輻照度-光伏功率散點圖的觀察,確定選取的Copula函數類型; 步驟S 1 4,利用和盡(P),得到唯一的C 〇 p u 1 a函數C連接R和R,
,擬合Copula函數參數。
[0014] 在步驟S11中,已標記的錯誤數據指的是在數據采集過程中已被系統識別并標記 為錯誤數據的數據。
[0015] 在步驟S12中,常用的Copula函數有Clayton Copula,Gaussian Copula,Frank Copula函數等。
[0016] 可以理解,上述所述的輻照度-光伏功率Copula函數參數的獲取方法僅僅為具體 的實施例及表達方式,還可以根據實際需要進行選擇。
[0017] 在步驟S20中,所述概率功率曲線可通過以下方法計算: 步驟S21,給定輻照度累計概率分布取值,確定光伏功率累計概率分布的條件概率分布 函數 (p)丨 0-);沒)。
[0018] 步驟S22,設功率曲線的置信概率為α,即有#的數據落于概率區間內,多的數據 落于區間外。
[0019] 步驟S23,設置信區間的不對稱系數為ΛΤ,計算置信區間上下邊界的分位概率為, @,表示數據點高于上邊界的概率為總,低于下邊界的概率為:蟲。
[0020] 步驟S24,利用光伏功率累計概率分布的條件概率分布函數計算.爲,:4對應的分 位數A,Α。
[0021] 步驟S25,通過光伏功率累積概率分布函數求逆計算不同輻照度r取值下光伏功率 的上下邊界取值斯和辱,形成概率功率曲線中的上下兩條曲線。