62] 所述的數據修正是指:當任一時刻K的用水量數據存在異常或缺失時,判斷K+1和 K-1兩個時刻的用水量數據是否存在異常或缺失,若不存在異常或缺失,則求取K+1和K-1 兩個時刻用水量的平均值后作為K時刻的用水量數據;若存在異常或缺失,則進行數據填 補處理。
[0063] 所述的數據填補是指:當數據缺失率低時,采用統計方法中的前后相鄰填充方法 進行缺失值填補,即分段線性插值來估計缺失數據;當數據缺失率高時,采用基于關聯規則 的類均值填補算法。
[0064] 步驟(21)對歷史用水量序列中的突變跳點數據進行處理包括以下步驟:
[0065] (211)采用流量閾值約束處理突變跳點數據;
[0066] (212)采用相鄰值變化率閾值約束處理突變跳點數據。
[0067] 步驟(2)對歷史用水量序列進行預處理還包括以下步驟:
[0068] (22)異常數據包括缺失數據,對歷史用水量序列中的缺失數據進行處理。
[0069] 步驟(22)對歷史用水量序列中的缺失數據進行處理包括以下步驟:
[0070] (221)數據缺失率小于設定值,采用統計方法中的前后相鄰填充方法進行缺失數 據填補;
[0071] (222)數據缺失率大于或等于設定值,采用關聯規則算法的類均值填補算法進行 缺失數據填補,選取相關性最大的三個屬性作為標準數據對缺失屬性進行分組。然后用各 組的均值去填補相應的缺失數據。
[0072] 步驟(4)選取相關系數大于設定值的一組歷史用水量,其中設定值為0. 75, 一組 歷史用水量包括預測時刻前lh、23h、24h、25h、48h、72h、96h、120h、144h以及168h的用水 量,h為小時。
[0073] 步驟(6)對城市短期用水量預測模型進行改進為選擇最小二乘支持向量機中核 參數〇和正規化參數y,包括以下步驟:
[0074] (61)采用精英策略kbest,只有較優的粒子會影響其他粒子的位置及速度,加快 收斂速度;
[0075] (62)采用自適應的慣性權重策略,按照粒子與最優粒子的差距自適應地改變位置 及速度,提高搜索能力;
[0076] (63)引入歷史最優信息,結合了 PS0的個體歷史最優及群體歷史最優提高算法的 搜索能力。
[0077] 本發明的另一個實施例的基于最小二乘支持向量機模型的城市短期用水量預測 方法,原始數據還包括氣象數據和/或節假日因子,步驟(4)中作為訓練樣本集的時間序列 組合還包括氣象數據和/或節假日因子。
[0078] 氣象數據為日平均溫度。
[0079] 可以選取溫度作為氣象數據對用水量預測的影響,計算出日最高溫度與用水量的 相關性為〇. 75,日最低溫度與用水量的相關性為0. 71,日平均溫度與用水量的相關性為 0. 85,因此選取日平均溫度作為預測模型的輸入。
[0080] 本實施例的基于最小二乘支持向量機模型的城市短期用水量預測方法,包括如下 步驟:
[0081] a)分別通過供水公司數據采集與監視控制系統和天氣預測網站獲取歷史用水量 數據和氣象數據;
[0082] b)針對歷史用水量序列中的異常和缺失數據進行預處理,包括數據修正和數據填 補;
[0083] c)根據修正或填補處理后的歷史用水量數據,分析各因素和用水量之間的關聯 性;
[0084] d)采用最小二乘支持向量機方法,建立城市短期用水量預測模型,選取預測時刻 前固定長度的歷史用水量、氣象數據和節假日因子時間序列組合作為訓練樣本集,對預測 模型進行訓練,且在進行下一時刻預測前實時更新訓練樣本,即添加上一時刻的實際用水 量和氣象數據并去除最原始的數據;
[0085] e)對最小二乘支持向量機模型得出的用水量預測值,進行誤差檢驗并將模型應用 于未來用水量的預測。采用未經訓練的一定時間段的用水量和氣象數據時序樣本組合(即 測試樣本集)帶入模型預測輸出,并與實際用水量數據進行比較,判斷模型的預測誤差是 否滿足預測精度要求。若不滿足要求,則對預測模型進行改進。在此基礎上,將預測模型應 用于未來用水量的實時滾動預測。
[0086] 以下更具體地描述本發明的基于最小二乘支持向量機模型的城市短期用水量預 測方法。
[0087]如圖1所示,基于最小二乘支持向量機模型的城市短期用水量預測方法,具體步 驟如下:
[0088] 步驟一、原始數據獲取
[0089] 選取某特大城市供水管網某支線2013年6月1日~2014年5月31日的用水量 實測數據作為樣本數據庫。供水數據采集系統SCADA每隔10分鐘記錄一次瞬時流量,因此 分析樣本共有52560條數據。
[0090] 從氣象部門查詢對應時間內每日的最高氣溫和最低氣溫,取其平均值作為日平均 氣溫。
[0091] 查詢日歷,確定對應時間內每日是否為節假日。
[0092] 步驟二、用水量數據的預處理
[0093] 按照供水管網實際運營,判斷流量數據是否為異常點。由于支線的瞬時流量數據 是10分鐘級,因此得到的流量序列理應是一個緩慢變化過程,不會產生突變、跳躍的數據 點。而詳細分析原始數據可以發現,部分數據點與其相鄰數據的變化幅度很大,此種數據點 我們也將其歸類為異常數據。綜上所述,我們可將異常點分為突變跳點數據及缺失數據兩 大類。
[0094] 突變跳點:本文的樣本實測流量數據頻率為十分鐘級,相鄰流量之間的變化應是 平緩的,但分析數據發現,樣本數據具有嚴重的毛刺現象。本文采取兩種規則來對突變跳點 數據進行處理:1、流量閾值約束;2、相鄰值變化率閾值約束。流量閾值約束是按照供水管 網某支線實際運營情況給流量設置一個合理的上下限,保證流量在下限值Q min和上限值9_ 之間。處理規則為:
【主權項】
1. 一種基于最小二乘支持向量機模型的城市短期用水量預測方法,其特征在于,包括 W下步驟: (1) 獲取原始數據,所述原始數據包括歷史用水量序列; (2) 對所述歷史用水量序列進行預處理,W去除所述歷史用水量序列中的異常數據; (3) 對預處理后的歷史用水量序列進行相關性分析; (4) 采用最小二乘支持向量機方法,建立所述城市短期用水量預測模型,選取相關系數 大于設定值的一組歷史用水量的時間序列組合作為訓練樣本集,對城市短期用水量預測模 型進行訓練; (5) 采用所述城市短期用水量預測模型進行實時預測; (6) 計算預測誤差,如果所述預測誤差不滿足預測精度要求,對所述城市短期用水量預 測模型進行改進。
2. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(1)獲取原始數據包括W下步驟: (11) 獲取一個城市供水管網中的一個支線在一個時間段內的歷史用水量序列; (12) 獲取所述時間段內每日的氣象數據,包括最高氣溫和最低氣溫,計算所述最高氣 溫與所述最低氣溫的平均值作為日平均氣溫; (13) 從日歷中判斷所述時間段內每日是否為節假日,獲得節假日因子。
3. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(2)對所述歷史用水量序列進行預處理包括W下步驟: (21) 異常數據包括突變跳點數據,對所述歷史用水量序列中的突變跳點數據進行處 理。
4. 如權利要求3所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(21)對所述歷史用水量序列中的突變跳點數據進行處理包括W下步驟: (211) 采用流量闊值約束處理所述突變跳點數據; (212) 采用相鄰值變化率闊值約束處理所述突變跳點數據。
5. 如權利要求3所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(2)對所述歷史用水量序列進行預處理還包括W下步驟: (22) 異常數據包括缺失數據,對所述歷史用水量序列中的缺失數據進行處理。
6. 如權利要求3所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(22)對所述歷史用水量序列中的缺失數據進行處理包括W下步驟: (221) 數據缺失率小于設定值10%,采用統計方法中的前后相鄰填充方法進行缺失數 據填補; (222) 數據缺失率大于或等于設定值10%,采用關聯規則算法的類均值填補算法進行 缺失數據填補,選取相關性最大的=個屬性作為標準數據對缺失屬性進行分組,然后用各 組的均值去填補相應的缺失數據。
7. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,步驟(4)選取相關系數大于設定值的一組歷史用水量,其中所述設定值為0.75, 所述一組歷史用水量包括預測時刻前比、2化、2化、2化、4她、7化、9化、120h、14化W及16她 的用水量,h為小時。
8. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,所述原始數據還包括氣象數據和/或節假日因子,步驟(4)中作為訓練樣本集的 時間序列組合還包括所述氣象數據和/或所述節假日因子。
9. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法,其 特征在于,所述氣象數據為日平均溫度。
10. 如權利要求1所述的基于最小二乘支持向量機模型的城市短期用水量預測方法, 其特征在于,步驟(6)對所述城市短期用水量預測模型進行改進為選擇最小二乘支持向量 機中核參數0和正規化參數丫,包括W下步驟: 化1)采用精英策略化est,只有較優的粒子會影響其他粒子的位置及速度,加快收斂 速度; 化2)采用自適應的慣性權重策略,按照粒子與最優粒子的差距自適應地改變位置及速 度,提高捜索能力; 化3)引入歷史最優信息,結合了PSO的個體歷史最優及群體歷史最優提高算法的捜索 能力。
【專利摘要】本發明提供一種基于最小二乘支持向量機模型的城市短期用水量預測方法,包括以下步驟:對歷史用水量進行預處理;進行相關性分析;采用最小二乘支持向量機方法,建立城市短期用水量預測模型,選取相關系數大于設定值的歷史用水量的時間序列組合作為訓練樣本集進行訓練;采用城市短期用水量預測模型進行實時預測;計算預測誤差,如果預測誤差不滿足預測精度要求,對城市短期用水量預測模型進行改進。本發明提供的城市短期用水量預測方法,對歷史用水量進行預處理,盡可能保持原有的變化規律從而提高預測的精度;采用最小二乘支持向量機方法,解決了供水系統非線性、無法建立精確模型的問題;綜合考慮氣象數據和/或節假日因子,提高預測的精度。
【IPC分類】G06Q50-06, G06Q10-04
【公開號】CN104715292
【申請號】CN201510141201
【發明人】王景成, 戢鋼, 葛陽, 劉華江, 楊麗雯, 胡濤
【申請人】上海交通大學
【公開日】2015年6月17日
【申請日】2015年3月27日