ABB
关注中国自动化产业发展的先行者!
CAIAC 2025
2025工业安全大会
OICT公益讲堂
当前位置:首页 >> 资讯 >> 行业资讯

资讯频道

基于气象均值
随机森林模型的风电功率预测
  • 作者:王兆国 刘座铭 徐丽媛 李静 薛一波
  • 点击数:4544     发布时间:2017-11-03 17:52:00
  • 分享到:
精准的风电功率预测对保障大规模风电并网调控,提高电能质量和电力系统安全稳定运行具有重要意义。其中,风向和风速的间歇性和波动性变化是影响风电功率精准预测的主要原因。针对风电功率精准预测问题,本文结合气象预报数据,基于随机森林模型算法对七个风电场的风电功率进行预测。实验结果表明,本文基于气象均值的随机森林模型,极大提高了风电功率预测的准确性,实验结果的均方根误差值低于行业同类算法。
关键词:

王兆国 清华大学信息技术研究院,清华大学信息科学技术国家实验室(筹)

刘座铭 国网吉林省电力有限公司电力科学研究院

徐丽媛 清华大学信息技术研究院,清华大学信息科学技术国家实验室(筹)

李 静 电网安全与节能国家重点实验室(中国电力科学研究院)

薛一波 清华大学信息技术研究院,清华大学信息科学技术国家实验室(筹)


1 引言


化石能源是目前全球主要消耗的能源,大量化石能源消耗导致环境污染、气候变暖等诸多问题。近几年清洁能源的使用,大力发展可再生能源已经成为全球共识。同期,我国提出全球能源互联网战略,实现风能、光能、水能和火能互补的发展战略[1]。国家能源局印发的《风电发展“十三五”规划》中明确指出,提高风能比重,实现风电由补充向替代能源转变[2]。国家能源局发布风电并网统计数据,2016年新增风电装机容量1930万kW,风电发电量2410亿kW h[3],可见风电正在逐步大规模并入电网。但风力发电易受到风向、风速、时间、季节等环境因素影响,具有间歇性和波动性等特性。这些多变因素给风力发电量精准预测、电网的调度、运行和控制带来极大影响。仅2016年全社会用电量达59198亿kW h,其中3.5%因电力预测的偏差,而白白消耗。


在电力预测方面,风电功率预测是指风电场风力发电机发电功率的预测,按照时间划分主要包含:超短期预测、短期预测、中期预测和长期预测。超短期预测主要预测未来30min以内数据,主要用于风机智能控制及电能质量评估。短期预测一般预测未来30min到72h,主要用于电力系统调度、电力系统稳定和电能质量控制。中期预测一般预测未来数周或数月,主要用于设备状态评估和制定维修计划。长期预测是针对未来几年的预测,主要用于发电厂投入决策和全年发电量预估。


按照预测方法划分主要包含:持续法、时间序列分析法、卡尔曼滤波法、神经网络、机器学习模型和组合预测方法。持续法[4]是通过将最近时刻的历史风速值作为下一刻预测的方法,常用于超短期预测。时间序列分析法[5,6],主要通过系统采集的风功率数据,按照时间序列拟合曲线建模,并基于模型预测。卡尔曼滤波法[7,8]主要通过单一序列建立模型,基于卡尔曼滤波器原理实现预测,此类算法主要用于实时在线计算。神经网络方法[9],如BP神经网络等,是基于并行信息计算的算法模型,通过仿生物学原理利用神经元互通互联提升系统模式识别能力,最新进展利用深度神经网络方法完成风功率预测[10]。依据机器学习模型完成风功率预测的方法主要包含梯度提升[11]、支持向量机[12]、随机森林[13]、K近邻[14]等模型。组合预测[15-17]方法主要通过多种预测方法组合的方法,进而提高精度、减小误差。


本文提出一种新型的风功率预测模型,该方法首先通过统计观察历史风机功率数据,发现风功率具有明显季节变化特性,并基于季度风电功率数据建立多工况的风机预测模型。而对于同一时刻的多次天气预报数据采用均值互补策略,消除偶然气象数据的误差。其次,利用构建好的历史风电功率数据和气象数据,建立随机森林预测模型。实验结果表明,本文方法具有较小的预测误差,适用于多工况复杂的风电功率预测问题。


2 基于随机森林的风功率预测模型


2.1 随机深林模型建模过程


建立2001年Breiman提出随机森林模型(RandomForest,RF)[18]。随机森林模型是一个包含多个决策树的分类器,以分类回归树(CART)作为元分类器,用Bootstrap完成有放回的重抽样方法,从原始训练数据中抽取多个样本子集进行决策树建模,通过多个决策树基于投票原则得出最终结果。随机森林模型具有计算精度高、泛化误差可控、收敛速度快、有效解决不平衡分类等优点。


12312313.JPG


2.2 基于时间序列的风电功率建模


IEEE与Kaggle[20]机器学习比赛平台联合发起的GEFCom全球能源预测比赛之一的风力发电预测,数据集包含发电量数据和气象数据。发电量数据为2009/7/1/1时至2010/12/31/24时之间以1小时为时段记录,分别由七家发电站产生的真实发电量数据,清洗并归一化处理后共18758条记录。其中“date”参数表示数据采集时间,如“2009070100”表示为2009年7月1日0时。“wp1-7”表示7个参数归一化后的7家风电场的发电量数据,如“wp1 0.045”表示第一家风电场发电量为0.045,数据样例如表1所示。


表1 风电功率数据示例

1.JPG


风电功率受限于风资源的变化,而风能资源易受到海陆热力差异、行星风带位置移动、风季环流等方面的影响,而形成季节性周期变化。为了探寻风电功率数据的季节性变化,本文将风电功率数据按照季度刻画风电功率变化趋势,如图1所示。由图1观测可知,风电功率数据具有明显季度变化特性,因此在建模时,分别按照不同季度单独训练模型,以提高预测的精度。


2.jpg

1 风电功率季节性变化趋势图


2.3 基于滑动均值的气象信息模型


建立2001年Breiman提出随机森林模型对发电量进行预测,重要依据是气象数据,数据中包含了风的各项预报,包括风向、风速和相对的发电装置的风向分量。气象数据中“date”参数表示采集时间,如“2009070100”表示为2009年7月1日0时发布的气象数据。“h”参数表示未来某时刻数据,如“1”表示2009年7月1日1时预计的气象数据;“u、v”分别表示相对于的发电装置的风向分量;“ws(wind speed)”表示风速,通过标准化处理,将风速数据转化为0~10的数据;“wd(wind direction)”表示风向数据,数据样例如表2所示,每个风电场气象数据约10万条。


表2 气象数据示例

3.JPG


气象数据每日两次分别于0时及12时发布,每次发布未来48小时的气象预测数据,因此每个时间点至多有四次气象预报数据,数据示例如图2所示。基于数据特性,部分气象数据缺失,且同时刻多次预测数据均有浮动误差,为了提高预测准确性,减小偶然误差,本文采取滑动平均值方法完成气象预测数据的平滑处理。


4.JPG

图2 平滑均值气象数据


2.3 基于随机森林的风电功率预测流程


2001年,Breiman提出的随机森林模型,对于风电功率预测主要包含:数据清洗与建模、多工况数据分类、机器学习模型训练、实时气象数据输入、风电功率预测等几个模块,如图3所示。数据清洗与建模主要包含对天气预报数据的平滑均值处理和基于时间序列的风电功率分析,得到多工况的多个子数据集,并依据已有的机器学习模型分别对不同工况的子数据集建模,形成多工况的数据预测模型。当实时气象数据作为数据输入多工况风电功率预测模型时,模型自动预测并输出预测的数据。


5.JPG

图3 风电功率预测流程图


3 实验评估


3.1 实验平台与数据集说明


实验平台采用航天联志Aisino5230R服务器,双CPU共32核,DDR3-32G内存,4T硬盘,2MCache,前端总线1333Mhz, 实验环境为SKlearn[21]。为了检验模型的准确性和抗过拟合能力,按照比赛规则:训练数据集为2009/7/1/1时至2010/12/31/24时,间隔为1小时的风电功率数据和同时段的气象数据,训练过程采用实则交叉验证方法防止过拟合。而测试集为2011/1/1/1时至2012/6/28/12时间隔1小时的风电功率数据和气象数据。按照图3的训练测试流程,模型输入为测试集的气象数据,预测风电场的风电功率。


3.2 评价指标


均方根误差(Root-Mean-Square Error,RMSE)是观测值与真值偏差的平方和与观测次数N比值的平方根。均方根误差对观测数据中的特大或者特小误差反应敏感,因此均方根误差能够很好的反应出测量的精密度。在Kaggle[20]机器学习比赛中,均选择RMSE作为模型评价标准。


6.JPG


3.3 实验评估


按照图3的系统测试流程,其预测结果与真值结果拟合度评估如图4所示,其中横坐标为2011/1/1/1时至2012/6/28/12时间隔1小时对应的气象数据,纵坐标为相应时刻对应的风电功率。从图4中观测结果所示风电功率的预测曲线和真值曲线拟合度良好。


7.JPG


图4 真实值与测量值拟合实验


为了进一步评估算法和模型,选取普通最小二乘(Ordinary Least Square,OLS)、梯度提升(Gradient Boosting Regressor,GBR)、随机森林(Random Forest Regressor, RFR)、K最近邻(K Neighbors Regressor,KNN)完成模型构建和评估,并分别对七个风电场风电功率数据建模,并根据测试结果完成RSME评估,其检测结果如表3所示。


由表3数据可知,本文提出基于不同季度数据和多工况预测模型在七个风电场中预测结果均表现优异,其中随机森林模型的RSME为0.1371695,此结果优于Kaggle[20]机器学习比赛第一名成绩0.14566。


表3 模型算法评估

8.JPG


4 结语


本文方法充分考虑风电特性,按照季度和多工况特性训练多工况的风电功率预测模型。该模型具有较好的拟合特性和较低的均方根误差值,其实验结果表明本文方法优于Kaggle测评比赛中第一名成绩,可见本文数据建模方法、模型选择和模型训练方面具有较好的特性,适合多工况复杂条件下的风功率预测。


基金项目: 国家科技支撑计划资助项目(2015BAK34B00);国家电网公司科技项目互联大电网一体化网络分析计算支撑服务及关键技术研究(KY-SG-2016-031-JLDKY)


作者简介


王兆国(1986-),男,黑龙江七台河人。现为清华大学信息技术研究院博士后,主要研究方向为电力大数据智慧分析、网络与信息安全。


参考文献:


[1] 刘振亚. 全球能源互联网[M]. 北京: 中国电力出版社, 2015.

[2] 国家能源局. 国家能源局关于印发《风电发展“十三五”规划》的通知[Z]. 北京: 国家能源局.

[3] 国家能源局. 2016年风电并网运行情况[Z]. 北京: 国家能源局, 2017.

[4] 李丽, 叶林. 基于改进持续法的短期风电功率预测[J]. 农业工程学报, 2010, 26(12): 182-187.

[5] Wang J, Hu J. A robust combination approach for short-term wind speed forecasting and analysis–Combination of the ARIMA (Autoregressive Integrated Moving Average), ELM (Extreme Learning Machine), SVM (Support Vector Machine) and LSSVM (Least Square SVM) forecasts using a GPR (Gaussian Process Regression) model[J]. Energy, 2015, 93: 41 - 56.

[6] Lydia M, Kumar S S, Selvakumar A I, et al. Linear and non-linear autoregressive models for short-term wind speed forecasting[J]. Energy Conversion and Management, 2016, 112: 115 - 124.

[7] Chen K, Yu J. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach[J]. Applied Energy, 2014, 113: 690 - 705.

[8] Zuluaga C D, Alvarez M A, Giraldo E. Short-term wind speed prediction based on robust Kalman filtering: An experimental comparison[J]. Applied Energy, 2015, 156: 321 - 330.

[9] Quan H, Srinivasan D, Khosravi A. Short-term load and wind power forecasting using neural network-based prediction intervals[J]. IEEE transactions on neural networks and learning systems, 2014, 25(2): 303 - 315.

[10] Hu Q, Zhang R, Zhou Y. Transfer learning for short-term wind speed prediction with deep neural networks[J]. Renewable Energy, 2016, 85: 83 - 95.

[11] Jiang Y, Xingying C, Kun Y U, et al. Short-term wind power forecasting using hybrid method based on enhanced boosting algorithm[J]. Journal of Modern Power Systems and Clean Energy, 2017, 5(1): 126 - 133.

[12] Liu Y, Sun Y, Infield D, et al. A hybrid forecasting method for wind power ramp based on Orthogonal Test and Support Vector Machine (OT-SVM)[J]. IEEE Transactions on Sustainable Energy, 2017, 8(2): 451 - 457.

[13] Lahouar A, Slama J B H. Hour-ahead wind power forecast based on random forests[J]. Renewable Energy, 2017, 109: 529 - 541.

[14] Yesilbudak M, Sagiroglu S, Colak I. A novel implementation of kNN classifier based on multi-tupled meteorological input data for wind power prediction[J]. Energy Conversion and Management, 2017, 135: 434 - 444.

[15] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122-137.

[16] Saleh A E, Moustafa M S, Abo-Al-Ez K M, et al. A hybrid neuro-fuzzy power prediction system for wind energy generation[J]. International Journal of Electrical Power & Energy Systems, 2016, 74: 384 - 395.

[17] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122 - 137.

[18] Breiman L. Random forests[J]. Machine learning, 2001, 45(1): 5 - 32.

[19] Krause J. Introduction to Bootstrap[M]. Introducing Bootstrap 4. Apress, 2016: 23 - 32.

[20] GEFCom2012. Global Energy Forecasting Competition 2012-Wind Forecasting[OL]. https://www.kaggle.com/c/GEF2012-wind-forecasting/leaderboard

[21] Scikit-learn. Scikit-learn[OL]. http://scikit-learn.org/stable/.


摘自《工业控制系统信息安全》专刊第四辑

热点新闻

推荐产品

x
  • 在线反馈
1.我有以下需求:



2.详细的需求:
姓名:
单位:
电话:
邮件: