91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:

发布论文

论文咨询

XGBoost与GRU模型在发电功率预测中的应用

  2024-06-03    58  上传者:管理员

摘要:超短期光伏发电功率预测是电网安全调度与平稳运行的基础。针对传统单一预测模型存在预测精度不高、模型抗干扰能力差、鲁棒性不强等问题,本文提出了一种基于双重XGBoost-GRU的混合预测模型,并经过以澳大利亚爱丽丝泉光伏发电系统为算例的仿真分析。仿真实验的结果表明,双重XGBoost-GRU组合预测模型相较于GRU、XGBoost-GRU误差分别降低了93.93%、75.65%,说明了基于特征创造XGBoost-GRU融合预测模型具有良好的预测效果。

  • 关键词:
  • GRU模型
  • XGBoost模型
  • 光伏功率预测
  • 混合预测模型
  • 预测精度
  • 加入收藏

1、引言


相较于其他新能源,近年来光伏发电技术发展较为成熟且适用于大规模发展。截至2021年底,光伏发电并网装机容量达到3.06亿千瓦,突破3亿千瓦大关,连续7年稳居全球首位[1]。但光伏出力易受到天气因素的影响,存在较强随机波动性与间歇性,给电网安全调度与平稳运行带来了挑战。因此,提高光伏发电预测精度是解决这一问题的有效途径之一。

针对光伏出力预测问题,国内外学者已进行了大量相关研究,按预测形式大致可分为点预测、区间预测以及概率预测。针对用于调度计划制定的点预测大致可分为物理法、统计法、元启发法以及组合法[2,3,4]。虽然物理法对光伏发电近似物理模型直接进行构建,但模型抗干扰能力差,鲁棒性不强;统计法往往需要搜集和处理大量的历史数据,给数据的获取与处理提出了挑战;元发启法则通过算法对样本的训练得到预测条件与预测值之间的关系,但单一模型容易陷入局部最优解,预测误差较大,在实际应用中受限。因此,多种模型组合预测法可有效避免上述问题,进一步提高预测精度。

常见的组合预测方法有模态分解法、最优加权组合法、误差倒数法等[3,4]。例如,汤德清等提出一种基于LSTM-XGboost组合的超短期风电功率预测方法[5];Chen T等提出了一种长短期记忆网络与卷积神经网路的混合神经网络[6],用以局部特征的提取,构建了基于CNN-LSTM-XGBoost超短期光伏功率预测模型。针对当前研究的不足,本文提出了一种基于双重极度梯度提升(Extreme Gradient Boosting,XGboost)与门控循环单元(Gate Recurrent Unit,GRU)组合模型的超短期光伏发电预测模型。首先,基于光伏电厂的历史气象与发电数据,采用皮尔逊系数法筛选出与光伏发电功率强相关的气象特征;然后,根据已有的特征构造新的特征;再将归一化的数据集作为XGboost和GRU模型的输入,分别构建XGboost和GRU超短期光伏发电预测模型,在此基础上利用倒数误差法将两模型加权组合构建组合预测模型。算例分析证明本文所提出的模型提高了预测精度。


2、XGBoost与GRU模型概述


2.1 XGBoost算法原理

XGBoost是一个可拓展的Tree boosting算法,被广泛应用于数据科学领域[7,8]。

XGboost的目标函数如式所示:

式中,为模型预测值与真实值的差值;T为叶子结点的个数;ωj为第j个结点的分数;Y、λ是超参数、惩罚系数。

在迭代过程中,目标函数可先简化为:

由于损失函数不会提前给出,即在目标函数处进行泰勒二阶展开可得:

这样,目标函数可进一步化简为:

式中:

此时,目标函数为开口向上的二次函数,其最优解与对应的值ω见式:

2.2 GRU算法原理

作为长短期记忆(Long short-term memory,LSTM)的一种变体形式,GRU与LSTM结构类似。与LSTM相比,它去掉了“细胞”结构,将3个门控机制减少至2个,只包含重置门与更新门,并且使用隐藏状态来进行信息传递,从而有效缓解当LSTM计算量大时产生的训练效率低的问题[9,10]。GRU的基本单元结构如图1所示,前向传播如式(7)所示。

其中:xt表示在t时刻的输入;ht-1表示t-1时刻的隐藏状态;zt表示t时刻更新门状态;rt表示t时刻重置门状态;tanh为激活函数;WZ、Wr与W为对应权值系数矩阵;bz、br与b为对应的偏置项。

图1 GRU模型原理  


3、数据预处理


3.1异常数据处理

异常数据会在一定程度上影响模型的拟合程度,因此需要对异常数据进行检测与修正。

3.1.1异常值检测

传统阈值法是将被标记的数据与其前后时刻数据进行比较,当被标记数据大偏离其前后时刻数据,则表明该被标记数据为异常数据。在比较过程中,正常数据易受大偏离异常数据的影响,可能会被标记为异常数据。为降低其发生的概率,现提出一种基于平均距离的3-sigma异常值检测法。其计算公式如公式(8)所示。

式中:K表示被检测数据邻近数据点个数,为偶数;dmean.n表示被检测数据n与邻近点的平均距离;表示平均距离;σ为标准差。

3.1.2异常值修正

地球上的气候从长期看是不稳定的,但从短期看则为连续波动,具有不可突变的性质。在不考极端天气情况下,受天气因素影响所产生的光伏发电功率数据与气象大户局是平滑变化的。因此,采用平均值替代法修正异常值,计算公式见公式(9)。

3.2数据归一化

原始数据不同特征间量纲差别很大。以气温为例,气温数值通常在-40~50之间,而光伏发电功率通常为几十甚至上百千瓦。由于量纲不同,两者数值差异巨大。当将其输入预测模型中进行训练时,不仅会使训练时长延长,更会造成较大误差,降低模型预测精度和延长训练时间,不利于模型训练拟合[11,12]。因此需要对原始数据进行归一化处理,计算公式如公式(10)所示。

式中:yi、xa表示归一化后和归一化前的数据;xmax表示特征中的最大值;xmin表示特征值中的最小值。


4、影响因素分析


影响光伏发电功率的因素有光伏电站本身的电气特征(如太阳电池组件的倾斜角度、太阳电池的效率等)和外部天气因素(如辐照度、天气类型、季节、温度等)[13,14]。如果要考虑所有影响因素,则会增加预测模型的训练时间,影响其泛化能力,降低模型的预测精度和稳定性。因此,在训练预测模型前,有必要对不同影响因素进行相关性分析。通过皮尔逊系数法计算各特征与光伏数据的相关性[15,16],从而判断不同特征对光伏预测的影响程度,筛选出与光伏发电强相关的特征,在此基础上构建新的特征,作为预测模型的输入变量,以此降低数据维数,并提升预测模型的拟合速度,进而达到提高光伏预测模型的预测精度。

采用皮尔逊相关系数衡量两特征间是否存在相关性以及相关程度的大小,其计算公式如下:

式中:xi、表示光伏发电功率影响因素与其均值;yi、为光伏发电功率与其均值;r为皮尔逊相关系数。当所计算r的绝对值越接近于1时,表明两特征间相关性越强。其相关程度划分如表1所示[17]。  

表1 相关程度划分表  


5、预测方法


分别构建GRU单一模型以及双重XGBoost预测模型,得到预测值分别为,然后分别计算GRU与双重XGBoost预测模型的相对预测误差,其计算式如下:

其中,ytruei为对应时刻的真实值;i对应不同时刻,取1,2,3...n。

然后采用倒数误差法分别将上述两模型进行加权组合,得到最后组合预测模型的预测值。其计算公式可表示为:

由式(14)可看出,倒数误差法是将较大权值赋予给误差较小的预测值;反之,则赋予误差较大的预测值,使得整体预测值误差下降,从而达到提升预测精度的目的。

双重XGBoost-GRU组合预测模型的算法描述框图如图2所示。流程主要包括对原始数据的预处理、数据特征选择、归一化处理、划分数据集组合模型构建以及预测。其中,通过XGBoost预测模型进行特征创造在后文会说明。

图2 双重XGBoost-GRU组合预测模型的算法描述框图   


6、算例分析


6.1数据源以及计算平台

本文采用的是澳大利亚爱丽丝泉2021年2月11日至2022年2月8日的历史光伏发电以及气象数据[18]。数据的采样时间间隔为5min,每天可采集288组数据,共104544组数据。其中2021年2月11日至2022月1月8日的历史数据用于特征创造;2022年1月9日到2022年2月8日的历史数据用于预测验证,前28天的历史数据作为训练集,后3天的数据作为验证集。

计算平台采用的配置为:win10系统、Intel i5-6200U@2.30GHz、RAM 8.00GB,采用python语言编程实现GRU和XGBoost预测模型的构建以及融合预测模型的构建。

6.2相关性分析

通过计算皮尔逊相关系数,可得到光伏发电功率与各气象数据的相关性,其计算表达式上文已做说明。光伏发电历史功率与各因素之间的Pearson相关系数如表2所示。  

表2 光伏发电功率与气象数据的相关系数  

由表2可得出,光伏系统效率、总辐射强度、漫辐射强度、温度、相对湿度相关性较强。

6.3光伏发电功率影响因素特征构造

由表2中的Pearson相关系数值可知,光伏发电历史功率与光伏系统效率相关性较强,但在实际预测过程中不能直接使用该特征进行预测。此时,可利用其它气象因素来对光伏效率进行特征构造,再将其预测值用来预测光伏发电功率。

6.4模型参数设置

通过训练测试不同的XGBoost模型参数,寻找最优的参数组合,使得模型的预测误差最低。XGBoost模型参数设置如表3、表4所示。

同理,测试不同的GRU网络结构时,当迭代次数为50,第一、二、三层的均为16个神经元时模型预测误差最小。  

表3 XGBoost预测模型特征值创造参数   

表4 XGBoost预测模型参数  

6.5预测结果分析

为了衡量模型的预测效果,选取澳大利亚爱丽丝泉2022年2月26日-2月28日三天的数据作为验证集,然后根据所得到的模型参数设置,分别构建GRU单一预测模型,并通过第4节的方法构建XGBoost-GRU以及双重XGBoost-GRU的组合预测模型。将上述3种模型的预测结果进行对比分析,不同模型的预测结果效果如图3所示(分别为2月6日-8日7:20~18:10预测曲线)。

图3 光伏发电功率预测曲线   

对于不同预测模型的性能,选取平均绝对误差、均方根误差和平均绝对百分比误差这三种评价指标对模型的预测结果进行评估。其计算公式如下:

式中:yi、为光伏发电原始值与其对应的预测值。

表5为各模型的预测误差结果。由表5中三个评价指标可知,基于双重XGBoost-GRU的混合预测模型的MAE、RMSE与MAPE分别为0.0080KW、0.0028KW、0.9726%。双重XGBoostGRU组合预测模型相较于GRU、XGBoost-GRU,三种评价指标MAE、RMSE与MAPE分别降低了97.73%和87.06%、99.50%和97.90%、93.93%和75.65%。这说明双重XGBoost-GRU组合预测模型相较于其他模型,预测值和真实值更为接近,预测偏差更小,有着更好的预测精度。

表5 不同模型MAE、RMAE、MAPE对比  


7、结论


本文提出了一种基于特征选择的双重XGBoost-GRU混合模型的预测方法。模型验证采用澳大利亚爱丽丝泉2021年2月11日至2022年2月8日的历史发电数据。其中2021年2月11日至2022月1月8日的历史数据用于特征创造;2022年1月9日到2022年2月8日的历史数据用于模型预测验证。将基于双重XGBoost-GRU混合预测模型与其他模型的预测结果进行对比,得到以下结论:

(1)相较于传统单一模型,本文所提出的基于双重XGBoost-GRU组合预测模型在预测精度以及稳定性上有着明显的提升效果。

(2)双重XGBoost-GRU组合预测模型能够有效应对天气变对光伏发电功率的影响,其预测曲线与真实值曲线更为接近。

(3)构建组合预测模型,能够充分发挥不同模型的预测优势,有效降低单一预测模型的预测误差,提高预测模型的鲁棒性以及预测精度。


参考文献:

[1]王闯,丁帅,贺睿.太阳能光伏性能参数和大型并网太阳能光伏电站性能优化建议.科技创新与应用,2023,13(21):23-27

[2]赖昌伟,黎静华,陈博,等.光伏发电出力预测技术研究综述.电工技术学报,2019,34(06):1201-1217

[3]吴硕.光伏发电系统功率预测方法研究综述.热能动力工程,2021,36(08):1-7

[4]王愈轩,梁沁雯,章思远,等.基于LSTM-XGboost组合的超短期风电功率预测方法.科学技术与工程,2022,22(14):5629-5635

[5]汤德清,朱武,侯林超.基于CNN-LSTM-XGBoost模型的超短期光伏功率预测.电源技术,2022,46(09):1048-1052

[7]陈纬楠,胡志坚,岳菁鹏,等.基于长短期记忆网络和LightGBM组合模型的短期负荷预测.电力系统自动化,2021,45(04):91-97

[8]孙超,吕奇,朱思曈,等.基于双层XGBoost算法考虑多特征影响的超短期电力负荷预测.高压电技术2021,47(08):2885-2898

[9]李丰君,王磊,赵健,等.基于天气融合和LSTM网络的分布式光伏短期功率预测方法.中国电力,2022,55(11):149-154

[10]朱俊丞,杨之乐,郭媛君,等.深度学习在电力负荷预测中的应用综述.郑州大学学报(工学版),2019,40(05):13-22

[12]邱瑞东.基于机器学习的光伏电站功率短期预测方法研究[硕士学位论文].新疆大学,乌鲁木齐市,2022

[14]刘雨晴.区域综合能源系统短期用能需求预测及优化运行策略研究[硕士学位论文].湖南大学,长沙,2022

[17]赵海龙,张丹丹,黄松,等.基于皮尔逊相关系数的海南省地闪密度与雷击故障关系分析.高压电器,2019,55(08):186-192


基金资助:吉林省科技厅项目《大型厂区智能安全管理系统研究与应用示范》(No.20230203139SF)资助;


文章来源:李光环,杨小天,刘训钊.XGBoost与GRU模型在发电功率预测中的应用[J].福建电脑,2024,40(06):21-26.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

电力学报

期刊名称:电力学报

期刊人气:2048

期刊详情

主管单位:国网山西省电力公司

主办单位:山西省电机工程学会,山西大学

出版地方:山西

专业分类:电力

国际刊号:1005-6548

国内刊号:14-1185/TM

创刊时间:1986年

发行周期:双月刊

期刊开本:16开

见刊时间:7-9个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定