摘要:超短期光伏发电功率预测是电网安全调度与平稳运行的基础。针对传统单一预测模型存在预测精度不高、模型抗干扰能力差、鲁棒性不强等问题,本文提出了一种基于双重XGBoost-GRU的混合预测模型,并经过以澳大利亚爱丽丝泉光伏发电系统为算例的仿真分析。仿真实验的结果表明,双重XGBoost-GRU组合预测模型相较于GRU、XGBoost-GRU误差分别降低了93.93%、75.65%,说明了基于特征创造XGBoost-GRU融合预测模型具有良好的预测效果。
加入收藏
1、引言
相较于其他新能源,近年来光伏发电技术发展较为成熟且适用于大规模发展。截至2021年底,光伏发电并网装机容量达到3.06亿千瓦,突破3亿千瓦大关,连续7年稳居全球首位[1]。但光伏出力易受到天气因素的影响,存在较强随机波动性与间歇性,给电网安全调度与平稳运行带来了挑战。因此,提高光伏发电预测精度是解决这一问题的有效途径之一。
针对光伏出力预测问题,国内外学者已进行了大量相关研究,按预测形式大致可分为点预测、区间预测以及概率预测。针对用于调度计划制定的点预测大致可分为物理法、统计法、元启发法以及组合法[2,3,4]。虽然物理法对光伏发电近似物理模型直接进行构建,但模型抗干扰能力差,鲁棒性不强;统计法往往需要搜集和处理大量的历史数据,给数据的获取与处理提出了挑战;元发启法则通过算法对样本的训练得到预测条件与预测值之间的关系,但单一模型容易陷入局部最优解,预测误差较大,在实际应用中受限。因此,多种模型组合预测法可有效避免上述问题,进一步提高预测精度。
常见的组合预测方法有模态分解法、最优加权组合法、误差倒数法等[3,4]。例如,汤德清等提出一种基于LSTM-XGboost组合的超短期风电功率预测方法[5];Chen T等提出了一种长短期记忆网络与卷积神经网路的混合神经网络[6],用以局部特征的提取,构建了基于CNN-LSTM-XGBoost超短期光伏功率预测模型。针对当前研究的不足,本文提出了一种基于双重极度梯度提升(Extreme Gradient Boosting,XGboost)与门控循环单元(Gate Recurrent Unit,GRU)组合模型的超短期光伏发电预测模型。首先,基于光伏电厂的历史气象与发电数据,采用皮尔逊系数法筛选出与光伏发电功率强相关的气象特征;然后,根据已有的特征构造新的特征;再将归一化的数据集作为XGboost和GRU模型的输入,分别构建XGboost和GRU超短期光伏发电预测模型,在此基础上利用倒数误差法将两模型加权组合构建组合预测模型。算例分析证明本文所提出的模型提高了预测精度。
2、XGBoost与GRU模型概述
2.1 XGBoost算法原理
XGBoost是一个可拓展的Tree boosting算法,被广泛应用于数据科学领域[7,8]。
XGboost的目标函数如式所示:
式中,为模型预测值与真实值的差值;T为叶子结点的个数;ωj为第j个结点的分数;Y、λ是超参数、惩罚系数。
在迭代过程中,目标函数可先简化为:
由于损失函数不会提前给出,即在目标函数处进行泰勒二阶展开可得:
这样,目标函数可进一步化简为:
式中:
此时,目标函数为开口向上的二次函数,其最优解与对应的值ω见式:
2.2 GRU算法原理
作为长短期记忆(Long short-term memory,LSTM)的一种变体形式,GRU与LSTM结构类似。与LSTM相比,它去掉了“细胞”结构,将3个门控机制减少至2个,只包含重置门与更新门,并且使用隐藏状态来进行信息传递,从而有效缓解当LSTM计算量大时产生的训练效率低的问题[9,10]。GRU的基本单元结构如图1所示,前向传播如式(7)所示。
其中:xt表示在t时刻的输入;ht-1表示t-1时刻的隐藏状态;zt表示t时刻更新门状态;rt表示t时刻重置门状态;tanh为激活函数;WZ、Wr与W为对应权值系数矩阵;bz、br与b为对应的偏置项。
图1 GRU模型原理
3、数据预处理
3.1异常数据处理
异常数据会在一定程度上影响模型的拟合程度,因此需要对异常数据进行检测与修正。
3.1.1异常值检测
传统阈值法是将被标记的数据与其前后时刻数据进行比较,当被标记数据大偏离其前后时刻数据,则表明该被标记数据为异常数据。在比较过程中,正常数据易受大偏离异常数据的影响,可能会被标记为异常数据。为降低其发生的概率,现提出一种基于平均距离的3-sigma异常值检测法。其计算公式如公式(8)所示。
式中:K表示被检测数据邻近数据点个数,为偶数;dmean.n表示被检测数据n与邻近点的平均距离;表示平均距离;σ为标准差。
3.1.2异常值修正
地球上的气候从长期看是不稳定的,但从短期看则为连续波动,具有不可突变的性质。在不考极端天气情况下,受天气因素影响所产生的光伏发电功率数据与气象大户局是平滑变化的。因此,采用平均值替代法修正异常值,计算公式见公式(9)。
3.2数据归一化
原始数据不同特征间量纲差别很大。以气温为例,气温数值通常在-40~50之间,而光伏发电功率通常为几十甚至上百千瓦。由于量纲不同,两者数值差异巨大。当将其输入预测模型中进行训练时,不仅会使训练时长延长,更会造成较大误差,降低模型预测精度和延长训练时间,不利于模型训练拟合[11,12]。因此需要对原始数据进行归一化处理,计算公式如公式(10)所示。
式中:yi、xa表示归一化后和归一化前的数据;xmax表示特征中的最大值;xmin表示特征值中的最小值。
4、影响因素分析
影响光伏发电功率的因素有光伏电站本身的电气特征(如太阳电池组件的倾斜角度、太阳电池的效率等)和外部天气因素(如辐照度、天气类型、季节、温度等)[13,14]。如果要考虑所有影响因素,则会增加预测模型的训练时间,影响其泛化能力,降低模型的预测精度和稳定性。因此,在训练预测模型前,有必要对不同影响因素进行相关性分析。通过皮尔逊系数法计算各特征与光伏数据的相关性[15,16],从而判断不同特征对光伏预测的影响程度,筛选出与光伏发电强相关的特征,在此基础上构建新的特征,作为预测模型的输入变量,以此降低数据维数,并提升预测模型的拟合速度,进而达到提高光伏预测模型的预测精度。
采用皮尔逊相关系数衡量两特征间是否存在相关性以及相关程度的大小,其计算公式如下:
式中:xi、表示光伏发电功率影响因素与其均值;yi、为光伏发电功率与其均值;r为皮尔逊相关系数。当所计算r的绝对值越接近于1时,表明两特征间相关性越强。其相关程度划分如表1所示[17]。
表1 相关程度划分表
5、预测方法
分别构建GRU单一模型以及双重XGBoost预测模型,得到预测值分别为,然后分别计算GRU与双重XGBoost预测模型的相对预测误差,其计算式如下:
其中,ytruei为对应时刻的真实值;i对应不同时刻,取1,2,3...n。
然后采用倒数误差法分别将上述两模型进行加权组合,得到最后组合预测模型的预测值。其计算公式可表示为:
由式(14)可看出,倒数误差法是将较大权值赋予给误差较小的预测值;反之,则赋予误差较大的预测值,使得整体预测值误差下降,从而达到提升预测精度的目的。
双重XGBoost-GRU组合预测模型的算法描述框图如图2所示。流程主要包括对原始数据的预处理、数据特征选择、归一化处理、划分数据集组合模型构建以及预测。其中,通过XGBoost预测模型进行特征创造在后文会说明。
图2 双重XGBoost-GRU组合预测模型的算法描述框图
6、算例分析
6.1数据源以及计算平台
本文采用的是澳大利亚爱丽丝泉2021年2月11日至2022年2月8日的历史光伏发电以及气象数据[18]。数据的采样时间间隔为5min,每天可采集288组数据,共104544组数据。其中2021年2月11日至2022月1月8日的历史数据用于特征创造;2022年1月9日到2022年2月8日的历史数据用于预测验证,前28天的历史数据作为训练集,后3天的数据作为验证集。
计算平台采用的配置为:win10系统、Intel i5-6200U@2.30GHz、RAM 8.00GB,采用python语言编程实现GRU和XGBoost预测模型的构建以及融合预测模型的构建。
6.2相关性分析
通过计算皮尔逊相关系数,可得到光伏发电功率与各气象数据的相关性,其计算表达式上文已做说明。光伏发电历史功率与各因素之间的Pearson相关系数如表2所示。
表2 光伏发电功率与气象数据的相关系数
由表2可得出,光伏系统效率、总辐射强度、漫辐射强度、温度、相对湿度相关性较强。
6.3光伏发电功率影响因素特征构造
由表2中的Pearson相关系数值可知,光伏发电历史功率与光伏系统效率相关性较强,但在实际预测过程中不能直接使用该特征进行预测。此时,可利用其它气象因素来对光伏效率进行特征构造,再将其预测值用来预测光伏发电功率。
6.4模型参数设置
通过训练测试不同的XGBoost模型参数,寻找最优的参数组合,使得模型的预测误差最低。XGBoost模型参数设置如表3、表4所示。
同理,测试不同的GRU网络结构时,当迭代次数为50,第一、二、三层的均为16个神经元时模型预测误差最小。
表3 XGBoost预测模型特征值创造参数
表4 XGBoost预测模型参数
6.5预测结果分析
为了衡量模型的预测效果,选取澳大利亚爱丽丝泉2022年2月26日-2月28日三天的数据作为验证集,然后根据所得到的模型参数设置,分别构建GRU单一预测模型,并通过第4节的方法构建XGBoost-GRU以及双重XGBoost-GRU的组合预测模型。将上述3种模型的预测结果进行对比分析,不同模型的预测结果效果如图3所示(分别为2月6日-8日7:20~18:10预测曲线)。
图3 光伏发电功率预测曲线
对于不同预测模型的性能,选取平均绝对误差、均方根误差和平均绝对百分比误差这三种评价指标对模型的预测结果进行评估。其计算公式如下:
式中:yi、为光伏发电原始值与其对应的预测值。
表5为各模型的预测误差结果。由表5中三个评价指标可知,基于双重XGBoost-GRU的混合预测模型的MAE、RMSE与MAPE分别为0.0080KW、0.0028KW、0.9726%。双重XGBoostGRU组合预测模型相较于GRU、XGBoost-GRU,三种评价指标MAE、RMSE与MAPE分别降低了97.73%和87.06%、99.50%和97.90%、93.93%和75.65%。这说明双重XGBoost-GRU组合预测模型相较于其他模型,预测值和真实值更为接近,预测偏差更小,有着更好的预测精度。
表5 不同模型MAE、RMAE、MAPE对比
7、结论
本文提出了一种基于特征选择的双重XGBoost-GRU混合模型的预测方法。模型验证采用澳大利亚爱丽丝泉2021年2月11日至2022年2月8日的历史发电数据。其中2021年2月11日至2022月1月8日的历史数据用于特征创造;2022年1月9日到2022年2月8日的历史数据用于模型预测验证。将基于双重XGBoost-GRU混合预测模型与其他模型的预测结果进行对比,得到以下结论:
(1)相较于传统单一模型,本文所提出的基于双重XGBoost-GRU组合预测模型在预测精度以及稳定性上有着明显的提升效果。
(2)双重XGBoost-GRU组合预测模型能够有效应对天气变对光伏发电功率的影响,其预测曲线与真实值曲线更为接近。
(3)构建组合预测模型,能够充分发挥不同模型的预测优势,有效降低单一预测模型的预测误差,提高预测模型的鲁棒性以及预测精度。
参考文献:
[1]王闯,丁帅,贺睿.太阳能光伏性能参数和大型并网太阳能光伏电站性能优化建议.科技创新与应用,2023,13(21):23-27
[2]赖昌伟,黎静华,陈博,等.光伏发电出力预测技术研究综述.电工技术学报,2019,34(06):1201-1217
[3]吴硕.光伏发电系统功率预测方法研究综述.热能动力工程,2021,36(08):1-7
[4]王愈轩,梁沁雯,章思远,等.基于LSTM-XGboost组合的超短期风电功率预测方法.科学技术与工程,2022,22(14):5629-5635
[5]汤德清,朱武,侯林超.基于CNN-LSTM-XGBoost模型的超短期光伏功率预测.电源技术,2022,46(09):1048-1052
[7]陈纬楠,胡志坚,岳菁鹏,等.基于长短期记忆网络和LightGBM组合模型的短期负荷预测.电力系统自动化,2021,45(04):91-97
[8]孙超,吕奇,朱思曈,等.基于双层XGBoost算法考虑多特征影响的超短期电力负荷预测.高压电技术2021,47(08):2885-2898
[9]李丰君,王磊,赵健,等.基于天气融合和LSTM网络的分布式光伏短期功率预测方法.中国电力,2022,55(11):149-154
[10]朱俊丞,杨之乐,郭媛君,等.深度学习在电力负荷预测中的应用综述.郑州大学学报(工学版),2019,40(05):13-22
[12]邱瑞东.基于机器学习的光伏电站功率短期预测方法研究[硕士学位论文].新疆大学,乌鲁木齐市,2022
[14]刘雨晴.区域综合能源系统短期用能需求预测及优化运行策略研究[硕士学位论文].湖南大学,长沙,2022
[17]赵海龙,张丹丹,黄松,等.基于皮尔逊相关系数的海南省地闪密度与雷击故障关系分析.高压电器,2019,55(08):186-192
基金资助:吉林省科技厅项目《大型厂区智能安全管理系统研究与应用示范》(No.20230203139SF)资助;
文章来源:李光环,杨小天,刘训钊.XGBoost与GRU模型在发电功率预测中的应用[J].福建电脑,2024,40(06):21-26.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29人气:9248
人气:5319
人气:3843
人气:3466
人气:3198
我要评论
期刊名称:电力学报
期刊人气:2048
主管单位:国网山西省电力公司
主办单位:山西省电机工程学会,山西大学
出版地方:山西
专业分类:电力
国际刊号:1005-6548
国内刊号:14-1185/TM
创刊时间:1986年
发行周期:双月刊
期刊开本:16开
见刊时间:7-9个月
影响因子:0.814
影响因子:1.445
影响因子:0.657
影响因子:0.000
影响因子:0.688
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!