摘要:为解决复杂气象因素下光伏电站发电量预测结果不理想及波动较大的问题,针对陕西洛南某光伏厂区发电情况,基于XGBoost模型建立光伏电站发电量预测模型并对其进行相关评价及验证。研究结果表明,XGBoost模型在光伏电站发电量预测方面存在较好的精度与可靠性,相较于其他预测模型(支持向量机模型、决策树模型、随机森林模型、BP神经网络模型),XGBoost模型预测值与实际测定值的相对误差最小,相对误差可以控制在6%以内,决定系数最高,证实了XGBoost模型在光伏电站发电量预测方面存在较好的精度与可靠性。本研究可为此类光伏电站厂区的发电量预测及管理运行提供参考。
加入收藏
为改善升级我国能源消费结构,清洁能源的应用势在必行[1]。作为一种方便高效的可再生能源,光伏能源已得到广泛关注。而作为光伏发电系统的核心环节,光伏电站发电量的精准预测对于电力系统的运行和管理显得尤为重要[2-4]。截至目前,主流预测方法主要分为数学统计法和物理法两部分[5]。数学统计法指利用电站历史数据预测发电功率;物理法指预测太阳辐照量,结合光电转换效率公式计算发电功率。诸多学者针对光伏电站发电量影响因素作用程度展开研究。周强[5]等人研究发现太阳辐照度是影响电站发电效率最为关键的因素之一,其变化呈周期性,与电站发电效率呈正相关关系。何旻[6]在研究中指出,日常照射温度、空气湿度和场区内部风速对电站发电量也存在一定的影响,温度的变化会影响光伏组件电流,同时改变电压大小,导致发电功率改变,空气湿度的变化会影响太阳辐照度和温度,风速的改变会影响日常温度高低,各因素之间相互作用影响组件发电效率,致使电站发电量发生改变。综上所述,由于各影响因素所存在的不确定性,综合考虑各因素权重占比,进行光伏电站的发电量预测是非常有必要的。
目前,相关学者关于采用机器学习进行发电量预测已取得一定进展。周强[5]等人采用基于小波神经网络预测方法,发现GA-WNN预测模型具有较高的精度,适用于光伏电站的发电量预测。宰红斌[7]等人根据监测数据,基于GA-SVM算法,并结合GA-Elman神经网络算法估计输电线路的温度,达到了防治采空区灾害的目标。李军[8]等人建立反向传播神经网络分析相关气象数据进行发电量预测,发现传统的BP神经网络所得数据存在精度不够的弊端。
综上所述,为寻求一种合适算法进行数据建模以确保预测的可靠性,本文针对陕西商洛某光伏电站发电量预测偏差较大及气象影响因素易波动的问题,采用极端梯度提升法进行光伏电站某时段内发电量预测,并结合陕西商洛夏秋季该电站气象数据(太阳辐照度、温度、空气湿度和风速)及实际测定发电量进行分析,结果表明,极端梯度提升法(XGboost)具有对训练样本数目及特征数据类型需要较小,训练时间低、适用范围广、精度高的优点,能对相关电站的稳定运行提供帮助。
1、预测模型建立
XGBoost(极端梯度提升法)是采用梯度提升为一般原理设计的机器学习模型,采用强弱学习器相结合的方法。梯度提升树以顺序方式形成,对数据进行学习及改善迭代预测,并结合创建树,通过管理模型的复杂性和减少内置调节过拟合来提高预测精度[9]。
设x1为自变量,特征因子为太阳辐照度、温度、湿度和风速,因变量y1为该光伏场区特征时间段(10:00~17:00)内光伏电站平均发电功率,建立过程如下[9]:
式中,fk为决策树;F为决策树所有相关函数;yi为第i天场区特征时间段内光伏电站平均发电功率的预测值。训练过程中目标函数如下式:
式中,l为损失函数;Ω为正则化项;yi为第i天特征时间段内光伏电站平均发电功率测定值。当第k次迭代时,第i天样本预测公式为:
式中,为经历(k-1)次迭代后来自先前累积模型的电站平均发电功率预测值。因此,改写目标函数如下:
Ω(fk)可表示为:
式中,T为叶的总数;λ和γ为惩罚系数。
提取第k棵分类回归树的电站平均发电功率预测值进行优化。次元二阶泰勒展开式近似表达:
式中,gi与hi分别为第i天电站平均发电功率预测值的一阶梯度与二阶梯度,计算公式如下:
通过代数计算得到第k次迭代中损失函数极值点的数值为:
得到最优解目标函数为:
2、电站发电量预测
本次预测研究选用陕西洛南某光伏电站的日平均发电功率作为发电量预测的评价参数。使用该年度内秋夏两季,三种气象条件下(晴天、阴天、雨天)光伏电站特征时间段内(10:00~17:00)日平均发电功率为基础数据,单次工况各取三组样本作为平行数据,不同工况下各天气类型预测参数如表1所示。
表1 夏季和秋季天气类型预测参数
在进行模型输入前,完成数据标准化处理,符合模型标准后作为初始数据分别输入XGBoost、支持向量机、决策树、随机森林和BP神经网络等各预测模型,预测模型中自变量特征因子为太阳辐照度、温度、湿度和风速,因变量为该厂区特征时间段(10:00~17:00)内光伏电站平均发电功率。表2为模型参数设置,随机选用70%数据为训练集,剩余30%为测试集,用于验证模型精度。
表2 模型最优参数设置表
各预测模型训练完毕后应用于测试集,可以得到相关特征集合中不同特征的相关程度。结果如图1所示,发现日太阳辐照度权重占比可以达到72.3%,电站厂区日常温度、湿度和风速权重占比基本维持在10%左右。日太阳辐照度对电站发电功率的影响显著大于其他因素,与相关学者研究结论一致[5]。各预测模型预测日平均发电功率与实测值对比结果如图2所示。可以发现,各模型训练完成后,决定系数均接近于1,表明各模型的预测精度均较高。且与支持向量机、决策树、随机森林和BP神经网络等预测模型对比,XGBoost模型训练所得预测值与光伏厂区的日平均发电功率实际测定值相差波动范围最小,决定性系数可达0.99。
图1 特征因子权重排序
图2 预测结果对比图
采用训练完毕的各训练模型输入相应训练天数,可以得到不同工况下光伏电站的日发电功率,进而求得日发电量,并与实际测定值对比,所得结果如表3所示。
由表3可以发现,XGBoost模型预测值与实际测定值误差范围在6%以内。晴天工况下的日平均发电量相较于阴天和雨天两种工况存在显著提升,间接证明了日太阳辐照度是影响光伏电站发电效率的关键因素。且相较于阴天和雨天两种工况,厂区晴天环境下发电量增幅区间在35%~42%和68%~75%之间,差距尤为明显。对比实际测定值,支持向量机模型、决策树模型、随机森林模型、BP神经网络模型相对误差均处在7%~18%,误差区间明显高于XGBoost模型,证明XGBoost模型存在预测精度更高的优势。
表3 模型预测结果表
3、XGboost模型预测评价
为了验证XGBoost模型的预测合理性。采用平均绝对误差(MAE)[10]、均方根误差(RMSE)[11]、决定系数(R2)[12]等三个指标来对模型的泛化性、精确性、稳定性进行相关评价。各指标计算公式如下:
式中,yi和分别为日平均发电功率的实际测定值和发电功率模型预测值;yi为测定值的平均值;n为测定值数量。
决定系数R2越靠近1,表示模型预测精度也高。均方根误差值越小说明误差越小,即模型预测精度较为可靠。为验证XGBoost模型合理性与优势,本文采用该厂区特征时间段(10:00~17:00)内光伏电站平均发电功率作测试数据集,将XGBoost模型与其他模型进行精度对比,模型参数见表3。以上述三个指标作为评价标准,训练完毕后各模型对应评价指标结果如图3所示。
图3 各模型评价参数对比图
可以发现,训练完成后各模型精度均符合精度要求(>0.9),其中,XGBoost模型精度最高,决定系数达到0.99。且XGBoost模型的均方根误差最小,相较于支持向量机模型、决策树模型、随机森林模型、BP神经网络模型分别降低了0.681、0.543、0.382、0.762。证明XGBoost模型预测的合理性,为相关光伏电站发电量的预测提供新的思路。
4、结束语
本文就光伏电站发电量预测精度不够及气象因素复杂等一系列问题,提出一种基于极端梯度提升法的光伏电站发电量预测方法。以特征时间段(10:00~17:00)日平均发电功率为评价参数,建立并通过XGBoost模型预测不同气象条件下厂区内的日发电量,完成模型可靠性验证,预测结果精度较高。并采用相关评价指标(RSME、MAE、R2),与诸多模型对比确定了XGBoost模型的优势。
参考文献:
[1]徐修衍.光伏发电的发展现状及控制方法研究[J].光源与照明,2022(4):96-98.
[2]王婧骅,张娟,赵婉茹,等.基于时间序列的分布式光伏电站发电数据采集方法[J].电网与清洁能源,2022,38(6):137-142.
[3]马胜红,赵玉文,王斯成,等.光伏发电在我国电力能源结构中的战略地位和未来发展方向[J].电器工业,2005(6):27-33.
[4]华龙,齐冲,刘雪娇.基于RBF神经网络的太阳能发电量预测[J].科技和产业,2022,22(7):375-380.
[5]周强,张晓忠,陈久益,等.基于遗传算法小波神经网络的光伏电站发电量预测方法[J].智慧电力,2024,52(4):78-84.
[6]何旻.分布式光伏电站中长期发电量影响因素分析及预测方法研究[D].杭州:浙江工业大学,2020.
[7]宰红斌,吴浩林,王昊,等.基于改进机器学习的输电线路弧垂温度估计方法[J].电力工程技术,2022,41(2):209-214,223.
[8]李军,许继生,王生渊.一种并网型光伏电站光功率及发电量预测的方法[J].青海电力,2010,29(2):18-20.
[9]覃源,薛存,李遥,等.盐冻耦合作用下水工混凝土耐久性及寿命预测[J].水力发电学报,2024,43(2):110-122.
[10]纪德洋,金锋,冬雷,等.基于气象相似性的光伏电站输出功率估计[J].太阳能学报,2022,43(5):173-179.
[11]李遥,李照荣,王小勇,等.基于斜面辐射算法的短期光伏功率预测方法研究[J].干旱气象,2020,38(5):869-877.
[13]张苏宁,王芳,朱燕,等.基于极端梯度提升的跨地区多种类电力需求预测[J].计算机与现代化,2022(3):18-22,29.
文章来源:吴江江,兰智.基于极端梯度提升法的某光伏电站发电量预测[J].电器工业,2025,(01):6-10+38.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29人气:4356
人气:1976
人气:1923
人气:1432
人气:1186
我要评论
期刊名称:水力发电学报
期刊人气:1804
主管单位:中国科学技术协会
主办单位:中国水力发电工程学会
出版地方:北京
专业分类:水利
国际刊号:1003-1243
国内刊号:11-2241/TV
创刊时间:1982年
发行周期:月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:0.212
影响因子:1.298
影响因子:0.360
影响因子:0.663
影响因子:0.210
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!