摘要:针对光伏发电功率存在的较大随机性和不确定性问题,提出一种基于改进长短期记忆神经网络的光伏发电功率预测方法,以此提高光伏发电功率预测的准确性。首先,分析与光伏发电出力相关性较强的气象特征,并利用t分布近邻嵌入降维技术将被选取的特征数据降至二维,以减小数据复杂度。然后,通过密度峰值聚类将降维后的数据自动聚成3类,帮助训练长短期记忆神经网络预测模型。与传统循环神经网络和长短期记忆神经网络模型相比,所提模型在光伏发电功率预测方面表现出较高的预测精度,MSE减少49.00%和31.77%,RMSE减少28.59%和17.41%,MAE减少62.35%和53.52%。研究结果表明,该模型在光伏发电功率预测方面具有较好的适用性。
加入收藏
光伏发电相对于传统化石能源发电形式,更具环保性,可有效解决环境污染对生态的影响,对推进可持续发展具有重要的战略意义[1-2]。随着光伏发电装机容量占比的不断提升,光伏发电所带来的问题也不容忽视。由于高比例的光伏和风电的接入,电网所承担的安全风险也在增加[3]。光伏发电在供电时,因受当地天气条件、气候特征等外部环境的影响,发电功率不稳定,功率难以准确预测,不可避免地会产生较大预测误差。因此,分析影响光伏发电的特征因素,可实现较为准确的出力预测,减小预测误差,从而实现经济效益最大化。例如,太阳能随季节、天气、昼夜的变化,光伏发电出力不连续且波动较大[4],对后续未配置储能系统并入电网进行调度带来较大的困难[5]。因此,进行光伏发电功率预测对于电网的安全稳定运行具有重要的意义。
短期的光伏发电功率预测是如今可再生能源领域的热点之一,深度学习方法已广泛应用于发电预测领域[6-8]。文献[9]将长短期记忆神经网络(long short-term memory,LSTM)和卷积神经网络(convolutional neural network,CNN)相结合,构建了一个混合深度学习模型预测光伏出力;文献[10]结合经验模态分解方法和权值共享门控循环单元对风电场的功率进行了预测,实验证明了经验模态分解可有效提高预测精度;文献[11]提出一种针对光伏出力改进时间卷积神经网络的概率预测方法,采用变分模态分解方法分解光伏出力序列,最后用核密度估计了光伏出力概率密度曲线。文献[12]采用t分布近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)降维方法对原始的负荷数据降维,有效解决了台区的的特征维度过高带来的计算的复杂问题;文献[13]将密度峰值聚类和长短期记忆神经网络结合对风电场的风速进行预测,首先聚类成不同类别,然后对同类的风速进行了预测;文献[14]针对负荷的不确定性提出一种自适应的密度峰值聚类方法,有效解决了密度峰值的聚类弊端,针对不同类型的负荷数据,其适应能力更强、鲁棒性更佳;文献[15]采用密度峰值聚类对光伏发电功率进行聚类,然后采用广义回归神经网络对不同的光伏功率聚类类别进行预测,但其对于高维的光伏特征聚类效果不佳,适用范围较小;文献[16]将模糊C均值聚类-随机森林算法和长短期记忆神经网络相结合对分布式光伏电站进行了功率预测,所得结果预测的误差波动性小。
现有的功率预测方法在数据处理方面还存在不足,本文基于长短期记忆神经网络进行改进,选取相关性强的特征数据,采用非线性降维方法(t分布近邻嵌入法)对特征数据进行降维,相对于只能处理线性相关的数据传统线性降维方法主成分分析法,t分布近邻嵌入法能保留非线性的数据关系,能更好地展现出复杂数据的特征和结构,更有利于提取新能源特征数据的隐藏信息。然后采用密度峰值聚类对降维后的数据进行聚类,与传统聚类方法需人为确定聚类中心和聚类数量的区别是,密度峰值聚类能自动确定聚类中心和聚类数量,聚类速度快、鲁棒性强。最后,将聚类后的每一类构建长短期记忆神经网络模型,得到光伏发电功率预测结果。
1、理论基础
光伏发电数据特征多样且存在较大不确定性,每个特征的数值单位存在差异,为更好地训练模型,采用最大最小归一化处理原始特征数据。
1.1最大最小归一化
对数据进行归一化处理可避免神经元过于饱和,归一化处理后可将不同特征值的取值限定在0~1区间内,最大最小归一化的公式为:
式中:zi——最大最小归一化处理后的数据;yi——原始数据;ymin——原始数据特征的最小值;ymax——原始数据特征的最大值。
1.2 t分布近邻嵌入法
t分布近邻嵌入法是一种无监督的能对特征进行降维的随机算法[12]。t-SNE降维作为一种非线性降维方法,可挖掘高维数据的深层信息,最大程度地保留原始数据的结构和特征。对于特征数据集进行降维的步骤为:
1)构建高斯概率分布矩阵P。基于高斯概率分布函数将数据点xi和xj之间的欧氏距离转化为概率相似度,从而构建高斯概率分布矩阵P。具体为:
式中:pij——xi和xj之间的概率相似度;σi——高斯模型的标准差;Pi——相似度矩阵。
2)求低维数据中的t分布概率矩阵Q。在低维空间采用t分布函数将数据点之间的欧式距离转化为概率相似度qij:
式中:Yi——低维度下特征集;Qi——相似性度量矩阵。
3)使用KL散度迭代求Y。基于Kullback-Leible散度的梯度下降从而找到最小化pij和qij不匹配的低维数据。
如果pij大,则需一个较大的qij值来表示具有更高相似性的局部点;如果pij小,则需一个较小的qij值来表示相距较远的局部点。
图1 t-SNE流程
Fig.1 Flowchart of t-SNE
1.3密度峰值聚类
密度峰值聚类(density peak clustering,DPC)能弥补传统聚类算法不能自动确定聚类中心和聚类数量的不足,还能快速找到数据点中的密度峰值[15],同时还具有识别任意簇型、所需参数少的优点。对于数据集X={x1,x2,⋯,xn},其对应的下标集为IX={1,2,⋯,N}。运用DPC进行聚类的步骤如下:
1)计算数据点两两之间的距离dij。引入欧式距离来表示不同样本在空间距离上的数值差异,其表达式为:
2)找到密度计算的截断距离dc。要求平均每个点周围距离小于dc点的数量占总数的1%~2%。
3)计算每个点的局部密度ρi。局部密度采用高斯核函数,其表达式为:
4)找到距离其最近点的距离δi,即如果数据点xi的局部密度取值最大时,则该样本点的距离长度为在所有数据中与数据点xi之间距离最远的数据点到数据点xi的距离;否则,该样本点的距离表示该样本点与其距离最近,且密度高于自身的样本距离。
5)选择数据聚类中心。
6)对除聚类中心的点进行聚类。
1.4长短期记忆神经网络
长短期记忆神经网络能有效处理过去的信息,适用于时间序列的数据预测。LSTM作为RNN的一种,能有效解决RNN的梯度消失和梯度爆炸的问题,长短期记忆神经网络的基本结构有输入门、输出门和遗忘门,能保留原始数据的有效信息,从而达到记忆的功能。对于原始数据序列x=(x1,x2,⋯,xn),循环神经网络的计算公式为:
式中:fa——激活函数;W——权重系数矩阵;b——偏置向量;下标t——时刻。
LSTM的结构如图2所示,计算过程如式(15)~式(19)所示。
式中:i——输入门;f——遗忘门;C——细胞状态;o——输出门;σ——sigmoid激活函数;tanh——双曲正切激活函数。
图2 LSTM结构
2、构建光伏发电功率预测模型
基于以上理论,本文构建一种t-SNE-DPC-LSTM的光伏发电功率预测模型。首先分析影响光伏发电功率的气象因素,选取相关性大的特征数据进行降维,然后将降维后的数据进行聚类,最后将聚类后的数据分别输入到长短期记忆神经网络中进行预测。
2.1光伏发电功率影响因素
光伏发电功率的输出很大程度上取决于气象参数的变化。影响光伏发电功率大小的因素有气温、相对湿度、地面气压、太阳辐照度、风速、风向等。通过计算气象特征数据和光伏发电功率的Person相关系数,所得结果如表1所示。
表1 光伏发电功率影响因素相关系数
根据表1,选用气温、云层不透明度、太阳辐照度、相对湿度以及历史光伏发电数据作为原始特征输入数据。气温、云层不透明度和太阳辐照度与实际功率呈正相关,相对湿度与实际功率呈负相关。分析其原因,不同的天气类型气温会有所不同,晴天、雨天和多云等不同天气类型带来的太阳辐射量也会有所变化,从而造成光伏发电功率的变化[17]。大气云层会相应地遮挡照射到地表的太阳辐射,造成光伏发电的随机性与波动性。太阳辐照度和实际功率表现出强相关性,辐照度越高太阳辐射量越多,光伏发电功率也越大。相对湿度最主要的是会干扰光辐射在空气中的穿透能力以及光伏组件的吸热性能从而影响光伏发电功率的大小[18]。
2.2光伏发电功率预测步骤
光伏发电功率预测的流程如图3所示。
图3 光伏发电功率预测流程
1)输入原始光伏特征数据,将原始特征数据进行归一化处理,选取N个相关性强的特征数据;
2)采用t-SNE方法对N维特征数据进行降维,将N维数据降至二维;
3)降维后的数据进行密度峰值聚类,得M个类别的聚类数据;
4)采用长短期记忆网络分别对M类的光伏发电功率数据进行功率预测。
3、算例分析
为验证本文所提方法的有效性及可行性,采用华东某地区2020年1月1日—4月30日共11616个点的光伏发电数据和气象数据作为本文的数据集,采样间隔为15 min。将训练集和验证集按4∶1的比例进行划分,同时为对比分析本文模型的性能,将RNN模型和LSTM模型与本文模型进行对比。
3.1实验配置及参数设置
该算例在具有Intel®Xeon®Gold 5217 CPU@3.00 GHz,32 GB内存的计算机上执行。模型开发代码基于Matlab编写。本文在进行实验验证时采用网格搜索方法调整3种模型的参数,经网格搜索后,3个方法模型预测精度较高时参数不完全一致,RNN模型在初始学习率0.005、学习下降因子为0.5时预测精度较高,LSTM模型在初始学习率0.005、学习下降因子为0.2时预测精度较高。本文模型实验参数设置如表2所示。
表2 实验参数设置
3.2模型评价指标
本文采用均方误差(mean squared error,MSE)、均方根误差(root mean squared error,RMSE)、平均绝对误差(mean absolute error,MAE)、这3个评价指标来评价本文所设计模型的预测效果。其计算公式为:
式中:Zi——真实值;Z'i——预测值。
3.3特征数据t-SNE降维
根据表1气象因素与光伏发电功率相关系数大小,本文选用气温、云层不透明度,太阳辐照度、相对湿度、历史光伏数据作为原始特征输入数据。输入特征维度为五维,因气象因素存在较大不确定性,相关特征数值差异较大,因此采用非线性降维方法t-SNE降维来减小特征数据的维度,本文将特征数据经t-SNE降维至二维。特征数据经t-SNE降维后的结果如图4所示,横、纵坐标数值分别表示输入五维特征降维后映射的两个维度数据。降维后数据的复杂度减小,模型的计算量降低,有利于提高模型计算速度。
图4 降维结果
3.4 DPC聚类
选定的特征数据经过降维后,数据复杂度大大降低,为提高预测的精确性,本文采用密度峰值聚类对降维后的特征数据进行聚类,密度峰值聚类相较于传统的聚类方法具有简单高效的优势,也无需提前划分类簇,适用性更强。图5为经密度峰值聚类后的结果,横、纵坐标数值分别表示输入五维特征降维后映射的两个维度数据。将降维后的数据聚成3类,分别为类簇1、类簇2、类簇3。各类簇训练集和测试集的划分如表3所示。
图5 聚类结果
表3 各类簇训练集和测试集的划分
3.5预测模型结果分析
将聚类后的3类数据分别输入到LSTM模型里进行预测,类簇1~3所得预测结果如图6所示。从图6a可知,类簇1的发电功率数据差异性较大,光伏发电功率数值的峰值落差相对较大。从图6b可知,类簇2发电功率数据的峰值存在一定差异,光伏发电功率数值的峰值落差相对于类簇1稍小,但类簇2的发电功率数据的波动性相较于类簇1稍大,发电功率不稳定。从图6c可知,类簇3的发电功率数据差异性和峰值落差比类簇1和类簇2相对较小,发电功率更为稳定,可能是由于天气的因素导致类簇1和类簇2发电功率出现了波动。
图6 预测效果
3.6对比实验结果分析
为验证本文模型选取t-SNE降维方法和密度峰值聚类方法对原始特征数据进行处理的有效性,将本文模型的预测结果和未经改进的长短期记忆神经网络预测模型进行对比,同时还将循环神经网络模型RNN与本文模型进行对比。图7所示为3个模型的预测结果图。表4所示各模型的预测误差指数。
图7 对比实验预测结果
表4 误差结果对比
分析图7和表4可知,LSTM模型相较于RNN模型均方误差MSE减少25.24%,均方根误差RMSE降低13.54%,平均绝对误差MAE减少18.99%,所有指标均有所降低。本文对原有LSTM模型进行改进,选取与光伏发电功率相关较强的有关特征数据,采用降维和聚类对数据进行预处理。从表4可知,本文模型相对于LSTM模型,在均方误差MSE减少31.77%,均方根误差RMSE降了17.41%,平均绝对误差MAE减少53.52%。
LSTM模型结构相较于RNN模型增加了遗忘门,更加利于特征数据的流通和筛选,在一定程度上减少了数据的冗余。本文方法在原有LSTM模型的基础上增加了降维和聚类,对于数据的处理更为细致,也能有效提高计算精度,所以在实验验证时与RNN模型和原有LSTM模型进行对比,可验证本文方法可处理高维数据的有效性,以及提高预测精度的适用性。综上,本文模型的综合预测效果最佳,适用性较强。
4、结论
本文针对光伏发电功率存在较大的随机性和不确定性,提出一种基于改进LSTM的光伏发电功率预测方法。具体来说,本文分析了与光伏发电功率相关性较强的天气特征,包括有气温、云层不透明度、太阳辐照度、相对湿度。经过多次实验对比,本文模型主要存在以下几点优势:
1)选用与光伏发电功率相关系数强的特征数据和历史光伏发电数据作为本文所采用的t-SNE降维的输入数据,将特征数据降至二维有效数据,在保留有效特征数据的同时还能降低数据复杂度,减小模型计算量。
2)降维后的数据采用密度峰值聚类将数据聚成3类,将有相同特性的数据聚成一类,能更好地帮助新能源功率预测模型训练模型,从而提高预测精度。
3)将本文模型与RNN模型和原有LSTM模型的预测结果进行比较,MSE分别减少49.00%、31.77%,RMSE分别降低28.59%、17.41%,MAE分别减少62.35%、53.52%。
参考文献:
[1]贾凌云,云斯宁,赵泽妮,等.神经网络短期光伏发电预测的应用研究进展[J].太阳能学报,2022, 43(12):88-97.
[3]宋文峰,王倩,李亚楠,等.基于双馈风电场低电压穿越的高温超导故障限流器建模及其参数优化[J].电力系统保护与控制,2019, 47(18):99-107.
[6]李燚航,翟卫欣,颜寒祺,等.基于U-net神经网络模型的PM2.5逐小时浓度值预测模型[J].北京大学学报(自然科学版),2020, 56(5):796-804.
[7]宋飞扬,铁治欣,黄泽华,等.基于KNN-LSTM的PM2.5浓度预测模型[J].计算机系统应用,2020, 29(7):193-198.
[8]肖云鹏,王锡凡,王秀丽,等.面向高比例可再生能源的电力市场研究综述[J].中国电机工程学报,2018, 38(3):663-674.
[10]盛四清,金航,刘长荣.基于VMD-WSGRU的风电场发电功率中短期及短期预测[J].电网技术,2022, 46(3):897-904.
[11]邢晨,张照贝.基于改进时间卷积网络的短期光伏出力概率预测方法[J].太阳能学报,2023, 44(2):373-380.
[12]连子宽,姚力,刘晟源,等.基于t-SNE降维和BIRCH聚类的单相用户相位及表箱辨识[J].电力系统自动化,2020, 44(8):176-184.
[13]王东风,李嘉宇,黄宇,等.风电场风速预测的密度峰值聚类方法研究[J].太阳能学报,2021, 42(12):110-118.
[14]姚黄金,雷霞,付鑫权,等.基于改进自适应密度峰值算法的日负荷曲线聚类分析[J].电力系统保护与控制,2022, 50(3):121-130.
[15]姚宏民,杜欣慧,秦文萍.基于密度峰值聚类及GRNN神经网络的光伏发电功率预测方法[J].太阳能学报,2020, 41(9):184-190.
[16]方鹏,高亚栋,潘国兵,等.基于LSTM神经网络的中长期光伏电站发电量预测方法研究[J].可再生能源,2022, 40(1):48-54.
[17]李瑞青.计及气象因素的超短期光伏电站出力预测研究[D].吉林:东北电力大学,2019.
基金资助:国家自然科学基金(52177069);
文章来源:彭曙蓉,陈慧霞,孙万通,等.基于改进LSTM的光伏发电功率预测方法研究[J].太阳能学报,2024,45(11):296-302.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29人气:9194
人气:3576
人气:2931
人气:2681
人气:2042
我要评论
期刊名称:电力系统保护与控制
期刊人气:3078
主管单位:许昌开普电气研究院有限公司
主办单位:许昌智能电网装备试验研究院
出版地方:河南
专业分类:电力
国际刊号:1674-3415
国内刊号:41-1401/TM
邮发代号:36-135
创刊时间:1973年
发行周期:半月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.814
影响因子:1.445
影响因子:0.657
影响因子:0.000
影响因子:0.688
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!