91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

分时长短期记忆神经网络基础上光伏发电超短期功率预测

  2020-12-09    123  上传者:管理员

摘要:准确预测光伏发电功率对电力系统运行调度至关重要。提出一种基于Spearman相关系数和分时长短期记忆网络的光伏发电功率预测方法。首先利用Spearman相关系数分析每个时刻下影响光伏发电功率的因素,选取相关度高的影响因素作为长短期记忆网络模型的输入变量;然后,对每个时刻建立一个基于长短期记忆网络的预测模型,实现分时光伏发电功率的预测。最后,利用实际光伏发电站的历史发电功率和数值天气预报数据进行案例分析。结果表明,所提方法比单一长短期记忆网络预测模型具有更高的预测精度。

  • 关键词:
  • Spearman相关系数
  • 光伏发电
  • 分时预测
  • 超短期功率预测
  • 长短期记忆网络
  • 加入收藏

近年来全球光伏市场规模持续增长,2018年全球新增装机容量为99.8GW,再创历史新高,中国光伏市场新增装机容量约为45GW,位居全球首位[1]。光伏发电功率的预测是为了保证电网合理调度,以降低对电网造成的冲击[2]。然而,光伏发电系统的输出功率受到昼夜、季节和天气等自然因素影响而存在间歇性强、波动性和不确定性大的特点,给发电功率的准确预测带来巨大的挑战[3]。因此,光伏发电系统的超短期功率预测对电力系统调度和光伏电站的优化运行至关重要[4,5]。

目前,针对光伏功率预测问题已经提出了很多方法。根据建模方式的不同,常用的预测方法主要分为物理方法和统计方法两类[6]。物理方法需要建立光伏电池等效模型,将太阳辐照度预测值代入计算公式,得到电流电压输出,从而达到光电转换。文献[7]对比了3种光伏电池组件模型(3参数、4参数、5参数等效电路),以预测单晶体和多晶光伏电池板产生的功率。这类方法依赖于太阳辐照度的预测值并且未考虑实际运行时的气象影响因素。统计方法中既包括自回归(autoregressivemodel,AR)、自回归滑动平均(autoregressivemovingaveragemodel,ARMA)等线性预测算法[8,9],又包括径向基神经网络(radial-basisfunction,RBF)[10]、支持向量机(supportvectormachine,SVM)[11,12]、深度学习(deeplearning,DL)[13]等非线性人工智能预测算法。文献[10]将相似日数据作为训练样本,使用遗传算法对网络权值参数进行优化,建立了基于遗传算法的模糊RBF光伏发电功率预测模型。文献[11-12]考虑了天气条件因素,将同一类型天气划分为一类,实现了将SVM运用在不同天气类型下的光伏发电功率预测算法。该方法考虑了在不同天气条件下对光伏发电系统输出功率的影响,使得预测精度有所提高但对天气的分类过于简单,且SVM是一种适合小样本预测的学习方法,对大规模训练样本难以实施。文献[13]利用孤立森林算法对训练样本异常数据清洗,同时对天气分类,再结合长短期记忆神经网络进行短期光伏发电预测。该方法清洗异常数据后使得在不同天气类型预测效果更为稳定,但对天气影响因素考虑不多,且天气分类太少。文献[14-15]通过相关分析或聚类使得训练数据更具有特征性,提出了一种基于Takagi-Sugeno(T-S)模糊模型的光伏发电短期预测方法。该预测模型可以描述复杂的非线性光伏功率输出,解决了传统神经网络收敛速度慢的问题。文献[16-17]利用Pearson相关系数筛选出与光伏发电功率相关性强的因素作为输入,各自提出了ElmanNeuralNetwork(ENN)和级联前向神经网络预测方法。这2种方法虽然考虑了变量间的相关性使得预测精度提高,但Pearson相关系数适用条件需变量为正态分布,且ENN收敛速度慢,容易陷入局部最优。

光伏发电功率预测过程中,发电功率具有明显的动态特性,即预测时刻的发电功率不仅与输入前一时刻发电功率相关,与之前时刻状态也具有一定的相关性。因此,SVM和一些传统神经网络的静态预测方法不具备长时间的记忆能力,在光伏发电预测应用中存在局限性。另外,发电功率的影响因素众多,预测方法能否有效提取有用信息也非常重要[18]。针对传统神经网络不能对序列前后数据进行联系以及特征提取的问题,深度学习算法可有效解决。利用其在大数据分析和高级特征提取方面的优势,并且深度学习算法具有多层次结构将更好地应对光伏发电功率预测问题。深度学习算法中循环神经网络(recurrentneuralnetworks,RNN)[19]对输入信息有着一段时间的记忆保留,并利用保留住的信息进行传递影响后面节点的输出。但是当预测点与相关信息间隔很远时,则出现梯度消失问题,从而简单的循环神经网络无法记忆长期信息。分时长短期记忆网络(longshort-termmemory,LSTM)[20]是一种特殊的循环神经网络,通过自身特殊的结构设计,解决了常规循环神经网络训练过程中的梯度消失问题,使得其对信息长时间记忆保留,保证了很远的信息仍能进行记忆学习,并且LSTM已经在图像分类处理、翻译、语音辨识等领域有了广泛的应用[21,22,23,24]。

由于光伏发电功率在不同时刻受到的气象因素影响不同,当采用单一模型预测时往往会出现较大的误差,所以有必要对不同时刻的发电功率建立不同模型进行分时预测。本文提出一种基于分时Spearman相关系数和分时长短期记忆网络的光伏发电功率预测方法。首先通过Spearman相关系数分析选取出与发电功率相关性强的变量,确定模型的输入变量。接着再次利用Spearman相关系数计算输入变量中各个时刻数据间的相关性,相关性高的时刻数据确定为LSTM模型的输入数据。然后,利用LSTM网络对每个时刻输入数据序列与发电功率序列的非线性关系建模,构建分时长短期记忆网络的预测模型。最后,选取某实际光伏电站作为研究对象进行验证,通过对比不同的输入数据和单一预测模型验证了该算法在预测精度上有所提高,且在不同天气状况下具有一定适用性。


1、光伏发电功率与气象因素相关性分析


影响光伏发电的因素众多[25],若只使用发电功率历史数据作为网络模型的单变量输入,由于没有其他影响因素作为输入,那么在发电功率突变时刻无法准确预测,从而造成预测精度较低。但若输入变量过多,自变量之间存在的相关性会导致共线性问题且输入变量越多,对模型训练能力的要求就越大。因此,通过相关性分析人工筛选出影响光伏发电功率较强的因素,将其作为模型输入变量。本文获取数据包含实际当地测量数据变量:总辐射、直射辐射、散射辐射、组件温度、环境温度、气压、相对湿度、发电功率数值天气预报数据中主要变量:感热通量、潜热通量、短波辐射、长波辐射、地表气压、大尺度降水、对流降水和湿度。图1为某电站2017年7月份实测数据中总辐射、直射辐射、散射辐射、发电功率和气象预测数据中短波辐射、长波辐射6个变量的时间序列曲线图。

图12017年7月份各变量单一时间序列曲线图

现有方法采用Pearson相关系数进行相关性分析选取输入变量,但使用Pearson相关系数计算时的变量数据需满足正态分布[26],而图1中的变量数据经过Kolmogorov-Smirnov(K-S)正态检验并不服从正态分布。由于Spearman相关系数适用范围广,只要是成对的2个变量都可以使用Spearman相关系数,所以本文采用Spearman相关系数进行相关性分析。2个n维向量x,y的Spearman相关系数计算公式如下:

式中:Ri和Si分别为向量x,y进行排序后观测值i的秩次;¯R和¯S分别为向量x,y的平均秩次;N为观测值的总数量;di=Ri-Si,表示2个变量中观测值i的秩次之差。

Spearman相关系数中ρs是[-1,1]中的实数。当ρs>0时,两变量成正相关,反之,则负相关。|ρs|越大,变量x和y的相关程度越高。光伏发电功率与气象实际测量数据各变量的Spearman相关性计算结果如表1所示。光伏发电功率与气象预测数据各变量的Spearman相关性计算结果如表2所示。

表1光伏发电功率与实测气象数据间Spearman分析结果

表2光伏发电功率与预测气象数据间Spearman分析结果

由表1可知,光伏发电功率与总辐射相关性最大,Spearman相关系数为0.94;与散射辐射相关程度次之,相关系数为0.90;与直射辐射相关系数为0.86;发电功率与相对湿度相关程度最低为-0.12,所以发电功率与实测数据中的主要影响变量选择为总辐射、直射辐射和散射辐射。由表2可知,光伏发电功率与长波辐射和短波辐射强相关,相关系数分别为0.90、0.80,则发电功率与预测数据中的主要影响变量选择为长波辐射和短波辐射。

光伏发电功率不仅与前一时刻的影响因素有关,不同时刻下的影响因素和发电功率对预测时刻的发电功率皆具有一定影响。当预测模型输入数据选择为影响发电功率的多个时刻数据值时,其预测准确性会比只选择前一时刻数据高。所以对发电功率与总辐射、散射辐射、直射辐射、短波辐射、长波辐射6个变量各个时刻数据进行Spearman相关系数分析计算,通过相关性分析选择出与预测时刻发电功率相关性强的时刻数据,并以此为依据确定分时长短期记忆网络预测模型的输入数据。发电功率部分时刻的相关性分析结果见附录表A1,发电功率与总辐射部分时刻、直射辐射部分时刻、散射辐射部分时刻、长波辐射部分时刻、短波辐射部分时刻的相关性分析结果分别见附录表A2—A6。

从以上部分时刻Spearman相关分析结果可知,6:30—7:30这个时间段的实测数据中光伏发电功率、总辐射和散射辐射至少与前2个时刻的发电功率皆具有强关联。预测数据中的长波辐射不仅与当前时刻的发电功率具有强关联,且与前一时刻的发电功率也具有强相关。而这个时间段预测数据中的短波辐射与光伏发电功率相关性很弱,且由附录表A7可知,在17:30—18:30时间段短波辐射与发电功率相关性较强。由此可知,虽然影响光伏发电功率的主要变量为总辐射、直射辐射、散射辐射、短波辐射、长波辐射,但是在不同时刻变量对发电功率影响程度不同,甚至可能不受影响。那么在输入数据选择时,不同时刻下总辐射、直射辐射、散射辐射根据相关性强度选择与发电功率强相关的时刻数据作为输入数据,短波辐射、长波辐射根据相关性强度选择预测时刻数据以及强相关的时刻数据作为输入数据。由此不同时刻根据相关性强度选择不同的输入数据,从而分时预测就有可能比单一模型预测得到更理想的预测效果。


2、分时长短期记忆网络预测模型


2.1LSTM单元结构

LSTM网络模型由输入层、隐含层和输出层构成,隐含层不再是普通的神经单元,而是具有独特记忆细胞和3个“门”来控制记忆细胞状态的LSTM单元。3个“门”分别是:输入门,遗忘门,输出门。LSTM依靠独特记忆细胞以及“门”结构解决了RNN短时记忆的问题,可以记住更加久远的信息。LSTM单元结构如图2所示。其中Xt为与预测时刻光伏发电功率强相关的数据;Ht为预测时刻光伏发电功率。

图2LSTM单元结构

LSTM单元中遗忘门控制在最新时刻哪些信息需要被抛弃并重置记忆细胞;输入门控制哪些输入信息送入记忆细胞,对细胞状态进行更新;输出门控制记忆细胞中哪些信息会被输出并进入下一个时间步长中去;记忆细胞用于保存t时刻的状态信息。其原理为“门”结构中包含着sigmoid激活函数,sigmoid把值压缩到0~1之间,这样使得信息乘以0时,这部分信息被剔除,当信息乘以1时,这部分信息被保存,由此进行信息的更新或忘记。其中各变量之间的计算公式如下:

式中:ft、it、ot、Ct分别为遗忘门、输入门、输出门、记忆细胞状态的向量值;Wxf、Wxi、Wxo、Wxc为输入Xt到遗忘门、输入门、输出门、记忆细胞之间的权重矩阵;Whf、Whi、Who、Whc为上一个单元输出Ht-1到当前单元遗忘门、输入门、输出门、记忆细胞之间的权重矩阵;Wcf、Wci、Wco为上一个记忆细胞状态到当前单元遗忘门、输入门、输出门之间的权重矩阵;bf、bi、bo、bc为当前遗忘门、输入门、输出门、记忆细胞的偏置向量;σ为激活函数,一般为sigmoid函数。

LSTM单元的信息传递顺序如图3所示,其中A为一个LSTM单元,图3中隐含层有2个LSTM单元。当输入数据Xt从输入层的神经元输入后,流向不同LSTM单元中的输入门、遗忘门、输出门,然后对数据信息进行控制和更新。当数据信息在一个LSTM单元内部中通过“门”结构更新处理完成后,这个LSTM单元加工得到的信息将传递以下2个地方:1)信息会传递给下一个与之连接的LSTM单元,并在下一个LSTM单元的“门”结构进行下一步处理;2)信息会传递给输出层的神经元。从以上LSTM单元的信息传递流程可知,其内部需要对大量外来信息进行控制更新并传递给下一节点,从而为下一个单元提供信息。

图3LSTM单元信息传递顺序

2.2基于分时LSTM光伏发电功率预测

由光伏发电功率与气象因素间Spearman相关系数分析结果可知,不同时刻影响因素的影响程度不同,单一预测模型无法对其进行考虑。因此本文基于分时LSTM网络对光伏发电功率进行预测。光伏发电功率受昼夜、光照时长等条件影响,所以仅考虑预测时段为6:15—20:00,其中时间间隔为15min,共56个时刻的发电功率预测,则需要建立56个LSTM预测模型。每一个时刻模型输入选择与当前时刻发电功率相关性达到0.8以上的数据。这样,就确定了模型输入层的输入数据,模型其他参数确定:输入层神经元个数为输入数据维度;隐含层的层数经过考虑模型拟合效果和训练计算时间确定为3层;隐含层神经元第1层个数为输入数据维数的两倍,第2、3层为输入数据维数;输出层为预测时刻的发电功率,神经元个数为1。那么不同时刻下模型的参数设置也不同。如预测7:30时刻的光伏发电功率,输入数据为6:45—7:15的发电功率实测数据,7:00、7:15的总辐射和散射辐射实测数据,7:15、7:30的长波辐射预测数据。那么输入数据为9维,输出为1维,则输入层为9个神经元,输出层为1个神经元。隐含层第1层的神经元个数为18,第2、3层的神经元个数为9。图4给出了该时刻预测模型的基本网络结构图,含一个输入层,3个隐含层,1个全连接层,1个输出层,其中x1,x2,…,x9为9个输入数据,Cij代表第i个LSTM隐层的第j个LSTM神经元节点,第1层18个神经元,第2、3层9个神经元,H1为输出层神经元,输出7:30光伏发电功率的预测结果。

图47:30光伏发电功率预测模型网络

基于分时LSTM的光伏发电功率预测具体步骤如下:

步骤1:读入数据,对各变量进行Spearman相关系数分析,找出与发电功率强相关的因素;

步骤2:提取发电功率和强相关因素的各个时刻数据,并对提取数据相互间再次进行Spearman相关系数分析;

步骤3:由分析结果确认与预测时刻发电功率强相关时刻数据;

步骤4:建立分时LSTM模型,将强相关时刻数据作为各个时刻模型输入数据,进行归一化;

步骤5:对输入数据划分为训练集与测试集;

步骤6:输入LSTM网络模型,得出预测值,进行反归一化;

步骤7:测试值与真实值进行误差计算;

步骤8:利用训练好的LSTM网络模型,对预测时刻进行预测。


3、算例分析


3.1数据说明

本文所使用的原始数据集为国内某光伏电站2017年数据,该电站装机容量为100MW,数据采样时间间隔为15min。通过变量间Spearman相关系数分析结果确定将总辐射、直射辐射、散射辐射、光伏发电功率、短波辐射、长波辐射作为输入变量,由各个时刻间的关联分析结果确定分时预测模型的输入数据,每个时刻共计365组数据。

3.2误差评估指标

评估模型预测值与训练值拟合程度采用均方误差(meansquareerror,MSE)作为损失函数,若损失函数值越小,说明模型拟合的越好,计算公式为式(8)。以平均绝对误差(meanabsoluteerror,MAE)、均方根误差(rootmeansquareerror,RMSE)为指标进行误差计算[27],计算公式如下所示:。

式中:N为预测样本个数;pi为光伏发电功率预测值;Pi为光伏发电功率实际值。

3.3预测结果及分析

为检验本文提出的选择与预测时刻光伏发电功率强相关数据作为输入的有效性,从而确定分时预测模型。由2.2节中确定了每个预测时刻的模型的数据集、输入层神经元个数、隐含层层数及其神经元个数、输出层神经元个数。在不同预测时刻下,LSTM分时预测模型的输入数据选择也不同。通过采用同种LSTM分时预测模型,模型输入数据选择预测时刻前一时刻的发电功率,对比模型输入数据选择与预测时刻强相关的数据。选择多个时刻进行预测后并通过误差结果进行对比。以7:00,9:00,12:00,14:00,16:00,18:00六个时刻为例进行预测,其预测模型输入数据如表3所示,预测误差结果如表4所示。

表3预测模型输入数据

表4预测误差结果对比

从预测误差结果可知,同种分时LSTM预测模型下,考虑了多个强相关时刻作为输入数据的预测精度明显高于只使用了上一时刻发电功率的作为输入数据的预测精度。从而也说明了本文提出的以Spearman相关系数为依据,选择与预测时刻强相关数据作为输入对预测精度有所提升。

为检验文中提出的分时LSTM网络模型对发电功率预测精度的提升。通过单一LSTM预测模型、BP神经网络预测模型和分时LSTM预测模型对该电站10月1日至10月5日的发电功率进行预测。其中56个分时预测模型中预测同一天中各自对应时刻的发电功率,然后将这56个时刻的预测结果进行组合便形成了该天的光伏发电功率预测曲线。图5和图6分别为10月3日和10月5日的光伏发电功率实际与预测曲线。表5为5天中3种模型误差评估指标的结果对比。

图510月3日发电功率的实际与预测曲线

图610月5日发电功率的实际与预测曲线

表5预测误差结果对比

由图5、图6可知,分时LSTM模型预测效果最好,对存在功率大变化的时刻处理得更好。单一LSTM模型预测和BP预测中发电功率变化趋势与实际发电功率曲线相似,误差皆大于分时LSTM模型。从表5可看出,单一LSTM模型预测精度优于BP网络模型预测精度,说明了LSTM模型能有效解决光伏发电功率预测等时间序列问题。分时LSTM模型在单一LSTM模型基础上,进行分时处理,在预测精度上有很大的提升。因为LSTM分时预测模型的数据集为与预测时刻发电功率强相关的时刻数据,而传统单一LSTM模型的数据集为一年中所有时刻的数据,在模型训练时,分时预测能更准确的对突变时刻进行校正。因此,图5和图6中传统单一LSTM模型预测曲线变化趋势与实际功率曲线变化趋势相似,而LSTM分时预测曲线在功率突变时刻虽不平滑,但预测值更接近实际值。所以本文提出的基于分时LSTM网络的光伏发电超短期功率预测在不同天气条件下具有一定优越性。


4、结论


1)采用Spearman相关系数先分析各个变量间的相关性,再分析变量各个时刻数据间的相关性,一方面降低了变量多可能造成的共线性问题,另一方面确定了分时预测模型的输入数据。

2)通过算例结果验证了在同种LSTM模型下,将与预测时刻光伏发电功率强相关的数据作为输入数据时,其预测精度有所提高。也验证了基于分时LSTM网络模型比单一LSTM网络模型预测和BP神经网络模型预测效果更好,预测精度更高。

3)由于本文提出的基于Spearman相关系数和分时长短期记忆网络的光伏发电功率预测,预测时间局限于6:15—20:00,但是由于季节、昼夜的影响,实际上在夏季中发电站6:00和20:15时刻也有发电功率。在后续的研究工作中,可结合其他机器学习算法,对这些特殊的时刻进行准确预测,并且进一步提高预测的精度。

附录A

附表A1当前光伏发电功率与历史光伏发电功率Spearman相关性分析

附表A2发电功率与总辐射部分时刻Spearman分析

附表A3发电功率与直射辐射部分时刻Spearman分析

附表A4发电功率与散射辐射部分时刻Spearman分析

附表A5发电功率与短波辐射部分时刻Spearman分析

附表A6发电功率与长波辐射部分时刻Spearman分析

附表A7发电功率与短波辐射部分时刻Spearman分析


参考文献:

[1]赛迪智库光伏产业形势分析课题组.2019年中国光伏产业发展形势展望[J].电器工业,2019(5):51-55.

[2]邓忻依,艾欣.分布式光伏储能系统综合效益评估与激励机制[J].发电技术,2018,39(1):30-36.

[3]庄雅妮,杨秀媛,金鑫城.风光储联合发电运行技术研究[J].发电技术,2018,39(4):296-303.

[5]陈麒宇.泛在电力物联网实施策略研究[J].发电技术,2019,40(2):99-106.

[6]龚莺飞,鲁宗相,乔颖,等.光伏功率预测技术[J].电力系统自动化,2016,40(4):140-151.

[10]叶林,陈政,赵永宁,等.基于遗传算法—模糊径向基神经网络的光伏发电功率预测模型[J].电力系统自动化,2015,39(16):16-22.

[11]王昕,黄柯,郑益慧,等.基于PNN/PCA/SS-SVR的光伏发电功率短期预测方法[J].电力系统自动化,2016,40(17):156-162.

[18]杨东升,王道浩,周博文,等.泛在电力物联网的关键技术与应用前景[J].发电技术,2019,40(2):107-114.

[24]朱乔木,李弘毅,王子琪,等.基于长短期记忆网络的风电场发电功率超短期预测[J].电网技术,2017,41(12):3797-3802.

[25]史洁,刘晓飞.新能源功率预测算法优化研究[J].发电技术,2019,40(1):78-82.

[26]钱宇华,成红红,梁新彦,等.大数据关联关系度量研究综述[J].数据采集与处理,2015,30(6):1147-1159.

[27]国家能源局.NBT32011-2013光伏发电站功率预测系统技术要求[S].北京:中国电力出版社,2014.


田剑刚,张沛,彭春华,时珉,王铁强,尹瑞,王一峰.基于分时长短期记忆神经网络的光伏发电超短期功率预测[J].现代电力,2020,37(06):629-638.

基金:国家自然科学基金项目(51867008,51567007);江西省自然科学基金项目(20192ACBL20007);河北省重大研发计划项目(19214310D).

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

发电设备

期刊名称:发电设备

期刊人气:645

期刊详情

主管单位:上海发电设备成套设计研究院有限责任公司

主办单位:上海上发院发电成套设备工程有限公司

出版地方:上海

专业分类:电力

国际刊号:1671-086X

国内刊号:31-1391/TN

邮发代号:4-622

创刊时间:1987年

发行周期:双月刊

期刊开本:大16开

见刊时间:4-6个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定