91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于周期特征提取的DLnet预测模型研究

  2024-10-10    88  上传者:管理员

摘要:现有的预测方法很少独立分析能源消耗的周期性特征。本文提出了一个短期办公建筑能耗预测模型(DLnet),以解决周期性能耗数据利用效率低下的问题。首先,利用STL对能耗数据的周期成分进行分解,通过网格搜索算法寻找能耗数据的最优周期;然后,根据最优周期构建周期块;再根据周期块的数据形状构建时间序列块数据;之后,利用长短期记忆(LSTM)对时间序列块数据和周期块数据进行训练和学习;最后,通过线性回归将时间序列块数据和周期块数据的预测结果进行融合。事实证明,所提出的模型的4个预测精度指标分别比LSTM模型高7%,21%,25%和26%。

  • 关键词:
  • STL
  • 周期块
  • 时序块
  • 最佳周期
  • 长短期记忆
  • 加入收藏

降低建筑能耗对于减少温室气体排放[1]和节约成本[2]有着非常重要的现实意义。其中一些较为关键技术是对不稳定的未来建筑能耗进行预测[3],并选择理想的活动安排[4]等,从而达到降低能耗的目标。

能耗预测的研究已经有了许多成熟的方法,这些方法可以大致分为基于传统数学统计的方法[5]和人工智能的方法[6]。传统统计学模型,如线性回归模型(LogR)[7],自回归积分滑动平均(autoregressive integrated moving average, ARIMA)模型[8],灰色预测(GM)[9]等;广泛应用于能耗预测。传统统计学模型具有建模简单,预测效果较好,预测效率较高,在趋势性数据上表现较优等优点。机器学习算法也被广泛地应用于能耗预测问题中,如反向传播(back propagation, BP)神经网络[10],AdaBoost[11],长短期记忆(long short-term memory, LSTM)[12]等,这些模型具有较强的学习能力, 拟合效果较好,精度较高。但模型具有局限性,如BP神经网络收敛速度慢,收敛过程中易陷入局部最优,训练过程无完备的理论支撑,导致模型的学习率不稳定;AdaBoost对离群点较为敏感,从而会影响模型的训练精度。文献[12]基于LSTM神经网络对暖通空调未来短期能耗进行预测,实验表明,LSTM比传统方法的预测效果更好。文献[13]中的跳跃循环分量中的跳跃步数没有给出科学的确定方法,这导致无法高效全面地利用能耗的周期特性。

针对大部分模型只考虑了能耗数据的时序性,或者并未高效全面地利用其周期特性等问题,本文提出了DLnet模型,对建筑能耗进行预测。以STL(seasonal-trend decomposition procedures based on Loess)分解后的周期幅值与预设周期之商为目标进行寻优,得到最佳周期完成周期块XJ的构造;然后为了方便模型数据输入处理,根据XJ的形状构造时序块XC;然后使用LSTM神经网络对XJ和XC进行非线性预测,最后使用线性回归模型融合XJ和XC的预测结果来完成对能耗序列的预测。该模型在神经网络中显式性地对能耗数据的周期性和时序性进行建模,同时综合考虑序列的线性部分和非线性部分,对能耗数据进行了充分的学习,提升了模型的预测精度。


1、相关理论与方法


1.1 LSTM

LSTM的工作原理如图1所示[12]:根据式(2)和式(3),输入数据通过输入门it来丢弃一些信息,然后根据式(1)和式(4),将其与遗忘门ft中保留的信息叠加,形成当前单元状态Ct,最后,根据式(5)和式(6),最终信息由输出门ht输出。

图1 LSTM内部结构

1.2 STL

STL是由Cleveland R B等人[14]在20世纪末提出的时间序列分解算法。如图2所示,STL基于Loess(locally weighted regression,局部加权回归)将时序数据Yv分解为3个分量(趋势分量Tv、周期分量Sv、残差余项Rv)。

图2 STL算法流程


2、DLnet能耗预测模型


DLnet模型为单维单步超短期预测能耗预测模型,模型输入数据分为XJ和XC,数据长度相同。而线性回归预测模块则是为了融合XJ预测模块和XC预测模块的预测结果而存在的。

2.1 XJ构建

能耗序列通常具有明显的时序性特征,相邻数据间的相关性较强,也呈现多组明显的或潜在的周期特征。建筑能耗脱离不了人类的生产生活活动,例如用户在工作日的按时上下班、早出晚归、规律性的生活习惯等,都会使得能耗数据内蕴规律性。周期块数据通过数据每隔1个周期重复出现的特性进行预测,所以周期块数据为间隔T个时间步长(周期)的n个待预测序列组成,其中周期块数据最重要的是最佳周期的确定。

在使用STL对序列进行分解前,需要先确定输入序列的周期P。如图3所示,为了得到周期块数据的最佳周期,首先输入备选周期Pi(i=1,2,…),进行STL分解,得到Ti。最佳周期意味着蕴含者最多的信息,即在最短的周期内数据变化最大。故通过统计计算幅值Ai与周期Ti之商,选取周期与幅值之商最大的周期作为最佳周期Pz。以Pz为最佳周期构建的周期块数据单位时间内包含着最多的信息量,即该周期块数据在该思想中最为全面地考虑了能耗数据地周期性。

图3最佳周期确定流程

2.2 XC构建

由于周期块数据预测与时序块数据预测是同步进行的,所以为了模型输入数据的对齐,时序块数据的长度与周期块数据的长度一致,时序块数据相邻数据之间的时间步长为1,而周期块数据相邻数据之间的时间步长为Pz。XC通过滑动窗口算法构建。

2.3线性回归部分

Lai G K等人[13]发现,LSTM等神经网络模型在时间序列预测中对输入序列的线性部分不敏感。这是由于LSTM有高效的非线性建模能力,这可能导致模型对输入数据的规模不敏感,但是在现实生活中,由于人为因素导致数据呈现非周期性变化,数据的范围也在随之改变,这在一定程度上降低了LSTM模型的预测精度。因此,本文在模型的最后加入线性回归模型以弥补神经网络的这个缺陷。基于周期性建模的DLnet能耗预测模型如图4所示。

图4 DLnet模型

通过线性回归模型融合时序块预测模块和周期块预测模块的预测结果得到最终的预测值式中YC(t)和YJ(t)分别为时序块预测模块和周期块预测模块的预测结果值;Wy和by为线性模型学习的参数;文模型的最终预测值。


3、实验与分析


3.1实验数据集及其分析

实验数据集为2015年10月15日至2017年5月18日期间加拿大一栋办公楼的每小时用电量。来源自开源网站:这些数据集每隔1 h采样1次。

3.2数据预处理

Tp(household.xlsx中的grid_ipmort)是待预测的目标序列。由于Tp的前2 850个数据是空的,所以只使用最后10 000个完整的记录用于实验。前80 %的数据作为训练集,第二个20 %的数据作为测试集。将维数后的原始数据集转换为0~1范围内的无量纲标量,不仅可以使后续的模型处理速度更快,而且还便于比较和加权不同单位或大小的度量。

图5为实验预测目标序列Tp前1 000条数据的曲线,其中局部放大图可以看出较为明显的周期性,但是从长期趋势来看,Tp并是不呈现严格数学上的周期性。Tp的周期不能直接通过数理统计来计算,因此本文通过计算STL分解导出的周期分量的周期来确定XJ的最优周期。

图5 Tp曲线

3.3实验模型参数的确定

为了验证本文提出的DLnet组合模型的预测效果,本节采用表1中的模型用于实验对比分析。

表1实验对比基准模型

3.3.1周期块最佳周期的确定

通过网格寻优算法确定最佳跳跃循环分量周期,设置STL分解的周期范围为[2,200]、参数步长为2,以幅值(一个完整周期内极大值与极小值之差)为跳跃循环分量周期的评价指标。图6为STL不同预设周期与STL分解结果的周期分量幅值与周期之商之间的曲线。由图6可知周期块最佳周期为24。

图6周期块最佳周期寻优曲线

3.3.2模型参数设置

各个模型主要参数设置如表2所示。

表2模型主要参数

3.4实验评价指标

在本文实验中使用如下4种评估指标。其中,(t)为预测值,y(t)为真实值,(t)为真实值的均值,n为数据数量。均方根误差(root mean square error, RMSE)、平均绝对误差(mean absolute error, MAE)、对称平均百分比误差(symmetric mean absolute percentage error, SMAPE)、可决系数R2分别如式(8)~式(11)所示

3.5实验结果分析

本节对DLnet模型进行实验验证和对比分析。表3为预测误差对比,其中,每个模型的实验结果均是20组实验的平均值。从表3中可以发现,本文模型DLnet的4项预测精度评价指标均为最优,这表明DLnet模型的预测值与实际值更加接近,预测性能优于其他4个模型,即所提出的模型在多变量能耗预测任务中更加具有竞争力。

表3实验对比结果

图7为各个模型预测结果对比趋势,为了便于观察对比,仅截取前200 h的预测值进行对比。从图7(a)中可以发现,LSTM模型的预测值相较于支持向量回归(support vector regression, SVR)模型、KNR模型更接近于真实值,同时SVR模型与KNR模型预测值有很多不在真实值的置信区间内,综上说明LSTM对时间序列的学习能力较强。从图7中可以得出,DLnet的模型 性能优于M1、M2、M3和M4模型,预测值与实际值的偏差较小,但仍然存在对于能耗中变化尺度较大的突变能耗的预测不够准确的问题。

图7模型预测结果对比

图8为模型20组实验的RMSE结果箱线图,其中箱子形状大小说明了模型的稳定性,箱子越小模型的稳定性越高。从图8中可以明显看出,DLnet的RMSE明显优于其余3个模型,并且DLnet的稳定性优于其余3个模型,验证了本文模型的可信度。

图8模型实验对比箱线图


4、结 论


本文提出了一个基于周期性建模的DLnet能耗预测模型,它可以分为时间序列预测模块、周期性预测模块和线性回归模块。时间序列预测模块使用一个LSTM神经网络来预测XC。定期预测模块使用LSTM神经网络来预测XJ。XJ是根据Pz构建的。Pz是通过寻找STL分解得到的周期性分量的周期和振幅的最佳商而得到的。最终的预测结果是通过使用线性回归模块融合XJ和XC预测模块的结果而得到的。实验结果表明,与SVR、KNR和LSTM模型相比,DLnet模型在相同数据集上的RMSE、MAE、SMAPE和R2方面的结果更好。


基金资助:国家自然科学基金资助项目(62273264);


文章来源:廖雪超,黄相.基于周期特征提取的DLnet预测模型研究[J].传感器与微系统,2024,43(10):46-49+54.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

传感器与微系统

期刊名称:传感器与微系统

期刊人气:4119

期刊详情

主管单位:中国电子科技集团公司

主办单位:中国电子科技集团公司第四十九研究所

出版地方:黑龙江

专业分类:科技

国际刊号:2096-2436

国内刊号:23-1537/TN

邮发代号:14-203

创刊时间:1982年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定