摘要:在电力系统中对用户行为数据的分析过程存在主观性强的问题,且在复杂电网环境下难以做出准确的判断。对此,文中提出一种基于改进K-means聚类算法和深度学习相结合的分析算法。在改进K-means聚类算法的基础上构造出用户行为数据分析模型,实现了对行为数据的自适应学习。通过HRF-TCN预测模型筛选出用户行为数据的关键特征,降低数据维度后利用时间卷积网络进行预测,并将预测结果传递给电力系统中的设备,使其智能化地调整运行方式。基于公开用电数据集对算法进行的可行性验证结果表明,所提算法能够对用户的行为数据进行准确分析,数据分类效果指标DBI、SC分别为0.826 4和0.440 1,预测指标Ac和F1分别为96.8%、0.967 8,与同类算法相比,其分类效果更好、精度更高。
加入收藏
随着科学技术的发展,电力系统的网络拓扑结构越来越复杂。同时用户需求的提高使得电力设备的种类日益增多,且智能化程度不断提高,AI技术的应用也使传统电力系统逐步向智能电网的方向迈进[1]。在智能电网的发展过程中,也同时存储着大量的用户数据,为精准分析用户行为提供了基础。通过对用户数据的分析,可以对不同用户的用电负荷预测、用户侧需求的响应、电价的制定、综合能源系统中能源调度的优化、用户的偷电行为等进行分析[2]。由于用户的行为存在着不确定性和随机性,呈现出了多样化的态势。传统的用户数据处理方法是在预测时降低数据的维度,但这种方法存在着分析错误的风险,容易导致电力设备的智能化运行出现故障[3]。对此,文献[4]采用基于小波变换的智能化算法来筛选出关键特征,然后再降低数据维度。但小波变换神经网络的参数设置需要具备一定的先验性,对使用者有着较高的要求。文献[5]利用K均值聚类算法得到用户曲线,对不同类型的用户数据进行分类后再对其进行分析,但是所得结果的精度并不理想,难以直接用于设备的智能运行控制。文献[6]则利用改进PCA的朴素贝叶斯分类算法对数据进行分类,有效提高了数据分类效率。然而朴素贝叶斯算法也存在着缺陷,即属性条件独立性假设在实际应用中难以成立,此类问题会导致数据的分类结果出现较大误差。
在数据分析处理学习中,目前最常用的是神经网络学习算法,文献[7]利用BP神经网络对电力设备故障进行智能诊断,有效地节省了人力、物力。文献[8]利用LSTM网络对用户用电行为进行了预测,能够及时发现偷电行为,提高电网的效能。文献[9]利用GRU网络构建了电力设备监控系统,有效提高了电力系统设备安全运行的能力。但基于深度神经网络改进的LSTM和GRU网络,仍然存在着梯度消失和梯度爆炸的问题。为了提高电力设备智能化运行效率,针对上述问题,文中基于改进K-means聚类算法和深度学习技术,提出了一种分析算法来实现电力设备的智能化运行。首先,针对传统K-means聚类算法原始聚类中心选取困难的问题,利用麻雀搜索算法(Sparrow Search Algorithm,SSA)自适应地选择出最佳的聚类中心,然后再进行聚类。其次,构建出了一种HRF-TCN预测模型,利用HRF(Highest Random Forest)算法对用户行为数据关键特征进行筛选,降低输入数据的维度,再采用TCN(Temporal Convolutional Network)网络对用户行为数据进行学习预测。最后将预测结果传递给电力设备系统,为其智能化运行提供数据支持。
1、智能化电力设备模型构建
1.1改进K-means聚类算法
K-means算法是一种经典的聚类算法[10-11],其主要原理是将数据集合分为若干簇,然后将数据集中具有较高相似度的簇互相分离。但传统的K-means聚类算法在选择原始聚类中心时是随机的,这就使得每次对于数据集的分类结果均会有所不同。对此,该研究提出了一种基于麻雀搜索算法(SSA)[12]的改进K-means聚类算法,通过该算法来自适应地选择最佳的聚类中心。算法的原理是针对不同类型数据具有集中性的特点。首先,计算出各类型数据的特征指标作为输入数据;然后,以综合指标数据构建SSA算法中的适应度函数;最后,以K个聚类中心为寻优目标进行迭代运算。具体流程如图1所示。
图1基于SSA改进K-means聚类流程
具体步骤如下:
1)计算出电力系统中采集到电力数据集各种类型的指标,确定出聚类个数K。
2)根据步骤1)计算出的各个指标构建出SSA算法的适应度函数。
3)通过SSA算法进行迭代运算,求解出最佳的K个聚类中心。
4)采用欧几里得公式计算每一个数据di与聚类中心dk的空间距离o(di,dk):
5)根据最小距离的原则将数据划分到各个簇中,并更新聚类中心。若聚类中心发生变化,则说明分类不正确,重复步骤4)-步骤5),直至聚类中心不再改变。
6)输出最佳的聚类结果。
1.2 HRF-TCN预测模型构建
在经过改进的K-means聚类算法对数据进行分类后,相应的用户数据特征仍然较多,若全部输入神经网络进行学习,不仅会加大学习的难度,同时也会影响学习的速度与结果的精度。对此,文中在数据输入前先利用随机森林(Random Forest,RF)算法的改进方法HRF对数据进行预处理,筛选出关键特征并降低数据维度。然后,利用解决梯度问题的TCN进行学习预测。
HRF算法是一种集成学习算法,由若干个决策树组成[13]。决策树是一种无监督学习方式,能够从大量的数据中总结出数据的关键特征,并用树状图来呈现结果,如图2所示。从根节点开始逐步分类,直至叶节点。HRF中的每个决策树均会根据用户数据的属性得到一个结论,最终将数量最多的相同属性数据作为结果。假设用户数据有N个特征,而HRF会筛选出n(n<N)个特征。将这些特征作为决策树的属性,把每个决策树的分类结果统计出来,即可得到HRF最终的结果。
图2决策树拓扑图
TCN是在循环神经网络和卷积神经网络基础上进行改进的一种神经网络[14]。TCN没有使用传统RNN(Recurrent Neural Network)网络的算法结构,而是采用了残差块单元(Residual Block Unit,RBU)结构,RBU主要是由膨胀因果卷积(Dilated Causal Convolution,DCC)、权重归一化层、ReLU激活函数以及Dropout随机失活函数组成。DCC可以对上一时刻的输入进行扩张采样,再对较长时间的数据信息和不连续的数据进行特征提取,从而解决了时序的问题。通过在TCN中对RBU进行串联,解决了传统神经网络在预测时存在的梯度问题。其基本结构如图3所示。
综上所述,首先利用基于SSA算法改进的K-means聚类算法对电力系统中的用户数据进行分类;然后,将分类好的数据输入到HRF-TCN预测模型进行学习预测。利用HRF对数据进行降维,采用TCN网络进行学习预测;最终,将得到的高精度数据作为输入,传递给智能化电力设备系统,用于控制电力设备对用户行为做出正确的运行决策。整体运行控制流程如图4所示。
图3 TCN结构
图4智能化电力设备运行控制流程
2、数据预处理
在电力系统中,由于包括了多次的传感器采集、数据传输等处理过程,数据通常会存在异常,而异常数据会导致神经网络学习的结果偏离实际值。因此,有必要提前对数据集中的异常数据进行清理[15-16]。
为了提高模型的收敛速度,在数据输入模型前利用如式(2)所示的归一化公式对数据进行处理,使得原始数据变换到(0,1]范围之内。
式中,xr是归一化后的数据;μ是原始数据的平均值;δ是原始数据中的标准差。
3、算例分析
文中采用的公开数据集为我国内蒙古地区的用户数据,对所设计算法的可行性进行验证。数据集中包含有用户的用电量信息、异常数据信息、影响用户行为的气象信息、工作日与节假日信息、异常事件信息等。实验硬件平台为Intel Core i7-3230M CPU/12 GB RAM GPU/NVIDIA GT740 M,采用Python语言基于Tensoflow2.2进行算法编写。
首先对改进K-means聚类算法的分类效果进行验证,采用戴维森堡丁指数(DBI)和轮廓系数(SC)对其进行评价。其中,DBI越小越好,SC越大越好。实验结果如表1所示。
表1分类效果对比
从表1中可以看出,文中所提改进K-means聚类算法与聚类(AC)、高斯混合模型(GMM)、谱聚类(SC)、K-means、小批量K均值(MK-means)相比,DBI最低且SC最高,证明了该算法的聚类效果最优。而在时间成本方面,SC聚类算法的时间成本最低,但其聚类效果最差。因此,时间成本低于其他模型也失去了应用意义。综合对比来看,所提算法的聚类效果最佳,且时间成本偏低。
为了验证模型的预测效果,以检查用户异常用电为目标进行算例分析。文中采用准确率(Accuracy,Ac)、查准率(Precision,Pr)、召回率(Recall,Re)对预测效果进行评价。为了充分考虑准确率和召回率,将两个指标重新构建为F1指标,其中F1=2×Pr×Re (Pr+Re),实验具体结果如表2所示。
从表2可以看出,采用文中所提出的HRF-TCN预测模型与TCN、PCA-TCN、RF-TCN、HRF-LSTM、HRF-GRU进行对比,其准确率和F1指标均为最优。同样可以发现,在采用PCA和RF降低数据维度后,预测性能反而不如单一的TCN网络,从而证明了筛选关键特征的重要性。若筛选出的是非重要特征,则会严重影响神经网络的预测效果。这也从侧面证明了,研究中选择HRF进行降维是正确、合理的。对比HRF-TCN、HRF-LSTM和HRF-GRU可以发现,采用解决了梯度问题的TCN网络进行预测,能够明显提高预测的质量。对比时间成本可以发现,先经过数据降维处理再进行预测,可以提高预测效率。所提模型预测速度最快,原因在于TCN网络是残差块结构,有效节省了时间。
表2检测效果对比
综合分类效果与预测性能可看出,该文算法可以对用户数据进行高质量分析,为电力设备的智能化运行提供高精度数据,使其能够针对用户行为快速、自主地做出最优决策。
4、结束语
为了确保电力设备的智能化运行,针对目前用户数据处理分析存在的困难,提出了一种基于改进K-means聚类算法和深度学习方法相结合的数据处理算法,该算法优势在于:
1)提出了一种基于SSA算法改进的K-means聚类算法。通过SSA算法自动化选取最佳的K个聚类中心,克服了原始聚类中心选择困难的问题。该算法可以应用于电力系统规模大、设备种类多样化、用户数据复杂化的场景,且分类效果良好。
2)利用TCN能够扩大时间范围并解决传统神经网络梯度问题,将其作为预测模块并在其前端融合HRF降维模块可以提高模型的综合性能。实验结果表明,该组合预测模型能够有效提高数据的预测精度,同时节省时间成本。
然而在进行预测算例分析时,仅对常规的用户异常用电数据进行了实验,实验类型较为单一。而在后续的研究中,可以选取多样化的应用场景展开实验,例如用户的个性化用电需求等。
参考文献:
[1]梁龙基,张靖,何宇,等.基于博弈论的互联微电网多主体协同优化配置[J].电子科技,2021,34(7):43-49,78.
[2]蔡清媛.基于负荷数据预处理的用户用电行为分析方法研究[D].南京:南京邮电大学,2022.
[3]王威,王兰君.基于用电行为特征大数据的异常用户识别模型研究与应用[J].电力大数据,2021,24(12):19-26.
[6]李思奇,吕王勇,邓柙,等.基于改进PCA的朴素贝叶斯分类算法[J].统计与决策,2022,38(1):34-37.
[7]虞跃.基于深度学习的电力设备智能运行方式的研究[J].自动化与仪表,2020,35(7):20-24,67.
[8]万磊,陈成,黄文杰,等.基于BRB和LSTM网络的电力大数据用电异常检测方法[J].电力建设,2021,42(8):38-45.
[9]申晓杰,廖华,李闯,等.一种基于SVR和GRU的新型电力监控防护系统[J].计算机技术与发展,2023,33(3):215-220.
[10]刘明群,何鑫,覃日升,等.基于改进K-means聚类k值选择算法的配网电压数据异常检测[J].电力科学与技术学报,2022,37(6):91-99.
[11]闵小翠.基于K-均值聚类的多模态异构大数据检测算法研究[J].电子设计工程,2020,28(14):63-67.
[12]朱鹏,杜逆索,欧阳智.融合差分进化和混合多策略的麻雀搜索算法[J].计算机工程与设计,2022,43(6):1609-1619.
[13]文耀宽,侯慧娟,王雍.基于Apriori和C5.0算法的智能电表故障预测[J].自动化仪表,2022,43(5):90-94,101.
[14]李硕,王友国,柴允,等.基于时间卷积网络的极化码译码算法[J].计算机技术与发展,2022,32(3):54-58.
[15]曹立新,刘伟民,郭虎全.风电场功率曲线异常数据的清洗与建模[J].兰州理工大学学报,2022,48(4):64-70.
[16]高正男,杨帆,胡姝博,等.面向新能源电力系统状态估计的伪波动数据清洗[J].高电压技术,2022,48(6):2366-2377.
基金资助:国网大数据中心科技项目(529990220003);
文章来源:皮志贤,任俊达,李开阳,等.基于深度学习的电力设备智能运行方式研究[J].电子设计工程,2024,32(23):122-126.
分享:
数据终端采集系统需要对电压、电流、电能、功率等多种电气参数进行实时采集,随后上传到主站中进行存储,便于数据的后期处理。系统可以对用电信息进行分析处理,针对异常用电数据进行标记显示,以确保数据终端采集系统数据信息的有效性和精确性。随着电力系统的规模扩大以及用电需求的增加,电气数据采集变得越来越重要。
2025-01-07随着智能电网建设的不断推进,电力系统的运行效率和可靠性成为关注的焦点。低压台区作为电力系统的重要组成部分,其线损问题直接影响电网的经济运行和供电质量。低压台区线损是指电力在输电、变电、配电过程中由于电阻、电抗、设备损耗等原因而产生的电能损失。线损不仅直接降低了供电企业的经济效益,还可能影响电网的安全稳定运行。
2024-12-05随着科学技术的发展,电力系统的网络拓扑结构越来越复杂。同时用户需求的提高使得电力设备的种类日益增多,且智能化程度不断提高,AI技术的应用也使传统电力系统逐步向智能电网的方向迈进。在智能电网的发展过程中,也同时存储着大量的用户数据,为精准分析用户行为提供了基础。
2024-12-04电力系统是一个由多个子系统和设备组成的高度复杂系统,其包括发电、输电、配电和用电等环节。在这些环节中,涉及到大量的数据采集、传输和处理过程,数据来源也十分广泛,如传感器、计量器、监测系统等,使得电力数据具有高度的异构性和复杂性,需要对有效数据集成和分析,以便更好地理解和控制电力系统。
2024-12-03风机基础施工常见质量通病包括:基础不均匀沉降、混凝土强度不足、较多裂缝、冷缝等。以上质量通病会导致风电机组的倾斜和不平衡,影响风电机组在不同运行工况下的正常工作,严重时甚至造成基础的破坏和倒塌,从而威胁风电场的安全。本文结合实际案例,采用全面因素分析方法,针对风机基础施工中的每个施工环节的施工工艺和关键工序的质量控制。
2024-11-20对于电力施工企业项目而言,影响成本控制效果的因素涉及多个方面,从人力资源成本的角度分析,电力工程施工项目需要大量的劳动力,人工成本是项目成本的重要组成部分[1]。人员的工作效率、技术水平以及人工成本的合理安排,都会直接影响项目的成本控制效果。从材料成本的角度分析,电力工程需要使用大量的电缆、设备、工具等材料。
2024-11-11面对越来越大的生产需求,能源资源需求量也在逐渐增大,尤其对电力能源的需求更是与日俱增;而停电事故的发生意味着电网仍具有一定薄弱性,薄弱环节的存在极易造成电力故障发生连锁反应,降低局部或整体电网的运行安全性和稳定性.因此,识别电网中的薄弱环节一直是电力公司着力研究的项目之一,但是目前取得的成果与预期效果存在很大差距.
2024-11-11风电作为清洁能源,近年来并网入电比例不断加大,极大带动了风电建设市场的发展。根据目前风电建设市场现状,环境条件好、项目建设简单的风电场越来越少,风电施工项目逐渐转向风电资源丰富的山区地带,未来山区风电将迎来跨越式的发展。山区地带道路狭窄弯曲,纵横坡度较大,地面土质较为松软。
2024-11-11大雅河抽水蓄能电站位于辽宁省本溪市桓仁县大雅河上,站址距桓仁县城40km, 距沈阳市直线距离为152km。上水库位于大雅河左岸一撮毛山及其相邻次高峰之间的鞍部,通过开挖鞍部和在其东西两侧筑坝形成库盆。
2024-11-02配电网故障检查与维修在现代电力系统管理中扮演着重要角色,有序开展该项工作,可提升整个电力系统的运行稳定性。过去,由于技术水平等因素的影响,一般采用人员检查维修的方式。即工作人员根据后台监测信息,利用相关设备对配电网进行检测,以判断故障具体位置,并进行维修。
2024-10-23人气:3432
人气:2440
人气:2394
人气:2322
人气:2227
我要评论
期刊名称:电子设计工程
期刊人气:3200
主管单位:九三学社陕西省委员会
主办单位:西安市三才科技实业有限公司
出版地方:陕西
专业分类:电子
国际刊号:1674-6236
国内刊号:61-1477/TN
邮发代号:52-142
创刊时间:1994年
发行周期:半月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.333
影响因子:0.315
影响因子:0.438
影响因子:0.000
影响因子:0.527
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!