摘要:为了优化用电异常核算效果,提高用电异常检出率,借助物联网与数据挖掘技术,提出了一种用电异常精细化核算算法。首先,利用物联网技术,采集用户用电数据,并对采集到的用电数据进行标准化转换处理;然后,提取用户用电数据特征,计算特征向量的重要性指数并排序;最后,利用数据挖掘算法中的孤立森林算法,划分多尺度特征节点数据空间,使用iTree深度计算用电数据异常分值,实现用电异常核算。实验结果表明,在应用该算法后,用电异常的检出率显著提升,最高可达98%。
加入收藏
用电异常核算指对电力用户的用电数据进行实时监控和分析,旨在及时发现异常用电情况,进而有针对性地对其作出处理[1],从而有效减少能源浪费、提高电力使用效率、保障电力系统的安全稳定运行[2-3]。如何对用电异常进行精细化核算,成为了当前电力行业亟待解决的问题。传统的用电异常核算方法主要依赖于人工巡检和统计分析,不仅效率低下,而且难以发现潜在的用电异常。
物联网和数据挖掘技术的发展,为用电异常精细化核算提供了新的解决方案。通过这两种技术的结合,可以实现对用户用电数据的全面分析和利用,从而为用电异常精细化核算提供有用的信息和支持。基于此,本文提出了基于物联网和数据挖掘技术的用电异常精细化核算算法。
1、基于物联网的用户用电数据采集
物联网技术在用户用电数据采集领域的应用,可以使得数据采集更加智能、高效和准确。通过物联网传感器可以实时采集用户用电设备的数据,并将其传输至数据中心,使电力公司可以及时了解用户的用电情况,进行实时监测和分析。物联网技术支持大规模的传感器部署,能够覆盖更多的用户和设备,从而采集并分析更多的用电数据,为电力公司提供更全面的信息基础。物联网技术使得用电数据可以通过云平台进行远程访问和控制,电力公司可以随时随地监控用户用电情况,并根据需求进行优化调整,提供个性化的能源服务。
为了提高用电数据采集的效率与准确性,本文借助物联网技术,对用户用电数据进行采集。具体步骤如下:在电力用户的用电设备上安装物联网传感器[4-6];远程采集中心发布采集任务,轮询物联网数据库,获取满足条件的采集任务[7-8];分解采集任务,得出若干个子任务,通过消息总线,将子任务转发给协议栈;协议栈对子任务进行解析后发送给集中器,组成相应的报文;物联网传感器根据报文采集相应的用电数据,并将采集结果发送给执行模块。数据采集过程中,需要综合考虑电压波动的幅度、频率等因素对设备运行可能造成的影响。最后,通过物联网通信技术,将传感器采集到的用电数据传输至数据采集中心。
2、用户用电数据预处理
用户用电数据采集完毕后,需要对数据进行标准化预处理,将用电数据转换成统一尺度,便于不同特征之间的比较和分析。同时,提升用电数据的准确性与可靠性,为后续的用电异常精细化核算奠定良好的基础。标准化预处理的具体计算公式见式(1):
式中:xi、xi'分别表示标准化转换前后的用电数据;max(xi)、min(xi)分别表示样本中用电数据的最大值与最小值。通过式(1),能够实现对不同量纲用电数据的运算与特征分析。将标准化处理后的用电数据存储到数据库中,以便后续进行数据挖掘与用电异常核算。
3、提取多尺度用电特征
用户用电数据预处理完成后,接下来需要进行多尺度用电特征的提取。由于后续用电异常精细化核算是以用户用电数据特征为基础的,因此,所提取的用电特征越具有代表性,后续的核算结果便越精确。基于此,本文开展了用户多尺度用电特征提取的研究。
首先,依据上述预处理后的数据,提取出所有的用户用电数据特征,见表1。
表1 用户用电数据特征
其次,对各指标作矢量量化,并求出其重要性指数,具体计算公式见式(2):
式中:Pi表示第i个用电特征向量的重要性指数;wi表示指标权重;Si表示第i个特征向量;m表示用电特征向量的数量。通过式(2)计算特征向量的重要性指数,并从大到小对特征向量进行排序。选取排名前5的特征向量,组合在一起形成新的特征集合[9-10]。分析提取用电数据特征,借助数据挖掘技术,研究用电数据的趋势和周期性变化,以便发现异常值。
4、基于数据挖掘的用电异常精细化核算算法设计
多尺度用电特征提取完毕后,接下来需要利用数据挖掘技术,设计用电异常精细化核算算法。本文所提出的基于数据挖掘的用电异常精细化核算算法设计主要分为2个阶段。
(1)利用数据挖掘中的孤立森林方法,构建用电样本的分析架构。首先,设计t个iTree,将其进行组合以形成孤立森林。其次,从用电数据中随机选取ψ个用电数据样本点,组成待核算的子样本集,共同置于孤立森林的树根节点中。在当前树根节点数据中,随机设定一个用电异常核算维度,并围绕该核算维度生成切割点p。以p点为中心,构造一个超平面。在该平面内,划分节点数据空间,生成2个形状、规格均相同的子空间。统计核算维度中大于和小于p的用电数据,放入2个子空间内。随后,递归处理子节点,不断分解出新的用电数据子节点,直至用电数据无法再进一步分解为止,完成孤立森林构建。
(2)计算被核算用电样本的异常分值。在获取t个iTree后,将先前提取到的多尺度用电特征分别输入到iTree的各个节点中,对整个孤立森林进行迭代训练。然后,用生成的迭代训练结果,对用电测试数据进行全方位、多维度的评估。在此基础上,将用电数据x均匀地分布在孤立森林中的每一棵i Tree中,并根据用电数据的多尺度特征,确定数据在iTree中所处的深度,即数据最终落在iTree的第几层。以iTree的深度作为判定用电数据异常程度的依据,深度越小,则用电数据异常分值越高。异常分值的具体计算公式为:
式中:h(x)表示被核算样本在孤立森林中检索到的节点深度;E[·]表示对t个iTree取均值;c(ψ)表示孤立森林平均路径长度。通过式(3)计算用电数据异常分值s(x),根据经验设定0.5为界限值。若s(x)≥0.5,则说明用电存在异常隐患;若s(x)<0.5,说明用电数据正常。s(x)越接近1,说明用电异常的可能性越高;s(x)越接近0,说明用电异常的可能性越低。
由此,构建基于数据挖掘的用电异常精细化核算算法,实现对用电异常行为的识别、分类和核算,为电力行业的运营、管理和决策提供科学依据和支持。
5、实验分析
5.1 实验准备
本实验旨在验证基于物联网和数据挖掘技术的用电异常精细化核算算法的有效性和准确性。首先,进行实验环境配置,使算法能够稳定运行。实验环境配置如下:服务器采用Intel Xeon处理器,有着16 GB内存和1 TB SSD硬盘;操作系统选用Ubuntu 18.04 LTS;物联网采集软件使用MQTT Broker(如Eclipse Mosquitto);数据挖掘工具选择Weka 3.8.5。其次,分别连接宽带网络与无线网络,以保证数据传输速度和稳定性,方便移动设备访问。本文所使用的资料是一家供电公司所提供的实际用电资料。数据集的时间范围为一个月,采样频率为1次/min。该实验数据集包含约1亿条用电数据记录,总大小约为12 GB,其中用电异常数据大小约为1 GB,均标有标签。数据集内所有数据的格式均为CSV格式。根据时序对数据进行分类,并将其分为训练样本和测试样本。
将本文提出的算法设置为实验组,将文献[1]中的方法设置为对照组1,将文献[4]中的方法设置为对照组2。
5.2 核算结果分析
设定用电数据量分别为2 GB、4 GB、6 GB、8 GB、10 GB、12 GB,在用电数据量增加的情况下,测定应用3种算法后的用电异常检出率,并作出对比,结果如图1所示。
通过图1的对比结果可知,本文算法表现出了良好的性能优势;在用电数据量持续增加的情况下,本文算法用电异常检出率始终高于另外2个对照组,最高达到了98%。这说明该算法能够在数据集中有效地提取出异常用电行为的特征,并对其进行分类和识别,对用电异常行为的识别能力更强,能够准确地核算出潜在的用电异常情况,从而有效预防和减少电力资源的浪费和损失。
图1 用电异常检出率对比结果
6、结语
本文提出了用电异常精细化核算算法,一方面通过物联网技术,实时采集与监控电力用户的用电情况,实现用电数据的全面监测和数据共享;另一方面通过数据挖掘技术,对采集到的用电数据进行进一步地分析和挖掘,为电力行业的运营和管理提供科学决策和支持。实验结果表明,该算法可以有效地提高用电异常核算的准确性,降低电力行业的运营成本,推动电力行业的智能化发展,促进可持续发展。
参考文献:
[1]武亚光,张才俊,程飞飞.基于FP-growth算法的多尺度用电异常行为检测方法[J].电子设计工程,2023,31(23):118-121.
[2]郑世英,牛清林,刘伟,等.电力用户异常用电的深度神经网络检测方法[J].电力需求侧管理,2023,25(6):82-87.
[3]钱旭盛,朱萌,翟千惠,等.基于改进孤立森林算法的异常用电行为识别方法[J].沈阳工业大学学报,2023,45(6):601-606.
[4]潘骏,夏祥武,李梁,等.基于关联潮流感知与高斯混合模型的异常用电检测[J].电力建设,2023,44(11):138-148.
[5]陈慧,陈适,郭银婷,等.基于正则自编码器及Optuna寻优的异常用电数据清洗研究[J].电力需求侧管理,2023,25(5):53-58.
[6]闫相伟,宋国壮,刘怡豪.基于改进Stacking集成分类算法的用户用电信息异常识别[J].电子技术应用,2023,49(8):13-18.
[7]孟宋萍,彭伟,田晨璐.基于门控循环单元的非均衡数据驱动异常用电检测方法[J].计算机测量与控制,2023,31(10):54-60.
[8]吴泽黎,李清清,梁皓.基于BiLSTM-CatBoost模型的电力用户异常用电检测[J].自动化与仪表,2023,38(5):22-27.
[9]田健,杜暄,韩硕辰,等.基于物联网技术的低压居民日均电量异常自动判断系统设计[J].微型电脑应用,2023,39(5):123-128.
[10]顾臻,庄葛巍,贺青,等.基于LOF+SVM的异常用电用户分阶段识别方法[J].电气传动,2023,53(3):90-96.
文章来源:刘新鑫.基于物联网和数据挖掘的用电异常精细化核算算法[J].物联网技术,2025,15(01):64-66.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29我要评论
期刊名称:电力建设
期刊人气:2931
主管单位:国家电网公司
主办单位:国网北京经济技术研究院,中国电力工程顾问集团公司,中国电力科学研究院
出版地方:北京
专业分类:电力
国际刊号:1000-7229
国内刊号:11-2583/TM
邮发代号:82-679
创刊时间:1958年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.814
影响因子:1.445
影响因子:0.657
影响因子:0.000
影响因子:0.688
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!