摘要:在电力数据采集过程中,极易出现传感器故障、通信中断、数据丢失等问题,使得数据出现质量差异。多源数据格式与语义的不一致增加了数据集成的复杂性,导致电力数据集成效率较低。为此,提出基于迭代模糊聚类算法的多源异构电力数据集成方法。构建数据集成框架,通过语言生成器统一数据格式,利用迭代模糊聚类算法,模糊划分数据。反复迭代处理聚类中心和任意一个电力数据之间的欧几里得距离,获取最优聚类距离,采用频繁项集,获取数据功率谱密度,构建集成目标,设计电力数据集成流程。通过实验结果可知,应用该方法仅存在50 bit的数据集成误差,且电力数据集成效率较高。
加入收藏
电力系统是一个由多个子系统和设备组成的高度复杂系统,其包括发电、输电、配电和用电等环节。在这些环节中,涉及到大量的数据采集、传输和处理过程,数据来源也十分广泛,如传感器、计量器、监测系统等,使得电力数据具有高度的异构性和复杂性,需要对有效数据集成和分析,以便更好地理解和控制电力系统。由于多源异构电力数据之间难以实现共享操作,针对目前电网企业对信息资源的依赖程度较高的现状,迫切需要一种新的异构数据集成方案。
现阶段,国内专家学者已采用不同方法实现多源异构数据集成,如基于多维缩放和KICIC的电力负荷聚类方法,采用MDS算法,降维处理高维复合数据,获取降维后低维矩阵和归一化的特征向量。将该向量作为集成过程的输入权重,利用聚类中心在子域上的最大化间距实现电力数据集成[1];考虑数据缺失的电力系统暂态稳定自适应集成评估方法充分考虑数据缺失情况,在保证节点客观性的基础上,构建同步向量,测量单元的子集搜索模型,根据子集对应的特征集,训练稳定集成模型。采用自适应加权融合机制,实现电力数据集成[2]。
当前,大部分的异构数据集成都是从其自身结构入手,以处理不同来源之间的结构差异为重点,忽视了不同来源之间的语义关系,尽管其形式上已经完成了集成,但其在数据共享、互操作性方面仍有诸多缺陷,导致获取的共享数据中出现大量的冗余、无效信息。为了解决这一问题,采用迭代模糊聚类算法集成多源异构电力数据。
1、数据模糊分组
不同数据源的数据可能存在语义不一致的情况,同一指标在不同数据源中的定义不同,将导致数据集成后产生歧义。因此在实现电力数据集成前,将数据模糊分组,发现数据之间的迭代关系,从而为数据集成提供更好的支持。数据模糊分组主要是将多源异构电力数据按照相似性分成若干组,从而可以更好地处理与分析数据,同时也为电力数据集成提供了更好的基础。
多源异构的电力数据集成,一方面要求以领域专家为主体,构建“领域树”;另一方面要求构建一种具有较强的“树形”特征、能够实现逻辑推断、有较强表现力的“树形”特征描述语言,以实现电网信息的融合。基于此,选取合适的映射方式,将不同数据源的异构数据转换成能够识别多源数据的语义关系[3]。
在多源异构电力数据集成过程中,要实现对不同类型电网信息的融合,需要利用同一视角的中间模型,而各数据源之间则需要通过相互间的映射关系实现融合[4]。在中间层模型下,用户的查询将根据中间层模型和数据源模型之间的对应关系,分配不同数据源,并由包装器将不同的数据源查询得出的结果整合和封装[5],并返回给用户。
引入基于迭代模糊聚类算法,实现对多源异构空间数据的集成与交互操作[6],对不同语言的空间数据格式实现信息统一处理[7]。利用语言生成器,将所转换的空间数据格式传送给空间数据管理器,并将某种语言的数据集成到一起,将其作为一种语言再发送给应用程序[8-10]。为了实现空间数据的集成,需要对参与集成的空间数据生成语言,实现对空间数据的转换,进而挖掘出空间数据的相似性特征[11]。
基于以上提取到的空间数据的相似性,利用迭代模糊聚类算法,对待集成多源异构电力数据分组[12],由此构建的目标函数可表示为:
式中,n表示模糊分组个数;m表示电力数据数;ιij表示第i类的第j个电力数据隶属度;xj表示第j个多源异构电力数据样本点;oi表示第i类多源异构中心点。
通过引进拉格朗日因子[13-14],优化聚类中心和电力数据隶属度,从而实现更准确的数据模糊划分,如式(2)、式(3)所示:
上述公式中,oa表示第a类多源异构中心点。
根据上述公式,实现多源异构电力待集成数据分组。
2、电力数据集成方案
2.1目标构建
基于迭代模糊聚类算法,实现数据模糊划分,但由于集成目标不明确,集成效果并不理想。因此,为明确电力数据集成的目的和需求,首先需要构建电力数据集成目标,从而更好地选择数据源、确定数据集成方案和评估数据集成效果。利用迭代模糊聚类算法,实现数据模糊划分,以此构建集成目标,将聚类数据作为输入参数,输出结果为隶属度[15]。隶属度是指某个数据点与群集中心之间的归属程度。由于模糊聚类方法不需要监督,因此通过计算聚类中心和任意一个电力数据之间的欧几里得距离,确定数据集成目标,进而实现更准确的数据集成。可用如下公式表示:
通过反复迭代处理,能够获取最优的聚类距离,以此获取序列特征。待集成的数据库统计特征矩阵E,可表示为:
式中,xν表示数据序列;ψ表示电力数据划分匹配集。融合全部数据获取的特征分布域Sn,可表示为:
式中,μn表示并行规划聚类加权幅值;λ表示并行聚类自适应调节参数。
为确保数据集成的时效性和准确性,利用平均加权处理方法,通过迭代模糊聚类,设置多源异构电力数据集成时间窗口t,公式为:
式中,t1、t2分别表示集成时间和数据处理时间。由式(7)可获得数据信息整体最佳值,为了方便在高维数据空间中实现数据集成,需要采用频繁项集挖掘数据特性[16],从而获取多源异构待集成电力数据的功率谱密度ρ,计算公式为:
式中,η表示数据采集频率;ϕ表示功率谱估计结果。基于以上计算,由此构建多源异构电力数据集成目标Q,可表示为:
式中,l表示集成扰动间距。通过该目标,即可确定数据集成中心。
2.2电力数据集成流程设计
基于迭代模糊聚类算法的数据集成框架,在集成目标支持下设计集成流程,其步骤如下:获得电力数据库中各层的边界坐标范围信息,利用矢量法建立一套完整的电力数据库。判断数据中所包含的种类,从数据点的特性出发,输入不同的坐标及属性,并将这些数据储存到矢量向量中。对于数据点类型,设计数据集成流程如图1所示。
图1数据集成流程
当判定结果显示存在另外一个和该记录的ID相同时,继续判定该ID的两个记录节点是否相连,如果节点是相互连接的,则将LineString标记为一个成员元素;如果没有连接,则返回以上步骤循环该流程。在完成对不同类型数据的转换之后,将其合并为一份档案,完成数据集成。
3、实验
实验数据来源于UCI机器学习库,该数据库是一个公共数据仓库,包括了一些电力数据集,如“电力负载数据集”“电力数据质量数据集”等。从UCI机器学习库提取三种电力数据,分别是结构化数据、半结构化数据和非结构化数据。对于这三种数据,理想集成效果如图2所示。
图2理想集成效果
由图2可知,以结构化数据为x轴,半结构化数据为y轴,非结构化数据为z轴,确定理想集成中心坐标为(25,400,500)。设置该过程的理想集成时间为25 s,对集成耗时少于该时间的方法均视为理想集成方法。
将文献[1]提出的基于多维缩放和KICIC的数据集成方法、文献[2]提出的考虑数据缺失的暂态稳定数据集成方法和研究提出的迭代模糊聚类集成算法的应用效果对比分析,如图3所示。
图3不同方法的数据集成效果对比分析
由图3可知,文献[1]方法与文献[2]方法整体集成效果与理想效果存在一定差别,对应的理想集成中心坐标分别为(20,350,400)、(15,350,600);文中提出方法的理想集成中心坐标为(25,400,450),整体集成效果与理想效果最为近似,在非结构化数据z轴存在50 bit的集成误差,但相较于其他两种方法,该方法的集成误差最小。
为了进一步验证文中所提方法具有较高的集成效率,选取时间作为实验指标,对比利用三种方法分别对三种不同数据类型的集成时间,对比结果如表1所示。
由表1可知,通过对比三种不同数据类型集成时间与总计时间,文献[2]提出的考虑数据缺失的暂态稳定自适应集成方法耗时最长,其次是文献[1]提出的基于多维缩放和KICIC的集成方法,耗时最短的是基于迭代模糊聚类的集成算法,且该集成方法耗时在理想时间范围内,因此,该方法为理想集成方法。
表1不同方法集成时间对比分析
4、结束语
为了提高多源异构电力数据集成效率,设计了基于迭代模糊聚类算法的多源异构电力数据集成方案。通过对多源异构数据的集成,采用基于迭代式的模糊聚类方法,对不同类型的数据聚类和集成。实验结果表明,该方案设计具有合理性,且系统稳定性良好。
参考文献:
[1]刘诗语,吴鸣,李睿哲.基于多维缩放和KICIC的电力负荷聚类[J].科学技术与工程,2023,23(3):1096-1103.
[2]谭本东,杨军,刘源,等.考虑数据缺失的电力系统暂态稳定自适应集成评估方法[J].电力系统自动化,2021,45(23):68-75.
[3]贾俊杰,张玉超.基于用户模糊聚类的综合信任推荐算法[J].计算机工程,2021,47(6):60-67.
[4]张人上,邱久睿.基于混沌系统的扩频通信多源异构数据加密算法[J].火力与指挥控制,2021,46(8):162-166,176.
[5]耿新青,王正欧.基于增量式模糊聚类算法的文本挖掘[J].南京理工大学学报,2022,46(5):579-585,593.
[6]李向利,范学珍,逯喜燕.基于非负矩阵分解的修正模糊聚类算法[J].吉林大学学报(理学版),2022,60(6):1416-1422.
[7]朱峥瑜,宋燕.一种基于多重信息的不完全数据的模糊C均值聚类算法[J].小型微型计算机系统,2021,42(12):2545-2552.
[8]赵春霞,赵营颖,宋学坤.基于频繁项集的多源异构数据并行聚类算法[J].济南大学学报(自然科学版),2022,36(4):440-443,451.
[9]张颖,彭然.基于改进蜻蜓优化多核模糊聚类算法的异常检测[J].数学的实践与认识,2021,51(19):208-219.
[10]潘兴广,王士同.基于边缘峰度度量的特征缩减模糊聚类算法[J].控制与决策,2021,36(11):2665-2673.
[11]吴文波,吴昌钱,胡永.多源异构数据集下的改进挖掘算法设计[J].计算机仿真,2022,39(4):506-510.
[12]杨昔阳,林舒欣,李志伟,等.一种基于数字特征的二型熵模糊c均值聚类算法[J].福建师范大学学报(自然科学版),2021,37(6):28-37.
[13]李雪,张琳玮,姜涛,等.基于拉格朗日乘子的电力系统安全域边界通用搜索方法[J].中国电机工程学报,2021,41(15):5139-5152.
[14]刘天奇,韩冬,汪延德,等.基于内嵌增广拉格朗日函数Q-learning方法的虚拟电厂市场博弈策略[J].电网技术,2021,45(10):4000-4008.
[15]莫慧凌,郑海峰,高敏,等.基于联邦学习的多源异构数据融合算法[J].计算机研究与发展,2022,59(2):478-487.
[16]刘明红,袁昕,童辉.高维电力数据的聚类优化算法的研究[J].科技通报,2021,37(1):50-55.
基金资助:浙江省电力实业总公司科学技术项目(KJXM2022016);
文章来源:翁东雷,王露民,莫建国,等.基于迭代模糊聚类算法的多源异构电力数据集成[J].电子设计工程,2024,32(23):150-154.
分享:
数据终端采集系统需要对电压、电流、电能、功率等多种电气参数进行实时采集,随后上传到主站中进行存储,便于数据的后期处理。系统可以对用电信息进行分析处理,针对异常用电数据进行标记显示,以确保数据终端采集系统数据信息的有效性和精确性。随着电力系统的规模扩大以及用电需求的增加,电气数据采集变得越来越重要。
2025-01-07随着智能电网建设的不断推进,电力系统的运行效率和可靠性成为关注的焦点。低压台区作为电力系统的重要组成部分,其线损问题直接影响电网的经济运行和供电质量。低压台区线损是指电力在输电、变电、配电过程中由于电阻、电抗、设备损耗等原因而产生的电能损失。线损不仅直接降低了供电企业的经济效益,还可能影响电网的安全稳定运行。
2024-12-05随着科学技术的发展,电力系统的网络拓扑结构越来越复杂。同时用户需求的提高使得电力设备的种类日益增多,且智能化程度不断提高,AI技术的应用也使传统电力系统逐步向智能电网的方向迈进。在智能电网的发展过程中,也同时存储着大量的用户数据,为精准分析用户行为提供了基础。
2024-12-04电力系统是一个由多个子系统和设备组成的高度复杂系统,其包括发电、输电、配电和用电等环节。在这些环节中,涉及到大量的数据采集、传输和处理过程,数据来源也十分广泛,如传感器、计量器、监测系统等,使得电力数据具有高度的异构性和复杂性,需要对有效数据集成和分析,以便更好地理解和控制电力系统。
2024-12-03风机基础施工常见质量通病包括:基础不均匀沉降、混凝土强度不足、较多裂缝、冷缝等。以上质量通病会导致风电机组的倾斜和不平衡,影响风电机组在不同运行工况下的正常工作,严重时甚至造成基础的破坏和倒塌,从而威胁风电场的安全。本文结合实际案例,采用全面因素分析方法,针对风机基础施工中的每个施工环节的施工工艺和关键工序的质量控制。
2024-11-20对于电力施工企业项目而言,影响成本控制效果的因素涉及多个方面,从人力资源成本的角度分析,电力工程施工项目需要大量的劳动力,人工成本是项目成本的重要组成部分[1]。人员的工作效率、技术水平以及人工成本的合理安排,都会直接影响项目的成本控制效果。从材料成本的角度分析,电力工程需要使用大量的电缆、设备、工具等材料。
2024-11-11面对越来越大的生产需求,能源资源需求量也在逐渐增大,尤其对电力能源的需求更是与日俱增;而停电事故的发生意味着电网仍具有一定薄弱性,薄弱环节的存在极易造成电力故障发生连锁反应,降低局部或整体电网的运行安全性和稳定性.因此,识别电网中的薄弱环节一直是电力公司着力研究的项目之一,但是目前取得的成果与预期效果存在很大差距.
2024-11-11风电作为清洁能源,近年来并网入电比例不断加大,极大带动了风电建设市场的发展。根据目前风电建设市场现状,环境条件好、项目建设简单的风电场越来越少,风电施工项目逐渐转向风电资源丰富的山区地带,未来山区风电将迎来跨越式的发展。山区地带道路狭窄弯曲,纵横坡度较大,地面土质较为松软。
2024-11-11大雅河抽水蓄能电站位于辽宁省本溪市桓仁县大雅河上,站址距桓仁县城40km, 距沈阳市直线距离为152km。上水库位于大雅河左岸一撮毛山及其相邻次高峰之间的鞍部,通过开挖鞍部和在其东西两侧筑坝形成库盆。
2024-11-02配电网故障检查与维修在现代电力系统管理中扮演着重要角色,有序开展该项工作,可提升整个电力系统的运行稳定性。过去,由于技术水平等因素的影响,一般采用人员检查维修的方式。即工作人员根据后台监测信息,利用相关设备对配电网进行检测,以判断故障具体位置,并进行维修。
2024-10-23人气:3431
人气:2440
人气:2393
人气:2322
人气:2227
我要评论
期刊名称:电子设计工程
期刊人气:3200
主管单位:九三学社陕西省委员会
主办单位:西安市三才科技实业有限公司
出版地方:陕西
专业分类:电子
国际刊号:1674-6236
国内刊号:61-1477/TN
邮发代号:52-142
创刊时间:1994年
发行周期:半月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.333
影响因子:0.315
影响因子:0.438
影响因子:0.000
影响因子:0.527
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!