首页 > 论文范文 > 工程工业论文 > 电力工业论文 > 电力系统论文 > 基于迭代模糊聚类算法的多源异构电力数据集成

基于迭代模糊聚类算法的多源异构电力数据集成

2024-12-03 62 上传者：管理员

摘要：在电力数据采集过程中，极易出现传感器故障、通信中断、数据丢失等问题，使得数据出现质量差异。多源数据格式与语义的不一致增加了数据集成的复杂性，导致电力数据集成效率较低。为此，提出基于迭代模糊聚类算法的多源异构电力数据集成方法。构建数据集成框架，通过语言生成器统一数据格式，利用迭代模糊聚类算法，模糊划分数据。反复迭代处理聚类中心和任意一个电力数据之间的欧几里得距离，获取最优聚类距离，采用频繁项集，获取数据功率谱密度，构建集成目标，设计电力数据集成流程。通过实验结果可知，应用该方法仅存在50 bit的数据集成误差，且电力数据集成效率较高。

关键词：
多源异构
平均加权
数据采集
电力数据集成
迭代模糊聚类
加入收藏

电力系统是一个由多个子系统和设备组成的高度复杂系统，其包括发电、输电、配电和用电等环节。在这些环节中，涉及到大量的数据采集、传输和处理过程，数据来源也十分广泛，如传感器、计量器、监测系统等，使得电力数据具有高度的异构性和复杂性，需要对有效数据集成和分析，以便更好地理解和控制电力系统。由于多源异构电力数据之间难以实现共享操作，针对目前电网企业对信息资源的依赖程度较高的现状，迫切需要一种新的异构数据集成方案。

现阶段，国内专家学者已采用不同方法实现多源异构数据集成，如基于多维缩放和KICIC的电力负荷聚类方法，采用MDS算法，降维处理高维复合数据，获取降维后低维矩阵和归一化的特征向量。将该向量作为集成过程的输入权重，利用聚类中心在子域上的最大化间距实现电力数据集成[1]；考虑数据缺失的电力系统暂态稳定自适应集成评估方法充分考虑数据缺失情况，在保证节点客观性的基础上，构建同步向量，测量单元的子集搜索模型，根据子集对应的特征集，训练稳定集成模型。采用自适应加权融合机制，实现电力数据集成[2]。

当前，大部分的异构数据集成都是从其自身结构入手，以处理不同来源之间的结构差异为重点，忽视了不同来源之间的语义关系，尽管其形式上已经完成了集成，但其在数据共享、互操作性方面仍有诸多缺陷，导致获取的共享数据中出现大量的冗余、无效信息。为了解决这一问题，采用迭代模糊聚类算法集成多源异构电力数据。

1、数据模糊分组

不同数据源的数据可能存在语义不一致的情况，同一指标在不同数据源中的定义不同，将导致数据集成后产生歧义。因此在实现电力数据集成前，将数据模糊分组，发现数据之间的迭代关系，从而为数据集成提供更好的支持。数据模糊分组主要是将多源异构电力数据按照相似性分成若干组，从而可以更好地处理与分析数据，同时也为电力数据集成提供了更好的基础。

多源异构的电力数据集成，一方面要求以领域专家为主体，构建“领域树”；另一方面要求构建一种具有较强的“树形”特征、能够实现逻辑推断、有较强表现力的“树形”特征描述语言，以实现电网信息的融合。基于此，选取合适的映射方式，将不同数据源的异构数据转换成能够识别多源数据的语义关系[3]。

在多源异构电力数据集成过程中，要实现对不同类型电网信息的融合，需要利用同一视角的中间模型，而各数据源之间则需要通过相互间的映射关系实现融合[4]。在中间层模型下，用户的查询将根据中间层模型和数据源模型之间的对应关系，分配不同数据源，并由包装器将不同的数据源查询得出的结果整合和封装[5]，并返回给用户。

引入基于迭代模糊聚类算法，实现对多源异构空间数据的集成与交互操作[6]，对不同语言的空间数据格式实现信息统一处理[7]。利用语言生成器，将所转换的空间数据格式传送给空间数据管理器，并将某种语言的数据集成到一起，将其作为一种语言再发送给应用程序[8-10]。为了实现空间数据的集成，需要对参与集成的空间数据生成语言，实现对空间数据的转换，进而挖掘出空间数据的相似性特征[11]。

基于以上提取到的空间数据的相似性，利用迭代模糊聚类算法，对待集成多源异构电力数据分组[12]，由此构建的目标函数可表示为：

式中，n表示模糊分组个数；m表示电力数据数；ιij表示第i类的第j个电力数据隶属度；xj表示第j个多源异构电力数据样本点；oi表示第i类多源异构中心点。

通过引进拉格朗日因子[13-14]，优化聚类中心和电力数据隶属度，从而实现更准确的数据模糊划分，如式（2）、式（3）所示：

上述公式中，oa表示第a类多源异构中心点。

根据上述公式，实现多源异构电力待集成数据分组。

2、电力数据集成方案

2.1目标构建

基于迭代模糊聚类算法，实现数据模糊划分，但由于集成目标不明确，集成效果并不理想。因此，为明确电力数据集成的目的和需求，首先需要构建电力数据集成目标，从而更好地选择数据源、确定数据集成方案和评估数据集成效果。利用迭代模糊聚类算法，实现数据模糊划分，以此构建集成目标，将聚类数据作为输入参数，输出结果为隶属度[15]。隶属度是指某个数据点与群集中心之间的归属程度。由于模糊聚类方法不需要监督，因此通过计算聚类中心和任意一个电力数据之间的欧几里得距离，确定数据集成目标，进而实现更准确的数据集成。可用如下公式表示：

通过反复迭代处理，能够获取最优的聚类距离，以此获取序列特征。待集成的数据库统计特征矩阵E，可表示为：

式中，xν表示数据序列；ψ表示电力数据划分匹配集。融合全部数据获取的特征分布域Sn，可表示为：

式中，μn表示并行规划聚类加权幅值；λ表示并行聚类自适应调节参数。

为确保数据集成的时效性和准确性，利用平均加权处理方法，通过迭代模糊聚类，设置多源异构电力数据集成时间窗口t，公式为：

式中，t1、t2分别表示集成时间和数据处理时间。由式（7）可获得数据信息整体最佳值，为了方便在高维数据空间中实现数据集成，需要采用频繁项集挖掘数据特性[16]，从而获取多源异构待集成电力数据的功率谱密度ρ，计算公式为：

式中，η表示数据采集频率；ϕ表示功率谱估计结果。基于以上计算，由此构建多源异构电力数据集成目标Q，可表示为：

式中，l表示集成扰动间距。通过该目标，即可确定数据集成中心。

2.2电力数据集成流程设计

基于迭代模糊聚类算法的数据集成框架，在集成目标支持下设计集成流程，其步骤如下：获得电力数据库中各层的边界坐标范围信息，利用矢量法建立一套完整的电力数据库。判断数据中所包含的种类，从数据点的特性出发，输入不同的坐标及属性，并将这些数据储存到矢量向量中。对于数据点类型，设计数据集成流程如图1所示。

图1数据集成流程

当判定结果显示存在另外一个和该记录的ID相同时，继续判定该ID的两个记录节点是否相连，如果节点是相互连接的，则将LineString标记为一个成员元素；如果没有连接，则返回以上步骤循环该流程。在完成对不同类型数据的转换之后，将其合并为一份档案，完成数据集成。

3、实验

实验数据来源于UCI机器学习库，该数据库是一个公共数据仓库，包括了一些电力数据集，如“电力负载数据集”“电力数据质量数据集”等。从UCI机器学习库提取三种电力数据，分别是结构化数据、半结构化数据和非结构化数据。对于这三种数据，理想集成效果如图2所示。

图2理想集成效果

由图2可知，以结构化数据为x轴，半结构化数据为y轴，非结构化数据为z轴，确定理想集成中心坐标为（25,400,500）。设置该过程的理想集成时间为25 s，对集成耗时少于该时间的方法均视为理想集成方法。

将文献[1]提出的基于多维缩放和KICIC的数据集成方法、文献[2]提出的考虑数据缺失的暂态稳定数据集成方法和研究提出的迭代模糊聚类集成算法的应用效果对比分析，如图3所示。

图3不同方法的数据集成效果对比分析

由图3可知，文献[1]方法与文献[2]方法整体集成效果与理想效果存在一定差别，对应的理想集成中心坐标分别为（20,350,400）、（15,350,600）；文中提出方法的理想集成中心坐标为（25,400,450），整体集成效果与理想效果最为近似，在非结构化数据z轴存在50 bit的集成误差，但相较于其他两种方法，该方法的集成误差最小。

为了进一步验证文中所提方法具有较高的集成效率，选取时间作为实验指标，对比利用三种方法分别对三种不同数据类型的集成时间，对比结果如表1所示。

由表1可知，通过对比三种不同数据类型集成时间与总计时间，文献[2]提出的考虑数据缺失的暂态稳定自适应集成方法耗时最长，其次是文献[1]提出的基于多维缩放和KICIC的集成方法，耗时最短的是基于迭代模糊聚类的集成算法，且该集成方法耗时在理想时间范围内，因此，该方法为理想集成方法。

表1不同方法集成时间对比分析

4、结束语

为了提高多源异构电力数据集成效率，设计了基于迭代模糊聚类算法的多源异构电力数据集成方案。通过对多源异构数据的集成，采用基于迭代式的模糊聚类方法，对不同类型的数据聚类和集成。实验结果表明，该方案设计具有合理性，且系统稳定性良好。

参考文献:

[1]刘诗语,吴鸣,李睿哲.基于多维缩放和KICIC的电力负荷聚类[J].科学技术与工程,2023,23(3):1096-1103.

[2]谭本东,杨军,刘源,等.考虑数据缺失的电力系统暂态稳定自适应集成评估方法[J].电力系统自动化,2021,45(23):68-75.

[3]贾俊杰,张玉超.基于用户模糊聚类的综合信任推荐算法[J].计算机工程,2021,47(6):60-67.

[4]张人上,邱久睿.基于混沌系统的扩频通信多源异构数据加密算法[J].火力与指挥控制,2021,46(8):162-166,176.

[5]耿新青,王正欧.基于增量式模糊聚类算法的文本挖掘[J].南京理工大学学报,2022,46(5):579-585,593.

[6]李向利,范学珍,逯喜燕.基于非负矩阵分解的修正模糊聚类算法[J].吉林大学学报(理学版),2022,60(6):1416-1422.

[7]朱峥瑜,宋燕.一种基于多重信息的不完全数据的模糊C均值聚类算法[J].小型微型计算机系统,2021,42(12):2545-2552.

[8]赵春霞,赵营颖,宋学坤.基于频繁项集的多源异构数据并行聚类算法[J].济南大学学报(自然科学版),2022,36(4):440-443,451.

[9]张颖,彭然.基于改进蜻蜓优化多核模糊聚类算法的异常检测[J].数学的实践与认识,2021,51(19):208-219.

[10]潘兴广,王士同.基于边缘峰度度量的特征缩减模糊聚类算法[J].控制与决策,2021,36(11):2665-2673.

[11]吴文波,吴昌钱,胡永.多源异构数据集下的改进挖掘算法设计[J].计算机仿真,2022,39(4):506-510.

[12]杨昔阳,林舒欣,李志伟,等.一种基于数字特征的二型熵模糊c均值聚类算法[J].福建师范大学学报(自然科学版),2021,37(6):28-37.

[13]李雪,张琳玮,姜涛,等.基于拉格朗日乘子的电力系统安全域边界通用搜索方法[J].中国电机工程学报,2021,41(15):5139-5152.

[14]刘天奇,韩冬,汪延德,等.基于内嵌增广拉格朗日函数Q-learning方法的虚拟电厂市场博弈策略[J].电网技术,2021,45(10):4000-4008.

[15]莫慧凌,郑海峰,高敏,等.基于联邦学习的多源异构数据融合算法[J].计算机研究与发展,2022,59(2):478-487.

[16]刘明红,袁昕,童辉.高维电力数据的聚类优化算法的研究[J].科技通报,2021,37(1):50-55.

基金资助:浙江省电力实业总公司科学技术项目(KJXM2022016);

文章来源:翁东雷,王露民,莫建国,等.基于迭代模糊聚类算法的多源异构电力数据集成[J].电子设计工程,2024,32(23):150-154.

网友评论

加载更多

我要评论

期刊名称：电子设计工程

期刊人气：3202

期刊详情

主管单位：九三学社陕西省委员会

主办单位：西安市三才科技实业有限公司

出版地方：陕西

专业分类：电子

国际刊号：1674-6236

国内刊号：61-1477/TN

邮发代号：52-142

创刊时间：1994年

发行周期：半月刊

期刊开本：大16开

见刊时间：10-12个月

论文导航

基于迭代模糊聚类算法的多源异构电力数据集成

相关论文

基于LabVIEW多参数电气监测系统

关键词

基于自编码神经网络的低压台区线损异常快速识别方法

关键词

基于深度学习的电力设备智能运行方式研究

关键词