摘要:针对当前能源产业信息挖掘结果完整性差的问题,提出一种基于模糊聚类分析的能源产业信息自动挖掘建模方法。在模糊聚类分析算法中引入核学习算法,添加Gaussian核函数,搭建核模糊分析算法。确定核模糊分析算法的初始聚类中心,利用粒子群优化算法优化初始聚类中心,根据优化的初始聚类中心建立能源产业信息自动挖掘的目标函数,获取适应度值。根据适应度值与目标函数选择最佳个体,求解最佳个体的聚类有效性函数,解码输出聚类有效性函数最大时所对应的最优聚类数量与对应的聚类中心,以此搭建能源产业信息自动挖掘模型。实验结果表明,该模型可有效挖掘能源产业信息,在数据集规模不同的情况下该模型的调整兰德系数均较高,挖掘结果的完整性较高,自动挖掘效果佳。
加入收藏
新型能源产业能够为用户提供智慧用电方案,电费谷值时储电,峰值时用电,将大幅度减少用户电费[1,2,3],还可以利用互联网对信息流进行跨界交换,为用户提供实时的电表数据,但是随之而来的问题是能源产业信息剧增[4,5],加大了信息挖掘难度。文献[6]通过模糊C均值算法聚类降维后的特征数据,获取数据挖掘结果,该模型具备较优的数据聚类效果。文献[7]依据模糊神经网络建立数据挖掘模型结果。但这两种方法均存在计算开销较大的缺点,在挖掘较大规模的信息时实时性较差,在数据维度不同时的挖掘效果较差。
模糊聚类分析算法具备模糊集合理论的特点,在各大领域均取得了较优的应用效果,可全面呈现数据集的结构[8],聚类效果较佳。为此建立基于模糊聚类分析的能源产业信息自动挖掘模型,以此精准自动挖掘能源产业信息。
1、能源产业信息自动挖掘建模方法
1.1 确定初始聚类中心
利用基于密度聚类算法确定初始聚类中心[9],步骤如下:
步骤1:通过基于密度聚类方法获取o维Xφ内每维中的聚类中心gj′h,相应区间[ajh,βjh]内能源产业信息样本点数量为ri,i∈{1,2,⋯,n};
步骤2:利用各子区间cjh内的ri建立能源产业信息标号子集Rjh,计算每维子区间相应的长方形单元在Xφ内建立的τ个交集dτ[10];
步骤3:计算dτ的确切度ρ,公式如下:
式中,构建dτ的o维子区间中相应标号子集的并、交分别为Rτ、dτ′。
步骤4:以ρ符合dτ为前提,确定能源产业信息样本集的孤立点,公式如下:
在γ未超过设定百分比值的情况下,代表dτ内的能源产业信息样本点属于孤立样本点,即虚聚类[11,12],通过步骤4可获取τ′个符合ρ与γ条件的有效聚类子集d″τ′;
步骤5:通过k-均值聚类算法聚类处理d″τ′,获取d″τ′内的聚类中心gj′h,即KFCM算法的初始聚类中心[13]。
1.2 粒子群优化KFCM算法
利用粒子群优化(Particle Swarm Optimization,PSO)算法优化gj′h,缩短KFCM算法的聚类时间[14],提升能源产业信息自动挖掘精度。
PSO内的一个粒子代表一个初始聚类中心集合G=(g1′h,g2′h,⋯,gc′h),xiφ和gj′h的维度一致,设置PSO的适应度函数,公式如下:
若KFCM算法的能源产业信息自动挖掘效果有所改善,Jfφ会变小,相反f′(xiφ)会提升,因此f′(xiφ)与能源产业信息自动挖掘效果具有正相关关系。
利用PSO优化gj′h的具体步骤如下:
步骤1:设置样本数量c与允许误差δ;
步骤2:设置群体规模n,惯性权重ω,学习因子η1、η2,指数权重w;
步骤3:初始化粒子群g1′h,g2′h,⋯,gc′h,随机形成的聚类中心集合是Xφ={x1φ,x2φ,⋯,xnφ};在Xφ内随机选择c个能源产业样本进行初始化;
步骤4:求解K(xiφ,xjφ);
步骤5:求解各能源产业信息样本的ζjk;
步骤6:求解f′(xiφ),更新粒子速度vi(t+1)与位置Yi(t+1);
按照适应度值调整P(t)与P′(t),以生成下一代粒子,vi(t+1)与Yi(t+1)的更新公式如下:
式中,t是迭代次数;vi(t)、Yi(t)是粒子前一时刻的速度与位置;任意数是;P(t)、P′(t)分别是个体、全局极值。
步骤7:如果此时迭代次数T达到Tmax,那么结束迭代,在最后一代搜索出最佳解,获取得到P′的粒子,即初始聚类中心的集合,反之,令t=t+1,返回至步骤5;
步骤8:将更新隶属度函数ζjk作为一个粒子,对其进行更新处理[15];
步骤9:假设能源产业信息的聚类中心为gjφ,求解邻近两代ζjk之差E,如果E<ε,那么完成gjφ的优化,得到gj′h,反之,返回至步骤8。
1.3 能源产业信息自动挖掘建模
利用PSO-KFCM算法自动挖掘能源产业信息的实现步骤如下:
步骤1:初始化群体规模n、Tmax、迭代结束阈值ς,设置c、δ、b,确定gj′h;
步骤2:利用PSO优化gj′h,建立能源产业信息自动挖掘的Jfφ[16],并获取f′(xiφ);
步骤3:更新ζjk,通过求解相应的Jfφ,再计算出群体内全部个体目标函数的均值,如果t=0,那么令t=t+1,转至步骤2,若t≥Tmax,那么继续步骤4,反之,令t=t+1,转至步骤2;
步骤4:通过融合改进的HubertΓ统计量与分离度建立KFCM的自动挖掘模型FΓ′(c,G,Xφ),其公式如下:
2、实验分析
以某电网为实验对象,该电网共包含42个发电站,其中包含16个水力发电站,在该电网内随机选择有关16个水力发电站的10个数据集,这10个数据集的样本规模逐渐增大,由100 GB到1 000 GB,且数据集的样本维度各不相同,这10个数据集内的能源产业信息包含电网发电量信息、能源消耗信息、能源供应商信息与客户用电信息等。
利用该文模型自动挖掘10个数据集内在2020年有关16个水利发电站的能源消耗信息,自动挖掘结果如表1所示。
根据表1可知,该文模型可有效挖掘出所选择的10个数据集内有关能源产业信息中的能源消耗信息,且自动挖掘结果非常详细,实验证明该文模型可有效自动挖掘能源产业信息。
以数据集1为例,利用该文模型聚类处理该数据集内各类别能源产业信息的数据,该数据集内共包含三种类型的能源产业信息,分别是电网发电量信息、能源消耗信息与客户用电信息,聚类结果如图1所示。
表1 能源消耗信息自动挖掘结果
图1 聚类结果
根据图1可知,该数据集内共包含三个类别的数据,该文模型的聚类结果中共包含三个类别,与实际结果一致,说明该文模型具备较优的能源产业信息聚类效果。
利用调整兰德系数(Adjusted Rand Index,ARI)衡量该文模型的聚类效果,其取值区间为[-1,1],其值越大,聚类效果越佳,测试结果如图2所示。
根据图2可知,在不同数据集规模时,该文模型的平均ARI值与最大ARI值均较高,具备较优的能源产业信息聚类效果。
测试该文模型在不同样本维度时,初始聚类中心优化前后的能源产业信息自动挖掘的完整性,测试结果如图3所示。
根据图3可知,样本维度越大,该文模型的初始聚类中心优化前后的完整性均有所降低,在不同样本维度时,优化后的完整性均显著高于优化前,且收敛速度快于优化前。实验证明,在不同样本维度时,初始聚类中心优化后的完整性值较高,即优化后的能源产业信息自动挖掘效果优于优化前。
图2 ARI测试结果
图3 完整性测试结果
3、结论
电力企业的不断改革,使得能源产业信息呈爆炸式增长,同时由于能源产业信息规模庞大、维度不同,加大了能源产业信息自动挖掘难度,无法精准找到所需信息,为此建立基于模糊聚类分析的能源产业信息自动挖掘模型,提升信息自动挖掘效果,在不同能源产业信息规模与维度时,均可精准自动挖掘所需信息,为电力企业和用户提供更好的服务。
参考文献:
[1]黄铠,冯运凯,刘建武,等.基于大数据挖掘的油气田企业全产业链精准管理[J].物流技术,2020,39(2):102-108.
[2]艾崧溥,胡殿凯,张桐,等.能源互联网电力交易区块链中的关键技术[J].电力建设,2021,42(6):44-57.
[3]赵文琦,胡健,赵守国.中国能源产业的要素配置效率与产业高级化[J].数量经济技术经济研究,2020,37(12):146-162.
[4]郭立伟,叶峥.基于SEM的新能源产业集群形成影响因素实证研究[J].科技管理研究,2020,40(9):228-236.
[5]庞金香,隋萌萌.同态加密隐私保护数据高效智能挖掘仿真[J].计算机仿真,2019,36(6):316-319.
[6]米捷,刘道华.基于语义关联性特征融合的大数据挖掘方法[J].信阳师范学院学报(自然科学版),2019,32(1):141-145.
[7]许磊,王建新.基于模糊神经网络的异常网络数据挖掘算法[J].计算机科学,2019,46(4):73-76.
[8]张煜,陆亿红,黄德才.基于密度峰值的加权犹豫模糊聚类算法[J].计算机科学,2021,48(1):145-151.
[9]斯亚民.嵌入式模糊集数据库的FCM增量式聚类算法研究[J].中国电子科学研究院学报,2019,14(6):586-592.
[10]于建平,付继林,白塔娜,等.基于独有属性特征的情态与语境互动关系数据挖掘研究[J].燕山大学学报,2019,43(5):462-470.
[11]钱雪忠,姚琳燕.面向稀疏高维大数据的扩展增量模糊聚类算法[J].计算机工程,2019,45(6):75-81,88.
[12]周洁,姜志彬,张远鹏,等.基于密度的模糊代表点聚类算法[J].控制与决策,2020,35(5):1123-1133.
[13]郭鹏,李仁发,胡慧.一种基于超图Markov链松弛的聚类学习方法[J].计算机科学,2019,46(S1):452-456.
文章来源:陈竞,杜杰,丁胜利.基于模糊聚类分析的能源产业信息自动挖掘建模研究[J].电子设计工程,2024,32(01):138-141.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29人气:3466
人气:2469
人气:2430
人气:2348
人气:2236
我要评论
期刊名称:电子设计工程
期刊人气:3268
主管单位:九三学社陕西省委员会
主办单位:西安市三才科技实业有限公司
出版地方:陕西
专业分类:电子
国际刊号:1674-6236
国内刊号:61-1477/TN
邮发代号:52-142
创刊时间:1994年
发行周期:半月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.333
影响因子:0.315
影响因子:0.438
影响因子:0.000
影响因子:0.527
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!