摘要:针对多模态电网设备数据之间存在相互关系,导致数据检索效果差、检索精准度和效率低的问题,提出了基于映射关系的多模态电网设备数据实时检索方法。采用三元组表示多模态电网设备数据结构的本体映射关系,依据多模态电网设备数据的五元组集合,构建多模态电网设备数据实时检索模型。根据条件概率分布,生成包含图片和文本的文档,使文档呈线性稳定分布。结合哈希函数,计算数据点映射距离,利用Tag方法实时抽取待检索文档的关键词。计算任意两个待检索多模态电网设备数据文档之间关系,设计实时检索流程,实现多模态电网设备数据实时检索。实验结果表明,所提方法的检索召回率和准确率分别高达0.98和0.99,检索时间仅为27.4 ms,具有较好的多模态电网设备数据实时检索效果,提高了88.5%的检索召回率、23.8%的检索准确率以及36.3%的检索效率。
加入收藏
电网设备是指在电力系统中用于输送、传输、分配和控制电能的各种设备和设施。由于电力系统中大量数据快速积累,具备多模态、海量的特点,为电网设备数据检索带来了极大的挑战。随着多模态电网设备数据规模不断扩大,数据结构与类型也越来越复杂。
文献[1]提出了基于知识图谱的检索方法,对智能变电所一次设备基本信息进行分析,结合隐马尔科夫模型,建立电力系统主部件知识库。将KeyMap技术与智能变电所技术相结合,有效检索智能变电所设备信息。文献[2]提出了基于对抗投影学习的检索方法,采用对抗性学习方法,从多个模态中学习低维特征,基于跨模态投影匹配的约束条件,降低特征与类别投影匹配偏差,利用类别信息构造数据,实现数据检索。但上述检索方法仍存在检索效果差、准确度和效率低的问题。为此,提出了基于映射关系的多模态电网设备数据实时检索方法。
1、多模态电网设备数据映射关系
在电网监控系统中,从各个测控设备采集到的数据存储于实时数据库,这些数据适用于实时监控、现场监控,还能根据监测点发生的状况,作出预警及事故的判断与分析。这种数据储存方式,对于查询表的平均查询时长有很大的影响[3-4]。基于向量检索相对较高的特性,使用向量组织数据,电网设备数据结构如图1所示。
图1电网设备数据结构
现场的每个监控点都是通过厂站名称、监控点类型以及名称来确定的,可以用若干个参数来描述各个监控点的状态[5]。在本体论映射模型中,使用三元组来描述多模态电网设备数据之间的关系,如图2所示。
根据上述构建的映射三元组模型,将多模态电网设备数据分成一个五元组集合,可表示为式(1):
图2多模态电网设备数据映射三元组模型
式中,δ表示电网设备数据模态集合;ϕ表示模态集合中的一个元素;λ表示定义的属性集合[6];ϑ表示三元关系,该关系属于δ集合与λ集合的乘积;τ表示三元关系,该关系属于δ集合[7-8]。
在将文件映射成可供保存的关系模式时,有两种主要的映射方式,一种是模型映射方式,另一种是结构映射方式[9]。模型映射实现了从文件的树状结构到关系模式的转变;结构映射可以实现一个文件模式图的转化。在此基础上,提出了一种基于节点的模型映射方法,并设计了一系列关系,用于存储节点信息、节点值信息以及文件树的结构信息。
2、基于映射关系的电网设备数据实时检索
在五元组集合中,每个集合都包含了图片I和文本K两种模态数据,令R=[]R1,R2,⋯,RC表示模态无关的语义向量,其中,C为该向量维度,RC∈{}0,1,在该集合中有一个或多个值为1,其余值均为0,R所表示的语义空间总语义个数为2C个[10]。依据语义概念,提出了基于映射关系的数据实时检索模型如图3所示。
图3基于映射关系的数据实时检索模型
在该模型中,R服从先验参数多项式分布,属于C维向量。依据参数与数据映射关系,可依据条件概率分布生成包含图片和文本的文档,如下:
该文档与模态无关的语义向量R联合分布,可得到:
式中,αI、αK分别表示图片I和文本K的先验参数[11-12]。
当文档中除了包含上述图片和文本之外,还包含其他模态数据H时,待检索的文档生成过程改写为:
式中,αH表示其他模态数据的先验参数[13]。
对于三个先验参数,将全部数据集中的数据点随机投影到某个方向矢量上,该方向矢量指的是正态分布随机向量[14]。该方向上的所有数据点均服从条件概率分布规律,假设两个变量是稳定分布的,那么这两个向量的线性组合也是稳定分布的。哈希函数可表示为:
式中,z表示内积;α表示消除哈希边界带来的影响;ω表示权重。在标准高斯分布过程中,代表图片I和文本K的数据点映射距离可表示为:
式中,x表示数据点。基于该映射距离,结合Tag方法实时抽取待检索文档的关键词[15]。
针对电网设备数据中多模态交互影响,假设两种信息的相关性为等效,不考虑检索结果的边界权重以及检索结果间的相关性不一致,利用Tag方法对检索关键字进行实时提取。Tag方法能够体现信息主体内容的高层语义信息,被用户标注的相关网页可以作为附加信息,对多模态电网设备数据间的关联度进行评估,并将该关联度作为信息的边界权值。
因此,对于每个标签,可以得到一个信息的重要度排名,最后得到的关键词可以作为一个整合多种排名结果的过程,其计算公式如下:
根据对同一词项进行多个排序的研究可以发现,排名评分高的词最后的得分也较高。因此,使用Tag标签,可以有效地解决多个互动文本序列同时检索所带来的检索量大的问题[17-18]。利用Tag的关键词抽取方法,在某个具体页面上,假定已经标记出了对应的特征信息,就可以从该具体页面中,直接抽取出排名最高的关键词。
在含有图像和文字的文件中,文字可以作为图像的一个重要组成部分,并且图像和文字的联合使用可以提高图像的检索效率。
假设待检索文档为Di=()Ii,Ki,对于每个待检索的多模态电网设备数据文档Dj=()Ij,Kj,两者之间的关系可表示为:
该公式表示对每一个文档Dj进行Di检索的相似度,在获取每一个待检索文档和查询数据之间相似度后,将相似度按照从大到小的顺序依次排列,并将排列结果靠前的若干项作为检索结果。
基于此,设计的检索流程如图4所示。
图4基于映射关系的数据实时检索流程
结合图4设置阈值β,当Sim()Di,Dj≥β时,则说明多模态电网设备数据检索结果与目标有关,否则无关。
3、实验分析
为了验证基于映射关系的多模态电网设备数据实时检索方法的有效性,将其应用于某地区电站,其核心由数据源、规则库和本体结果组成。
3.1实验平台
为了方便实验分析,建立实验平台如图5所示。
3.2实验指标
使用检索召回率、检索准确率和检索时间作为多模态电网设备数据实时检索实验指标,其计算公式为:
图5实验平台
式中,TP表示检索到的多模态电网设备数据;FP表示检索到的不相关多模态电网设备数据;GP表示未检索到的多模态电网设备数据。其中,检索召回率越大,说明检索效果越好;检索准确率越大,说明检索精准度越高;检索时间越短,说明检索效率越高。
3.3实验结果与分析
分别采用文献[1]方法、文献[2]方法和所提方法对比分析检索效果。不同方法的检索召回率如图6所示。
图6不同方法的检索召回率
由图6可知,在电网模态数为5个时,文献[1]方法检索召回率达到最高为0.45;在电网模态数为3个时,文献[2]方法检索召回率达到最高为0.52;在电网模态数为7个时,所提方法检索召回率达到最高为0.98。由此可知,所提方法具有较好的检索效果。
不同方法的检索准确率如图7所示。
图7不同方法的检索准确率对比分析
由图7可知,在电网模态数为3个时,文献[1]方法检索准确率达到最高为0.67;在电网模态数为3个时,文献[2]方法检索准确率达到最高为0.80;在电网模态数为3个时,所提方法检索准确率达到最高为0.99。由此可知,所提方法的检索精准度较高。不同方法的检索时间如表1所示。
表1不同方法的检索时间
由表1可知,与文献[1]方法和文献[2]方法相比,所提方法的检索时间较短,能够有效提高检索效率。
4、结束语
为了提高检索精准度和检索效率,提出了基于映射关系的多模态电网设备数据实时检索方法。通过多元组映射关系,明确多模态电网设备数据之间的关系,结合Tag方法抽取关键词,实现电网设备数据实时检索。并通过实验验证了所提方法的检索精准度和检索效率较高,具有较好的检索效果。
参考文献:
[1]张子建,刘俊宇,梁煜,等.基于知识图谱的智能变电站一次设备信息检索研究[J].电气传动,2022,52(5):70-75,80.
[2]曾超,白琮,马青,等.基于对抗投影学习的跨模态哈希检索[J].计算机辅助设计与图形学学报,2021,33(6):904-912.
[3]强梓林,刘建国,刘云峰,等.基于时域-频域哈希编码的电网图像检索方法[J].计算机工程与科学,2022,44(10):1877-1884.
[4]罗芳,李春花,周可,等.基于多属性的海量Web数据关联存储及检索系统[J].计算机工程与科学,2014,36(3):404-410.
[5]魏秀卓,赵慧南.基于Mapreduce的多源多模态大数据检索方法研究[J].计算机仿真,2021,38(4):422-426.
[6]纪冲,刘岩.基于无监督深度学习的跨模态数据目标检索[J].计算机仿真,2021,38(3):380-383,418.
[7]刘峰,朱颉,张凯,等.数据挖掘下电网调度信号异常数据提取方法[J].湘潭大学学报(自然科学版),2021,43(6):74-80.
[8]王宏志,燕钰.深度学习驱动的跨模态数据检索[J].哈尔滨理工大学学报,2021,26(1):9-16.
[9]罗鹏程,王继民,王世奇,等.基于深度学习的科学数据集检索方法研究[J].情报理论与实践,2022,45(7):49-56.
[10]房小兆,唐宝动,韩娜,等.相似度保持跨模态哈希检索[J].小型微型计算机系统,2021,42(2):256-263.
[11]尹奇跃,黄岩,张俊格,等.基于深度学习的跨模态检索综述[J].中国图象图形学报,2021,26(6):13681388.
[12]聂为之,王岩,杨嵩,等.基于循环生成对抗网络的跨媒体信息检索算法[J].计算机学报,2022,45(7):1529-1538.
[13]王凯文,王树兰,王海燕,等.一种支持属性撤销的top-k多关键词密文检索方案[J].西安电子科技大学学报(自然科学版),2022,49(1):26-34.
[14]杜锦丰,王海荣,李明亮,等.多层语义对齐的跨模态检索方法研究[J].郑州大学学报(理学版),2021,53(4):83-88.
[15]薛振宇,余正涛,高盛祥.融入事件实体知识的汉越跨语言新闻事件检索[J].计算机工程,2022,48(8):274-282,291.
[16]许柏祥,刘丽,邱桃荣.面向近重复文本图像检索的三分支孪生网络[J].智能系统学报,2022,17(3):515-522.
[17]张雪琴,江帆,任栋.基于图像视频序列分析的乒乓球机器人击球轨迹预测方法[J].自动化与仪器仪表,2024(8):99-103.
[18]范建伟,李琳,靳志鑫.基于改进神经网络的视频序列运动目标识别方法[J].现代电子技术,2024,47(20):118-122.
基金资助:国家自然科学基金项目(82060853);
文章来源:陈雪,陈艺丹,何其淼,等.基于映射关系的多模态电网设备数据实时检索[J].电子设计工程,2025,33(05):26-30.
分享:
风能、潮汐能、太阳能等可再生能源存在间歇性供应和地域分布不均衡等特点,对自然条件的依赖性很强。因此,开发新型储能材料成为解决这一问题的核心。超级电容器因其具备高功率密度、超快的充放电速率及较长的循环使用寿命成为储能领域中非常重要的一员[1,2]。
2025-09-07根据《智能光伏产业创新发展行动计划(2021—2025年)》的指导,各相关部门推动智能制造与运维融合,国家数据局的成立也为数据资源整合提供了支持[1]。基于大数据、人工智能和物联网技术构建的智慧运维平台,实现了设备实时监测、预测性维护及资源优化调度,显著提升了运维效率,降低了成本并增强了安全性。
2025-09-07新能源是人类传统能源外,以新技术诞生的地热能、太阳能、风能等能源种类,具有可再生、资源丰富的优点,对人类、环境负面影响小,却存在开发难度大问题。而在新能源开发中,采取电气自动化技术,利用先进控制算法,能够提高新能源转换能源效率,如太阳能发电优化阵列倾斜方向。
2025-09-04双进双出钢球磨煤机作为发电厂广泛应用的制粉设备,具有生产效率高、能耗低、不受异物影响等特点。但是,由于煤种特性因素的变化、电网用电需求不确定,煤质与电厂负荷发生变化,要求磨煤机能够及时响应,提高燃烧效率,减少CO2与NOx排放。因此,在发电厂双进双出钢球磨煤机运行中,应结合实际情况,对其进行优化调整,从而推动发电厂可持续发展。
2025-09-04随着电力系统规模的不断扩大和技术的日益复杂,高压输电线路的二次回路面临的故障类型也日趋多样化。目前,专家学者大多对二次回路的继电保护回路、电流电压互感器回路的故障进行了研究,但是基于系统安全的高压输电线路二次回路全方位、全过程的故障研究分析相对缺乏。
2025-09-04电力载波通信(PowerLineCommunication,PLC)作为一种利用电力线进行数据传输的技术,凭借成本低廉和覆盖范围广泛的优势,在众多领域得到了广泛应用[1]。特别是在智能电网、家庭自动化和工业控制等领域,PLC技术能通过现有的电力基础设施实现高效的数据传输[2]。
2025-09-04文献[6]提出基于随机规划的多能源系统日前调度模型,考虑了风电光伏的不确定性,但未纳入光热储能的长期调节能力。文献[7]利用模型预测控制优化光热-光伏联合系统,侧重短期功率平滑,难以适应周计划的时间跨度。文献[8]构建了“风光火储”多目标优化模型,但将储能视为独立单元,忽略了光热发电与储能的一体化特性。
2025-09-04高电压设备通常是在恶劣环境和长期高负荷状态下运行,在运维检修工作不到位情况下,极易造成较大经济损失和人身安全隐患。尤其是绝缘老化现象,导致绝缘层无法对高压电起到良好绝缘效果,出现绝缘击穿、设备故障、通电故障及放电故障等多种问题。
2025-08-29根据国家电网公司抽检试验数据,熔断器主要缺陷集中于上导电片连接处、熔管螺纹接合部等关键部位。材质缺陷与温升异常直接相关,导电部件材质不达标会造成接触电阻增大,正常负荷电流下产生过热现象,长期运行将加速触头氧化和弹性元件老化。
2025-08-29数字化浪潮中,智能工厂建设是企业高质量发展的必然选择。开展基于MES系统的配电盘智能化生产线建设,是提升公司配电盘产能、品质和核心竞争力的重要路径。智能工厂MES模块与产线对接投入生产后,预计投入5年后产量由现有的1200面增至2500面以上,产能得到有效提升。
2025-08-29人气:5265
人气:3647
人气:3576
人气:3524
人气:3458
我要评论
期刊名称:电气传动
期刊人气:1461
主管单位:天津电气科学研究院有限公司
主办单位:天津电气科学研究院有限公司,中国自动化学会
出版地方:天津
专业分类:电力
国际刊号:1001-2095
国内刊号:12-1067/TP
邮发代号:6-85
创刊时间:1959年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.814
影响因子:1.445
影响因子:0.657
影响因子:0.000
影响因子:0.688
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!