91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于映射关系的多模态电网设备数据实时检索

  2025-03-11    50  上传者:管理员

摘要:针对多模态电网设备数据之间存在相互关系,导致数据检索效果差、检索精准度和效率低的问题,提出了基于映射关系的多模态电网设备数据实时检索方法。采用三元组表示多模态电网设备数据结构的本体映射关系,依据多模态电网设备数据的五元组集合,构建多模态电网设备数据实时检索模型。根据条件概率分布,生成包含图片和文本的文档,使文档呈线性稳定分布。结合哈希函数,计算数据点映射距离,利用Tag方法实时抽取待检索文档的关键词。计算任意两个待检索多模态电网设备数据文档之间关系,设计实时检索流程,实现多模态电网设备数据实时检索。实验结果表明,所提方法的检索召回率和准确率分别高达0.98和0.99,检索时间仅为27.4 ms,具有较好的多模态电网设备数据实时检索效果,提高了88.5%的检索召回率、23.8%的检索准确率以及36.3%的检索效率。

  • 关键词:
  • Tag方法
  • 多模态电网
  • 实时检索
  • 映射关系
  • 设备数据
  • 加入收藏

电网设备是指在电力系统中用于输送、传输、分配和控制电能的各种设备和设施。由于电力系统中大量数据快速积累,具备多模态、海量的特点,为电网设备数据检索带来了极大的挑战。随着多模态电网设备数据规模不断扩大,数据结构与类型也越来越复杂。

文献[1]提出了基于知识图谱的检索方法,对智能变电所一次设备基本信息进行分析,结合隐马尔科夫模型,建立电力系统主部件知识库。将KeyMap技术与智能变电所技术相结合,有效检索智能变电所设备信息。文献[2]提出了基于对抗投影学习的检索方法,采用对抗性学习方法,从多个模态中学习低维特征,基于跨模态投影匹配的约束条件,降低特征与类别投影匹配偏差,利用类别信息构造数据,实现数据检索。但上述检索方法仍存在检索效果差、准确度和效率低的问题。为此,提出了基于映射关系的多模态电网设备数据实时检索方法。


1、多模态电网设备数据映射关系


在电网监控系统中,从各个测控设备采集到的数据存储于实时数据库,这些数据适用于实时监控、现场监控,还能根据监测点发生的状况,作出预警及事故的判断与分析。这种数据储存方式,对于查询表的平均查询时长有很大的影响[3-4]。基于向量检索相对较高的特性,使用向量组织数据,电网设备数据结构如图1所示。

图1电网设备数据结构

现场的每个监控点都是通过厂站名称、监控点类型以及名称来确定的,可以用若干个参数来描述各个监控点的状态[5]。在本体论映射模型中,使用三元组来描述多模态电网设备数据之间的关系,如图2所示。

根据上述构建的映射三元组模型,将多模态电网设备数据分成一个五元组集合,可表示为式(1):

图2多模态电网设备数据映射三元组模型

式中,δ表示电网设备数据模态集合;ϕ表示模态集合中的一个元素;λ表示定义的属性集合[6];ϑ表示三元关系,该关系属于δ集合与λ集合的乘积;τ表示三元关系,该关系属于δ集合[7-8]。

在将文件映射成可供保存的关系模式时,有两种主要的映射方式,一种是模型映射方式,另一种是结构映射方式[9]。模型映射实现了从文件的树状结构到关系模式的转变;结构映射可以实现一个文件模式图的转化。在此基础上,提出了一种基于节点的模型映射方法,并设计了一系列关系,用于存储节点信息、节点值信息以及文件树的结构信息。


2、基于映射关系的电网设备数据实时检索


在五元组集合中,每个集合都包含了图片I和文本K两种模态数据,令R=[]R1,R2,⋯,RC表示模态无关的语义向量,其中,C为该向量维度,RC∈{}0,1,在该集合中有一个或多个值为1,其余值均为0,R所表示的语义空间总语义个数为2C个[10]。依据语义概念,提出了基于映射关系的数据实时检索模型如图3所示。

图3基于映射关系的数据实时检索模型

在该模型中,R服从先验参数多项式分布,属于C维向量。依据参数与数据映射关系,可依据条件概率分布生成包含图片和文本的文档,如下:

该文档与模态无关的语义向量R联合分布,可得到:

式中,αI、αK分别表示图片I和文本K的先验参数[11-12]。

当文档中除了包含上述图片和文本之外,还包含其他模态数据H时,待检索的文档生成过程改写为:

式中,αH表示其他模态数据的先验参数[13]。

对于三个先验参数,将全部数据集中的数据点随机投影到某个方向矢量上,该方向矢量指的是正态分布随机向量[14]。该方向上的所有数据点均服从条件概率分布规律,假设两个变量是稳定分布的,那么这两个向量的线性组合也是稳定分布的。哈希函数可表示为:

式中,z表示内积;α表示消除哈希边界带来的影响;ω表示权重。在标准高斯分布过程中,代表图片I和文本K的数据点映射距离可表示为:

式中,x表示数据点。基于该映射距离,结合Tag方法实时抽取待检索文档的关键词[15]。

针对电网设备数据中多模态交互影响,假设两种信息的相关性为等效,不考虑检索结果的边界权重以及检索结果间的相关性不一致,利用Tag方法对检索关键字进行实时提取。Tag方法能够体现信息主体内容的高层语义信息,被用户标注的相关网页可以作为附加信息,对多模态电网设备数据间的关联度进行评估,并将该关联度作为信息的边界权值。

因此,对于每个标签,可以得到一个信息的重要度排名,最后得到的关键词可以作为一个整合多种排名结果的过程,其计算公式如下:

根据对同一词项进行多个排序的研究可以发现,排名评分高的词最后的得分也较高。因此,使用Tag标签,可以有效地解决多个互动文本序列同时检索所带来的检索量大的问题[17-18]。利用Tag的关键词抽取方法,在某个具体页面上,假定已经标记出了对应的特征信息,就可以从该具体页面中,直接抽取出排名最高的关键词。

在含有图像和文字的文件中,文字可以作为图像的一个重要组成部分,并且图像和文字的联合使用可以提高图像的检索效率。

假设待检索文档为Di=()Ii,Ki,对于每个待检索的多模态电网设备数据文档Dj=()Ij,Kj,两者之间的关系可表示为:

该公式表示对每一个文档Dj进行Di检索的相似度,在获取每一个待检索文档和查询数据之间相似度后,将相似度按照从大到小的顺序依次排列,并将排列结果靠前的若干项作为检索结果。

基于此,设计的检索流程如图4所示。

图4基于映射关系的数据实时检索流程

结合图4设置阈值β,当Sim()Di,Dj≥β时,则说明多模态电网设备数据检索结果与目标有关,否则无关。


3、实验分析


为了验证基于映射关系的多模态电网设备数据实时检索方法的有效性,将其应用于某地区电站,其核心由数据源、规则库和本体结果组成。

3.1实验平台

为了方便实验分析,建立实验平台如图5所示。

3.2实验指标

使用检索召回率、检索准确率和检索时间作为多模态电网设备数据实时检索实验指标,其计算公式为:

图5实验平台

式中,TP表示检索到的多模态电网设备数据;FP表示检索到的不相关多模态电网设备数据;GP表示未检索到的多模态电网设备数据。其中,检索召回率越大,说明检索效果越好;检索准确率越大,说明检索精准度越高;检索时间越短,说明检索效率越高。

3.3实验结果与分析

分别采用文献[1]方法、文献[2]方法和所提方法对比分析检索效果。不同方法的检索召回率如图6所示。

图6不同方法的检索召回率

由图6可知,在电网模态数为5个时,文献[1]方法检索召回率达到最高为0.45;在电网模态数为3个时,文献[2]方法检索召回率达到最高为0.52;在电网模态数为7个时,所提方法检索召回率达到最高为0.98。由此可知,所提方法具有较好的检索效果。

不同方法的检索准确率如图7所示。

图7不同方法的检索准确率对比分析

由图7可知,在电网模态数为3个时,文献[1]方法检索准确率达到最高为0.67;在电网模态数为3个时,文献[2]方法检索准确率达到最高为0.80;在电网模态数为3个时,所提方法检索准确率达到最高为0.99。由此可知,所提方法的检索精准度较高。不同方法的检索时间如表1所示。

表1不同方法的检索时间

由表1可知,与文献[1]方法和文献[2]方法相比,所提方法的检索时间较短,能够有效提高检索效率。


4、结束语


为了提高检索精准度和检索效率,提出了基于映射关系的多模态电网设备数据实时检索方法。通过多元组映射关系,明确多模态电网设备数据之间的关系,结合Tag方法抽取关键词,实现电网设备数据实时检索。并通过实验验证了所提方法的检索精准度和检索效率较高,具有较好的检索效果。


参考文献:

[1]张子建,刘俊宇,梁煜,等.基于知识图谱的智能变电站一次设备信息检索研究[J].电气传动,2022,52(5):70-75,80.

[2]曾超,白琮,马青,等.基于对抗投影学习的跨模态哈希检索[J].计算机辅助设计与图形学学报,2021,33(6):904-912.

[3]强梓林,刘建国,刘云峰,等.基于时域-频域哈希编码的电网图像检索方法[J].计算机工程与科学,2022,44(10):1877-1884.

[4]罗芳,李春花,周可,等.基于多属性的海量Web数据关联存储及检索系统[J].计算机工程与科学,2014,36(3):404-410.

[5]魏秀卓,赵慧南.基于Mapreduce的多源多模态大数据检索方法研究[J].计算机仿真,2021,38(4):422-426.

[6]纪冲,刘岩.基于无监督深度学习的跨模态数据目标检索[J].计算机仿真,2021,38(3):380-383,418.

[7]刘峰,朱颉,张凯,等.数据挖掘下电网调度信号异常数据提取方法[J].湘潭大学学报(自然科学版),2021,43(6):74-80.

[8]王宏志,燕钰.深度学习驱动的跨模态数据检索[J].哈尔滨理工大学学报,2021,26(1):9-16.

[9]罗鹏程,王继民,王世奇,等.基于深度学习的科学数据集检索方法研究[J].情报理论与实践,2022,45(7):49-56.

[10]房小兆,唐宝动,韩娜,等.相似度保持跨模态哈希检索[J].小型微型计算机系统,2021,42(2):256-263.

[11]尹奇跃,黄岩,张俊格,等.基于深度学习的跨模态检索综述[J].中国图象图形学报,2021,26(6):13681388.

[12]聂为之,王岩,杨嵩,等.基于循环生成对抗网络的跨媒体信息检索算法[J].计算机学报,2022,45(7):1529-1538.

[13]王凯文,王树兰,王海燕,等.一种支持属性撤销的top-k多关键词密文检索方案[J].西安电子科技大学学报(自然科学版),2022,49(1):26-34.

[14]杜锦丰,王海荣,李明亮,等.多层语义对齐的跨模态检索方法研究[J].郑州大学学报(理学版),2021,53(4):83-88.

[15]薛振宇,余正涛,高盛祥.融入事件实体知识的汉越跨语言新闻事件检索[J].计算机工程,2022,48(8):274-282,291.

[16]许柏祥,刘丽,邱桃荣.面向近重复文本图像检索的三分支孪生网络[J].智能系统学报,2022,17(3):515-522.

[17]张雪琴,江帆,任栋.基于图像视频序列分析的乒乓球机器人击球轨迹预测方法[J].自动化与仪器仪表,2024(8):99-103.

[18]范建伟,李琳,靳志鑫.基于改进神经网络的视频序列运动目标识别方法[J].现代电子技术,2024,47(20):118-122.


基金资助:国家自然科学基金项目(82060853);


文章来源:陈雪,陈艺丹,何其淼,等.基于映射关系的多模态电网设备数据实时检索[J].电子设计工程,2025,33(05):26-30.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

电气传动

期刊名称:电气传动

期刊人气:1461

期刊详情

主管单位:天津电气科学研究院有限公司

主办单位:天津电气科学研究院有限公司,中国自动化学会

出版地方:天津

专业分类:电力

国际刊号:1001-2095

国内刊号:12-1067/TP

邮发代号:6-85

创刊时间:1959年

发行周期:月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定