摘要:通信网通常是由多个业务网络构成的,一旦网络出现故障,会导致全网告警风暴产生。为能够在大量告警信息中准确进行故障定位和诊断,论文设计出故障自动诊断系统和相应的维护平台,系统在通信网管理系统中得到了充分利用;实际应用结果表明,通信网故障诊断系统对光缆阻断等故障的诊断准确率达到90%以上。
1、引言
通信网络管理的主要任务是对网络进行实时监控,确保网络在日常运行中的稳定、高效和可靠。随着通信技术的快速发展和业务量的增长,网络运行告警规模与频度也相应增长。特别是在大型复杂异构型网络中,判断引发设备告警的原因更加复杂,需要投入大量的人力物力进行监控。如何对海量的告警数据进行分析和判断,找出根源故障成为当前研究的热点。在当前的研究中,一是通过研究网络告警数据的分布特性,提出使用多等级告警处理模型从而提升故障关联分析效率的方法;二是提出使用神经网络对告警数据进行分类,实现对网络告警分析的方法。在本研究中提出了采用故障规则推理引擎,分析现有告警数据,挖掘出根源故障从而提高故障诊断率的方法。
2、规则引擎原理
规则引擎最初来源于专家系统。该系统属于人工智能领域,用于人类推理方式的模拟,通过使用探索方法实现推理并证明这种推理的过程。规则引擎是基于规则方式实现推理的一种重要引擎。该引擎的规则依托一阶逻辑呈现的二元结构,其关注准确表达命题和一阶逻辑表达,不能含有模糊定义。规则引擎能够用于处理大量规则的推理场景,并将事实数据与产生式规则匹配,最后通过推理获得结论[1]。
2.1 规则引擎组成规则引擎是由规则库、推理机以及事实这三大部分共同构成,如图1所示。图1规则引擎结构示意图规则库能够用于推理规则的储存,规则是由结论、条件构成的语句,当满足该条件时能够激活结论。推理机能够实现引擎匹配,决定符合事实的规则,并设置规则优先级,符合条件的规则会被加入当前议程中。事实是指对象之间的多元关系。模式匹配器可决定规则匹配的方式,议程用于管理模式匹配器挑选规则的执行次序,执行引擎可用于规则执行。
2.2 推理过程规则引擎可以通过规则维护人员根历史据经验对告警分析归纳并形成规则或者对告警数据进行挖掘和案例学习后形成规则。规则形成后,推理引擎通过算法匹配决定执行顺序。从一定程度上来看,规则条件、匹配效率直接影响引擎性能。推理引擎需要迅速检测工作区域中的数据对象,从规则中找到符合相应条件的规则进行数据分析。大部分规则引擎产品的算法都来自于Charles Forgy博士于1979年提出Rete算法及其变体。Rete匹配算法是目前效率最高的一个前向链形推理算法,其核心思想是将分离的匹配项根据内容动态构造匹配树,以达到显著降低计算量的效果[2]。规则引擎的具体推理流程如下:①将初始数据(事实)输入推理机中;②利用模式匹配器比较规则库中的数据和规则;③如果执行规则存在冲突,即同时激活了多个规则,将冲突的规则放入冲突集合;④解决冲突,将激活的规则按顺序放入议程中;⑤使用执行引擎执行相应的规则,直到所有规则执行完成。
3、基于规则引擎的故障诊断系统
3.1 系统架构基于规则引擎故障诊断系统主要由两部分构成:规则管理模块和故障处理模块,如2图所示。
①规则管理模块通过对故障规则库的维护实现对规则的管理工作。对故障规则库的维护分为手工编辑和自动学习两种方式。手动编辑是依靠规则维护人员通过规则维护平台,依据专家经验手动定义、编辑产生故障关联规则。自动学习是依靠对海量告警信息进行数据挖掘和对样本长期案例学习,自动形成故障关联规则的方式。
②故障处理模块主要用于故障的关联诊断。规则处理引擎关联各方资源对告警信息实现分析处理,准确定位网络中存在的故障问题,找到故障原因,发布分析预警信息,降低网络故障对整个网络运行产生的不利影响。其主要部件包括:第一,规则处理引擎。其是系统的核心。通过获取告警、拓扑信息并与故障关联规则实现逻辑判断,最终分析出产生告警的根源故障以及该故障在整个网络中的具体位置,并将其录入信息库中。同时,规则处理引擎能够实现信息压缩、合并处理,过滤一些重复性的告警信息。第二,故障工单处置。对规则引擎分析出的故障结果保存到故障信息库中,由故障专家判断后,交由故障工单处理模块按相应步骤完成故障处理。典型故障工单处理流程如下所示:首先,需要对分析结果进行故障确认。一旦被确认为是故障问题,则会自动生成故障工单,并交由相应的故障维修人员。其次,故障维修人员在签收故障工单之后开展专业性故障处理,完成故障维修后填写故障回执单。最后,由管理员确认后即可完成整个故障处理。图2规则引擎的系统结构示意图;图3故障工单处理流程图
3.2 告警转故障规则本系统可以通过手动编辑或者自动学习两种方式形成故障关联诊断规则。生产的规则还需要专家经验判断形成最终的诊断规则[3]。
表1为一条自动生成的光缆阻断告警转故障的规则。如果该告警源为非波分系统群路盘发生光信号告警,同时,与其相关的对端非波分群路盘会发生远端接收失效告警,这种情况下可以判断为连接两个机盘的单缆阻断。生成的故障,属于紧急故障,无需考虑故障闪断时间。表1单缆阻断告警转故障规则
4、系统应用
利用规则推理的方法对通信网络设备进行故障相关性研究,设计故障关联推理规则,获得一些有价值的告警规则和定位根源告警信息,结合网络拓扑结构图表明所挖掘的关联规则的合理性,并通过这些告警规则分析通信网络存在的新告警信息,推测告警原因已经成为故障根源分析技术的一种通用性做法。
在本研究中所设计的故障诊断系统目前已经应用于通信网管理系统的故障诊断中。首先通过信息采集设备采集和检测通信网故障告警信息;其次利用本系统对海量故障告警信息关联定位分析;再次根据通信网故障专家的故障确认,形成故障工单;最后由专业的故障维修人员进行故障处置[4]。
根据通信网故障专家和工作人员的实际经验,针对目前通信网的故障问题可以将其分为线路故障、端口故障、光缆阻断,路由器故障等。系统在实际应用场景中,对现场运行结果进行统计,针对19类共2609个网元,一周63224条原始告警信息和一个月143316条告警信息进行了详细地对比分析试验,利用该系统对故障的诊断正确率可达到90%以上。
虽然本研究当前阶段已经初步实现了故障的采集、分类、诊断和预测,但是还存在比较大的提升空间。主要问题包括:①大量的关联规则还需要由人工制定;②对海量数据的关联规则样本学习和数据挖掘的结果还未实现完全的自动化,还需根据专家经验进行人工干预和判断准确性;③对当前火热的数据挖掘技术的研究和探寻还不足;④对故障工单的制定和派发也需要人工的介入,未能实现工单的自动生成,派发过程也未实现智能化。对于这些问题在未来还需要进一步研究和补充,为本故障诊断系统指明未来的研究方向。
5、结语
通信技术不断发展,由于通信网拓扑结构复杂,尤其是在大型复杂异构型网络中,利用网络拓扑信息进行故障分析的传统方法在海量告警信息风暴下,应用难度越来越大。研制和优化故障分析诊断系统是无可辩驳的发展趋势。本系统能够协助专业网管系统提高故障关联诊断能力,帮助工作人员及时发现网络故障问题,有效降低诊断时间,以提升网络运行的可靠性。未来本系统还需要进一步提高故障关联诊断率,加强故障诊断的准确性。
参考文献:
[1]徐俊洁,陈荣.基于故障关联的多故障概率诊断方法[J].计算机科学,2017(4):124-130.
[2]赵旭东.电力通信网络故障问题分析及对策研究[J].信息通信,2017(1):268-269.
[3]谭武坤,杨秋辉,陈伟.基于贝叶斯网络的通信网络故障定位方法[J].计算机应用,2018,38(S2):222-225+240.
[4]张书林,刘军,闫龙川,等.基于深度学习的电力骨干通信网故障诊断研究[J].软件,2018,39(3):202-206.
涂婷婷,李德军.故障关联的多故障概率诊断[J].中小企业管理与科技,2019,(28):167-169.
分享:
教学不仅是传授知识,更重要的是启智,为学生多打开几扇窗;此外,数学是一个整体,概率与现实世界关系紧密,因而是可以让学生结合所学内容做一些相关性研究课题的,譬如Berkerley大学统计系DavidAldous的创新性课程ProbabilityandRealWorld就是结合现实问题以分组课题研究形式来开展的.
2021-01-21在实分析、测度论、高等概率论等课程中,示性函数处处可见,是构造简单函数,逼近一般可测函数的基石.虽然学生在学习高等数学初期就会了解的著名的Dirichlet函数就是有理数集的示性函数,但遗憾的是,在教学中,特别是在初等概率论教学中,示性函数的作用没有得到应有的充分重视.有的教材对示性函数仅作简单应用[5],有的教材则对示性函数避而不谈。
2021-01-20《概率论与数理统计》是高等学校的基础课程,难度较大,需要较强的逻辑思维能力。另外,《概率论与数理统计》这门课知识点众多,应用场景也较多,如何较好地掌握书中的定理和定义是研究的重中之重。针对《概率论与数理统计》的教学中容易出现的诸多问题,以条件概率、全概率公式和极大似然公式为例;引入了互联网公司的就业要求以增强学生的学习意识,加强定理定义分解以改善学生对定理死记硬背的现象,增添趣味案例简化学生学习定理时的难度。
2020-12-29“穿越沙漠”游戏规定为:每名玩家在游戏开始时都会收到一定数额的资金与闯关地图,分别用来购买行进过程中必要的生活用品和规划全局路线,途中经过村庄可以用来补给资源,经过矿山并采矿能获得固定资金,玩家在探险途中还可能会遇到恶劣天气。在系统指定的时间内从起点处穿越沙漠到达终点即为通过,剩余的资金与资源越丰富获得优胜的机会越大。
2020-11-27大学数学课程是指概率论与数理统计、微积分与线性代数等一类课程,在高等教育教学中占据极为重要的地位。其中概率论与数理统计由于它的知识体系、课程性质等特点,使其具有开展思政教学改革的良好基础和明显优势。因此,本文以概率论与数理统计为对象,研究如何深入有效地开展大学数学课程思政建设,探索实施路径和有效方法。
2020-09-09本文首先用K-Means聚类算法对寿险客户进行价值细分,获得不同价值类别的客户;其次建立Logistic二分类模型进行客户流失预测,并比较细分前、细分后的预测效果。本文提出的方法,可以帮助寿险公司从宏观上预测客户流失的人数,从微观上判断客户的状态,为寿险行业的客户保留提供可行建议。
2020-09-09岩性识别是地质研究过程中非常重要的基础工作,尤其是在近地表以及深部无法直接采样区的地质研究中,准确地刻画深部岩石类型及其结构关系,可以为能源矿产勘探、深部结构与构造等研究提供重要的地质信息。因此采用什么数据、什么方法来进行岩性识别是一项极具价值的研究工作。
2020-08-10骰子模型有着广泛的应用.[1,2,3,4]苏有菊和魏首柳应用列举法、生成函数方法、母函数法、组合数法给出了投掷次数为2次或3次,点数之和为7或9时概率的具体计算例子.[5,6]本文将对生成函数法展开深入探讨,给出一个结构优美的计算公式,进一步给出任意面体的推广“骰子”,在n次投掷后的点数之和为m的概率计算公式.
2020-08-10本研究使用“基于源分析的形态学测量”方法[13],利用数据驱动的自适应脑区划分方法,通过对AD患者、轻度认知障碍患者及正常对照人群的脑结构磁共振图像进行特征提取,并采用机器学习的方法对给定数据进行分类。比较本研究中获得的特征提取方式与其它基于既有脑模板的分类效力,验证其在AD、MCI、NC人群鉴别分类中的性能。寻找能反映和区分AD发展中脑结构变异的潜在的新影像学特征。
2020-07-09文中介绍了因果推论到直接效应和间接效应的相关概念,针对中介有多个的情况,引用了Baron和Kenny(1986)与TylerJ.VanderWeele和Vansteelandt.的中介模型,建立多中介变量模型,并重新定义了多中介变量模型的直接效应和间接效应的概念。利用新建立的多中介变量模型对直接效应和间接效应进行模拟研究,在估计直接效应和间接效应时,采用了不同的方法进行模拟。
2020-07-08我要评论
期刊名称:通信管理与技术
期刊人气:365
主管单位:黑龙江省通信管理局
主办单位:黑龙江省通信学会,黑龙江省通信行业协会,黑龙江省互联网协会
出版地方:黑龙江
专业分类:科技
国际刊号:1672-6200
国内刊号:23-1521/TN
邮发代号:14-293
创刊时间:1979年
发行周期:双月刊
期刊开本:大16开
见刊时间:4-6个月
影响因子:0.407
影响因子:0.095
影响因子:0.500
影响因子:0.497
影响因子:0.353
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!