摘要:近年来,信息化基础设施发展非常迅速,对运维管理提出了更高的要求。本文结合实际情况,就信息化基础设施融合运维管理进行了探讨,希望为信息化基础设施运维提供借鉴。
1、数据中心运维管理现状与挑战
未来随着应急管理业务系统在新技术背景下的快速增长和加速重构,数据中心内将部署数量众多的网络、安全、服务器、存储、系统专用软硬件等设备,形成多厂家设备共存、物理和虚拟设备并存、跨异构网系设备共用的复杂局面,对数据中心传统运维方式带来了极大的挑战。
(1)云化数据中心导致运维管理工作量激增
应急管理云数据中心是由应急管理部主导建设的,为应急管理信息化业务体系正常运转提供基础支撑的数字底座。随着应急管理业务应用的加速重构和逐步丰富,云数据中心规模将日益增长,大量不同类型、配置各异的设备将在云数据中心集中部署,造成数据中心运维管理工作量迅速增加,而传统的运维管理系统采用分工式运维方式,即网络、安全、服务器、存储等分别具有独立的运维管理系统,各系统之间不仅存在重复建设、功能冲突等情况,更重要的是缺乏有效的故障预警、发现诊断等联动机制,导致设备故障难以定位,业务系统中断时间长的情况频繁出现。
(2)用户体验敏感导致对运维管理时效性的要求提高
随着用户对业务应用体验敏感度的日益提高,传统运维管理采用的集中监控系统无法从业务应用和用户视角反映系统运行情况,对于业务应用系统运行过程中出现的故障问题,难以在对应的IT基础设施环境中准确、快速定位故障原因,反之,对于IT基础设备发生故障后,难以准确评估受影响的业务范围和影响程度。业务应用和IT基础设施在运维管理过程中存在的关系脱节情况,对应急管理业务稳定运行产生了不利影响,极易引发业务中断、用户投诉、监管问责等一系列问题,不能满足用户对业务系统可靠、可用的根本需求。
(3)业务快速调整导致运维管理综合难度跃升
随着大数据、中台、微服务等新兴技术的不断应用,应急管理业务体系将迎来深度重构和快速增长,以监督管理、社会动员为代表的,具有大量移动并发访问场景的业务应用,将采用分布式架构进行系统重构,实现业务逻辑与基础系统的进一步解耦。由此对数据中心传统运维方式将产生颠覆性影响,原有“烟囱式”分隔独立的运维管理系统在业务快速调整情况下,难以准确高效调整IT基础设施,无法及时响应业务系统弹性扩容需要,不能根据业务系统运行数据综合预判IT基础设施未来调整需求。随着业务应用系统快速调整逐步常态化,将导致IT基础设施运维管理难度急剧跃升,传统运维管理结合人工智能等新兴技术进行转型升级迫在眉睫。
2、数据中心运维管理系统功能演进要点
为满足应急管理业务应用重构所产生的大量异构设备集中部署、不同系统故障预警信息关联整合、不同系统联动诊断调整,建立业务应用系统和IT基础设施运维的紧密联动等需求,数据中心运维管理系统未来应采用面向服务的模块化架构,具备对环境基础设施(供电、空调、微模块机房等)、网络设备(路由器、交换机等)、安全设备(防火墙、入侵防御等)、服务器设备、存储设备以及虚拟资源、操作系统、应用系统等的融合管理能力,实现自动发现、集中配置、集中监控、故障预警、集中告警、可视化管理、业务视角故障定位、统一报表等运维管理功能。
(1)自动发现,强化设备资源管理
IT设备在数据中心部署后,融合运维管理系统应能通过多种自动发现手段实时感知设备部署情况,并对完成部署的设备进行集中统一管理,包括网络管理、服务器管理、存储管理、虚拟资源管理、专用设备管理等基本功能模块。其中,网络管理模块应能够自动生成网络拓扑图,并对网络组建设备、网络质量、网络流量等进行管理、监控和分析;服务器管理模块应具备对CPU、内存、硬盘、风扇、电源等关键部件以及对服务器整机在线状态、健康状态等信息的监控能力;存储管理模块应能自动发现并实时监控存储网络资源,统计存储网络容量使用情况并作出容量预测;虚拟资源管理模块应能对计算虚拟设施,如集群、虚拟机等提供虚拟资源和物理设备的映射关系拓扑图,并实时更新各部件的性能数据;专用设备管理模块主要用于对融合通信、视频会商、安防监控等专用设备进行监测管理,提供语音质量诊断、视频流跟踪、数据分析等功能。融合运维管理系统通过持续监测IT设备基本信息和运行状态,对设备资源使用情况、设备运行情况等信息数据进行收集和汇总,为设备故障预判、精确定位、智能诊断等后续环节打下坚实的基础。
(2)集中配置,助力业务快速开通
融合运维管理系统应具有多类型设备集中配置、批量下发的功能,通过预制主流厂商网络、安全、服务器、存储和虚拟化等设备的配置表单模板,实现对数据中心不同类型设备的批量配置和快速下发,包括:网络设备的接口配置、VLAN配置、ACL配置、流量配置、QoS配置等;服务器设备的启动顺序、硬盘RAID、SANBoot、BIOS、HBA、操作系统安装等;存储设备的LUN创建和划分、存储池创建、主机映射创建等,同时需预留设备配置模板的增删接口,满足个性化设备的集中配置需求,助力应急管理业务快速上线开通。
(3)集中监控,推动运维降本增效
融合运维管理系统应具备设备拓扑、系统告警和业务视图的集中监控功能,通过对数据中心基础设施和不同类型IT设备CPU、硬盘、风扇状态的统一监控,实时反馈数据中心基础环境和IT设备硬件的工作状态;通过对IT物理设备和虚拟设备CPU利用率、内存使用率、接口流量、链路流量等性能指标进行集中监测,实时显示IT基础资源的性能使用状况;通过对中间件和业务应用系统进行服务性能指标的持续监控,快速了解业务服务可用性和响应时间等关键指标。融合运维管理系统对基础设施和IT设备的集中监控,简化了传统的运行维护管理流程,解决了运维管理人员在不同系统之间来回切换,运维工作绩效不佳的问题,有效地协助运维人员全方位掌控数据中心IT基础设备运行状态,及时获取关键指标异常变化,提升运维管理效率,降低成本。
(4)预警告警,降低业务中断风险
融合运维管理系统应具备故障预警、集中告警的功能。通过对数据中心基础设施和IT设备的集中监控,采集环境基础设施和IT设备的运行数据,对系统工作状态和可能出现的故障进行分析预判,并根据实际情况按需进行故障预警,提前采取有针对性的故障预防措施。当故障发生后,融合运维管理系统应采用集中告警方式,将不同类型设备的告警信息根据其关联关系进行归并整合,屏蔽冗余告警,进行故障原因分析,并以界面显示、声音、E-Mail、短消息服务、小程序等多种告警方式通知相关人员,确保运维管理人员能够随时随地了解故障信息,有效降低业务中断风险。
(5)可视管理,简化部门信息沟通
融合运维管理系统应具备对数据中心基础设施和IT设备的可视化管理能力,能够根据运维管理设备类型和应用场景灵活定制显示内容。融合运维管理系统利用大屏幕等显示设备,采用仪表盘、信息图表等方式,集中展现业务应用和IT设备的关联关系,并对关键业务服务状态进行可视化、数据化展现,以便持续监控关键业务使用量、响应时间、服务状态等性能指标,确保IT系统关键指标出现异常或设备故障发生后,能够全面、直观地展示受影响的业务范围和影响程度,形成数据中心运行维护管理“一图统揽”的业务形态,简化业务部门和IT运维部门信息沟通过程,提高故障快速响应处理能力。
(6)故障定位,保障业务持续稳定
融合运维管理系统应具备基于业务视角的故障定位能力。通过从业务角度监控数据中心IT基础设备的运行指标,建立业务系统和IT基础设备之间的逻辑联系,当业务系统出现异常后,能够准确定位业务异常原因,快速恢复业务正常运行,反之,基于业务系统和IT基础设备之间的关联关系,能够实现根据IT设备故障预判情况,确定受影响的业务范围和影响程度,提前规划并做好防范措施,确保应急管理业务持续稳定运行。
(7)统一报表,呈现资源使用趋势
融合运维管理系统应具有统一报表功能,通过对数据中心环境基础设施和不同IT基础设备的统一监控管理,获取数据中心环境数据和IT基础设备运行数据,实现不同设备数据信息的集中分析处理和统一呈现。利用统一报表功能,融合运维管理系统能深度挖掘运行数据潜能,构建资源跟踪、容量预测、历史性能统计等核心运管能力,满足用户跟踪资源使用情况,掌握IT系统容量利用率,及时发现关键业务性能瓶颈,预测IT系统资源使用趋势,指导IT资源配置优化,避免IT资源不足或过剩情况出现。统一报表功能还应实现将业务运行状态指标化并呈现给运维管理人员,使运维管理人员能够从业务角度监控IT基础设备的运行状态,及时发现业务异常指标,快速识别问题设备并采取积极干预措施,确保应急管理业务快速恢复、可靠运行。
3、结语
未来,在运维管理资源有限的情况下,随着应急管理业务云化、微服务化的逐步深入,业务应用对快速上线、灵活伸缩和服务等级的要求显著提高,传统的人工运维方式在面对海量IT设备运维管理、业务交叉调用关系极度复杂的数据中心环境时,难以保证高质量的IT服务水平。因此,传统人工运维向新型智能运维转变的需求日益迫切,而融合运维管理系统是智能运维演进过程中不可缺少的重要环节,通过构建融合运维管理系统将实现数据中心环境基础设施和IT基础设施的全生命周期自动化管理和性能容量智能运营,提升数据中心基础设施故障预防、发现和自愈能力。
参考文献:
[1]董凯.论云计算数据中心运行维护探索[J].中国新通信,2020,22(09):40.
[2]黄坚.数据中心事件管理的关键控制点[J].计算机产品与流通,2020(03):269.
[3]徐景日.大数据时代下的数据中心运维管理[J].信息与电脑(理论版),2020,32(02):113-115.
李旭东.信息化基础设施融合运维管理初步探讨[J].网络安全技术与应用,2020(11):38-39.
分享:
在扩频通信系统中,四相相移键控(Quadrature⁃PhaseShiftKeying,QPSK)信号具有误码率低、频谱利用率高等特点[1,2],应用越来越广。为了提高其抗干扰性,I、Q支路分别调制扩频码,如果载波多普勒动态范围大,不完全解扩I、Q支路上的扩频码情况下,锁相的环路无法直接进行载波捕获[3]。一般的扩频系统中都是先进行FFT运算对载波进行初始捕获,再通过锁相环进行跟踪捕获,可见精确的FFT算法是至关重要的[4]。
2024-01-03需要解决的问题。典型远程探测场景下,4 000 km处干扰机与弹头之间的角度间隔仅为0.02°~0.05°,导致常规的单站抗主瓣干扰手段力不从心。例如:利用和差波束的主瓣对消方法可以抑制近主瓣干扰(≥1 5波束宽度)[1,2,3],但对上述场景的目标信干比改善不足5 dB,不满足实际应用需求;盲源分离方法[4,5,6,7,8]利用混合信号相对于源信号统计特性变化找到信号的分离点,从而实现干扰与目标信号的分离。
2024-01-03显示玻璃破碎机理为玻璃缺陷位置应力集中导致裂纹萌生与扩展,并采用断裂分析技术解析起源位置、裂纹扩展、应力类型、冲击和摩擦方向等,全方位研究了玻璃断裂机理;文献[2]研究表明,显示玻璃强度主要取决于表面及边缘缺陷,并通过表面强度测试[3,4]、边缘强度测试[5,6]和冲击强度测试[7,8]表征玻璃强度;文献[9]基于神经网络算法,通过选取玻璃缺陷图像进行神经网络训练,对常见玻璃缺陷进行精确分类及识别。
2024-01-03随着城市化进程的加速,高层建筑物的数量不断增加,电梯已成为高层建筑中必不可少的交通工具[1]。尽管电梯内的电波传播不受自然气候因素的影响,但是电梯环境封闭、区域结构复杂、室外信号难以穿透等因素导致电梯内网络信号较差,严重影响了人们的通信体验和面临突发事件时的应急通信保障。因此,电梯信号覆盖成为各大运营商关注的重点。
2024-01-03正交时频空(Orthogonal Time Frequency Space,OTFS)调制是一种能够面对高速移动通信特性的先进调制技术。OTFS通过将发送数据经预处理和星座调整后映射到时延⁃多普勒(Delay⁃Doppler,DD)域,并经过一系列的二维变换使得同一个发送OTFS帧内的信号捕获到DD域等效信道的稀疏性,都经历了与时间选择无关的慢衰落,从而获得信道时间和频率的全分集增益以及更优越的抗干扰性能[3]。
2024-01-03早期的研究通常采用人工提取特征和传统机器学习方法进行情感识别.Bahari等[7]采用非线性k基于递归图的最近邻分类器(KNN),以识别不同的情感.Wang等 [8]使用基于频域特征的支持向量机(SVM)分类器对不同情感进行分类.然而,传统机器学习技术受到特征设计和特征选择的限制,需要大量的专业知识才能设计出性能更优的分类器.
2024-01-03无线传感器网络(Wireless Sensor Network,WSN)已广泛应用于许多领域,如森林火灾监测、建筑监控等[1,2,3]。一般来说,无线传感器网络由大量的传感器组成。由于这些传感器由能量受限的电池供电,网络的运行时间通常是有限的,这阻碍了传感器网络的发展[4,5,6]。考虑到每个传感器的电池容量是有限的,在电池耗尽之前补充传感器的能量供应至关重要。
2024-01-02快速傅里叶变换(FFT)是数字信号处理领域应用最广泛的算法,其广泛应用于数字通信、雷达系统、成像系统以及图像处理系统中。随着现代数字信号处理技术的发展,系统对于FFT的数据处理精度有着更高的要求。同时,不同的应用环境需要使用不同点数的FFT,对于当前的数字信号处理系统来说,也存在不同点数FFT动态实时切换的应用场景。因此,需要高精度、点数可配置的FFT处理器。
2024-01-02社区是城市的重要组成单元,社区治理水平直接影响城市的治理水平。为了提升社区智慧化管理水平,物联网技术被广泛应用[3,4,5],大量的水压[6,7]、烟感[8]等方面的感知设备在社区部署。大量物联网设备产生了海量的未清洗感知数据[9,10],冗余消息甚至是误报消息夹杂在一起,加重了社区运营管理负担;同时,部署设备的运维与管理也处于空白状态。
2023-10-23随着物联网(IoT)应用的大规模部署,室内人体活动检测受到了越来越多的关注。现存的系统大多需要人员携带传感器等外部设备,存在许多的局限性,如百度的“Baidu Eye”,哈工大的可识别手指的字母手套“CyberGlove”等。基于摄像头的活动识别无需携带外部设备但受限于光照和隐私等外部因素。
2023-09-06人气:2019
人气:1384
人气:1294
人气:1191
人气:929
我要评论
期刊名称:信息通信技术
期刊人气:574
主管单位:中国联合网络通信集团有限公司
主办单位:中国联合网络通信集团有限公司
出版地方:北京
专业分类:科技
国际刊号:1674-1285
国内刊号:11-5650/TN
创刊时间:2007年
发行周期:双月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.407
影响因子:0.095
影响因子:0.500
影响因子:0.497
影响因子:0.353
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!