1、调查背景
近年来,智能运维正成为企业高效管控种类繁多数量庞大的物理设备、精准定位故障信息、实时防护网络攻击、快速迭代需求变更等新时代运维场 景下不可或缺的科技力量和解决方案。
2、AIOps场景应用情况
AIOps仍处于初期发展阶段,受访者对目前AIOps能力水平的评价与期望超过其所在企业实际应用的情况。 • 从整体来看,30.27%的企业自评目前处于辅助智能化运维阶段,28.61%的企业自评处于进阶智能化运维阶段。
智能运维在质量、成本、效率、安全四大运维领域均已开展部署和应用,其中质量领域最为关注。 • 调查显示,54.79%的企业当前着重关注智能运维的质量领域(包括异常检测、告警收敛、根因分析、 故障处置等)能力建设,其次45.77%的企业关注效率领域,45.49%的企业关注成本领域,30.82%的 企业关注安全领域。
大部分企业在数据分析和算法模型分析方面已经逐步开始场景探索。并且已有15.61%和11.07%的受访者 所在企业将数据分析方法和算法模型应用与大部分业务场景。
3、AIOps能力成熟度模型
根据由中国信通院牵头制定的行业标准《云计算智能化运维 (AIOps)能力成熟度模型 第1部分:通用能力要求》中的AIOps 能力建设分级要求,可以将智能化运维整体能力从感知、分析、 决策、执行、知识更新五个维度进行级别划分,系统的参与程 度随智能化程度逐级递增,并结合智能运维应用场景特点,形 成AIOps能力成熟度模型。
从目前的发展情况来看,现阶段AIOps能力大多集中在L2级别, 主要以系统辅助分析,帮助人工进行决策和操作为主,较为领先的 能力实践可以达到L3级别,而L4和L5级别随着AIOps的技术发展 和能力的逐步增强,将是未来智能运维能力建设的发展方向和目标。
4、企业AIOps发展阶段
AIOps仍处于初期发展阶段,受访者对目前 AIOps能力水平的评价与期望超过其所在企业 实际应用的情况
不同AIOps能力成熟度阶段的企业关注领域各不相 同,达到全面智能化运维阶段的企业更加关注在效 率和安全领域的智能化运维能力建设
5、智能运维带来的效率提升
通过使用智能运维算法,可快速提 升运维智能化、自动化水平,大幅 降低故障平均检测时间,加速平均 修复时长。
通过调查发现,目前已经有11.95%的受访 者所在企业核心系统故障服务恢复时长可以 达到10分钟内的水平,并且还有11.23%已 经达到15分钟内进行恢复。大部分受访者所 在企业处于15-30分钟的恢复时间(18.76%) 和30-60分钟进行故障服务恢复(17.54%), 仅有7.86%的受访者所在企业恢复时间超过 4小时。
智能运维带来的效率提升 • 相较未引入智能运维能力,在使用 工具链、智能运维工具/平台处理一 次典型的故障(如核心系统的一次故 障发现到完全修复),整体故障处理 时间大概有多大提升。
从数据来看,53.96%的受访者可以感知到智 能运维带来的效率提升,其中25.4%的受访 者表示有一定效果提升(15-25%),16.77% 的受访者表示提升效果明显(30-50%),还有 11.79%的受访者感受到效果十分显著。
6、AIOps发展趋势与挑战
1、多数企业领导层已经对智能运维能力建设加以重视并付诸行动,但在智能运维的建设过程中仍有诸多困难与 挑战。
2、需求驱动能力升级,除普遍关注的质量场景,安全场景成为更多企业未来关注和提升的方向。
3、未来趋势:加强人员与技术方面投入,持续探索智能运维场景,持续优化现有场景能力,提升稳定性,易用性。