缩略图

将智能融入运维,卫宁健康开启服务新篇章

作者

周卫民 徐周 吕永涛 张春生

卫宁健康科技集团股份有限公司

近年来,伴随着信息技术日新月异的革新发展和各行业信息化水平的不断进步,智能运维技术的应用已经成为运维发展的必然趋势。卫宁健康紧跟时代发展潮流,逐步向智能运维方向发展,WiNEX产品从试点验证期迈步走向推广成熟期。卫宁健康依托自主研发的云运维平台,将人工智能技术融入日常运维场景中,让运维服务更便捷、更精准、更高效,推动公司运维管理迈入“新台阶”。

按照具体运维场景,我们从以下五个方面体现智能运维的能力要素:

多重监控体系,让故障定位更精准:云运维平台在技术层利用采集引擎、分布式任务定时采集各项性能指标数据,实现监控+诊断+预警三位一体。在业务层可以快速检测出主机、微服务、数据库、中间件、网络等实时运行情况,快速发现异常并定位其根源。截至2024年10月,云运维平台已监测运行指标160+,建立有效策略200+,并且按不同领域问题分为5大类进行分类组合,完善从单一指标的故障定位到复合指标策略组合的监控体系。云运维平台伴随着近年来的深度应用,从之前故障发生的单点式分散式管理,已升级为故障一键诊断、日志统一查询、故障一体化集中分析展示的故障处理模式。为了测算出更加精准的性能指标阈值,云运维平台内部定期采用算法模型异常值检测统计技术,分析客户海量的性能指标采集数据,持续更新性能指标预警阈值,形成最佳的预警指标规则知识库。

健全预警机制,让风险处置更迅速:云运维平台能够实时监控客户系统运行的各项指标,在发现运行风险或异常后,会结合预警策略自动生成预警消息,预警消息根据复合指标策略组合自动判断归类为红色、橙色或者黄色告警级别,并第一时间通过电话、微信、邮件等方式快速告知处理人员,结合系统预设的预警处置机制,确保预警消息受理快速有效、无一遗漏。当云运维平台发送对应监控预警消息时,系统会同步自动生成对应事件单,然后结合大数据模型计算,智能判断出各类预警事件最匹配的处置人员,自动完成事件单的指派。另外云运维平台在发送预警消息时会推送知识库中的预警推荐解决方案,助力处置人员快速准确处置预警,从而达成降低风险故障发生率、缩短故障处置时间的目标。

新兴技术应用,让服务工作更前置:云运维平台会智能搜集设定周期时间内的各运维指标的运行情况,通过大数据分析和机器学习,对当前已收集的运维指标数据进行分析,预测出未来运行趋势,如若预测出后续运行可能会发生异常,平台会通过预警机制告知相关人员提前介入处置,极大地降低系统故障运行发生概率。例如在关键系统接口耗时方面,平台分析各项目之间接口耗时横向对比,提前识别接口后续运行异常风险,避免应急事件发生。云运维平台借力新技术应用和对应场景故障处置路径,在检测到特定场景异常后自动触发“治愈”修复功能。目前云运维平台自动对数据库索引缺失、数据库死锁、无条件高业务并发、长时间挂起数据库进程等多个故障场景快速生成修复方案,默认自动执行对应修复动作。通过云运维平台趋势预测和故障自愈等功能,可大大降低故障处置的成本投入,逐步实现从“被动响应”到“无人值守”的运维模式优化。

一体化展示,让运维管理更高效:云运维平台实现一体化界面展示,提供丰富的数据分析和可视化功能。从整体维度来看,云运维平台中实现多客户统一管理,方便中心端运维人员统揽全局、通盘处置,助力运维人员更好地获悉所有客户系统状态和业务趋势。从客户维度来看,运维人员可以利用云运维平台查询客户现场运行整体概况,查看该客户当前服务器层、应用层、业务层的运行情况,并且针对单独指标提供下钻分析功能。云运维平台已实现从代码层→应用层→客户层→全景层的运维概况全面可观测,让整体运维管理工作更加便捷高效。

智能知识库,让请求响应更顺畅:2023年卫宁健康已发布供内部使用的智能知识库平台,集成公司现有知识数据,提供统一便捷的入口,实现跨平台、跨来源的高效搜索,借助深度学习、文本相似度以及大语言模型等人工智能技术,提供更加精准和智能的知识检索体验。2024年我们深化智能知识库平台应用层面,将智能知识库平台使用范围扩大至客户群体,在知识库中收录大量客户常用的业务操作指引和常用问题处理知识,提供相应业务操作指引及问题排查解决方案,客户请求可利用智能知识库实现快速智能答复,大大缩短客户请求响应时间,打通业务知识与用户应用的“最后一公里”。

伴随着智能运维技术的逐步深化应用,卫宁健康已完成从传统的人工被动响应向主动服务价值输出的转型,开启运维服务的新篇章。从发展趋势看,传统服务与人工智能的融合协同将成为未来运维服务发展的主要趋势,未来的智能运维也会必然朝着场景驱动、数据质量和信创可控的方向发展。智能运维发展为我们带来了全新的挑战和机遇,卫宁健康将会在未来不断提高智能运维建设水平,推动自身运维服务能力持续提升,为广大客户带来更加安全、智能、优质的服务体验。