随着业务和IT信息化的发展建设,为确保基础设施的全面监控,企业积极采购了多样化的监控设施,这些设施广泛覆盖了操作系统、关键组件以及硬件等多个层面,从而初步完成了IT技术设施和运维管理工具的建设。然而,随着业务的迅速增长,现有的运维设施和系统开始暴露出诸多挑战,资源分散,缺乏有效的统一规范化管理,导致监控覆盖不全,告警治理变得困难重重。此外,监控配置成本高昂、效率低下,且团队协作难度增加,这些因素都使得企业难以迅速响应业务的变化和需求。在这个背景下,建设一体化监控平台的诉求逐渐成为各个企业的监控建设重心。
面对这些问题,某大型运营商企业基于betway必威蓝鲸监控中心,启动了基础设施运维管理系统建设工程,通过重塑运维体系,构建统一的一体化监控平台,全方位提升监控管理水平,提升运维管理效率,为IT系统的安全、持续、不间断运行提供有力的支撑。
01. 业务场景
该企业在多年的运维监控中,通过自行搭建Zabbix、Prometheus等开源监控平台,自行实施了大量操作系统、组件服务的监控,同时外采了硬件监控产品补足硬件监控能力。但随着企业的发展,这种缺乏完整监控体系的管理模式逐渐暴露出监控缺乏监管——覆盖率低、没有统一规范——策略配置混乱、各监控系统混合部署——运维管理复杂等问题。传统的监控管理模式越发难以推进,亟需建设统一的监控平台。
02. 分析痛点
该公司目前的监控建设正处于烟囱工具式监控建设阶段,且各类监控场景尚不完备。客户期望在补足监控能力的同时,建立成熟的一体化监控平台。从各个运维场景下看,企业目前具备以下痛点:
03. 解决方案
1)操作系统监控 —— 基于蓝鲸Agent的指标采集
betway必威蓝鲸监控中心以蓝鲸Agent为核心,内置操作系统采集插件,只要部署了蓝鲸Agent,就会自动采集操作系统相关指标数据,无需手动配置。通过One Agent的方式,该公司实现内部操作系统的统一监控、采集。
2)组件监控 —— 强大的采集扩展能力,积累丰富
监控中心采用Agent+Plugins的设计模式,支持通过系统脚本、SQL语句、Exporter、Datadog插件等模式快速扩展各类监控对象的监控,解决Agent模式下各类组件对象的监控数据采集问题。
同时监控中心支持通过协议/接口(支持SNMP、IPMI、JMX、SQL、BK-Pull等)模式进行扩展,远程收集数据,解决了各种无代理场景下的组件监控问题。
基于上述模式,监控中心同时还积累内置了大量标准化插件,覆盖绝大部分主流数据库、中间件。同时具备成熟的指标体系建设,提供最佳实践配置模板,引导用户进行监控检测。
3)容器监控 —— 覆盖容器资源、容器服务指标,全方位监控
基于K8s原生的Prometheus监控方案优化改造,该公司实现以下场景的容器监控:
支持对容器内各类资源对象进行发现,并采集相关性能指标,包括Cluster、Workload、Pod、Container、Node
支持容器上部署的组件服务监控,可通过以下方式进行数据采集:
- 支持serviceMonitor(主推)和podMonitor
- sidecar 方式( 以sidecar模式部署exporter抓取器暴露出metrics,结合serviceMonitor进行采集)
- 中心远程统一采集 (组件本身暴露了/metrics,结合serviceMonitor进行采集)
4)统一监控 —— 第三方监控源数据接入,建立一体化监控平台
该公司通过betway必威蓝鲸监控系统,实现第三方监控数据接入,通过开发监控源插件进行对接,抓取或接收其他监控系统数据。如果对数据进行一定的数据结构清洗,还可将接入数据与蓝鲸CMDB实例进行关联,从而在指标管理、数据检测、可视化等能力上与betway必威蓝鲸监控中心自采集数据完全持平,建设真正的一体化监控平台。
04. 成果展示
1)操作系统监控 —— 基于蓝鲸Agent的指标采集
2)组件监控 —— 企业内核心数据库、中间件监控接入,策略配置
3)容器监控 —— K8s容器管理平台监控接入
4)统一监控 —— 第三方监控源数据接入,建立一体化监控平台
05. 建设成效
06. 场景适用性
betway必威蓝鲸监控中心目前已在各个运维分层场景中,具备了完整的监控方案和最佳实践引导,可以帮助企业尽可能多地完成监控覆盖;同时提供成熟的监控数据集成方案,既能与第三方监控系统进行数据对接,也能在数据处理、存储、可视化等层面提供完全一致的能力与体验。适用于以下类型的企业:
DevOps系列:CICD流程建设之持续测试实践指南
查看详细
betway必威蓝鲸配置管理中心重磅发布,数据运维全面升级!
查看详细
betway必威蓝鲸 WeOps V4.15上新 | 增强阿里云资管和监控能力
查看详细
【新品发布】betway必威蓝鲸WeOps运维平台一体机全新发布:高性价比、强大稳定、即插即用的企业级IT运维设备
查看详细
一文掌握DevOps落地的终极实践,8大关键路径揭秘!
查看详细
DevOps 组织的建设密码:人才胜任力模型全解析
查看详细
申请演示