• 发文
  • 评论
  • 微博
  • 空间
  • 微信

某金融机构智能运维案例分析

蓝海大脑 2018-11-14 16:05 发文


 背景介绍

      某金融机构成立于2002年,总部设于上海。目前信息中心管理二十多个主系统,上百个子系统,涵盖小型机、X86服务器、数据库、中间件、应用系统等,日常运维工作压力较大。为了适应对快速增长的云架构的监控分析,对故障进行快速定位及诊断,希望通过搭建一套完善集中的运维管理平台对硬件系统、存储、网络设备、数据库以及应用系统和交易数据实施全面监控,保障跨行信息交换网络系统的建设和运营工作,并引入大数据及AIOps理念协助更好地进行运行管理,实现运维自动化、智能化、可视化。


挑战痛点

- 在迫切的业务需求面前,金融行业传统IT运维仍旧面临着交付效率、运维质量等方面的多重压力。再加上传统金融机构降低应用成本、提高运营效率、提升用户体验以及持续挖掘内部潜力的需求也使得有效解决运维难题显得更为急迫。

- 运维环境庞大,系统组件多,结构复杂,缺乏统一的IT运营管理平台。大量的数据、日志无法及时识别和处理,主要依靠人工判断。以手工操作、人工巡检为主所带来的效率低下误差率高,运维管理工作压力变大。

- 运维不够全面自动化,缺乏预测和分析工具。

- 流程管理复杂,数据存在孤岛,缺乏统一的数据规范和标准,数据存储访问接口不一致。

- 系统应用告警质量在准确率、覆盖率、及时性方面有待提高。

- 故障诊断效率较低,主要体现在告警风暴、根因定位、及时止损。


                                                                                 

 解决方案

       蓝海云智能运维平台提供高效分析工具,包括开箱即用的运维分析场景、全程一站式查询和分析数据以及快速采集处理异构数据;通过机器深度学习提供的智能分析快速定位故障根源,发掘潜在业务价值和防范风险;管理多维数据,加速故障定位和排除以及大数据的汇总和智能分析能力。

数据

  通过数据标准化、集中统一的数据归集和统一的数据存储及分析系统解决数据规范与标准不统一、多系统数据孤岛引起的数据关联性缺失、数据访问接口多样性引起的访问困难等问题。提供多维度、业务化、实时性等数据展现。

流程

   优化流程,增强管控,对非功能需求进行全生命周期管理,并对应用发布过程中的非功能进行管控。提供IT全生命周期管理(系统升级和迁移、部署新系统、分发软件、软硬件及固定资产、合同管理、问题管理、安全管理、监控跟踪及业务连续性)。 保证流程的标准化、优化、持续改进以及和相关工具的集成。

工具

  上线即监控,全面实施监控,构建运维工具自动化管理平台,对应用进行全流程监控。

信息安全管理及服务

  提供配置管理、补丁管理、病毒防护、漏洞扫描、访问控制账号管理、合规性管理以及安全事件管理功能。

组织文化

  组织从传统开发模式向敏捷开发、开发运营一体化转型。简化流程、加强协作,持续改进。

智能

  对运营数据进行分析挖掘,对投产后应用进行智能评估。

     

应用价值及客户收益

智能运维管理带来了显著的成效,具体表现在以下几个方面:

- 将AI与业务运维场景结合,实现智能化异常监测与预测、智能化告警引擎、自动化故障处置。通过对数据的有效整合和利用,能够帮助客户建立全新的数字化业务监控指标体系和业务运维考评规范,确保业务管理流程的高效管控。

- 统一运维管理平台提供性能分析、告警分析、容量预测等能力,提高运维团队监控效率与监控质量,有效地管理IT系统资源。快速定位故障根源、排查和关联分析,确保系统平稳运行,防范潜在风险。

- 提供自动部署、自动扩展、统一资源管理、 配置自动收集以及报表和性能分析等运维功能,实现运维的全自动化、 智能化、全局可视化。

- 助力IT创新,实现平稳迭代,降低运维压力。实现运维数据的自动化收集,平台化管理,精细化分析和场景化应用。

洞察启示

- 随着应用复杂度大大增加,解决IT问题需要考虑多数据源并跨团队协作。数据类型更趋多样化,IT从成本中心转向业务拓展。需要一套成熟的智能运维平台进行数据端到端数据采集及全栈溯源,智能分析根源和智能报警。

- 运维管理工作难度大,周期长,贯穿信息化建设始终。必须将其作为长期性的、常规性的基础工作来进行。

- 数据管理成败的关键在于合理有效的组织架构和流程,而不是管理系统自身,因此应当更重视数据质量管理配套的组织架构和流程建设。

- 数据标准化是信息化建设不可逾越的过程,是进入数据时代的前提。需要考虑不同的组织、文化、环境和资源,成功的经验不是简单的复制,应考虑如何站在别人肩膀上,避免重复劳动,看得更高,走的更好、更远。

- 智能运维管理是一套系统的工程,需要单位领导的大力支持以及各部门间的密切配合。

智能运维管理是一套系统的工程,需要单位领导的大力支持以及各部门间的密切配合。通过全链路监控、端到端应用性能管理、实时分析与可视化展示等解决方案找到需解决的根源问题,持续提升业务运营和IT管理效率。相信一体化智能运维平台将全面提升运维管理水平,同时对业务发展起到更为重要的支撑和推动作用。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    蓝海大脑

    基于机器视觉的工业视觉检测,高性...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码