如何让IT业务系统运行无忧
IT系统运行无忧,这是如今每一个企业进行信息化建设是都希望达到的目的。但由于人力、技术、资源、管理等方面的限制,让 “IT业务系统运行无忧”成为不可遇也难求的终极目标。即便是像电信、金融等信息化工作遥遥领先的行业,也难以保证自己的信息业务可以高枕无忧。
也许大家会问:“这样说来,我们所提倡的业务永续,运行无忧不就成了镜花水月,渴望而不可及的事情了么?那你们还把这句话作为自己的企业宣传口号?”看官莫急,且听我们一一道来。
“IT业务系统运行无忧”向用户表达了一种服务管理理念,而如何无限接近和达到这种个目标正是IT运维厂商不断驱动力,正式这种驱动力不断帮助用户提升运行管理水平,持续逼近“IT业务系统运行无忧”的境界。
根据IDG统计结果,信息系统故障20%来自于系统原因,70%来自于管理原因。所以在建立了合理的IT基础架构后(如冗余和灾备体系),如何从技术层面对IT基础设施进行有效监控,及时发现与规避故障,降低系统原因引起的系统停机时间;同时在管理层面下功夫,持续提高日常运维管理管理能力,降低人为原因引起的服务中断,是我们努力实现“IT系统运行无忧”的两大主要途径。
(1)面向基础设施的管理,降低系统原因引起的停机时间
随着企业信息系统规模的不断扩大,业务应用的持续增加,IT基础架构已经变得越来越复杂。仅仅依靠某个工具或个人,已经不能胜任如此巨大的工作量并满足业务紧迫性的要求。因此,必须有一个完整的、全面的IT基础架构监控解决方案,帮助信息部门实时掌握IT基础设施的运行状况。
面向基础设施的管理主要包括以下内容:
全面管理系统资源:提供对网络、主机、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面管理。
智能化故障管理:自动收集各种管理功能产生的故障事件。完成故障事件收集、过滤、关联和处理等工作,以实现对故障的快速定位、处理。
性能管理与优化:对网络和应用等性能进行监控,定期提供性能报表和趋势表,为网络和应用性能优化提供科学依据。
有的企业已经逐渐建立的数据网管、桌面管理等管理工具,但这样的管理工具之间缺乏整合,割裂了网络、应用、安全等基础平台之间的关系,不能实现全面的、统一的、集中的和主动的对IT基础设施进行集中运行监控,既浪费了人力资源,也难以做到快速发现故障。
(2)面向运维服务管理,降低管理原因引起的服务中断时间
我们很多企业信息部门的IT系统日常运行管理条块分割,网络、应用、安全、IT基础环境等基本上是各管一摊,这样增加了不少重复和冗余工作,也不能有效利用人力资源。在IT基础设施集中监控平台的技术上建立运维服务管理,将能够实现以上优势:
提高IT员工的专业素质,提高员工的服务能力和工作效率;
规范IT部门的服务水平,规范工作流程,降低由人事变动导致的风险;
提高IT服务的可用性、可靠性和安全性,为业务用户提供高质量的服务;
有效控制IT部门的开支,降低IT运营成本,减少运营风险;
从总体上提高企业IT投资的回报,提高企业的综合竞争力。
很多企业已经理解到规范化运维服务的重要性,并目纷纷建立了各项运维流程化管理制度,但这些流程只能以文件的形式进行规范,没有相应的技术设施予以支持与保证。同时对日常运维服务的工作量和服务质量也缺乏量化的工具
面向运维服务的管理主要包括以下内容:
运维服务管理:运维服务管理基于人与流程的结合,提供方便,灵活工作流程的管理功能,使工作人员维护管理工作的自动化和信息化,其中包括帮助台、事件管理、问题管理以及值班管理等根据客户量身定制的业务管理功能;
智能总控中心:通过实时动态视图一目了然地展现当前IT系统的运行状态及趋势。可以综合监控IT系统中各种资源的实时状态和性能信息等所有运行情况,帮助管理人员快速发现问题,分析和确定问题所在;
知识库:使工程师在处理系统故障的时候,能够参考相关故障处理的方法,让有较低技术水平的工程师也能够进行系统维护,从而降低系统管理对个人的依赖。
综合报表:对系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助领导更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为领导决策提供支持信息。
绩效评估:通过运维平台的工单处理数据,领导可以对系统维护人员的工作绩效有一个直观的了解。从而通过预定的关键绩效指标对工作人员进行绩效评估。
(3) IT业务运行管理解决方案,以IT基础设施监控平台为支撑,以IT运维服务管理为抓手,努力实现“业务永续”的终极目标
Broadview IT运行管理解决方案由IT基础设施监控平台和IT运维服务平台组成,IT基础设施监控平台具有计算机网络、业务应用、系统安全和机房环境的监控报警功能;IT运维服务平台具有运行值班管理、运行维护管理、资产管理、运行统计与考核管理等功能,将人员、流程和技术有机地结合起来,将管理、监控和考核有机地结合起来,提升整个信息中心的运维管理水平。
BroadView以统一事件平台为核心,将网络管理、系统管理、安全管理、服务管理贯穿在一起,建立的统一的IT运行管理平台。Broadview解决方案主要由基础监测层、统一事件处理层、运行服务管理层等组成,各个层次完成的基本的功能和技术规范如下:
(1)基础监测管理
基础监测管理实现对各类被管对象的管理功能,从范围看包括网络设备、安全设备、服务器、应用平台和业务系统等,从功能看主要包括配置管理、拓扑管理、故障管理、性能管理等,基础监测管理层面向相关领域的专业技术管理人员。
(2)统一事件管理
统一事件管理是运行管理平台的处理核心。通过统一数据接口规范数据接入标准,系统具备接入不同的基础监测系统的事件;利用事件规则库进行事件的过滤压缩、关联分析,大大压缩告警数量,定位真正故障原因; 提供事件处理的策略,完成真正告警的通知和自动化处理。
(3) 运行维护管理
运行维护管理包含集中运行展现和维护流程管理两大功能模块。
集中运行展现提供集中的直观的监控呈现、快速发现和分析各类运行隐患,主要包括:网络拓扑、业务视图、告警监测、资产视图、统计分析等。通过全面的展现手段,使运行值班人员掌控全局运行状况,保障业务的稳定运行。
维护流程管理通过借鉴ITIL等IT服务流程标准,建立符合公安行业现状和发展趋势的流程维护管理功能,流程管理的主要功能包括:故障处理、工单管理、资源管理、项目管理、值班管理、信息发布、运行考核等。
(4) 统一资源/知识库
统一资源库提供了各类信息的统一存储机制,包括资源信息、事件告警、性能分析、运维数据等,并为上层运行维护管理提供支撑数据。
统一知识库贯穿于系统的各个层次,包括采集、分析、运维知识库等不同层次,包括信息内容、专家技能、标准规范、考核指标等不同内容,通过知识建设降低对个人依赖,实现运行知识的有效共享。
这个体系结构是一个完整的网络管理、系统管理、安全管理、IT基础环境管理、运行值班管理解决方案,可以最大限度的保护网络中的投资,并充分考虑到将来管理需求扩展。
(5)总结
可以看出,以IT基础设施监控平台为支撑,以运维服务平台为抓手,全面提高IT系统的可用性,降低服务中断时间,通过这样的一体化方案,“IT业务系统运行无忧”才可以落到实处,而并不是类似噱头的空谈。(广通信达供稿)
- 1BSM实施之前做什么
- 2ERP系统安全保护
- 3中小企业选择管理软件的三点建议
- 4商业科技熊牛之争
- 5从"失败产品博物馆"看"需求管理"
- 6BI不关乎企业生死
- 7企业IT部门编制预算的六个窍门
- 8十大软件即服务(SaaS)流行词
- 9郑州OA核心系统集中建设,个性系统统一规划
- 10地产与商业客户关系管理系统功能需求
- 11项目管理拒绝技巧大全
- 12SAP与微软重新领航ERP
- 13IT部门嬗变
- 14中小企业电子商务进化论
- 15巧解IT项目人际关系的软绳索
- 16严控成本 从ERP精准计算开始
- 17大企业首选IT “量身定制”
- 18IBM全球首席财务官(CFO)研究报告
- 19企业如何修炼统一安全防御能力
- 20GIS企业级应用摸底调查
- 21SaaS模式应用者经验之谈
- 22BI的6宗罪
- 23做需求调研必须回答的三个问题
- 24如何编制内部计划书
- 25关于DM的几点体会
- 26阿里巴巴盈利模式分析
- 27利用最优方法实现应用加速解决方案
- 28SAP成为CRM领头羊?
- 29ERP合同签订绕过六个陷井
- 30在制造业环境中如何应用仓储管理技术