在运维初期,人们通常认为运维工程师就像救火的消防员,7*24小时响应异常。每天数不尽的更新发布和问题修改,运维人员每天的工作都很饱和,压力也很大,是一个比较疲惫的过程。我们如何提高运维质量,降低运维成本?Servicehot认为统一管理,形成有效的运维管理系统很有必要。接下来就给大家做个分享。
一、处理模式标准化流程化
Servicehot ITSM的主要功能包括服务台、事件管理、问题管理、变更管理、发布管理、配置管理和服务级别管理等,通过建立统一的处理模式,利用标准化和流程化的方式对日常工作进行梳理,包括数据中心的建设。可以通过运维服务的申请到运维服务的部署,包括应用的部署等流程来规范我们日常的运维工作。标准统一了,我们做运维时就相对容易很多。
二、完善的CMDB
实现用户、资产、以往问题的历史记录等可查询、可追溯。Servicehot ITSM通过组建CMDB对用户信息、资产信息进行记录和维护,并把每个事件/问题与用户以及发生故障的资产对应起来,形成历史记录以便查询和借鉴。如:某个用户报告某路由器通讯故障,维护人员就可以根据资产编号查询到该路由器以往的故障状况。如该路由器出现过多次故障,并且都是线路质量较差,维护人员则可以根据这一依据向有关部门提出线路维护申请。
三、数据日志
数据库数据及日志都是很重要的信息,它可以让我们对IT系统中的各类问题和相应的服务状况进行全面掌握和了解。包括系统日志、应用日志、数据库日志、设备日志等。
四、运维知识库
Servicehot ITSM的知识库主要包括事件库、问题库、经典案例库、解决方案库及文档库。事件库记录了日常所做的运维事件,当运维事件短时间内无法解决,需要通过开发做一些变更时,我们便将这个事件升级为问题,并通过问题库来跟踪运维事件变更所带来的具体进展情况。经典案例库和解决方案库主要是对于运维遇到的一些经典问题的解决方法,包括系统的经典的部署方法、解决方案等,都可以做一些统一的记录或存储,当有新的系统要部署时,也是可以通过这样查阅解决方案以及经典案例,快速得到部署的方法。文档库主要是存储了我们在标准化和流程化时做的一些文档,去做一些存储,其中也有一些版本是管理相关的东西。这是运维的基础数据。
运维的职责在于保证服务的稳定运行,对突然出现的问题做到快速响应和处理;通过Servicehot ITSM可以帮助运维人员解决日常问题,构建知识库,预测可能发生的问题。结束运维初期相对混乱的状态,为公司带来更大价值。