IT运维人员之痛及解决办法
金蝶云社区-天冥异
天冥异
15人赞赏了该文章 715次浏览 未经作者许可,禁止转载编辑于2018年11月02日 11:34:07

image.png

全球IT数码行业 


IT运维人员之痛


1.工作繁琐:

采购设备软硬件,上架贴标签,系统环境软硬件部署,统计核实设备信息、复核系统变更情况,搬迁设备,调优系统……如此工作,日复一日,年复一年,会让人感觉无始无终。

2.鸭梨山大:

各种繁琐工作交织在一块,在有限时间、精力和繁重工作情况下,我们倍感鸭梨山大。尤其出现各种运维故障时,系统上线、调优、升级、恢复等特殊环境下,我们不仅仅是冷静地快速解决问题,还要面对背后一帮大佬的监察盘问……

3.设备系统故障:

设备系统,尤其是过保的硬件设备,很容易出故障。机房的温度,湿度,业务的读写频繁度,业务人员野蛮地使用,各种因素都会导致设备系统意外故障。意外就是意外,往往出现在不恰当的时间、地点。经常会让运维人员莫名郁闷。

4.熬夜加班:

有没有别人节假日团圆happy,你却在苦逼的加班熬夜。有没有别人吃喝畅聊时,你却在角落里苦逼的远程vpn操作,有没有三更半夜像特务一样起床打开电脑操作,低声细语的频繁打电话?有没有……?反正我都有……

5.IT消防员:

我们就是IT消防员,我们的最高境界就是无我境界,大家都很舒服时,都想不起来我。一旦想起来我,可能IT环境出问题了......我们只有硬着头皮去结尾,牺牲我一个,幸福一大家。

6.背黑锅:

运维人员有天生背黑锅的宿命。当你找不出别人的问题时,那就只能背黑锅,或许找出问题,也可能一起背黑锅。任何行业工作都有其委屈尴尬的一面,背黑锅是运维人员成熟历练的必经之路。

运维体系是运维的基础和核心。通过运维体系的构建及完善,使我们的运维做到稳定可靠、准确完备和规范科学。


如何解决运维之痛


从人、事、物、流程这四个方面便可以很好地将运维体系进行解构,它们彼此互相作用,共同构建了一个完整实用的运维体系。下面列举了这四个方面各自的含义及相关内容。

1.人

例如完善岗位职责与职业发展、提高团队技术水平、完善技能分享与培训、完善团队绩效考核、规范工作行为规范等。目的是要建成一支工作高效、技术水平高、团结稳定、有职业素养的运维团队。

2.事

例如做好日常基础运维工作,保障好生产业务运行。不断探索新的运维理念与技术,探索优化系统架构。具体可以分为几大块,例如运维流程管理,资源架构规划,应急与故障处理,监控与优化,安全与防护,项目及日常工作等等。目的是要明白运维做什么正确的事,怎么正确地做事,做事有章法,稳定高效能。

3.物

主要是如何管理好系统运维所涉及的各种资源。例如机房环境、办公设备、服务器、网络设备、操作系统、应用软件、工具等各种软硬件资源。目的要使各类资源配置管理妥当,清楚资源属性,知道从哪来,现在哪,要去哪。使得物尽其用,物有所值,安置妥当。

4.流程标准

运用流程标准将上述要素(人、事、物)有机地结合,有序科学地流转、高效稳定地运行。例如资源规划与采购,各种标准规范、项目规范、软硬件配置部署规范、安全制度、工作交接等等。

通过实施运维自动化,能够很好贯穿人、事、物、流程标准。运维体系的好坏影响运维自动化的实施执行,反过来,运维自动化也会推动运维体系的建设。

面对成百上千的机器,人工手工运维显然是不现实的,这个时候就凸显自动化运维的优势了。

自动化运维分担了我们很多的工作压力,将重复、乏味的工作交给程序去做。既高效又避免人为错误,帮助我们科学有序的管理设备,系统及业务。


标准规范与自动化是当前主流运维成熟进阶的必经之路。流程标准很重要,必须要执行与持续完善,这是运维自动化以及公司运营一切的基础。看过复杂的航空线路图,航海线路图,铁路交通图吧!是不是会感叹标准化与自动化的重要性。运维工作也是一样的道理。


流程规范是最佳实践方法论,但不是目的。我们没必要纠结于高大全的标准与自动化,我们需要从我们运维需求出发,痛点出发,持续改进与解决运维实际问题。

怎么运用好自动化,提升运维水平:制度流程战略 + 自动化战术+工作责任心素质。

干运维工作,需要很多技能知识,十八班武艺样样都得会。精不精,修行在个人。

做运维工作,实施运维自动化,需要具有很多技术、管理、实践储备。


1.由开发主导运维自动化系统

通常由开发人员主导运维自动化系统研发,貌似顺理成章,但事实情况,很多开发人员可能并不了解运维工作情况,对运维架构体系并不清楚。开发人员他们开发的系统往往带有开发人员的很多主观意识。这就造成运维自动化系统并不很适合运维人员日常使用与维护。


2.由运维主导运维自动化系统

运维人员懂运维需求,是应该的,也是职业素养必须具备的。但运维人员往往不懂开发,甚至很多运维人员对shell/perl/python不熟悉,更别说开发一个系统了。自己不懂开发,那么在主导运维自动化系统中就会感觉坡脚乏力。

说到这里,或许有人会说,最好有这么一个团队,干运维又会开发。这的确是最好不过了,但这种复合人才总是稀缺紧俏的。


运维不懂开发?我们是这么克服解决的。

我们的路子:

1.自学成才,一切问题的解决首先要靠自己。

2.有目的,有分工的研究学习。比如有的研究python,有的研究Web前端,有的研究数据库设计。

3.互相分享知识经验,互相帮助协作。

4.学习研究外界同行、大师的经验。

5.参加一些大会,沙龙论坛。了解发展大势。

6.知易行难,知行合一。知道是一回事,更需要迈开步子,逐步执行下去!


通过运维开发,我们获得的成果与经验:

1.通过该项目梳理了现有运维资源情况,更加准确掌握了系统资源情况。

2.通过该项目不断规范了系统管理。使运维工作逐步准确规范化、体系流程化、高效智能化。

3.运维工作从人工高密度转型到自动化技术高密度,紧跟当前IT运维开发的发展大趋势。

4.运维人员从原有的基础系统运维岗位逐步转型为开发运维复合型人才,职业发展空间更大。

5.探索开拓了运维更大的能动性,逐步建立自动化运维体系,更好地支撑保障业务生产运行。

and so on…


图标赞 15
15人点赞
还没有人点赞,快来当第一个点赞的人吧!
图标打赏
0人打赏
还没有人打赏,快来当第一个打赏的人吧!