发布网友 发布时间:2022-03-01 04:16
共1个回答
热心网友 时间:2022-03-01 05:46
系统运维工程师(Operations)在国内又称为运维开发工程师(Devops),负责维护并确保整个服务的高可用性,同时不断优化系统架构、提升部署效率、优化资源利用率提高整体的ROI。运维工程师最基本的职责都是负责服务的稳定性,确保服务可以24H不间断地为用户提供服务。
工作内容:
1、在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同得作用,因此运维工程师的工作内容和方向非常多:
(1) 事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。
(2) 问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
四个方面的管理内容:
1、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理;
2、应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web 等的监控与管理;
3、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;
4、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators)。
以上内容参考:百度百科--系统运维工程师