职位描述
岗位职责
1、负责laaS平台运维工作,包括物理机、天翼云主机、分布式存储等,主要针对操作系统层面进行运维管理;
2、负责运维自动化、智能化平台及其组件的设计与开发;
3、故障事件的应急处置,参与及推进事件本质原因的调查及改进;
4、监控数据采集、统计、告警系统的开发与维护(zabbix server)
5、国产化操作系统替换升级;
任职要求:
1、大学本科及以上学历,并取得相应学位,计算机及相关专业优先;
2、五年及以上运维开发经验,具有大型云平台运维开发经验优先;
3、有CentOS等主流Linux操作系统和内核维护及版本迭代经验;
4、熟练使用Shell、Python、Ansible等脚本工具,熟练使用Zabbix、Prometheus、Grafana等日志、监控工具;
5、了解容器及虚拟化技术,了解OpenStack、Kubernetes生态,具备一定组件故障排查能力;
6、了解国产操作系统,对Linux替换为国产操作系统有认知;
7、对运维体系有深入的研究和理解,有运维自动化系统经验优先;
8、具备Zabbix专家认证者优先,ZCS\ZCP\ZCE