个人简介 #
具备 5 年+ DevOps 经验,精通 Kubernetes、Docker、CI/CD、监控运维 及 云平台交付运维。曾深度参与 浙江移动磐基 PaaS 平台 交付与运维,管理 2000+ 服务器、10 万+ Pod,支撑浙江 11 市核心业务流量。
精通 Kubernetes 高可用架构、Prometheus 联邦监控、微服务治理、数据库优化,具备 大规模业务上云、自动化运维、故障排查及性能优化 能力。熟练掌握 Ansible、Jenkins、GitLab、Prometheus、Grafana,并具备 大规模 K8s 集群调优及自动化运维 经验。
擅长 中间件(Redis、Kafka、Zookeeper、Pulsar、Nacos)、数据库(MySQL、PostgreSQL、ClickHouse) 部署与优化。曾主导 BOSS 业务 10 分钟内启动 5 万 Pod 的 Kubernetes 调优,保障高并发业务稳定运行。
工作经历 #
亚信科技 —— 系统和应用运维 工程师 #
(磐基 PaaS 平台 | 2022.XX - 2024.XX)
- 负责 浙江移动磐基 PaaS 平台 交付运维,涵盖 2 个 K8s 控制面 + 38 个运行面集群,管理 2000+ 机器、10 万+ Pod。
- 采用 Ansible Playbook 部署 二进制高可用 Kubernetes 集群,并搭建 PaaS 平台(门户、弹性计算、组件管理、API 网关等)。
- 维护 Redis、Kafka、Zookeeper、Pulsar、Nacos、MySQL、ClickHouse 等关键中间件,优化高可用与性能。
- 负责 Prometheus 联邦监控架构,实现 38 个运行面的统一数据汇总和告警推送,优化 Prometheus 远程写参数、Kafka Adapter 队列满等问题,提升系统稳定性。
- 参与 双中心、双平面 设计,确保 Harbor、网关等核心组件高可用,并优化 ETCD、Kubelet、Kube-apiserver 运行参数,满足 BOSS 业务 10 分钟内启动 5 万 Pod 需求。
- 负责 浙江 CRM 统一 AI 平台、杭研智慧家庭看板、网状网磐道系统等核心系统 的上云交付。
荣怀集团—— devops工程师 #
(2021.XX - 2022.XX)
- 负责 Linux 及 Windows Server 服务器 维护,保障 IT 基础设施稳定运行。
- 搭建 Prometheus + Grafana 监控体系,结合 Node Exporter 采集主机指标,Alertmanager 实现钉钉和短信通知。
- 通过 Kubekey 部署 Kubernetes 集群,并推动 Kubesphere + DevOps CI/CD 流程,实现 代码拉取、编译、打包、推送、自动部署。
- 维护 MySQL 主从同步架构、RabbitMQ 消息队列、Redis Cluster,优化数据库性能,提升并发处理能力。
- 采用 Spring Cloud + Nacos + Sentinel + SkyWalking 搭建微服务架构,结合 Haproxy + Keepalived 确保 K8s 高可用。
- 负责 B 端 & C 端学校公众号平台 业务(饭卡充值、请假出校、在线报修、人脸识别等),提升系统可用性。
昊阳天宇有限公司—— 运维工程师 #
(2020.XX - 2021.XX)
- 负责 Linux 服务器及 MySQL 数据库 维护,成功恢复多次数据库误操作崩溃问题。
- 负责 B 端文件上传/下载系统 开发与优化,提升数据存储及访问效率。
- 维护 TCL 自动化测试脚本,优化系统升级流程,提高测试效率。