Loading...
正在寻找新机会

Rich Zhu

技术总监 / 运维总监 / 资深架构

AI+智能运维体系 · 亿级流量实战专家 · 安全/稳定/成本 三维精控

0年+
行业经验
0台+
服务器规模
0万+UV
日请求量
0→1
架构从零搭建经验
R

个人信息

运维架构专家 · 技术管理者

安全架构 AI驱动 自动化 成本管控
北京航空航天大学 · 计算机科学与技术 · 工学 学士学位
1991年11月 · 男 · 汉族
英语可日常工作交流
新加坡 / 日本 / 香港 / 国内远程

核心优势

深耕运维领域14年,融合技术与管理,打造稳定、高效、安全的技术体系

AIOps智能运维

基于AmazonQ 开发企业AI平台,实现业务数据观测、故障分析、性能诊断。结合Thanos+AI建立数据模型,实现异常预测与秒级告警,推动运维从被动响应走向智能预防。

自研自动化平台

自主研发高效CI/CD系统,取代Jenkins等工具。集成数据分析、权限管理、缓存加速等功能,经受多次安全渗透测试验证。

安全架构专家

从架构设计源头防漏洞,建立可视化安全监控。成功应对公司资金安全、员工恶意操作等高危事件,守护企业核心资产。

大规模实战经验

新浪、阿里(哈啰)背景,5000+台服务器运维经验,支撑日请求4000万UV的高并发业务。深刻理解大型企业架构与业务。

成本精准管控

数据化监控多业务成本支出,合理评估人员扩张与技术投入。以灵活、可扩展、安全、稳定为导向,大幅降低IT成本。

一体化运维平台

设计开发统一运维平台,实现多云与自建机房管理。集成资产管理、监控、域名、工单、SSO等多个子系统。

业务架构实战

具备业务架构设计和开发能力,主导高并发IM系统架构设计,稳定支撑全公司消息体系及第三方消息交互。

技术产品化思维

从用户需求出发,结合技术可行性,推动多款高效产品落地。将复杂技术需求转化为简洁易用的解决方案。

多团队协作管理

丰富的跨工种、跨岗位团队管理经验。高效协调团队成员沟通合作,提升整体效率,成功交付多个重要项目。

工作经历

从一线运维到技术总监,持续积累大规模系统运维与团队管理经验

开云/亚博 技术中心
资深高级架构师
2023.11 — 至今
  • 跨部门协同:统筹运维、域名、业务、安全、运维开发等多组协作,推动需求工具化、工具平台化
  • 平台研发:主导自研CMDB、域名管理系统(150万+域名)、CDN系统、SSO统一平台、审批系统等核心基础设施
  • 智能监控:设计开发边缘节点拨测系统,实时检测域名可用性,实时检测域名无法访问问题,第一时间排查域名被墙,业务故障等问题,保障业务连续性
  • 自研打包/发布系统:自研打包发布系统,整合替代Jenkins/Ansible/ArgoCD等工具,集成审计与权限管理,大幅降低维护成本
  • AIOps落地:基于Amazon Q构建企业AI平台,实现业务数据观测、故障分析、性能诊断;部署Thanos+AI实现多集群监控与异常预测
  • 代码安全审计:部署SonarQube/Strix安全扫描工具,对项目代码进行漏洞检测、风险代码识别,保障代码质量与安全合规
  • 内部风控体系:研发操作日志分析系统,结合AI Agent实时分析所有服务器的异常操作日志,和所有内部系统的操作日志,监控内部员工操作行为,精准识别异常与恶意操作,有效防范内部安全风险
AIOps 平台研发 150万+域名 CI/CD重构 安全审计
VimWorld (美企远程)
运维经理 (Chief SA Officer)
2021.9 — 2023.11
  • 战略规划:主导制定运维SOP及技术基础架构标准,负责中间件选型与验收
  • 智能运维:推动AIOps项目立项,搭建大数据平台,将AI对抗测试接入生产业务
  • 团队管理:负责招聘、绩效、月度考核及人才培养,实现团队成员扬长避短
  • 沟通协同:作为技术战略接口人,确保部门目标与CTO及集团战略高度一致
AIOps 大数据平台 SOP制定 团队管理
哈啰出行
SRE 工程师 P7
2019.8 — 2021.9
  • 规模化运维:负责5000+台服务器运维,支撑日请求4000W次的高并发业务
  • 自动化/DevOps:主导自动化平台开发,完善CI/CD流程,显著提升自动化覆盖率
  • 成本控制:基于数据指标执行精准扩容/缩容,有效控制公司IT成本
  • K8S与云原生:维护300+节点K8S集群,结合CEPH存储,对接自动化需求
5000+服务器 K8S IT成本控制 CI/CD
日日煮
运维经理
2016.8 — 2019.8
  • 负责DevOps平台基础组件构建,推进自动化运维平台开发 (Golang/Vue)
  • 负责业务安全评估与加固,保障业务7x24小时稳定运行
  • 推动程序架构优化与容器化落地,实施CI/CD降低运维成本
  • 响应生产环境监控预警,快速定位分析解决故障及突发情况
Golang Vue 容器化 安全加固
GoldenTek Inc.
业务运维工程师组长
2014 — 2016.7
  • 开发自动化运维平台 (Python + Element UI),实现发版、回滚、重启等管控功能
  • 部署细颗粒度监控系统,负责异常流量与网络攻击处理
  • 负责组员KPI考核、任务分配及技术培训,组织技术会议
Python Ansible 监控系统
新浪 Show
业务运维工程师
2011.4 — 2014
  • 负责华东华北5大机房日常巡检与服务器维护
  • 负责直播业务的高并发流量应对与故障处理
  • 编写Shell/Python脚本实现细颗粒度监控告警
  • 推进虚拟化技术并交付业务使用
直播运维 Shell 虚拟化