TGTGInsighttelegram intelligenceLIVE / telegram public index
← 集英社(海外求职招聘)
集英社(海外求职招聘) avatar

TGINSIGHT POST

Post #22

@ji_ys

集英社(海外求职招聘)

Views3,330Post view count
PostedJun 2606/26/2025, 07:38 AM
Post content

Post content

新增 运维工程师 (序列:#运维#SRE ) 工作职责: 1. 云端基础架构监控与管理 • 使用云端监控工具和仪表板监控云端系统和服务的性能、可用性及健康状态。 • 监控云端资源使用情况,确保系统稳定运行并进行必要的优化调整。 2. 事件响应与故障排除 • 及时响应系统异常与警报,分析并解决影响云端应用与基础架构的问题。 • 与内部开发团队、DevOps 及云端供应商(AWS, GCP, Azure)协作,排查并修复技术问题。 3. 自动化与基础架构即代码 • 开发与维护自动化脚本(如 Bash、Python、Node.js),提升系统运行效率与可扩展性。 • 建立并维护 Infrastructure as Code(IaC)流程,确保基础架构的标准化与自动化部署。 4. 与内部团队协作 • 与 DevOps、开发团队密切合作,确保云端基础架构符合应用需求。 • 提供技术培训,帮助内部团队理解并优化云端平台的使用方式。 任职资格: 1. 云端平台与基础架构 • 了解 AWS、GCP 或 Azure 主要云端服务(如 EC2, S3, IAM, VPC, Cloud Functions, Kubernetes, SQL/NoSQL 数据库)。 • 了解云端网络架构(如 VPC、子网、负载均衡、DNS、CDN)。 2. 技术支持与 API 集成 • 了解 API 测试工具(如 Postman)并能协助客户进行 API 调试与错误排查。 • 具备与客户技术团队合作、解决技术问题的能力。 3. 自动化与 DevOps 技能 • 熟悉基础架构即代码(IaC)工具,如 Terraform、CloudFormation、Ansible。 • 具备 CI/CD 工具(如 GitHub Actions、GitLab CI、Jenkins)的经验。 • 熟悉 Shell Script、Python 或其他脚本语言以进行系统自动化。 4. 事件管理与故障排除 • 熟悉监控与日志分析工具(如 Prometheus、Grafana、Datadog、ELK Stack)。 • 具备服务器、网络、应用系统的故障排除能力,能快速分析与解决问题。 • 具备撰写 SOP 与 Incident Report 的经验。 5. 沟通与文档撰写能力 • 良好的技术沟通能力,能够与内部团队、客户及云端服务供应商协作。 • 具备技术文档撰写经验,能够编写操作手册、API 文档、技术支持 FAQ。 工作地点:海外远程(非中国/越南)