在Higgs,服務可靠性工程師 (Service Reliability Engineer)有別於網站可靠性工程師 (Site Reliability Engineer),負責系統服務的可靠性、可擴展性和安全性,同時專注系統服務的延遲、效能與承載量,並以高可用及分散式系統自動化維運基礎設施。
工作內容
- 建置與維運混合雲架構服務
- 視覺化業務系統 / 管理系統的負載狀態、部屬狀態、服務健康…等狀態
- 協助CI/CD流程自動化與CI/CD系統維運
- 定期的報告與事件紀錄
- 解決方案研究與推廣
- RD團隊的技術支援
條件要求
- 具 DevOps/SRE工作 2 年以上相關經驗
- Kurbunetes / Docker安裝、設定、管理及維護等
- AWS 實務經驗 – 瞭解雲服務的本質及他對應的地端服務,有混和雲建構經驗
- Ansible(AWX) / Terraform自動化組態部署與操作經驗
- 具備建置與維運CI/CD ( Gitlab / Jenkins )流程經驗
優先考慮
- 取得任一AWS Certification
- 熟悉AWS EKS / S3 / OpenSearch / ElastiCache / ECR / NLB / ALB / CloudWatch / CloudFront
- 熟悉Kafka/ Elasticsearch 安裝/設定與效能調校