立足於運維團隊,面向產品研發部門做重要的技術溝通與協作。
本團隊偏向infra面,關注重點含Kubernetes及運維相關開源工具。近期方向在強化infra維護性、安全性與監控機制上,過程中會視需要自行編寫程式,但更多時間在於操作運維相關工具、跨部門溝通協作與troubleshooting。
工作項目
- 根據近期與中期需求,評估與引進開放原始碼工具,甚至自行設計適當的自動化工具
- 研究推廣分散式系統性能與可靠度最佳化相關技術以及最佳實踐,例:Microservice architecture, Service Mesh, eBPF, Secret management, Kubernetes multi-cluster management, gRPC, L7 load balance, GraphQL, Stream processing
- 我們正處於將傳統「單體服務 + VM」 架構轉移至「微服務 + Kubernetes」架構的歷程中。需與產品研發團隊與產品營運團隊密切合作,解決痛點,改善流程,為短期與中期商業價值帶來貢獻
- 與產品開發及運維團隊協作,持續強化整體系統安全性,例:Software supply chain, Container image / network / Kubernetes runtime security
- 持續強化各產品團隊已普遍使用的CI/CD與GitOps機制
- 跨產品、跨部門協調,在不明確的需求中,研擬具體可行的方案
職位需求
- 具基本的Web API實作經驗與微服務概念
- 掌握至少一種主流程式語言,例:Go, Python, Rust, C, C#, Java, JavaScript, PHP, Ruby
- 瞭解容器化技術,例:Docker, Podman
- 瞭解容器管理編排工具,例:Kubernetes
- 有建置監控與日誌系統經驗,並主動發現及排除問題,例:Elastic Stack, Prometheus, Grafana, APM, Distributed tracing。
- 有建置CI/CD pipeline或GitOps經驗,例:GitLab CI/CD, Jenkins, Argo CD
- 有經驗以Infrastructure as Code建置與維護基礎設施
- 有跨產品、跨部門協調的經驗,在不明確的需求中,研擬具體可行的方案
加分條件
- 有經驗設計負載測試,找出可能的弱點,並尋求改進之道
- 熱於總結知識與經驗,分享與傳承
- 有經驗於最佳化、調校分散式儲存系統,例:Ceph, Longhorn
- 有經驗於最佳化、調校event streaming / message queue相關工具,例:Kafka