【工作內容】
- 建立與推行 SRE 相關工作流程:SLO 文化專案建立與推行,SRE 傳教士的角色
- 協同 Infra 團隊維護日常服務:例如:定期的服務指標 Review,效能改進重點討論,協同規劃與執行新功能導入
- 服務指標監控與相關工具開發,例如:服務可用度量測,API 響應時間監測,系統健康度評估
- 效能指標監控與相關工具開發,例如:前後端元件效能指標選定,指標異常偵測
- 系統維運自動化,例如:系統異常偵測與災後恢復機制,系統升級與版本控制
【條件要求】
- SRE 相關內容三年以上工作經驗
- 具備雲端 Linux/Docker 微服務系統叢集維運經驗(GCP/AWS/Azure,GCP為佳)
- 具備大型 NoSQL 資料庫維運經驗(如 Elasticsearch, InfluxDB 等)
- 精通 Linux 系統負荷衡量標準與工具
- 熟 Clean Code、Design Pattern
- 熟 Python、Javascript
【加分條件】
- 曾主導或參與 SLI/SLO/SLA 等系統穩定指標之制定與執行
- 具備組織團隊、人力規劃以及策略推動能力
- Github 開源專案參與經驗
【技術挑戰】
thingnario 已經站穩台灣太陽能 AIoT 軟體監控系統的地位,海外市場也正在快速成長中。以目前單日收集電力資料逼近上億筆的情況,對系統穩定著墨較多的仍只有Availability。因此在其他面向如 Reliability, Scalibility, Disaster Recovery, Problem/Incident Management 以及 Performance 上,如何從零開始建立完整的 SLI/SLO/SLA 以及對應的 tool chain,並引領團隊深化對應的mindset,將是身為 SRE 的您最大的技術挑戰。
【技術成長】
- 因應海外市場的成長與系統吞吐量的快速增加,同時管理多個server實例並快速且安全的deploy新版本將是未來可預見的挑戰。同時如何從系統穩定的角度帶動自身與團隊的成長,以回應我們成為世界級軟體公司的渴求,將是我們對您的期待。
- thingnario的研發團隊多數都對各自的技術能力有不小的自我要求,並且保持著互相理性討論的開放文化,以追求彼此的快速成長。我們歡迎對於技術有熱衷的朋友,加入 thingnario 一起學習、成長、變強。
【薪資福利】
- 保障年薪14個月(12個月薪+中秋、端午各半個月、農曆過年1個月,未滿一年依照到職比例計算)
- 年度分紅,2021年度全體員工分紅為 0 ~ 1.5個月之間
- 提供技術股20%給予員工認購(到職半年後會進行評比決定認購數量,數量為 0 ~ 1.3M股之間)
- 特休假:勞基法為基礎,額外加上5天
【薪資範圍】
- 年薪台幣130萬元 ~ 200萬元之間(目前實際上內部員工所屬該職位的年薪薪資範圍)
碩士畢,5y+ 相關經驗,精通 Python、Django,並有擔任協會講師,專注區塊鍊、AI 領域發展。
申請動機:對巨量資料架構、影像處理、AI、架構設計很有興趣
有前測及簡單問卷,了解人格特質,問題蠻細,感覺得出很重視人選是否符合特質,希望回饋內容豐富。測驗題目偏簡單,但不確定是希望測試程式碼品質還是更實際的 use case,有準備即可輕鬆完成。