【工作內容】

  • 建立與推行 SRE 相關工作流程:SLO 文化專案建立與推行,SRE 傳教士的角色
  • 協同 Infra 團隊維護日常服務:例如:定期的服務指標 Review,效能改進重點討論,協同規劃與執行新功能導入
  • 服務指標監控與相關工具開發,例如:服務可用度量測,API 響應時間監測,系統健康度評估
  • 效能指標監控與相關工具開發,例如:前後端元件效能指標選定,指標異常偵測
  • 系統維運自動化,例如:系統異常偵測與災後恢復機制,系統升級與版本控制

【條件要求】

  • SRE 相關內容三年以上工作經驗
  • 具備雲端 Linux/Docker 微服務系統叢集維運經驗(GCP/AWS/Azure,GCP為佳)
  • 具備大型 NoSQL 資料庫維運經驗(如 Elasticsearch, InfluxDB 等)
  • 精通 Linux 系統負荷衡量標準與工具
  • 熟 Clean Code、Design Pattern
  • 熟 Python、Javascript

【加分條件】

  • 曾主導或參與 SLI/SLO/SLA 等系統穩定指標之制定與執行
  • 具備組織團隊、人力規劃以及策略推動能力
  • Github 開源專案參與經驗

【技術挑戰】

thingnario 已經站穩台灣太陽能 AIoT 軟體監控系統的地位,海外市場也正在快速成長中。以目前單日收集電力資料逼近上億筆的情況,對系統穩定著墨較多的仍只有Availability。因此在其他面向如 Reliability, Scalibility, Disaster Recovery, Problem/Incident Management 以及 Performance 上,如何從零開始建立完整的 SLI/SLO/SLA 以及對應的 tool chain,並引領團隊深化對應的mindset,將是身為 SRE 的您最大的技術挑戰。

【技術成長】

  • 因應海外市場的成長與系統吞吐量的快速增加,同時管理多個server實例並快速且安全的deploy新版本將是未來可預見的挑戰。同時如何從系統穩定的角度帶動自身與團隊的成長,以回應我們成為世界級軟體公司的渴求,將是我們對您的期待。
  • thingnario的研發團隊多數都對各自的技術能力有不小的自我要求,並且保持著互相理性討論的開放文化,以追求彼此的快速成長。我們歡迎對於技術有熱衷的朋友,加入 thingnario 一起學習、成長、變強。

【薪資福利】

  • 保障年薪14個月(12個月薪+中秋、端午各半個月、農曆過年1個月,未滿一年依照到職比例計算)
  • 年度分紅,2021年度全體員工分紅為 0 ~ 1.5個月之間
  • 提供技術股20%給予員工認購(到職半年後會進行評比決定認購數量,數量為 0 ~ 1.3M股之間)
  • 特休假:勞基法為基礎,額外加上5天

【薪資範圍】

  • 年薪台幣130萬元 ~ 200萬元之間(目前實際上內部員工所屬該職位的年薪薪資範圍)

Tagged as: clean code, design pattern, docker, javascript, linux, NoSQL, python, SRE

One interview review on this position: Senior Site Reliability Engineer
Please go Interview Reviews page for furthur reviews.

  1. Consultant in charge
    Reply
    The interview reviews are provided by JECHO candidates, any unauthorized reproduction is prohibited.

    碩士畢,5y+ 相關經驗,精通 Python、Django,並有擔任協會講師,專注區塊鍊、AI 領域發展。
    申請動機:對巨量資料架構、影像處理、AI、架構設計很有興趣

    有前測及簡單問卷,了解人格特質,問題蠻細,感覺得出很重視人選是否符合特質,希望回饋內容豐富。測驗題目偏簡單,但不確定是希望測試程式碼品質還是更實際的 use case,有準備即可輕鬆完成。

Leave a Reply or a Review

*