【工作內容】

  • 建立與推行 SRE 相關工作流程:SLO 文化專案建立與推行,SRE 傳教士的角色
  • 協同 Infra 團隊維護日常服務:例如:定期的服務指標 Review,效能改進重點討論,協同規劃與執行新功能導入
  • 服務指標監控與相關工具開發,例如:服務可用度量測,API 響應時間監測,系統健康度評估
  • 效能指標監控與相關工具開發,例如:前後端元件效能指標選定,指標異常偵測
  • 系統維運自動化,例如:系統異常偵測與災後恢復機制,系統升級與版本控制

【條件要求】

  • SRE 相關內容三年以上工作經驗
  • 具備雲端 Linux/Docker 微服務系統叢集維運經驗(GCP/AWS/Azure,GCP為佳)
  • 具備大型 NoSQL 資料庫維運經驗(如 Elasticsearch, InfluxDB 等)
  • 精通 Linux 系統負荷衡量標準與工具
  • 熟 Clean Code、Design Pattern
  • 熟 Python、Javascript

【加分條件】

  • 曾主導或參與 SLI/SLO/SLA 等系統穩定指標之制定與執行
  • 具備組織團隊、人力規劃以及策略推動能力
  • Github 開源專案參與經驗

【技術挑戰】

thingnario 已經站穩台灣太陽能 AIoT 軟體監控系統的地位,海外市場也正在快速成長中。以目前單日收集電力資料逼近上億筆的情況,對系統穩定著墨較多的仍只有Availability。因此在其他面向如 Reliability, Scalibility, Disaster Recovery, Problem/Incident Management 以及 Performance 上,如何從零開始建立完整的 SLI/SLO/SLA 以及對應的 tool chain,並引領團隊深化對應的mindset,將是身為 SRE 的您最大的技術挑戰。

【技術成長】

  • 因應海外市場的成長與系統吞吐量的快速增加,同時管理多個server實例並快速且安全的deploy新版本將是未來可預見的挑戰。同時如何從系統穩定的角度帶動自身與團隊的成長,以回應我們成為世界級軟體公司的渴求,將是我們對您的期待。
  • thingnario的研發團隊多數都對各自的技術能力有不小的自我要求,並且保持著互相理性討論的開放文化,以追求彼此的快速成長。我們歡迎對於技術有熱衷的朋友,加入 thingnario 一起學習、成長、變強。

【薪資福利】

  • 保障年薪14個月(12個月薪+中秋、端午各半個月、農曆過年1個月,未滿一年依照到職比例計算)
  • 年度分紅,2021年度全體員工分紅為 0 ~ 1.5個月之間
  • 提供技術股20%給予員工認購(到職半年後會進行評比決定認購數量,數量為 0 ~ 1.3M股之間)
  • 特休假:勞基法為基礎,額外加上5天

【薪資範圍】

  • 年薪台幣130萬元 ~ 200萬元之間(目前實際上內部員工所屬該職位的年薪薪資範圍)

技能標籤: clean code, design pattern, docker, javascript, linux, NoSQL, python, SRE

您正瀏覽的職缺:Senior Site Reliability Engineer    有 1 則面試心得
更多內容請前往 企業面試心得

  1. 負責顧問
    Reply
    以下內容由 JECHO 顧問群向人選取得面試回饋,或由人選主動提供,請勿任意轉載。

    碩士畢,5y+ 相關經驗,精通 Python、Django,並有擔任協會講師,專注區塊鍊、AI 領域發展。
    申請動機:對巨量資料架構、影像處理、AI、架構設計很有興趣

    有前測及簡單問卷,了解人格特質,問題蠻細,感覺得出很重視人選是否符合特質,希望回饋內容豐富。測驗題目偏簡單,但不確定是希望測試程式碼品質還是更實際的 use case,有準備即可輕鬆完成。

留下您的回應或面試心得

*