Site Reliability Engineer

Baví tě udržovat moderní webové aplikace v chodu a bránit je dnem i nocí před incidenty? Jsi komunikativní se zájmem o práci v mezinárodním prostředí? Pojď se pobavit o SRE pozici.

Reagovat
Home One Arrow

Neovia je IT společnost zaměřená na vývoj softwarových řešení s důrazem na infrastrukturu a open-source technologie. Na trhu působíme už více než 6 let a máme zkušenosti s doručováním inovativních řešení klientům jako Dr. Max, T-Mobile a Generali.

Náplň práce

Vedení řízení incidentů od jejich zjištění až po vyřešení, zajištění včasné komunikace a minimalizace dopadu na zákazníky. Koordinace spolupráce s pohotovostními týmy (DevOps a R&D) při řešení kritických problémů a poskytování rychlých řešení. Působení jako manažer incidentů během velkých událostí, poskytování aktualizací a zajištění dodržování zavedených protokolů pro řízení incidentů.

Co hledáme

  • Silné porozumění protokolům pro reakci na incidenty, RCA a procesům po incidentu
  • Zkušenosti s nástroji pro monitorování a upozorňování, jako jsou Prometheus, Grafana, Coralogix nebo jejich ekvivalenty
  • Znalost správy cloudů (AWS) a hluboké porozumění praktikám škálování a spolehlivosti
  • Znalost CI/CD pipeline a nástrojů pro automatizaci (např. Jenkins, Terraform, Github Actions)
  • Zkušenosti s prací v pohotovostním režimu a vedením zásahů při incidentech
  • Ochotu pracovat v týmu a být osobně přítomen 3 dny v týdnu v kanceláři na Praze 2
  • Schopnost plynulé komunikace v angličtině

Co můžeme nabídnout

  • 4 000 Kč - 7 000 Kč na MD (dle zkušeností)
Jak se přihlásit?
Zaměstnanci firmy Neovia oslavují nového kolegu

Pošlete nám
e-mail