Job description
Buscamos um(a) DevOps / Site Reliability Engineer (SRE) para atuar em projetos de alta complexidade, com papel estratégico na garantia de disponibilidade, performance, segurança e escalabilidade de plataformas críticas.
Essa pessoa será responsável por evoluir a confiabilidade dos sistemas, atuando de forma próxima a engenharia de software, dados, arquitetura e produto, em ambientes cloud, distribuídos e orientados a métricas.
O contexto envolve sistemas de missão crítica, alta volumetria de acessos e dados, integrações complexas, necessidade de observabilidade avançada e automação contínua de infraestrutura e operações.
Main responsibilities
- Atuar como DevOps / SRE, sendo referência técnica em confiabilidade e operação
- Projetar, implementar e evoluir infraestrutura escalável, resiliente e segura
- Garantir alta disponibilidade, performance e tolerância a falhas dos sistemas
- Definir e implementar práticas de observabilidade (logs, métricas, traces, alertas e SLOs)
- Atuar em incident management, troubleshooting e análise de causa raiz (RCA)
- Automatizar processos de provisionamento, deploy e operação (Infrastructure as Code)
- Evoluir pipelines de CI/CD, garantindo qualidade, segurança e rastreabilidade
- Trabalhar com arquiteturas cloud-native, microserviços e sistemas orientados a eventos
- Apoiar decisões de arquitetura com foco em confiabilidade, custo e escalabilidade
- Promover cultura de confiabilidade, automação e melhoria contínua
Requirements and skills
- Experiência sólida como DevOps Engineer, SRE ou posição equivalente
- Forte conhecimento em cloud computing (AWS, Azure ou GCP)
- Experiência com containers e orquestração (Docker, Kubernetes)
- Vivência com Infraestrutura como Código (Terraform, Bicep, CloudFormation ou similares)
- Experiência com CI/CD (GitHub Actions, GitLab CI, Azure DevOps, Jenkins, etc.)
- Conhecimento em observabilidade e monitoramento (Prometheus, Grafana, Datadog, New Relic, ELK, OpenTelemetry)
- Experiência com redes, segurança básica e automação
- Capacidade de atuar em ambientes críticos e de alta complexidade
- Perfil analítico, colaborativo e orientado à resolução de problemasExperiência prática com SRE (SLIs, SLOs, Error Budget)
- Vivência com arquiteturas de alta escala e missão crítica
- Experiência com plataformas de dados e workloads intensivos
- Conhecimento em FinOps e otimização de custos em cloud
- Atuação em ambientes regulados ou enterprise
Additional information
- Atuação em projetos estratégicos e tecnicamente desafiadores
- Forte integração com engenharia, dados e produto
- Autonomia técnica para decisões de alto impacto
- Ambiente colaborativo e orientado a excelência operacional
- Modelo de trabalho e benefícios compatíveis com o mercado