A Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que processa milhões de requisições diárias. Se está em busca deste desafio, vem ser Getraker!
Senior Site Reliability Engineer (SRE)
GETRAK | Analista Sênior | Remoto
Vaga publicada em 11/12/2025
Principais responsabilidades
Definir, implementar e monitorar SLIs/SLOs de disponibilidade, latência e confiabilidade.
Projetar e otimizar pipelines de CI/CD para microsserviços em ambiente de alta disponibilidade.
Administrar e evoluir infraestruturas em AWS (EC2, ECS/EKS, S3, RDS, CloudFront, VPC, IAM, CloudWatch etc.).
Gerenciar bancos distribuídos e sistemas críticos: Astra DB / Cassandra (DataStax), Redis e RabbitMQ.
Automatizar provisionamento, configuração e escalabilidade com Terraform, Ansible ou similares.
Desenvolver e manter práticas de observabilidade (métricas, logs, tracing) usando DataDog e ferramentas correlatas.
Liderar investigações em incidentes críticos, propondo soluções definitivas (blameless postmortems).
Atuar em otimização de custos em nuvem, equilibrando confiabilidade e budget.
Garantir a segurança e conformidade da infraestrutura, com políticas de acesso, backup e auditoria contínua.
Colaborar com times de engenharia e produto, trazendo visão de confiabilidade para o ciclo de desenvolvimento.
Requisitos técnicos
6+ anos de experiência em SRE/DevOps em ambientes de alta escala e missão crítica.
Domínio de AWS e arquitetura cloud-native.
Conhecimento avançado em Cassandra (Astra DB / DataStax), Redis e RabbitMQ.
Experiência com microsserviços e conteinerização (Docker, Kubernetes, ECS/EKS).
Forte experiência em automação (Terraform, Ansible, etc.).
Vivência com observabilidade e DataDog (métricas, logs e tracing).
Sólido entendimento de redes, segurança e protocolos.
Experiência com incident response e resolução de problemas complexos.
Atuação em ambientes ágeis, com cultura DevOps/SRE.
Inglês avançado para interação com parceiros internacionais;
Diferenciais
• Experiência em ambientes SaaS B2B de grande volume de dados.
• Certificações relevantes (AWS, Kubernetes, DevOps, SRE).
• Conhecimento especializado em GitHub Actions.
• Experiência com arquiteturas serverless (AWS Lambda) e event-driven.
• Histórico em migração e otimização de bancos distribuídos e infraestrutura em nuvem.
Perfil comportamental
Proatividade;
Facilidade em se comunicar;
Ser uma pessoa que trabalhe em equipe, com comprometimento e responsabilidade.
Digite o seu e-mail para gerar um link de indicação