Estamos em busca de um(a) profissional para integrar nosso time como SRE , com expertise em soluções de observabilidade utilizando Datadog. Se você é apaixonado(a) por automação, monitoramento de sistemas e melhoria contínua, essa oportunidade é para você!
Principais Responsabilidades:
Implementar e gerenciar soluções de observabilidade com Datadog.
Criar e manter dashboards, alertas e métricas relevantes.
Desenvolver e implementar SLOs (Service Level Objectives).
Participar ativamente na resolução de incidentes.
Automatizar processos de infraestrutura e monitoramento.
Colaborar com times de desenvolvimento para melhorar a instrumentação das aplicações.
Requisitos Técnicos Essenciais:
3+ anos de experiência como SRE ou DevOps.
Experiência sólida com Datadog e suas principais funcionalidades:
APM (Application Performance Monitoring)
Log Management
Infrastructure Monitoring
Synthetic Monitoring
Conhecimento em práticas de observabilidade (métricas, logs, traces).
Experiência com Linux e containers (Docker).
Conhecimento em ferramentas de IaC (Infrastructure as Code).
Proficiência em pelo menos uma linguagem de programação (Python, Go ou similar).
Diferenciais:
Certificações relacionadas ao Datadog.
Experiência com Kubernetes.
Conhecimento em outras ferramentas de observabilidade.
Experiência com cloud pública (AWS, GCP ou Azure).
Habilidades Comportamentais:
Excelente capacidade de resolução de problemas.
Boa comunicação para interagir com diferentes times.