Logo do curso
Curso

Confiabilidade e SRE:

métricas, Error Budget e resiliência

Quero estudar na alura

10h

Para conclusão

12

Pessoas nesse curso

Certificado

De participação

Introdução_

O que você aprenderá_

  • Defina SLIs, SLOs e políticas de Error Budget para balancear inovação e estabilidade.
  • Avalie a confiabilidade de serviços usando métricas que correlacionam experiência do usuário e impacto de negócio.
  • Projete e priorize estratégias de resiliência, incluindo rollback e testes de engenharia do caos.
  • Implemente práticas combinadas de SRE, DevOps e Platform Engineering para reduzir trabalho manual e eliminar silos.
  • Conduza post-mortems blameless e transforme incidentes em ações de melhoria contínua.
  • Desenvolva automações e ferramentas de plataforma que aumentem observabilidade e autonomia das equipes.

Público alvo_

Este curso é indicado para engenheiros de confiabilidade, profissionais de DevOps, engenheiros de plataforma, líderes técnicos e demais profissionais de TI que desejam aprofundar práticas de observabilidade, automação e governança da confiabilidade em serviços escaláveis.

Lara Xavier

Lara Xavier

github

linkedin

Especialista em Observabilidade, DevOps Sênior, e primeira mulher embaixadora da Grafana Labs no Brasil. Atuando com tecnologia em âmbito público e privado há 10 anos, nas horas vagas é pesquisadora de Tecnologias Assistivas, atleta de crossfit e mãe do Tomcat.

Curso atualizado em 27/03/2026

Ementa

  1. Introdução ao SRE e Seus Fundamentos

    • Origem e Evolução do SRE
    • SRE vs DevOps vs Engenharia de Plataforma
    • 1. Atividade Única Escolha
    • 2. Atividade Única Escolha
    • 3. Atividade Única Escolha
    • 4. Atividade Única Escolha
    • 5. Atividade Única Escolha
    • O que aprendemos?
  2. Cultura e Decisões Baseadas em Dados

    • Cultura Blameless
    • Tomada de Decisão Orientada a Dados
    • 1. Atividade Única Escolha
    • 2. Atividade Única Escolha
    • 3. Atividade Única Escolha
    • 4. Atividade Única Escolha
    • 5. Atividade Única Escolha
    • O que aprendemos?
  3. Resiliencia e Indicadores de Servico

    • SLI - Service Level Indicator
    • Resiliencia Organizacional e Postmortems
  4. Objetivos e Acordos de Confiabilidade

    • SLA - Service Level Agreement
    • SLO - Service Level Objective
  5. Error Budget e Automação

    • Error Budget
    • Automação Como Pilar de Confiabilidade

Descubra se esse curso é pra você! Leia as primeiras aulas

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos
Escola

DevOps

Conheça o movimento que preza pela automação e monitoramento das construções de softwares. Explore a Internet das Coisas, desenvolva infraestruturas completas e crie um pipeline de construção de software. Tudo isso com a ajuda de ferramentas poderosas, como o Terraform e o Kubernetes.

Conheça a escola

Faça parte da nossa comunidade no discord!

Troque conhecimentos com a comunidade da Alura

Aprenda SRE com esse e outros cursos, comece agora!

Conheça os Planos para Empresas