
Especialista de SRE nada mais é que um desenvolvedor de software com experiência e conhecimento em operações de TI. Engenharia de Confiabilidade do Site (SRE) é um termo que surgiu com o Google, nos idos de 2003. De lá para cá, evoluiu bastante, assim como a web que conhecemos hoje. Sua definição descreve, basicamente, de “tratar operações (Ops) como se fosse um problema de software”. Em outras palavras, o principal objetivo da SRE é desenvolver sistemas de software e soluções automatizadas visando seus aspectos operacionais.
E, para que isso aconteça, é necessário seguir um conjunto de práticas que incorporem aspectos da engenharia de software nas operações, com foco na eficiência e principalmente na confiabilidade dos sistemas desenvolvidos, sejam eles quais forem.
Neste post, vamos aprofundar quais as atribuições e responsabilidades que tornam esse profissional cada vez mais requisitado pelas organizações atualmente.
Principais responsabilidades de um especialista SRE
Antes de listarmos as responsabilidades propriamente ditas, é relevante destacarmos as habilidades técnicas de um especialista SRE. Esse é um profissional que precisa ter conhecimento não apenas das principais ferramentas de automação, como também das linguagens de programação mais comuns, como JavaScript, Python, Ruby e PHP. E claro, também precisará ter experiência nos principais provedores de nuvem, como AWS e Google Cloud.
O dia a dia de um especialista SRE
Além de criar ferramentas de automação para gerenciar operações de TI, o especialista SRE precisa ter um pensamento focado em integração e entrega contínuas (CI/CD), monitoramento e gestão de alertas e incidentes.
Os SREs são profissionais responsáveis por garantir que a infraestrutura e os sistemas que dela dependem estejam funcionando conforme o esperado – daí o termo “confiabilidade do sistema”. Eles também monitoram aplicações e serviços críticos 24/7/365 para garantir sua disponibilidade e minimizar eventuais problemas de inatividade que sempre acabam acontecendo, em maior ou menor escala.
Outra tarefa atribuída a um SRE é a documentação da resolução de incidentes, conhecidos como “postmortems”. Essa é uma prática comum de segurança cibernética e que geralmente fica sob a responsabilidade desse profissional: consiste em documentar a causa raiz de um incidente a fim de evitar que aconteça novamente. Ou, como explica detalhadamente o Google em seus livros sobre SRE, a aprender como proceder corretamente em caso de incidentes futuros.
A importância estratégica de um especialista SRE é tanta, que esse profissional também precisa assumir responsabilidades de plantão, em função de alertas que precisam ser resolvidos em tempo real. Isso significa que a função SRE tem uma relação direta sobre como as equipes de desenvolvimento e infraestrutura podem melhorar a confiabilidade de um sistema através da otimização de processos de plantão.
Conclusão
Como você pode imaginar, os SREs trabalham em colaboração com diferentes equipes, principalmente de operações e desenvolvimento. Habilidades de comunicação e um mindset analítico são fundamentais para que essa colaboração flua naturalmente. E, ao construir sistemas confiáveis e fornecer suporte a essas equipes, a ideia é que mais tempo possa ser dedicado à criação e lançamento de novos recursos para os clientes.
O DevOps Institute apontou, em seu relatório anual de desempenho na área de desenvolvimento de software, que a adoção global de práticas SRE deve ultrapassar os 44% em 2022. Então se você pensa em seguir uma carreira como SRE, já sabe que o mercado está bastante aquecido e com excelentes perspectivas para o futuro.

