Analista Infraestrutura Júnior SRE (DPRO.SRE - Magalu Cloud) at Magalu Cloud

Remote - BR

Apply
More jobs at Magalu Cloud

A Magalu Cloud é a plataforma de computação em nuvem criada pela maior e mais inovadora empresa de varejo do Brasil, a Magazine Luiza. Fundada em 2020, nossa missão é clara: impulsionar a competitividade do Brasil por meio da tecnologia. Oferecemos serviços de nuvem com soluções desenvolvidas localmente, uma interface simples, preços líderes de mercado em reais brasileiros e suporte em português, tornando a nuvem mais acessível para todos. Nosso objetivo é construir um vasto ecossistema de iniciativas que capacitem as equipes de tecnologia com as bases necessárias para desenvolver software robusto e eficiente. Junte-se à comunidade que está transformando o Brasil com a nuvem mais robusta da América Latina. Estamos buscando um(a) Analista de Infraestrutura Júnior (SRE) que será responsável por auxiliar na implementação, monitoramento e garantia da disponibilidade e performance dos produtos, além de fornecer suporte às equipes de desenvolvimento, contribuindo para a eficiência e confiabilidade.

Requisitos

Experiência

  • Experiência na tratativa de incidentes, incluindo análise inicial, resposta a alertas, apoio à investigação de causa raiz e implementação de ações corretivas.

Habilidades

  • Noções de ferramentas de observabilidade, como Prometheus, Grafana e OpenSearch.
  • Familiaridade com scripts em Python e Bash para automação de tarefas operacionais.
  • Conhecimento em administração e uso de sistemas baseados em Linux.
  • Experiência na tratativa de incidentes.
  • Conhecimento em nuvens públicas (AWS, Azure ou Google Cloud).

Responsabilidades

  • Apoiar a gestão de incidentes, contribuindo com a análise de causa raiz e na implementação de ações preventivas.
  • Colaborar no desenvolvimento e automação da infraestrutura por meio de ferramentas como Ansible e Terraform.
  • Participar de iniciativas voltadas para aprimorar a eficiência, resiliência e performance do ambiente.
  • Apoiar na criação e manutenção de runbooks e playbooks para resposta a incidentes e operações rotineiras.
  • Contribuir para a evolução de práticas de observabilidade, incluindo melhorias em monitoramento, logging e tracing distribuído.

Tecnologias

AnsibleTerraformPrometheusGrafanaOpenSearchPythonBashLinuxAWSAzureGoogle Cloud

See if your resume is ready for this job

See how our AI can optimize your resume and improve your chances for this role.