Descripción del puesto

📢 ¡Buscamos Site Reliability Engineer (SRE)!

💻 Modalidad: Remoto con la posibilidad de requerir asistencia ocasional a la oficina para reuniones de equipo o instancias de coordinación específicas

📍Contamos con unas hermosas y cómodas oficinas en Almagro - CABA como espacio de coworking al que se puede asistir junto con el equipo si gustan de ello. Muchas veces sus integrantes se autoconvocan para compartir jornadas laborales o reuniones recreativas 🤜🤛

🕘 Full time, de 9hs a 18hs.

🎯 ¿Cuál será tu propósito principal?

Garantizar la confiabilidad, disponibilidad, escalabilidad y eficiencia de los sistemas en producción, combinando prácticas de ingeniería de software y operaciones. El objetivo es automatizar al máximo los procesos para que los servicios sean predecibles, medibles y resilientes.

👩‍💻 ¿Cuáles serán tus responsabilidades?

  • Diseñar y mantener la estrategia de monitoreo y observabilidad de la infraestructura y aplicaciones.
  • Construir y mantener dashboards de visibilidad para distintos equipos (Dev, Ops, Management).
  • Gestionar incidentes y participar de guardias rotativas 24x7
  • Colaborar en el diseño y mejora de pipelines de CI/CD garantizando confiabilidad, seguridad y eficiencia en los despliegues.
  • Garantizar que los backups y planes de DR sean medibles, probados, automatizados y realmente confiables
  • Asegurar que la plataforma sea rápida, eficiente y pueda crecer sin perder estabilidad ni confiabilidad.
  • Definir con management y gestionar SLOs/SLIs y error budgets
  • Gestionar la documentación, estandarización de operaciones.


Requisitos

🔍 ¿Qué esperamos de vos?

  • Contar con al menos 3 años de experiencia en roles de SRE o posiciones afines.
  • Conocimientos en:

Excluyentes:

  • - Experiencia sólida en Kubernetes (deployment, scaling, HPA/VPA, troubleshooting).
  • - Dominio de al menos un cloud provider (AWS, GCP o Azure).
  • - Observabilidad y monitoreo: Loki, Grafana, Tempo, Mimir, Prometheus, OpenTelemetry, Datadog.
  • - CI/CD pipelines: GitHub Actions, GitLab CI, Jenkins, ArgoCD, Azure DevOps u otros.

Deseables:

  • - Infraestructura como Código (IaC): Terraform, Helm, Kustomize.
  • - Scripting y automatización: Go o Python
  • - Conocimientos en redes, seguridad, balanceo de carga y gestión de bases de datos (SQL/NoSQL).

🕵️‍♀️ Nos orientamos a personas con suma orientación al detalle y con capacidad de análisis.

💜 Valoramos la curiosidad por investigar y proponer ideas u oportunidades de mejora.


Beneficios

Ofrecemos los siguientes beneficios:

✔️ Prepaga médica de excelente nivel 🩺
✔️ 20 días de estudio anuales 📚
✔️ Convenio Gympass 🏋️‍♀️
✔️ Día off de cumpleaños 🎂
✔️ Programa de referidos 👥

✔️ Sorteos durante el año 🎁


a través de Hiring Room