ALFACONSEIL.CA logo
ALFACONSEIL.CA Verified
Information Technology & Services, IT Consulting

Expert DevOps / SRE – Observabilité

Montréal-ouest, Quebec, CanadaOnsiteContractPosted 2 months ago

Is this role right for you?

Upload your resume and get a skill-by-skill breakdown — see exactly where you match, where you're close, and what to highlight. Not a mystery percentage.

Get a tailored resume highlighting what this role needs.

Role summary

We are seeking an expert DevOps / SRE to guide teams in enhancing their reliability and observability practices. This role blends technical expertise with hands-on coaching, focusing on improving performance, resilience, and SRE maturity while promoting sustainable DevSecOps practices. Responsibilities include coaching teams on SRE and observability adoption, conducting audits, recommending improvements, and fostering collaboration between development, security, and operations. The role involves designing and evolving observability solutions (logs, metrics, traces) with a focus on Datadog, defining business-aligned strategies, implementing SRE indicators, optimizing solutions, and contributing to the observability platform's roadmap and documentation.

Nous recherchons un(e) expert(e) DevOps / SRE pour accompagner les équipes dans l’évolution de leurs pratiques de fiabilité et d’observabilité.

Ce rôle combine expertise technique et coaching terrain. Vous interviendrez directement auprès des équipes pour améliorer la performance, la résilience et la maturité SRE, tout en favorisant l’adoption de pratiques durables en DevSecOps.

Responsabilités

  • Accompagner les équipes applicatives et plateformes dans l’adoption des pratiques SRE et d’observabilité
  • Agir comme coach technique pour développer l’autonomie des équipes
  • Réaliser des audits, recommander des améliorations concrètes et promouvoir l’amélioration continue
  • Favoriser la collaboration entre les équipes de développement, sécurité et opérations
  • Influencer positivement les pratiques et standards organisationnels
  • Concevoir et faire évoluer des solutions d’observabilité (logs, métriques, traces), notamment avec Datadog
  • Définir des stratégies alignées sur les objectifs d’affaires et les enjeux de fiabilité
  • Mettre en place des indicateurs SRE (SLO, SLI, error budgets)
  • Optimiser la performance, la disponibilité et les coûts des solutions
  • Effectuer des revues post-déploiement et assurer la qualité des solutions
  • Contribuer à la stabilité et à l’évolution de la plateforme d’observabilité
  • Participer à la définition de la feuille de route technologique
  • Documenter les pratiques et partager les connaissances
  • Participer au support en rotation (au besoin)

Profil recherché

  • 5 à 10 ans d’expérience en DevOps, SRE, opérations TI ou domaines connexes
  • Expérience concrète en coaching ou accompagnement d’équipes techniques
  • Bonne maîtrise des concepts SRE : SLO, SLI, error budgets, gestion du risque
  • Expérience en amélioration de la fiabilité, haute disponibilité et tolérance aux pannes
  • Capacité à adapter les pratiques selon la maturité des équipes
  • Expérience en gestion d’incidents dans des environnements critiques
  • Maîtrise des post-mortems, analyse de causes racines et plans correctifs
  • Capacité à intervenir efficacement sous pression
  • Bonne compréhension des piliers : logs, métriques, traces
  • Expérience avec une plateforme d’observabilité (Datadog un atout important)
  • Expérience avec les pipelines CI/CD (Azure DevOps ou équivalent)
  • Connaissance des environnements cloud (AWS et/ou Azure)
  • Expérience en automatisation et en pratiques DevSecOps

Compétences clés

  • Excellentes habiletés de communication et vulgarisation
  • Leadership d’influence et posture de coach
  • Capacité à travailler dans des environnements complexes et en transformation
  • Esprit analytique et orienté solutions durables
  • Bilinguisme (français / anglais)
Ready to apply?
You'll be redirected to ALFACONSEIL.CA's application page.