ALTEN Canada logo
ALTEN Canada Verified
IT Consulting, Engineering Services, Technology Consulting

Spécialiste SRE / Observabilité (Datadog)

Montreal, Quebec, CanadaOnsiteFull TimePosted 2 months ago

Is this role right for you?

Upload your resume and get a skill-by-skill breakdown — see exactly where you match, where you're close, and what to highlight. Not a mystery percentage.

Get a tailored resume highlighting what this role needs.

Role summary

ALTEN Canada is seeking a Spécialiste SRE / Observabilité (Datadog) to support a client in the banking sector. This role involves guiding teams in adopting SRE practices, enhancing operational maturity, and designing scalable observability solutions. Responsibilities include coaching teams on observability, driving continuous improvement in monitoring and incident management, promoting DevSecOps, and designing/evolving Datadog-based observability solutions. The specialist will also propose architectural improvements, ensure solution quality, contribute to the technology roadmap, and document practices. The role requires approximately 5-10 years of experience in technical coaching or IT operations/DevOps/SRE, with a strong understanding of SRE principles and practical experience with observability platforms like Datadog.

Qui sommes‑nous ?

Chef de file mondial de l’industrie de l’ingénierie et du conseil TI avec plus de 58 000 conseiller·e·s à travers le monde, le Groupe ALTEN optimise la performance technologique des entreprises depuis plus de 30 ans.

Les personnes qui composent le groupe ALTEN constituent le moteur de notre activité. Chez ALTEN Canada, nous offrons à chaque candidat·e un service entièrement personnalisé. Vous avez la possibilité d’exercer votre métier de façon indépendante ou permanente. Nous sélectionnons les meilleures opportunités répondant à vos aspirations professionnelles. Nous positionnons votre savoir‑faire sur des mandats passionnants à la hauteur de vos ambitions.

ALTEN Canada c’est aussi un centre de solutions, le Montreal Delivery Center (MDC), qui propose des services managés dans les domaines du développement applicatif, de la pratique Données, IA & Analytiques Avancées et de la Cyber Sécurité pour les secteurs bancaires, télécoms et pour l’industrie au sens large.

Nos expert·e·s sont sélectionné·e·s rigoureusement et assurent une proximité ainsi qu’un niveau de services et de compétences incomparable dans la région de Montréal.

Quels profils recrutons‑nous et pour qui ?

Pour soutenir la croissance de notre client dans le secteur bancaire, ALTEN Canada recrute un·e
Spécialiste SRE / Observabilité (Datadog)
dont le rôle sera d’accompagner et transformer les équipes dans l’adoption des pratiques SRE, d’élever le niveau de maturité opérationnelle, et de concevoir des solutions d’observabilité évolutives et fiables.

Quelles seront mes responsabilités ?

  • Accompagner les équipes applicatives et plateformes dans l’adoption des pratiques SRE et d’observabilité, en tenant compte de leur réalité métier et de leur maturité.
  • Agir comme coach technique pour aider les équipes à concevoir, déployer et exploiter leurs propres solutions d’observabilité.
  • Conduire et soutenir l’amélioration continue (monitoring, alerting, SLO, gestion d’incidents).
  • Promouvoir la collaboration entre développement, sécurité et opérations (DevSecOps).
  • Influencer positivement les pratiques afin d’assurer une adhésion durable aux standards de l’organisation.
  • Concevoir et faire évoluer des solutions d’observabilité sur Datadog, alignées sur les besoins métier et les objectifs de fiabilité.
  • Proposer et vulgariser des améliorations architecturales (coûts, performance, disponibilité).
  • Mettre en place des recettes d’observabilité favorisant l’autonomie des équipes.
  • Réaliser des audits post‑déploiement pour assurer la qualité et la conformité des solutions.
  • Participer à l’administration, l’évolution et la qualité de la plateforme Datadog.
  • Contribuer à la feuille de route technologique et aux décisions stratégiques liées à l’observabilité.
  • Documenter les pratiques et connaissances dans Jira et Confluence.
  • Participer au support en rotation (soir/nuit) selon la cédule d’équipe.

Je suis convaincu·e ! Quelles compétences dois‑je avoir pour rejoindre vos équipes ?

Expérience et certifications

  • Environ 5 à 10 ans d’expérience pertinente en accompagnement, coaching ou en vulgarisation technique
  • Environ 5 à 10 ans d’expérience pertinente en opérations TI, DevOps, fiabilité des services, SRE ou domaines connexes.
  • Certifications SRE, DevOps ou Cloud : un atout important.

Maîtrise des concepts SRE

  • Solide compréhension et expérience pratique des principes SRE, notamment :
  • Fiabilité des services et gestion du risque
  • SLO, SLI et error budgets
  • Équilibre entre stabilité et vélocité
  • Automatisation et réduction du travail manuel (toil)
  • Capacité à adapter les pratiques SRE au contexte des équipes, selon leur maturité et leurs contraintes opérationnelles.
  • Expérience dans l’amélioration de la résilience des systèmes : haute disponibilité, tolérance aux pannes et dégradation contrôlée.

Opérations et gestion d’incidents

  • Expérience concrète en gestion d’incidents et d’événements dans des environnements critiques.
  • Compréhension des processus post‑incident :
  • Revues post‑mortem sans blâme
  • Analyse des causes racines
  • Suivi et mise en œuvre d’actions correctives durables
  • Capacité à intervenir efficacement sous pression et à soutenir les équipes lors d’incidents majeurs.

Observabilité au service du SRE

  • Bonne compréhension des piliers de l’observabilité (logs, métriques, traces) et de leur utilisation pour :
  • Mesurer la fiabilité des services
  • Alimenter les SLO et indicateurs opérationnels
  • Améliorer la détection, le diagnostic et la prévention des incidents
  • Expérience avec une plateforme d’observabilité (Datadog) dans un contexte SRE ou DevOps.

DevOps, automatisation et plateformes

  • Expérience en DevOps / DevSecOps, incluant l’automatisation via pipelines (Azure DevOps).
  • Capacité à promouvoir et mettre en place des pratiques favorisant l’autonomie des équipes (libre‑service, standardisation, templates).
  • Connaissances des environnements cloud AWS et/ou Azure (certifications un atout).
  • Connaissances en administration de systèmes, d’applications et de services infonuagiques.

COMPÉTENCES (COMPORTEMENTS, HABILETÉS)

  • Habiletés relationnelles et posture professionnelle
  • Excellentes compétences en communication, accompagnement et vulgarisation technique.
  • Capacité démontrée à agir comme coach et influenceur, sans autorité hiérarchique.
  • À l’aise de travailler avec plusieurs équipes en parallèle dans des contextes de transformation.
  • Souci aigu du service à la clientèle;
  • Esprit analytique orienté vers la résolution durable de problèmes

Pourquoi se joindre à nos équipes ?

Rejoindre ALTEN Canada, c’est intégrer une entreprise qui valorise l’innovation, la collaboration et le développement professionnel. Vous aurez l’opportunité de travailler sur des projets à fort impact, dans un environnement inclusif et stimulant, tout en bénéficiant d’un accompagnement personnalisé dans votre parcours de carrière.

*Veuillez noter que toutes les demandes seront évaluées, toutefois, nous ne communiquerons qu’avec les candidat·e·s sélectionné·e·s dans le cadre de cette offre d’emploi.*

*ALTEN Canada s'engage à promouvoir l'équité, la diversité et l'inclusion. Nous nous engageons à offrir un environnement de travail où chaque personne se sente accueillie, valorisée et respectée afin de pouvoir s’épanouir pleinement.*

*Nous avons à cœur d’offrir des mesures d’accessibilité aux personnes qui en font la demande, à ce titre, nous vous encourageons à communiquer avec nous si vous avez besoin d’accommodation dans le cadre du processus de recrutement.*

Ready to apply?
You'll be redirected to ALTEN Canada's application page.