Coach/Concepteur(trice) DevOps-SRE
Role summary
Wepoint is seeking a DevOps-SRE Coach/Designer to join a dynamic delivery team. This role acts as a trusted partner, driving the adoption of observability practices and elevating SRE maturity within the organization. The position combines technical expertise, coaching, and influence to sustainably transform practices. Responsibilities include coaching teams on SRE and observability, designing resilient observability solutions on Datadog, promoting DevSecOps culture, and contributing to platform evolution and strategic roadmaps. The ideal candidate has 5-10 years of experience in technical coaching and IT operations/DevOps/SRE, with a strong understanding of SRE principles and observability pillars. Proficiency in French and English is required.
Company Description
Wepoint is the architect of major transformations for businesses and public sector organizations.
We support our clients from strategy through technological implementation, always striving to think beyond the obvious and to act within the framework of Economic, Social, Environmental, and Technological Responsibility (RESET). Our goal is to create new ways of working, new economic models, and smarter environments.
In nearly 20 years, we have become one of the key players in digital transformation, employing 3,500 people across Europe, Tunisia, North America, and the Asia-Pacific region.
What We Are Looking For
COURAGE – AUTHENTICITY – OPENNESS – COMMITMENT – ELEGANCE
Do these words resonate with you? They are our company values.
At Wepoint, we are looking for committed talents who are ready to share their expertise within open and collaborative teams, and who are not afraid to take initiative. We also value people who are able to challenge themselves and continuously improve.
At the heart of relationships at Wepoint are authenticity and the constant pursuit of excellence for our clients — this is what we expect from our future colleagues.
Description Du Poste
Vous aurez l’opportunité de travailler dans une équipe de livraison dynamique et centrale dans la livraison de services opérationnels. La personne titulaire du poste agit comme partenaire de confiance des équipes de livraison et d’opérations. Elle intervient directement sur le terrain pour accompagner l’adoption des pratiques d’observabilité, faire évoluer les façons de faire et élever le niveau de maturité SRE de l’organisation.
Le rôle combine expertise technique, coaching et capacité d’influence afin de transformer durablement les pratiques, plutôt que de se limiter à la conception de solutions.
Responsabilités
Accompagnement et transformation des équipes
- Accompagner les équipes applicatives et plateformes dans l’adoption des pratiques SRE et d’observabilité, en tenant compte de leur réalité métier et de leur niveau de maturité;
- Agir comme coach technique auprès des équipes pour les aider à concevoir, déployer et exploiter leurs solutions d’observabilité de façon autonome;
- Favoriser l’amélioration continue des pratiques (monitoring, alerting, SLO, gestion d’incidents) par des revues, audits et recommandations concrètes;
- Promouvoir une culture de collaboration interdisciplinaire entre développement, sécurité et opérations (DevSecOps);
- Influencer positivement les comportements et les pratiques afin d’assurer une adhésion durable aux standards et normes organisationnelles.
Observabilité et fiabilité des services
- Concevoir et faire évoluer, avec les équipes, des solutions d’observabilité évolutives et résilientes sur la plateforme Datadog;
- Définir et mettre en œuvre des stratégies d’observabilité alignées sur les besoins métier, la fiabilité des services et les objectifs d’affaires;
- Proposer et vulgariser des améliorations architecturales visant l’optimisation des coûts, la performance et la haute disponibilité;
- Mettre en place et diffuser des recettes d’observabilité en mode DevSecOps, favorisant le libre-service et l’autonomie des équipes;
- Réaliser des audits post déploiement afin d’assurer la qualité, la conformité et la pérennité des solutions de surveillance.
Plateforme, gouvernance et opérations
- Assurer la qualité, la stabilité et l’évolution de la plateforme Datadog;
- Appliquer et promouvoir les meilleures pratiques d’administration de la plateforme;
- Participer à l’élaboration de la feuille de route technologique et contribuer aux décisions stratégiques liées aux opérations et à l’observabilité;
- Assurer la documentation et le partage de connaissances dans Jira et Confluence;
- Participer au support en rotation (soir/nuit) selon la cédule d’équipe.
Qualifications
Expérience et certifications
- Environ 5 à 10 ans d’expérience pertinente en accompagnement, coaching ou en vulgarisation technique;
- Environ 5 à 10 ans d’expérience pertinente en opérations TI, DevOps, fiabilité des services, SRE ou domaines connexes;
- Certifications SRE, DevOps ou Cloud : un atout important.
Maîtrise des concepts SRE
- Solide compréhension et expérience pratique des principes SRE, notamment : fiabilité des services et gestion du risque, SLO, SLI et error budgets, équilibre entre stabilité et vélocité, automatisation et réduction du travail manuel (toil);
- Capacité à adapter les pratiques SRE au contexte des équipes, selon leur maturité et leurs contraintes opérationnelles;
- Expérience dans l’amélioration de la résilience des systèmes : haute disponibilité, tolérance aux pannes et dégradation contrôlée.
Opérations et gestion d’incidents
- Expérience concrète en gestion d’incidents et d’événements dans des environnements critiques;
- Compréhension des processus post incident : revues post‑mortem sans blâme, analyse des causes racines, suivi et mise en œuvre d’actions correctives durables;
- Capacité à intervenir efficacement sous pression et à soutenir les équipes lors d’incidents majeurs.
Observabilité au service du SRE
- Bonne compréhension des piliers de l’observabilité (logs, métriques, traces) et de leur utilisation pour : mesurer la fiabilité des services, alimenter les SLO et indicateurs opérationnels, améliorer la détection, le diagnostic et la prévention des incidents;
- Expérience avec une plateforme d’observabilité (Datadog) dans un contexte SRE ou DevOps.
DevOps, automatisation et plateformes
- Expérience en DevOps / DevSecOps, incluant l’automatisation via pipelines (Azure DevOps);
- Capacité à promouvoir et mettre en place des pratiques favorisant l’autonomie des équipes (libre‑service, standardisation, templates);
- Connaissances des environnements cloud AWS et/ou Azure (certifications un atout);
- Connaissances en administration de systèmes, d’applications et de services infonuagiques.
Communication
- Excellente communication en français et en anglais. L'anglais est requis, le poste demandant de communiquer avec des clients et partenaires situés à l'extérieur du Québec.
Seuls les candidats légalement autorisés à travailler pour tout employeur au Canada seront considérés.
Wepoint Benefits
- Minimum of 3 weeks of vacation starting from the first year;
- Comprehensive group insurance with a generous employer contribution;
- Employer contribution to a group RRSP;
- Full remote work flexibility: Hybrid, Remote, or On-site;
- A warm, bright, and welcoming office offering fresh fruit, coffee, beverages, occasional meals, etc.;
- Annual IT equipment budget;
- A balanced work environment with flexible working hours;
- Career development: training and certifications, online or in-person learning, Wepoint Academy, etc.;
- An international community of experts ready to share their knowledge;
- A company culture focused on individuals’ needs and their belonging to a strong community.
#tech&security