Senior DevOps - SRE

Montreal, Quebec, CanadaOnsiteContractSeniorPosted 2 months ago

Is this role right for you?

Upload your resume and get a skill-by-skill breakdown — see exactly where you match, where you're close, and what to highlight. Not a mystery percentage.

Get a tailored resume highlighting what this role needs.

Role summary

Highspring is seeking a Senior DevOps - SRE to join one of their major clients. This role focuses on enhancing the reliability, resilience, and performance of production platforms within complex distributed environments. The SRE will automate deployments, design observability solutions, and influence development teams to improve system quality. Key responsibilities include ensuring platform stability, implementing technical improvements, and participating in technical planning. The ideal candidate possesses strong SRE practices, IaC, CI/CD, and observability expertise, with hands-on experience in Docker, Kubernetes, Terraform, Ansible, and AWS.

About Highspring

Highspring is a consulting and professional services firm specialized in technology delivery, digital transformation, and high‑performance engineering. We partner with organizations of all sizes to accelerate innovation, strengthen operational excellence, and build scalable, future‑ready platforms. Our teams combine technical depth, modern delivery practices, and a people‑focused mindset to help clients achieve meaningful, sustainable impact.

The Opportunity

We're looking for a Site Reliability Engineer (SRE) to help one of our major clients strengthen the reliability, resilience, and performance of their production platforms. This role is ideal for someone who thrives in complex distributed environments and enjoys working closely with development, architecture, and product teams to drive engineering excellence.

What You'll Do

Ensure the stability, reliability, and resilience of critical production platforms.
Automate end‑to‑end deployment, testing, and quality controls using modern Infrastructure‑as‑Code and continuous delivery practices.
Design and industrialize observability solutions (logs, metrics, alerts) to support service‑level objectives.
Guide and influence development teams to improve reliability, performance, and security from design through operations.
Identify, prioritize, and implement technical improvements by replacing outdated technologies with sustainable, business‑aligned solutions.
Participate in technical planning with engineering leadership and product owners, contributing to shared standards, tooling, and documentation.

What You Bring to the Table

- Bachelor's degree in computer science, software engineering, or a related field and
5+ years of relevant experience
;
- OR
a Master's degree and
4+ years of experience
;
- OR
a university certificate and
8+ years of experience
.
- Strong expertise in Site Reliability Engineering practices, Infrastructure‑as‑Code, continuous deployment, and automated testing.
- Hands‑on experience with ecosystems such as Docker, Kubernetes, Git‑based delivery pipelines, Terraform, Ansible, and observability tools (e.g., Splunk, Datadog, SonarQube).
- Professional experience in Java development
or
system administration in distributed environments.
- AWS certification

Core Skills Required

Reliability engineering
CI/CD & IaC automation
Observability architecture
Distributed systems
Performance and resiliency optimization
Cloud engineering (AWS)
Modern DevOps tooling

Our Stack

*Typical tools used on this mandate include:*

- Containerization & Orchestration:
Docker, Kubernetes
- IaC & Automation:
Terraform, Ansible
- CI/CD:
Git‑based pipelines
- Observability:
Splunk, Datadog, SonarQube
- Languages:
Java (or equivalent experience)
- Cloud:
AWS (certified)

Why Join Highspring

At Highspring, you'll join a team of experienced consultants who value collaboration, autonomy, and continuous learning. We offer the opportunity to work on impactful projects, contribute to modern engineering practices, and grow your career in a supportive, forward‑thinking environment. If you're passionate about reliability, automation, and technical excellence, we'd love to meet you.

---

À propos de Highspring

Highspring est une firme de services‑conseils spécialisée en livraison technologique, transformation numérique et ingénierie moderne. Nous accompagnons des organisations de toutes tailles afin d'accélérer l'innovation, renforcer l'excellence opérationnelle et bâtir des plateformes durables et évolutives. Nos équipes allient expertise technique, pratiques de livraison modernes et approche humaine pour générer un impact réel et durable.

L'Opportunité

Nous recherchons un(e) Ingénieur(e) en Fiabilité des Sites (SRE) afin de soutenir l'un de nos clients majeurs dans l'amélioration de la fiabilité, de la résilience et de la performance de ses plateformes critiques en production. Ce rôle s'adresse à une personne qui aime travailler dans des environnements distribués complexes et qui souhaite collaborer étroitement avec les équipes de développement, d'architecture et de produit.

Ce que vous ferez

Assurer la stabilité, la fiabilité et la résilience des plateformes critiques en production.
Automatiser les déploiements, les tests et les contrôles de qualité de bout en bout grâce aux pratiques modernes d'infrastructure sous forme de code et de livraison continue.
Concevoir et industrialiser des solutions d'observabilité (journaux, métriques, alertes) pour soutenir les objectifs de niveau de service.
Accompagner et influencer les équipes de développement afin d'améliorer la fiabilité, la performance et la sécurité, du design à l'exploitation.
Identifier, prioriser et mettre en œuvre les améliorations techniques en remplaçant les technologies désuètes par des solutions durables et alignées aux besoins d'affaires.
Participer à la planification technique avec la direction et les propriétaires de produit, tout en contribuant aux normes, outils et documentation partagés.

Ce que vous apportez

- Baccalauréat en informatique, génie logiciel ou domaine connexe et
au moins 5 ans d'expérience pertinente
;
- OU
maîtrise et
4 ans d'expérience
;
- OU
certificat universitaire et
8 ans d'expérience
.
- Maîtrise des pratiques SRE, de l'infrastructure sous forme de code, du déploiement continu et des tests automatisés.
- Expérience concrète avec des écosystèmes tels que Docker, Kubernetes, les chaînes de livraison Git, Terraform, Ansible, ainsi que des solutions d'observabilité (Splunk, Datadog, SonarQube).
- Expérience en développement Java
ou
en administration de systèmes dans des environnements distribués.
- Certification AWS

Compétences essentielles

Ingénierie de la fiabilité
Automatisation CI/CD et IaC
Architecture d'observabilité
Environnements distribués
Optimisation de performance et résilience
Ingénierie infonuagique (AWS)
Outils DevOps modernes

Notre pile technologique

- Conteneurs et orchestration :
Docker, Kubernetes
- IaC et automatisation :
Terraform, Ansible
- CI/CD :
Chaînes Git
- Observabilité :
Splunk, Datadog, SonarQube
- Langages :
Java
- Nuage :
AWS (certification requise)

Pourquoi rejoindre Highspring

Chez Highspring, vous rejoindrez une équipe de consultants expérimentés qui valorisent la collaboration, l'autonomie et l'apprentissage continu. Vous contribuerez à des projets d'envergure, à l'adoption de pratiques d'ingénierie modernes et à votre propre développement professionnel dans un environnement stimulant et bienveillant.

Ready to apply?

You'll be redirected to Highspring's application page.