Senior DevOps - SRE
Role summary
Highspring is seeking a Senior DevOps - SRE to join one of their major clients. This role focuses on enhancing the reliability, resilience, and performance of production platforms within complex distributed environments. The SRE will automate deployments, design observability solutions, and influence development teams to improve system quality. Key responsibilities include ensuring platform stability, implementing technical improvements, and participating in technical planning. The ideal candidate possesses strong SRE practices, IaC, CI/CD, and observability expertise, with hands-on experience in Docker, Kubernetes, Terraform, Ansible, and AWS.
About Highspring
Highspring is a consulting and professional services firm specialized in technology delivery, digital transformation, and high‑performance engineering. We partner with organizations of all sizes to accelerate innovation, strengthen operational excellence, and build scalable, future‑ready platforms. Our teams combine technical depth, modern delivery practices, and a people‑focused mindset to help clients achieve meaningful, sustainable impact.
The Opportunity
We're looking for a Site Reliability Engineer (SRE) to help one of our major clients strengthen the reliability, resilience, and performance of their production platforms. This role is ideal for someone who thrives in complex distributed environments and enjoys working closely with development, architecture, and product teams to drive engineering excellence.
What You'll Do
- Ensure the stability, reliability, and resilience of critical production platforms.
- Automate end‑to‑end deployment, testing, and quality controls using modern Infrastructure‑as‑Code and continuous delivery practices.
- Design and industrialize observability solutions (logs, metrics, alerts) to support service‑level objectives.
- Guide and influence development teams to improve reliability, performance, and security from design through operations.
- Identify, prioritize, and implement technical improvements by replacing outdated technologies with sustainable, business‑aligned solutions.
- Participate in technical planning with engineering leadership and product owners, contributing to shared standards, tooling, and documentation.
What You Bring to the Table
- Bachelor's degree in computer science, software engineering, or a related field and
5+ years of relevant experience
;
- OR
a Master's degree and
4+ years of experience
;
- OR
a university certificate and
8+ years of experience
.
- Strong expertise in Site Reliability Engineering practices, Infrastructure‑as‑Code, continuous deployment, and automated testing.
- Hands‑on experience with ecosystems such as Docker, Kubernetes, Git‑based delivery pipelines, Terraform, Ansible, and observability tools (e.g., Splunk, Datadog, SonarQube).
- Professional experience in Java development
or
system administration in distributed environments.
- AWS certification
Core Skills Required
- Reliability engineering
- CI/CD & IaC automation
- Observability architecture
- Distributed systems
- Performance and resiliency optimization
- Cloud engineering (AWS)
- Modern DevOps tooling
Our Stack
*Typical tools used on this mandate include:*
- Containerization & Orchestration:
Docker, Kubernetes
- IaC & Automation:
Terraform, Ansible
- CI/CD:
Git‑based pipelines
- Observability:
Splunk, Datadog, SonarQube
- Languages:
Java (or equivalent experience)
- Cloud:
AWS (certified)
Why Join Highspring
At Highspring, you'll join a team of experienced consultants who value collaboration, autonomy, and continuous learning. We offer the opportunity to work on impactful projects, contribute to modern engineering practices, and grow your career in a supportive, forward‑thinking environment. If you're passionate about reliability, automation, and technical excellence, we'd love to meet you.
---
À propos de Highspring
Highspring est une firme de services‑conseils spécialisée en livraison technologique, transformation numérique et ingénierie moderne. Nous accompagnons des organisations de toutes tailles afin d'accélérer l'innovation, renforcer l'excellence opérationnelle et bâtir des plateformes durables et évolutives. Nos équipes allient expertise technique, pratiques de livraison modernes et approche humaine pour générer un impact réel et durable.
L'Opportunité
Nous recherchons un(e) Ingénieur(e) en Fiabilité des Sites (SRE) afin de soutenir l'un de nos clients majeurs dans l'amélioration de la fiabilité, de la résilience et de la performance de ses plateformes critiques en production. Ce rôle s'adresse à une personne qui aime travailler dans des environnements distribués complexes et qui souhaite collaborer étroitement avec les équipes de développement, d'architecture et de produit.
Ce que vous ferez
- Assurer la stabilité, la fiabilité et la résilience des plateformes critiques en production.
- Automatiser les déploiements, les tests et les contrôles de qualité de bout en bout grâce aux pratiques modernes d'infrastructure sous forme de code et de livraison continue.
- Concevoir et industrialiser des solutions d'observabilité (journaux, métriques, alertes) pour soutenir les objectifs de niveau de service.
- Accompagner et influencer les équipes de développement afin d'améliorer la fiabilité, la performance et la sécurité, du design à l'exploitation.
- Identifier, prioriser et mettre en œuvre les améliorations techniques en remplaçant les technologies désuètes par des solutions durables et alignées aux besoins d'affaires.
- Participer à la planification technique avec la direction et les propriétaires de produit, tout en contribuant aux normes, outils et documentation partagés.
Ce que vous apportez
- Baccalauréat en informatique, génie logiciel ou domaine connexe et
au moins 5 ans d'expérience pertinente
;
- OU
maîtrise et
4 ans d'expérience
;
- OU
certificat universitaire et
8 ans d'expérience
.
- Maîtrise des pratiques SRE, de l'infrastructure sous forme de code, du déploiement continu et des tests automatisés.
- Expérience concrète avec des écosystèmes tels que Docker, Kubernetes, les chaînes de livraison Git, Terraform, Ansible, ainsi que des solutions d'observabilité (Splunk, Datadog, SonarQube).
- Expérience en développement Java
ou
en administration de systèmes dans des environnements distribués.
- Certification AWS
Compétences essentielles
- Ingénierie de la fiabilité
- Automatisation CI/CD et IaC
- Architecture d'observabilité
- Environnements distribués
- Optimisation de performance et résilience
- Ingénierie infonuagique (AWS)
- Outils DevOps modernes
Notre pile technologique
- Conteneurs et orchestration :
Docker, Kubernetes
- IaC et automatisation :
Terraform, Ansible
- CI/CD :
Chaînes Git
- Observabilité :
Splunk, Datadog, SonarQube
- Langages :
Java
- Nuage :
AWS (certification requise)
Pourquoi rejoindre Highspring
Chez Highspring, vous rejoindrez une équipe de consultants expérimentés qui valorisent la collaboration, l'autonomie et l'apprentissage continu. Vous contribuerez à des projets d'envergure, à l'adoption de pratiques d'ingénierie modernes et à votre propre développement professionnel dans un environnement stimulant et bienveillant.