SRE (Site Reliability Engineer) / DevOps (F/H) - CDI

SEKOIA recrute !

À propos

SEKOIA est un acteur francophone majeur, dédié uniquement au domaine de la Cybersécurité.

Créée en 2008, sous forme de cabinet de conseil et d’expertise, la société compte en 2018 une soixantaine de collaborateurs, répartis entre les sites de Paris et de Rennes.

SEKOIA fonde sa maîtrise sur son expertise en Threat Intelligence, sans autres objectifs que d’améliorer son savoir, ses techniques et ses méthodes pour gagner en efficacité dans la préservation des systèmes et des intérêts de ses clients.

Nous sommes un laboratoire, un observatoire et un centre opérationnel dont le moteur est un groupe référent pluridisciplinaire.

Traitant de problématiques de pointe dans un environnement collaboratif propice à l’innovation, durable et vertueux, SEKOIA est un milieu de confrontation permanente aux nouvelles formes de menaces. Nous œuvrons pour capitaliser l’expérience du domaine et du terrain pour partager un savoir faire consolidé chaque jour un peu plus.

SEKOIA n'est pas organisé en BU, mais forme un seul groupe de professionnels, structuré en 8 équipes de tailles réduites, spécialisées autour de compétences, agiles et autonomes.

  • Gouvernance et projets : équipes GRC et Smart PMO
  • Activités Défensives : Blue Team, Purple Team, MSSP
  • Activités Offensives : Red Team, Purple Team, MSSP
  • Renseignement sur la menace : Purple Team
  • Développement de solutions technologies : Equipe plateforme

SEKOIA dispose également d'un centre de formation préparant aux certifications professionnelles du marché et traitant des derniers sujets d’actualité (Conformité GDPR, Intelligence Artificielle, Blockchain) accueillant chaque année plus de 1000 personnes.

Descriptif du poste

L'équipe Platform

Une équipe dédiée pour la production d'applications de cybersecurité collaboratives
L'équipe platform de SEKOIA porte la réalisation d'une platforme révolutionnaire pour les usages de la cybersécurité. Celle-ci simplifie l'interconnexion des applications de cybersécurité pour proposer à ses utilisateurs des workflows d'analyses innovants. L'équipe se compose de développeurs backend/frontend mais également de profils reliability(SRE), design (UX/UI), et product owner (PO) pour assurer la réalisation des produits. Nous faisons confiance aux employés pour qu'ils fassent les bons choix et nous favorisons l'autonomie et la responsabilisation des équipes. De nombreuses technologies, langages et outils sont exploités. Les conférences et les formations nourissent les membres de l'équipe pour s'aguerrir aux dernières technologies/approches de son domaine. L'équipe platform exploite quotidiennement de nombreuses approches. Voici quelques credo de l'équipe : « everything as code », « mono-repo », « continuous delivery », « you built it, you run it », « agility », « micro-services », « docker everything » et « surface is first ».

Le chapter SRE

Le chapter SRE (Site Reliability Engineering)
SRE, pour « Site Reliability Engineering », que l’on pourrait traduire par « ingénierie de fiabilité », consiste à travailler sur la stabilité et la résilience d’une platforme informatique (au sens large), c’est-à-dire sa capacité à résister à une défaillance ou à un pic d’activité. Cette équipe se retrouve à mi-chemin entre l’administration système, la surveillance et la maintenance d’une platforme informatique et le développement d’outils destinés à fiabiliser son fonctionnement.

Pour cela, une partie des travaux de l'équipe SRE consistent à :

  • garantir la bonne sécurité de la platforme (en intervenant comme conseil pour les autres équipes, en mettant en œuvre des solutions spécifiques de sécurité, et en surveillant les évènements de sécurité envoyés par nos propres équipements) ;
  • surveiller le bon fonctionnement de la plateforme au sens large et travailler à l’amélioration de la qualité des métriques permettant de superviser les équipements de la plateforme et des applications ;
  • automatiser les tâches répétitives (déploiement de nouvelles versions, identification de défaillances, réparations, etc.) ;
  • faciliter le travail des personnes qui interviennent sur le projet en rapprochant l’environnement de développement et de test de l’environnement de production ;
  • fiabiliser les applications existantes tout en mettant en œuvre les changements de manière graduelle ;
  • intervenir sur la plateforme en cas d’incident.

L’équipe SRE est amenée à travailler principalement avec les outils suivants :

  • VMware vSphere pour la gestion de nos machines virtuelles (environ 80 machines virtuelles actuellement) ;
  • Docker et Docker Swarm pour la gestion de nos conteneur qui hébergent nos microservices ;
  • Salt et Salt Cloud pour la gestion centralisée de nos machines virtuelles ;
  • Prometheus pour la collecte et la supervision des métriques.

L'offre

En tant qu’ingénieur⋅e SRE, vous interviendrez sur la plateforme SEKOIA.IO au sein d’une « squad » axée autour d’un produit de type SaaS (équipe composée de cinq à dix personnes). Votre rôle sera d’assurer la stabilité, la résilience et à la sécurité des différentes plateformes (production, test, chaine de compilation et d’intégration).

Vos principales missions seront de :

  • garantir la disponibilité opérationnelle des services en assurant la supervision et la résolution des éventuels problèmes sur l’ensemble de nos plateformes ;
  • participer au développement du produit en portant dans la discussion la voix du SRE sur les choix d'infrastructure (au sens large) et en produisant le résultat de ces discussions ;
  • participer à la mise en œuvre de solutions permettant de renforcer la sécurité opérationnelle de nos clusters Docker Swarm et Kubernetes ;
  • améliorer les mécanismes et outils de surveillance et journalisation (métriques collectées, journaux système, erreurs, traces entre les services, etc.) ;
  • améliorer de façon continue les mécanismes de déploiement, en améliorant l’outillage, en le rendant disponible aux développeurs, en accélérant le temps de déploiement.

Profil recherché

Il serait intéressant de maîtriser les sujets suivants :

  • GNU/Linux d’un point de vue système (scripting, processus, monitoring, debugging) ;
  • les principes des bases de données relationnelles, notamment les aspects performance et sécurité ;
  • savoir développer avec un des langages utilisés sur la plateforme (Python, Go, Bash, etc.), et savoir rentrer dans une base de code produit pour y apporter des modifications liées au SRE ;
  • savoir communiquer avec les autres membres de l'équipe pour savoir comment répondre à ses problématiques ;
  • savoir faire sens de métriques et les mettre en place pour pouvoir améliorer la plateforme.

Et aussi :

  • Docker et l’écriture de Dockerfile ;
  • Git et GitHub ;
  • le concept d'« infrastructure as code » ;
  • des connaissances relatives à Kubernetes seraient un plus.

Process de recrutement

1 entretien technique avec nos équipes puis 1 entretien axé management !

Informations complémentaires

  • Type de contrat : CDI
  • Date de début : 01 octobre 2019
  • Lieu : Rennes, France (35000)
  • Niveau d'études : Bac +5 / Master
  • Télétravail possible