Insitoo
Au sein du pôle de la DSI, le projet de BI du système et répond aux enjeux suivants :
• Piloter le système et les processus métier associés
• Garantir la qualité et la cohérence des données
• Fournir les données pour l’analyse et l’amélioration continue du système
Elle est utilisée par environ 1000 utilisateurs (analystes, experts métiers, experts SI).
Le projet est composé de cinq équipes couvrant à la fois le développement des traitements fonctionnels, des reportings ainsi que la gestion des plateformes et de l’outillage.
Dans un contexte de transformation du SI décisionnel, l’équipe porte actuellement des enjeux forts de modernisation des traitements Big Data, avec une migration en cours vers Spark ainsi qu’un projet de refonte complète dans le cloud basé sur Databricks à moyen terme.
Les missions s’inscrivent dans une trajectoire progressive :
Phase 1 : Modernisation des traitements existants
• Migration de traitements Informatica et PL/SQL vers Spark (Java)
• Participation à l’optimisation des traitements existants
• Maintenance corrective et évolutive des traitements PL/SQL
• Appropriation des processus métier derrière les flux de données
Phase 2 : Refonte cloud (Databricks)
• Participation au projet stratégique de migration vers le cloud
• Conception et mise en œuvre de pipelines de données sur Databricks
• Industrialisation des traitements dans un environnement moderne
Activité principale
• Concevoir, développer et maintenir des pipelines de données en Spark (Java)
• Migrer des traitements legacy vers des architectures Big Data modernes
• Assurer la maintenance des traitements existants SQL / PL-SQL
• Garantir la performance, la robustesse et la qualité des données
• Participer activement au RUN et à l’amélioration continue
Activité secondaire
• Contribution aux bonnes pratiques de développement et d’exploitation
• Mise à jour du référentiel documentaire
• Partage de connaissances au sein de l’équipe
• Participation à la guilde Spark de l’équipe (choix de conception, optimisation des traitements, road map technique etc…)
Stack technique de l'équipe : Spark, Java, Ceph, Tableau Server, Oracle, Informatica, Maven, Control-M, Git, Jenkins, Terraform
Description du profil
Dans ce contexte, nous recherchons un Data Engineer ayant une forte appétence pour :
• La compréhension des enjeux métier liés à la donnée
• Les environnements Big Data en transformation
• Le travail sur des systèmes existants et l’amélioration continue
Le profil attendu combine compétences techniques solides et posture d’ingénieur impliqué dans le fonctionnement global du SI (BUILD & RUN).
Une expérience minimale de 3 ans est requise.
Compétences attendues sur le profil
Défini/challenge les solutions et architectures techniques permettant le traitement de volumes importants de pipelines de données suffisamment sécurisés et lisibles pour les Data Analysts et Data Scientists.
Maîtrise des solutions de stockage de données
Maîtrise des technologies du Big Data permettant le traitement et la manipulation de données
Maîtrise des outils de gestion de code et de déploiement projet
Maitrise des fondamentaux de l’agilité
Maîtrise des solutions de stockage de données
Maîtrise avancée des langages structurés
Maîtrise avancée des technologies du Big Data permettant le traitement et la manipulation de données
Impératif pour candidater :
Spark
SQL / PL-SQL
Programmation Orientée Objet (Java ou Python)