Insitoo

Développeur Big Data Spark (H/F)

Lyon, France
Dès que possible
> 12 mois
Régie
Temps plein
Apache Spark
SQL
PL/SQL

Référence:
17-DEVBS-LY
Projet :

Au sein du pôle de la DSI, le projet de BI du système et répond aux enjeux suivants :
• Piloter le système et les processus métier associés
• Garantir la qualité et la cohérence des données
• Fournir les données pour l’analyse et l’amélioration continue du système

Elle est utilisée par environ 1000 utilisateurs (analystes, experts métiers, experts SI).

Le projet est composé de cinq équipes couvrant à la fois le développement des traitements fonctionnels, des reportings ainsi que la gestion des plateformes et de l’outillage.
Dans un contexte de transformation du SI décisionnel, l’équipe porte actuellement des enjeux forts de modernisation des traitements Big Data, avec une migration en cours vers Spark ainsi qu’un projet de refonte complète dans le cloud basé sur Databricks à moyen terme.

Les missions s’inscrivent dans une trajectoire progressive :
Phase 1 : Modernisation des traitements existants
• Migration de traitements Informatica et PL/SQL vers Spark (Java)
• Participation à l’optimisation des traitements existants
• Maintenance corrective et évolutive des traitements PL/SQL
• Appropriation des processus métier derrière les flux de données

Phase 2 : Refonte cloud (Databricks)
• Participation au projet stratégique de migration vers le cloud
• Conception et mise en œuvre de pipelines de données sur Databricks
• Industrialisation des traitements dans un environnement moderne

Descriptif de la mission :

Activité principale
• Concevoir, développer et maintenir des pipelines de données en Spark (Java)
• Migrer des traitements legacy vers des architectures Big Data modernes
• Assurer la maintenance des traitements existants SQL / PL-SQL
• Garantir la performance, la robustesse et la qualité des données
• Participer activement au RUN et à l’amélioration continue

Activité secondaire
• Contribution aux bonnes pratiques de développement et d’exploitation
• Mise à jour du référentiel documentaire
• Partage de connaissances au sein de l’équipe
• Participation à la guilde Spark de l’équipe (choix de conception, optimisation des traitements, road map technique etc…)

Stack technique de l'équipe : Spark, Java, Ceph, Tableau Server, Oracle, Informatica, Maven, Control-M, Git, Jenkins, Terraform

Description du profil

Dans ce contexte, nous recherchons un Data Engineer ayant une forte appétence pour :
• La compréhension des enjeux métier liés à la donnée
• Les environnements Big Data en transformation
• Le travail sur des systèmes existants et l’amélioration continue

Le profil attendu combine compétences techniques solides et posture d’ingénieur impliqué dans le fonctionnement global du SI (BUILD & RUN).

Une expérience minimale de 3 ans est requise.

Compétences attendues sur le profil

  • Défini/challenge les solutions et architectures techniques permettant le traitement de volumes importants de pipelines de données suffisamment sécurisés et lisibles pour les Data Analysts et Data Scientists.

  • Maîtrise des solutions de stockage de données

  • Maîtrise des technologies du Big Data permettant le traitement et la manipulation de données

  • Maîtrise des outils de gestion de code et de déploiement projet

  • Maitrise des fondamentaux de l’agilité

  • Maîtrise des solutions de stockage de données

  • Maîtrise avancée des langages structurés

  • Maîtrise avancée des technologies du Big Data permettant le traitement et la manipulation de données

Impératif pour candidater :

  • Spark

  • SQL / PL-SQL

  • Programmation Orientée Objet (Java ou Python)

Rémunération:
540 €/J