Développeur Big Data Spark (H/F)

Lyon, France
Dès que possible
> 12 mois
Régie
Temps plein
PL/SQL
Apache Spark
Produits Databricks
Python
SQL
Java - Confirmé

Référence:
17-DBDS-LY
Projet :

Au sein du pôle, le projet est le projet de BI (business intelligence) du système et répond aux enjeux suivants :

• Piloter le système et les processus métier associés

• Garantir la qualité et la cohérence des données

• Fournir les données pour l’analyse et l’amélioration continue du système

Elle est utilisée par environ 1000 utilisateurs (analystes, experts métiers, experts SI).

Le projet est composé de cinq équipes couvrant à la fois le développement des traitements fonctionnels, des reportings ainsi que la gestion des plateformes et de l’outillage.

Dans un contexte de transformation du SI décisionnel, l’équipe porte actuellement des enjeux forts de modernisation des traitements Big Data, avec une migration en cours vers Spark ainsi qu’un projet de refonte complète dans le cloud basé sur Databricks à moyen terme.

Descriptif de la mission :

Activité principale

• Concevoir, développer et maintenir des pipelines de données en Spark (Java)

• Migrer des traitements legacy vers des architectures Big Data modernes

• Assurer la maintenance des traitements existants SQL / PL-SQL

• Garantir la performance, la robustesse et la qualité des données

• Participer activement au RUN et à l’amélioration continue

Les missions s’inscrivent dans une trajectoire progressive :

Phase 1 : Modernisation des traitements existants

• Migration de traitements Informatica et PL/SQL vers Spark (Java)

• Participation à l’optimisation des traitements existants

• Maintenance corrective et évolutive des traitements PL/SQL

• Appropriation des processus métier derrière les flux de données

Phase 2 : Refonte cloud (Databricks)

• Participation au projet stratégique de migration vers le cloud

• Conception et mise en œuvre de pipelines de données sur Databricks

• Industrialisation des traitements dans un environnement moderne

Activités secondaires

• Contribution aux bonnes pratiques de développement et d’exploitation

• Mise à jour du référentiel documentaire

• Partage de connaissances au sein de l’équipe

• Participation à la guilde Spark de l’équipe (choix de conception, optimisation des traitements, road map technique etc…)

Stack technique de l'équipe

Spark, Java, Ceph, Tableau Server, Oracle, Informatica, Maven, Control-M, Git, Jenkins, Terraform

Description du profil

Dans ce contexte, nous recherchons un Data Engineer ayant une forte appétence pour :

• La compréhension des enjeux métier liés à la donnée

• Les environnements Big Data en transformation

• Le travail sur des systèmes existants et l’amélioration continue

Le profil attendu combine compétences techniques solides et posture d’ingénieur impliqué dans le fonctionnement global du SI (BUILD & RUN).

Une expérience minimale de 3 ans est requise.

Compétences attendues sur le profil

Compétences techniques requises

• Maitrise en Spark (indispensable)

• Maitrise en SQL / PL-SQL (indispensable)

• Connaissances en Java (indispensable)

Compétences appréciées

• Expérience sur Databricks

• Python

Qualités attendues

• Curiosité et capacité à comprendre le fonctionnel et le sens des traitements

• Culture du RUN (exploitation, stabilité, amélioration continue)

• Autonomie, rigueur et sens des responsabilités

• Capacité d’analyse et de résolution de problèmes

• Esprit d’équipe et communication

Rémunération:
415 €/J