Insitoo

Architecte Databricks (H/F)

Lyon, France
Dès que possible
> 12 mois
Régie
Temps plein
Microsoft Power BI
Produits Databricks
Python
Intégration continue et livraison continue (CI/CD)
Apache Spark
SQL
Modélisation des données
Applications cloud

Référence:
17-ARDS-LY
Projet :

Au sein du pôle, l’équipe transverse agit sur les deux départements en gérant et supervisant des projets communs, ici celui de la refonte des applications de BI.
Cette équipe en cours de construction est aujourd'hui constituée d'un chef de projet. Elle est accompagnée par diverses ressources du pôle, du département ou des équipes applicatives (managers, coordinateurs, référent techniques, pilote de système applicatifs...).
La mission du projet : Accompagner la migration et l’industrialisation d’une plateforme data cible autour de Databricks / Spark / Power BI​.

Descriptif de la mission :

Activité principale

  • Concevoir, développer et maintenir des pipelines data sous Databricks / Spark

  • Développer les traitements en Python, PySpark et SQL

  • Contribuer à la définition et à la mise en œuvre du modèle de données cible

  • Industrialiser les pipelines : standards de développement, tests, CI/CD, déploiement

  • Mettre en place des traitements robustes, maintenables et scalables

  • Orchestrer les traitements via Databricks Workflows / Lakeflow Jobs

  • Contribuer à la qualité, à l’observabilité et à la fiabilité des traitements

  • Participer au run : suivi de production, analyse d’incidents, amélioration continue

  • Prendre en compte les enjeux de performance et de maîtrise des coûts

Activité secondaire

  • Participer au cadrage des besoins avec le Product Owner et les équipes utilisatrices

  • Contribuer aux choix techniques liés à la nouvelle plateforme data

  • Participer à la mise en place des pratiques de développement Databricks

  • Contribuer à l’interfaçage avec Power BI ou à des processus intégrés Databricks / Power BI

  • Participer à l’intégration de sources d’alimentation du datalake, Kafka apprécié

  • Contribuer à la documentation technique et aux standards d’équipe

  • Participer aux rituels agiles et à l’amélioration continue de la feature team

Stack technique de l'équipe

Obligatoires : Databricks, Spark, PySpark, Python, SQL
Obligatoires : Modélisation data, Delta Lake, Unity Catalog
Obligatoires : CI/CD, tests, industrialisation des pipelines
Demandées : Certification Databricks, cloud public, Terraform
Demandées : Databricks Workflows, observabilité
Appréciées : Kafka, Lakeflow / DLT, Power BI
Appréciées : Certification cloud

Description du profil

Nous recherchons un Lead Data Engineer / Expert Databricks pour accompagner la migration et l’industrialisation d’une nouvelle plateforme data.
Le profil interviendra sur la conception de pipelines Databricks / Spark, la structuration du modèle de données cible et la mise en place de standards de développement robustes, maintenables et industrialisés.
Le profil devra accompagner les équipes de développement pour assurer le respect des bonnes pratiques établies pendant la migration.
Une capacité à prendre du recul, à proposer des choix techniques structurants et à travailler avec des équipes Data, BI et métier est attendue. Une connaissance de Power BI est appréciée pour faciliter l’exposition des données vers les usages analytiques.

Compétences attendues sur le profil

  • Expertise confirmée sur Databricks : Certification Databricks attendue

  • Très bonne maîtrise de Spark / PySpark

  • Très bonne maîtrise de Python et SQL

  • Solide compétence en modélisation de données

  • Bonne connaissance de Delta Lake et Unity Catalog

  • Expérience en industrialisation de pipelines data : CI/CD, tests, déploiement

  • Expérience sur des environnements cloud publics, sans cloud cible imposé

  • Connaissance de Terraform pour les sujets Databricks / cloud

  • Bonne pratique de Databricks Workflows

  • Sensibilité à l’observabilité, à la qualité de service et à la maintenabilité

  • Appétence pour les sujets de performance et de maîtrise des coûts

  • Kafka apprécié pour l’ingestion de données vers le datalake

  • Power BI apprécié pour les usages d’exposition et de consommation BI

  • Certification cloud appréciée

Rémunération:
630 €/J