YOUSSEF

Data consultant

Informations

Compétences

Technos

  • AWS
  • AWS
  • AWS Lambda
  • AWS Lambda
  • Amazon Athena
  • Amazon Athena
  • C
  • C
  • ELK
  • ELK
  • Framework Spring
  • Framework Spring
  • Framework Spring
  • Framework Spring
  • Git
  • Git
  • Graylog
  • Graylog
  • Hibernate
  • Hibernate
  • JIRA
  • JIRA
  • JPA
  • JPA
  • Java
  • Java
  • Jenkins
  • Jenkins
  • Kibana
  • Kibana
  • Kubernetes
  • Kubernetes
  • Linux
  • Linux
  • Microsoft Azure
  • Microsoft Azure
  • NoSQL
  • NoSQL
  • Node.js
  • Node.js
  • Python
  • Python
  • Python3
  • Python3
  • QUICKSIGHT
  • QUICKSIGHT
  • Quiksight
  • Quiksight
  • Rancher
  • Rancher
  • S3
  • S3
  • Spark
  • Spark
  • Spring Boot
  • Spring Boot
  • WISE PACKAGE STUDIO
  • WISE PACKAGE STUDIO
  • azureML
  • azureML
  • storage
  • storage
  • Voir plus
  • Voir moins

Métier

  • Amazon Redshift
  • Amazon Redshift
  • Analyses Big Data
  • Analyses Big Data
  • Apache Spark
  • Apache Spark
  • Apprentissage automatique
  • Apprentissage automatique
  • Big data
  • Big data
  • Programmation web
  • Programmation web
  • Spring Batch
  • Spring Batch
  • Voir plus
  • Voir moins

Langues

  • Anglais
  • Anglais
  • Voir plus
  • Voir moins

Expériences (22)

Data steward
IMA assurances
De March 2023 à October 2023
Niort, Nouvelle-Aquitaine, France

Contexte général

Contribution à l’intégration des données au sein du DATAHUB en assurant la qualité des données et le respect des règles de l’ingestion et la consommation des données.


Description

- l’interlocuteur data de référence dans l’entreprise, le point d’entrée incontournable pour accéder aux données.

- métiers et en partenariat constant avec les équipes DATAHUB et Décisionnelles, aider à identifier les données, à les collecter, mais aussi à les valider et à les structurer.

- sensibiliser à la protection des données.

Accompagner les producteur de la données à identifier et tagger les DCP et les DCP sensible.

- documenter la donnée et centraliser les connaissances autour des datasets sur Airtable.

- Création de dashboard KIBANA pour accompagner les producteur.

- Définir et déployer des stratégies de gouvernance des données, des politiques, des rôles, des responsabilités, des processus, des contrôles.

- Data Lineage avec Purview.

Microsoft Power BI
Bus de service Azure
RabbitMQ
SQL
Kibana
JIRA
Airtable
Data engineer
IMA assurances
De March 2023 à October 2023
Niort, Nouvelle-Aquitaine, France

Contexte général

Contribution à l’intégration des données au sein du DATAHUB en assurant la qualité des données et le respect des règles de l’ingestion et la consommation des données.


Description

- L’interlocuteur data de référence dans l’entreprise, le point d’entrée incontournable pour accéder aux données.

- En partenariat constant avec les équipes DATAHUB et Décisionnelles, aider à identifier les données, à les collecter, mais aussi à les valider et à les structurer.

- Sensibiliser à la protection des données.

- Accompagner les producteurs de la données à identifier et tagger les DCP et les DCP sensible.

- Documenter la donnée et centraliser les connaissances autour des datasets sur Airtable.

- Création de dashboard KIBANA pour accompagner les producteurs.

- Définir et déployer des stratégies de gouvernance des données, des politiques, des rôles, des responsabilités, des processus, des contrôles.

- Data Lineage avec Purview.

Environnement technique : Azure Storage/ parquet file, SQL ,AzureDS, Pubsub, KIBANA, GitHub, Jira, Airatable, Purview .

Microsoft Power BI
Bus de service Azure
RabbitMQ
SQL
Kibana
JIRA
Airtable
Data engineer
Auchan International
De April 2021 à June 2023
Villeneuve-d'Ascq, Hauts-de-France, France

Contexte général

Responsable Pays. Contribution au Data Lake Datapool par la collection et l’intégration des données magasins et site


Description

collections des données des magasins en mode batch et en streaming : - develement des pipline d’integration de données vers bigquery - conception de l’architecture Streaming et developement des cloud fonctions pour intégrer les données sur firestore et datastore. - orchestration des équipes dans les pays envoyant les données de magasins.

Python
Apache Airflow
Google Cloud Platform (GCP)
Google BigQuery
Google Data Studio
Cloud Firestore
Git
JIRA
Consultant Data & Data engineer
DECATHLON
De April 2018 à April 2023

Mission :

-Contribution au Datalake Decathlon par la collection et l’intégration des données de la RFID.

-Animations des Collaborateur(Usines de produits finis)

 

Projets :

Définir le dictionnaire de données (mission data steward). Developpement de

l’environnement, les microservices de collection et d’injection des données sur s3.

Outils:

java8, SpringBoot, S3, Kensis, SQL ,Quicksight, Datastudio, Docker, Rancher,Kafka.

Kubernetes,cloudBerry,Jenkins, GitHub,ELK, Jira, confluence

Mission :

Conception et développement des application Web autour du métier de La RFID

Projets : Refente du microservice (MOTHER COUNTER) qui génère les numéro de séries unique

décathlon.

Contribution au développement des applications RFID SUITE, EFFIDAP, CATALOG.

Outils :

java8, Spring Boot, Datastudio, Docker, Rancher, Kubernetes, Jenkins, GitHub,PostgresSql

Data engineer
Seriver
De June 2022 à February 2023
Suresnes, Île-de-France, France

Contexte général

Contribution à la Data platform Servier : collection et intégration des données biomédical.


Description

Conception développement de solutions permettant aux utilisateurs de manipuler des données médicales, tout en assurant la sécurité et la robustesse des différentes interactions utilisateur :

- Collections des informations sur les données et création du dictionnaire de données

- Développement de la partie client (Rstudio, Jupyter) sous Compute engine. - Gestion des utilisateurs avec azure AD.

- Développement de l’infrastructure avec Terraform sous GCP.

- Migration de fichiers biomidical vers gcs et Bigquery

- Creation de dashboard avec Power BI

Terraform
JIRA
Google Cloud Platform (GCP)
Google BigQuery
Gestion des identités et des accès (IAM)
Python
Google App Engine
Microsoft Power BI
Git
JIRA
Data engineer
SERVIER
De June 2022 à February 2023

Contexte général

Contribution à la Data platform Servier à travers le project AXE : collection et intégration des données biomédical.


Description

Conception développement de solutions permettant aux utilisateurs de manipuler des données médicales, tout en assurant la sécurité et la robustesse des différentes interactions utilisateur :

- Collecte des informations sur les données et création du dictionnaire de données.

- Développement de la partie client (Rstudio, Jupyter) sous Compute engine.

- Gestion des utilisateurs avec azure AD.

- Développement de l’infrastructure avec Terraform sous GCP.

- Migration de fichiers biomédical vers gcs et Bigquery.

- Création de dashboard avec Power BI

Environnement technique : python37, GCS, SQL ,BigQuery, IAM ,Pubsub, Cloud function,Terraform, GitHub, Jira, PowerBI.

Data engineer
Auchan
De April 2021 à June 2022

Contexte général

Responsable Pays. Contribution au Data Lake Datapool par la collection et l’intégration des données magasins et sites


Description

Collecte data des magasins en mode batch et en streaming :

- Développement des pipeline d’intégration de données vers bigquery

- Conception de l’architecture Streaming et développement des cloud function pour intégrer les données sur firestore et datastore.

- Orchestration des équipes dans les pays envoyant les données de magasins.

Environnement technique : python37, Airflow, GCP, SQ

Ingénieur études et Développement
Davidson SI Nord
De April 2018 à April 2021
Région de Lille, France
Big Data Engineer & Backend developer
Decathlon France
De April 2018 à April 2021
Lille, Hauts-de-France, France

Contribution au Datalake Decathlon par la collection et l’intégration des données de la RFID.

Résponsable qualité de la Data des usines.

Dévelopement du Compteur mère (Service de génération des numéro de series sur le Tag RFID).

Data engineer
DECATHLON
De April 2018 à April 2021

Contexte général

Contribution au Datalake Decathlon par la collection etl’intégration des données de la RFID.


Description

Définir le dictionnaire de données en collaboration avec les data steward.

Développement de l’environnement et les micro services de collection et d’injection des données sur s3.

- Refaire l’application Mother counter qui permet la génération des numéros de séries imprimé sur la Tag RFID avec Spring boot et migration de la base de données oracle vers Postgres .

- Conception de Développement du microservice de collection et d’intégrations de données des usines en streaming.

- Accompagnement et suivi des usines capables d’envoyer des données de production.

- Intégrations des données sur le Datalake Decathlon, traitement et analyses de données dans l’univers AWS.

Environnement technique : Java8, SpringBoot, S3, Kensis, SQL ,Quicksight, Datastudio, Docker, Rancher, Kubernetes, cloudBerry, Jenkins, GitHub,ELK, Jira, confluence

Big Data Engineer & Backend developer
Decathlon France
De March 2018 à April 2021
Lille, Hauts-de-France, France

Contribution au Datalake Decathlon par la collection et l’intégration des données de la RFID.

Résponsable qualité de la Data des usines.

Dévelopement du Compteur mère (Service de génération des numéro de series sur le Tag RFID).

Ingénieur études et Développement
Davidson SI Nord
De March 2018 à April 2021
Région de Lille, France
Data Engineer- Développeur
VAKA
De April 2017 à November 2017
Région de Avignon, France

Amélioration d'un module de catégorisation en utilisant l'apprentissage supervisé et non supervisé en utilisant Azure Machine Learning ,et développement d'un module de recommandation.

tout en développant des compétences en analyse prédictive, mongoDb, Azure cognitive services , et développement NodeJs...

Data Engineer- Développeur
VAKA
De April 2017 à November 2017
Région de Avignon, France

Amélioration d'un module de catégorisation en utilisant l'apprentissage supervisé et non supervisé en utilisant Azure Machine Learning ,et développement d'un module de recommandation.

tout en développant des compétences en analyse prédictive, mongoDb, Azure cognitive services , et développement NodeJs...

Data engineer
VAKA
De February 2017 à October 2017

Contexte général

Contribution au développement de l’application d’automation d’articles.


Description

Mise en place de l’environnement Datalake sur Azure et implémentation des algorithmes ML.

Environnement technique : NodeJS, AzureML, Azure Cloud, Python2.7, MongoDb, SCRUM, Talend

Data engineer
VAKA
De May 2017 à September 2017

Missions :

Contribution au développement des API REST de l’application d’automatisation d’article. Gestion de l’écosystème Data autour de l’application.

Outils :

Java8, AzureML, Azure Cloud, Python2.7, MongoDb, SCRUM.

Développement et mise en oeuvre d'une application mobile de gestion des articles du journal ALM
Akwa Group
De July 2016 à September 2016
Préfecture de Casablanca, Morocco
Développement et mise en oeuvre d'une application mobile de gestion des articles du journal ALM
Akwa Group
De July 2016 à September 2016
Préfecture de Casablanca, Morocco
Développement et mise en oeuvre d'une application mobile de gestion des articles du journal ALM
Akwa Group
De July 2016 à September 2016
Préfecture de Casablanca, Morocco
Application web :gestion des articles journalistiques avec la framework Symfony
Akwa Group
De July 2015 à August 2015
Préfecture de Casablanca, Morocco
Application web :gestion des articles journalistiques avec la framework Symfony
Akwa Group
De July 2015 à August 2015
Préfecture de Casablanca, Morocco
Application web :gestion des articles journalistiques avec la framework Symfony
Akwa Group
De July 2015 à August 2015
Préfecture de Casablanca, Morocco