Faouzia

Developer , Data scientist

Informations

Compétences

Technos

  • Analyse de données
  • Java
  • Machine Learning
  • Python
  • Text Mining
  • Voir plus
  • Voir moins

Métier

  • Big data
  • Programmation neurolinguistique (PNL)
  • Science des données
  • Services web
  • Voir plus
  • Voir moins

Expériences (16)

Data analyst
StarClay-Nature et Découvertes
Depuis May 2017

Projet Crowfunding et recommandation des produits :

o Crawling des données

o Préparation et analyses

o Traitement, recommandation, rapprochement des données textuelles

o Dashboard, visualisation, parallélisation.

o Développement, architecture Big Data.

Environnement technique : Python, scikit-learn, Nifi, Kibana, Elasticsearch

Associé gérant
AnalyticsGO
De November 2019 à December 2019
Région de Lille, France

Développement mobile Android, cryptographie, web et web mobile

https://play.google.com/store/apps/details?id=yessad.smscoder

Networks analysis
CAMAIEU INTERNATIONAL
De February 2019 à April 2019
Data Scientist
CGI FINANCE (Financeurs Créatifs)
De September 2018 à December 2018
Région de Lille, France
Data scientist
CGI Finance
De September 2018 à December 2018

Prédiction des prix de voitures d'occasion.

Analyse statistique des données

Application des méthodes de régression.

Environnement technique: Python, pandas, scikit-leanr, java, PMML.

Data Scientist
StarClay
De September 2016 à March 2018

2016 / Engie

• Machine Learning on electric load curves

      Modeling customers' thermo-sensitivity

     * Technical environment: Python

2016 / Groupe Renault

• Project Assistance to the forecast of the Italian and English car market

    Articles scraping from automotive market web sites

     Text mining: Analysis of the online articles.

     Stemming, POS tagging, dependency parsing,

     Extraction of professional opinions and their projections over time.

     Extraction and Annotation of named entities NER & NEA

     Results visualization

     Participation in the Response to the Tender for proposal Call

     Documentation: bibliographic research and implementation of the most recent paper about the feelings analysis

    

• Project Analysis of opinions on the diesel market

     Web crawling

     Natural Language Processing: Analysis of feelings and opinions

     Dataviz: graphical presentations of the results

     * Technical environment: Python, Neo4j, Java, CoreNLP, NLP, NLTK,

SentiWordNet, py2neo

2016-2017 / Lexis Nexis

• Project of Jurisprudence Documents Rapprochements

      XML documents parsing

      Data preparation

      Extraction and choice of features , features reduction

     Machine learning algorithms application: documents rapprochement, cosine similarity and KNN

     * Technical environment: Python, scikit-learn, java, spark MapReduce and spark MLlib

2016-2017 / Nature et Découvertes

• Crowfunding and product recommendation

      Data scraping

      Preparation and data analyzes

      Data processing, recommendation, textual data rapprochement

      Dashboard, visualization, parallelization.

      Development, Big Data architecture.

      Natural Language Processing

      * Technical environment: Python, scikit-learn, Nifi, Kibana, Elasticsearch.

Data scientist
StarClay-Lexis Nexis
De October 2016 à April 2017

Rapprochement des documents jurisprudence

o Parsing des documents XML

o Préparation des données

o Extraction et choix des features, réduction des caractéristiques

o Applications des algorithmes de machine learning : rapprochement des documents, cosinus similarité et KPP

Environnement technique : Python, scikit-learn, java, spark MapReduce et spark MLlib

Consultant
StarClay-Renault
De July 2016 à December 2016

Aide à la prévision du marché automobile Italien et Anglais :

o Crawler des articles des sites spécialisés sur le marché automobile

o Text mining : Analyse des articles online.

o Stemming, POS tagging, dependency parsing,

o Extraction des avis des professionnels et leurs projections dans le temps.

o Extraction et Annotation d’entités nommées NER & NEA

o Visualisation des résultats

o Participation à la Réponse Appel d’Offre

o Documentation : recherche bibliographique et implémentation du papier le plus sur l’analyse des sentiments

Projet Analyse des opinions sur le marché du diesel

o Crawler le web

o Natural Language processing : Analyse de sentiments et des opinions

o Dataviz : présentations graphiques des résultats

Environnement technique : Python, Neo4j, Java, CoreNLP, NLP, NLTK, SentiWordNet, py2neo

Consultant
StarClay-Engie
De July 2016 à December 2016

Machine Learning sur les courbes de charge

=> Modélisation de la thermo-sensibilité des clients

Environnement technique : Python

Data science
Mediabong
De March 2016 à August 2016
Région de Paris, France

• Setting up a video matching system (advertising or tutorial) and news online articles

       Crawling online articles

       Preprocessing and data preparation (cleaning, standardization)

       Graph building from a large textual dataset

       Using supervised learning algorithms for themes prediction; analysis and choice of the best results

       Proposal of a new unsupervised matching algorithm based on the graph

       Proposal of a new metric of similarity that gives a better result that cosine similarity

       Results validation was done by MediaBong users

       * Technical environment: Python, BeautifuSoup, py2neo, Neo4j, Cypher, MongoDB, scikit-learn, Maui

       * Publication: Communication; Junior Conference on Data Science and Engineering: Faouzia YESSAD,

Khalid MEHL and Albert BIFET. Pairing Online News Articles to Videos using Graph Minging. 2016

Stage
MediaBong
De January 2016 à July 2016

Mise en place d’un système de rapprochement entre les vidéos (publicitaires ou tutorial) et les articles d’actualité en ligne

o Crawling des articles en ligne

o Prétraitement et préparation des données (nettoyage, normalisation)

o Construction d’un graph à partir d’un grand ensemble de données textuelles

o Utilisation des algorithmes d’apprentissage supervisé pour la prédiction de la thématique ; analyse et choix de meilleurs résultats

o Proposition d’un algorithme de rapprochement non-supervisé basé sur le graph

o Proposition d’une nouvelle métrique de similarité qui de meilleurs résultats que cosinus similarité

o Validation des résultats a été faite par les utilisateurs

Environnement technique : Python, BeautifuSoup, py2neo, Neo4j, Cypher, MongoDB, scikit-learn, Maui

Stage
Altran research
De July 2015 à December 2015

Prédiction de la satisfaction des clients et proposition d’amélioration de la marge sur le projet. Prévision de la vie d’un projet dans la phase Go/NoGo.

o Prétraitement et préparation des données sur les projets Altran France 2014 et 2015. Ces données ont été accompagnées d’enquêtes de satisfaction client.

o Parser des données semi-structurées XML, analyse des données et choix des patterns importants

o Netoyage des données, extraction des features

o Utilisation des méthodes de machine learning (supervisée ou non) : SVM, arbre de décision, K-means et K plus proches voisins

o Proposition d’une méthode hybride pour la prédiction de la satisfaction des clients.

Data science
Altran France
De November 2014 à September 2015

• Customer satisfaction prediction and proposal for improvement of margin on the project.  Predicting the project life in Go / NoGo phase.

      Preprocessing and preparation of Altran France data between 2014 and 2015. These data were accompanied by surveys of customer satisfaction.

      Parse XML semi-structured data, data analysis and choice of the most important patterns

      Data cleanup, feature extraction

      Use of machine learning methods (supervised or not): SVM, decision tree, K-means and K nearest neighbors

      Proposal of a hybrid method for predicting a customer satisfaction

      Processing of PostMortem France in 2014 and forecast of the liveliness of the project from a Go / NoGO analysis

      Project management: Follow-up of a team of consultants, tasks distribution, results discussion

     

* Technical environment: Python, scikit-learn, Java, Weka, Apache POI, xslt and Xpath, text mining, regression.

TransPerfect
Consultant
De January 2015 à June 2015

Traduction automatique.

o Réalisation de la mémoire de traduction Anglais-Français à partir d’une grande base de données

o Extraction d’entité nommées NER (Named Entity Recognition)

o Crawling sur le web et recherche d’une traduction faite par l’humain à partir des mots clefs pertinents et NE.

Environnement technique : Java

Autres projets

o Web : développement d’une interface interactive pour la réservation des places de théâtre.

o Extraction de connaissances à partir de données semi-structurées

o Traitement d’images, OpenCV

o Enseignement des mathématiques, classe scientifique terminal (plus d’un an d’expérience)

Publication: Communication; Junior Conference on Data Science and Engineering: Faouzia YESSAD, Khalid MEHL et Albert BIFET. Pairing Online News Articles to Videos using Graph Minging. 2016

Technology Developer
TransPerfect
De March 2015 à May 2015
Région de Paris, France

• Automatic translation.

       Realization of an English-French translation memory from a large database

       Named Entity Recognition (NER)

       Crawling on the web and search for a human-made translation from the relevant keywords and NE.

Web Developer
FesThea
De January 2013 à January 2013
Picardie, France

Tickets online reservation

Room visualization and reservation with click on it