Colomba V.

Data engineer (Azure/databricks) | Unity Catalog, Azure DevOps

Aix-en-Provence, Provence-Alpes-Côte d'Azur, France

About

Mon blog : https://medium.com/le-blog-de-lapprentissage-automatique #java #MOA #gestionprojet #productowner #datascience #machinelearning #deeplearning

Experience

  • Senior Data Platform Engineer | Azure | Databricks | PySpark at Cityway
    Mar 2021 - Present · 5 yrs 4 mos

    1. Conception & architecture - Design de plateformes data Azure (Databricks, Data Factory) - Définition des architectures pipelines scalables et maintenables 2. Data engineering - Développement de pipelines batch avec PySpark (Databricks) - Optimisation performance et coûts 3. Orchestration - Mise en place de workflows avec Azure Data Factory - Gestion des dépendances et scheduling 4. Gouvernance & qualité - Structuration des données (modélisation, qualité, traçabilité) - Mise en place de bonnes pratiques data 5. Restitution - Exposition des données via Power BI - Collaboration avec équipes métier 6. Industrialisation - CI/CD avec Azure DevOps - Automatisation des déploiements

  • Data scientist (formation) at Openclassrooms Centrale-Supélec
    Jan 2020 - Dec 2020 · 1 yr

    Formation comportant 7 projets professionnalisant : Projet 1 : Concevez une application au service de la santé publique Analyse de données exploratoire, Feature engineering Projet 2 : Anticipez les besoins en consommation électrique de bâtiments Modèles d’apprentissage supervisé : EDA, cleaning, features engineering, évaluation des performances, sélection des features importantes, optimisation des hyperparamètres (gridsearch, optimisation bayésienne, …) Projet 3 : Segmentez des clients d'un site de e-commerce Modèles d’apprentissage non supervisé. Adapter les hyperparamètres d'un algorithme non supervisé afin de l'améliorer, évaluer les performances d’un modèle d'apprentissage non supervisé, mettre en place le modèle d'apprentissage non supervisé adapté au problème métier, transformer les variables pertinentes d'un modèle d'apprentissage non supervisé, suivi des flux avec des diagrammes de Sankey Projet 4 : Catégorisez automatiquement des questions (de manière supervisée ou non) Projet pour la mise en place de NLP Prétraiter des données non structurées pour obtenir un jeu de données exploitable, mettre en œuvre des techniques d’extraction de features pour des données non structurées, représenter graphiquement des données à grandes dimensions, mettre en œuvre des techniques de réduction de dimension Création d’un point d’API (FastAPI, serveur Uvicorn, Test avec Postman) Projet 5 : Classification d'images Elaboration d'un réseau de neurone CNN "maison", mise en place de la data-augmentation sur le modèle construit, utilisation de réseaux existant avec transfer learning. Livrairies utilisées : Keras Projet 6 : Développez un POC à partir d’un papier de recherche récent Choix du sujet : Fixres de Facebook Research => Data augmentation. Librairie utilisée : Tensorflow Projet 7 : Participation à une compétition Kaggle Compétition : Riiid !

  • PROLOGIA (6 yrs 3 mos)
    • Chef de projet informatique / Product owner
      Mar 2014 - Mar 2019 · 5 yrs 1 mo

      Projet Bamboo (ensemble de solutions qui permet, entre autres, l’adéquation optimale entre la charge de travail à effectuer, les ressources à engager et leur organisation avec pour objectif d'avoir une bonne prévision, planification et gestion des ressources) Mes principales missions : - Suivi de plusieurs projets clients, - Etude du besoin client, mise en place de devis, rédaction de fichiers de spécifications - Planification des ressources partagées avec 2 autres chefs de projets - Veille au respect des normes qualité sur mes projets - Formation des clients - Animation de clubs utilisateurs et d'ateliers avec différents clients et prospects - Suivi d'un projet interne de refonte du logiciel avec la méthode agile, rédaction des stories, relation avec les prestataires externes (également rôle de product owner sur ce projet) - Participation aux développements java si nécessaire - Définition et paramétrage des compteurs RH

    • Ingénieur Analyste développeur (en prestation)
      Jan 2013 - Mar 2014 · 1 yr 3 mos

  • Scala (En prestation chez Experian-Prologia) (Marseille)
    • Consultante Fonctionnel domaine bancaire
      Feb 2012 - Dec 2012 · 11 mos

      Projet Tallyman pour Vivalis (banque marocaine, Casablanca) – Progiciel de recouvrement de créances. - Etude du besoin client afin d’adapter la version « générique » de Tallyman à la gestion du recouvrement des créances propre à cette banque, - Support client (réunion quotidienne), - Rédaction des fichiers de spécifications. - Implémentation des spécificités du client, - manipulation de la base de données (requêtes SQL, dumps,…) - Formations du client (utilisation de Tallyman, phase d’UAT, formation des formateurs, rédaction manuel utilisateur), - Formations internes (utilisation de l’outil, mise en place des tests unitaires, …). Pour cette mission, j'ai suivi deux formations en anglais : - Formation des formateurs - Formation sur les méthodologies, les stratégies du recouvrement de créances. Compétences acquises : Suivi de projet, suivi et support client, création de supports de formation et méthodologies pour former.

    • Ingénieur Informatique
      Nov 2010 - Jan 2012 · 1 yr 3 mos

      Projet LOGIC - progiciel d'instruction de prêt immobilier pour la banque postale. Mes missions principales étaient : - rédaction de spécifications - développement d'évolutions et de corrections d'anomalies - rédaction de cahiers de recette et passage de tests - développement de la partie "éditions"

  • Ingénieur Informatique at Motricity
    Dec 2008 - Aug 2010 · 1 yr 9 mos