Dylan Youmbi

[+5k ] Data Engineer Spark & Python | Airflow | Fabric | Databricks | Superset

Paris, Île-de-France, France

About

Data Engineer | Spark • Airflow • AWS • SQL• Fabric• Databricks Data Engineer avec plus de 5 ans d’expérience dans le développement et l’orchestration de pipelines de données scalables. Spécialisé dans le traitement de données massives (Spark, Python, SQL), l’automatisation des workflows (Airflow) et la mise en qualité des données. Interventions sur : - ingestion et transformation de données multi-sources (IoT, marketing, finance), - mise en place de KPI métiers et dashboards, - monitoring, data quality et documentation, - environnements Cloud AWS. Objectif : Récupérer et transformer la donnée brute en insights fiables et actionnables. [email protected] ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ Data Engineer with over 5 years of experience in designing and orchestrating scalable data pipelines. Specialized in large-scale data processing (Spark, Python, SQL), workflow automation (Airflow), and data quality management. Key areas of expertise include: - Ingestion and transformation of multi-source data (IoT, marketing, finance), - Definition and implementation of business KPIs and dashboards, - Monitoring, data quality assurance, and documentation, - Cloud environments on AWS. Goal: ingest and transform raw data into reliable and actionable insights.

Experience

  • Consultant Data Engineer at Direction générale des Finances publiques
    Oct 2025 - Present · 9 mos

    Projet OneVison : Offrir une vision globale et unifiée des dettes et crédits des usagers & entreprises sur le plan national • Analyse fonctionnelle des besoins des services de recouvrement (SGC, SIE, Trésoreries Amendes, produits divers) • Collecte, transformation et consolidation de données fiscales au sein du Datalake expérimental (HUE) • Modélisation des données débiteurs / créditeurs pour les personnes morales de droit privé • Mise en place de règles métiers visant à qualifier les flux et à détecter les incohérences • Conception de KPIs pour le suivi du recouvrement, des restes à recouvrer et des excédents • Développement de tableaux de bord sur Tableau pour restitution auprès des agents • Contribution à la démonstration de la faisabilité technique d’un outil national • Participation à l’expérimentation sur plusieurs départements (17, 95, 91) et analyse des retours utilisateurs Environnement Technique SQL, Python, Power BI, Datalake, Git, Linux , Hue , Jupyter , Bash , Cron table , Tableau, Spark Projet Pilot'Acceuil: L’enjeu consiste aujourd'hui à rendre plus accessible les données relatives au métier de l’accueil et à les regrouper en une seule interface pour mieux les analyser, les interpréter et piloter l'activité d'accueil au niveau des services, des directions, des inter-régions et au national.

  • Data Analyst / Data Engineer at Amoddex
    Sep 2025 - Present · 10 mos

    Amoddex est un cabinet de conseil spécialisé dans le management des systèmes d’information et l’accompagnement des stratégies de sourcing.

  • Consultant Data engineer at Fitbra
    Nov 2024 - Apr 2025 · 6 mos

    • Création et gestion d’une boutique Shopify (design, intégration de produits, personnalisation de • Analyse des performances à l’aide de Google Analytics et des outils de suivi Shopify. • Gestion des commandes, relations clients et suivi logistique. • Collecte, structuration et traitement des données issues de Shopify, Facebook Ads et Google Ads pour mesurer l’efficacité des campagnes marketing • Développement d’un pipeline de traitement Big Data sous Databricks pour l’analyse des ventes e-commerce (ingestion S3, transformation PySpark, stockage Delta Lake) • Orchestration des workflows avec Apache Airflow pour automatiser l’ingestion et le traitement des données. • Analyse avancée des performances avec Google Analytics, mise en place de KPIs pour le suivi des conversions et du ROI des campagnes • Création de tableaux de bord interactifs sous Power BI pour visualiser les ventes, le comportement des clients et les performances marketing Outils utilisés : Shopify , Facebook Ads Manager, Google Ads , Google Cloud Console , Canva ,Google Analytics

  • Consultant Data Engineer at SOCOTEC
    Sep 2022 - Nov 2024 · 2 yrs 3 mos

    En tant que Data Engineer chez SOCOTEC Gestion, j’ai contribué à la structuration, l’automatisation et l’exploitation des données stratégiques de l’entreprise. Mon rôle englobait la gestion des flux de données, l’optimisation des infrastructures techniques et la mise en place de solutions analytiques avancées. 🔹 Principales missions : Développement & Intégration de données : Extraction, transformation et chargement des données (ETL) via Apache Spark, Microsoft Dynamics 365, API et SFTP. Alimentation du Datawarehouse & Datalake : Participation à la construction du Datalake, modélisation et centralisation des données pour améliorer leur exploitation. Orchestration & Supervision : Gestion des infrastructures techniques (Spark-Master, Rancher, Apache Airflow) et pipelines ETL garantissant la fiabilité et la disponibilité des données. Analyse & Reporting : Conception et développement de tableaux de bord interactifs sous Power BI, en lien avec les besoins métier. Documentation & Maintenance : Rédaction de documentations techniques et accompagnement des mises en production. Collaboration Métier : Collecte des besoins auprès des différentes Business Units (BU) et interaction avec les équipes Data Science. 📌 Projets Clés : ✅ Projet Ciblage Marketing Développement d’un pipeline de données pour optimiser le ciblage des campagnes marketing en consolidant les données de plusieurs sources (CRM via API, SFTP, bases de données, MDM). Automatisation du traitement des fichiers hétérogènes par regex et fichiers de configuration, puis chargement dans Oracle pour exploitation via Power BI. ✅ Projet Consolidation Refonte du processus de chargement des tables dans Microsoft SQL Server en migrant des données depuis Oracle SQL. Traitement des données avec Apache Spark pour assurer la performance et l’intégrité des données avant ingestion. ✅ Projet Atelier de Données Mise en place d’une application centralisée de visualisation de dashboards avec RLS

  • Assistant Technique Python at PROLAB
    Apr 2024 - Sep 2024 · 6 mos

    • Suivi Régulier : Accompagnement continu des porteurs de projets pour assurer le bon déroulement de leurs initiatives. • Fourniture de Solutions Informatiques : Développement et mise à disposition de solutions technologiques adaptées aux besoins spécifiques des projets. • Conseil et Orientation : Assistance dans la définition des objectifs et des stratégies des projets pour garantir leur succès. • Support Technique Complet : Offre d'une assistance technique globale pour toutes les phases de réalisation des projets.