Joaquin S. Espinoza Rios

Data Team Leader | BI | ETL | Big Data | Cloud | Azure | GCP | AWS

Peru

About

Profesional con pasión por el mundo de los Datos (ETL, Datamart, Data Warehouse, Data Lake y Data Verse ), Tecnologías Cloud (Azure, GCP, AWS) y herramientas BI (Power BI, Tableau, Pentaho, QlikView, QlikSense). Durante mi experiencia he desarrollado e implementado proyectos de Integración de Datos, configuración de Infraestructura para Datos y BI; teniendo en consideración el uso de herramientas de versionado, auditoria, UX/UI y testing. Asimismo, he aportado valor desde la concepción del modelo de datos hasta el nacimiento de una única fuente de verdad; pasando por diversas herramientas de Data Exploitation, Data Discovery, Self-Service BI, Data Profiling, hasta la obtención de indicadores de desempeño (KPI). Me considero creativo, analítico y con una curva de aprendizaje leve al momento de abordar retos.

Experience

  • Data Team Leader at Indra
    Feb 2024 - Jan 2025 · 1 yr

    • Definición del stack de herramientas para integración y almacenamiento de datos. • Capacitar recursos en ADF y Cosmos DB para MongoDB vCore, con la finalidad de iniciar los desarrollos de integración. • Definir, validar esquematica, unicidad e integridad dentro del modelo de datos (NoSQL) de Clientes para procesos de conciliacion y migracion • Coordinar con infraestructura y microservicios para definición de desarrollos. • Analizar, construir e implementar integraciones mediante pipelines de datos. • Integraciones con Salesforce, SAP y diversas fuentes de FARECO y PREBILLING • Creación de Scripts PyMongo para integrar Cosmos DB y ADF mediante agregaciones Tecnologías: Azure Cloud, Storage Account, Blob Storage, Azure Files, Azure Data Factory (ADF), Azure Cosmos DB para MongoDB (vCore & RU), Azure Batch, Batch Account, Python (PyMongo), Azure DevOps, TMForum

  • Big Data Engineer at Indra
    Oct 2023 - Dec 2023 · 3 mos

    • Ingesta de CDRs de tráfico móvil (tasado y cursado). • Crear DAGs para ingesta de CDRs(XML, Parquet, Avro) hacia Hive • Creación de plug-ins para custom operators de lado de ingesta. • Análisis y Desarrollo para Dags basados en dependencia y PMR para Claro Club. • Análisis para iniciar desarrollo del reemplazo de Configurador Tecnologías: Spark, Hue, YARN, Hive, HDFS, Apache Airflow, Linux, Apache NiFi, PySpark

  • Senior Data Engineer at Vooxell
    May 2021 - Oct 2023 · 2 yrs 6 mos

    • Líder Técnico dentro de la Tribu Data para los Squad MIS GCP Reloaded y BAU Contactabilidad en Rimac Seguros • Ingeniero de datos senior para el proyecto Plan Tech Core en Rimac Seguros • Manejo temas del lado de Backend con GCP, aprovisionando estructuras de datos dentro del ecosistema construido. • Optimización de pipelines y modelos de datos, en pro de reducir la facturación y manejo efectivo de recursos dentro del ecosistema construido. • Elaboración de POCs para adicionar valor al Squad y QA. • Deconstruir consultas desde Power BI, para el proceso de mapeo de datos. • Construcción de integración para monitoreo de dashboards usando Power BI REST API y Power Automate. • Validación de Datos del lado AWS hacia GCP. • Automatización de consultas mediante scripting con Python (DAG - Directed Acyclic Graphs) en Apache Airflow para ingesta masiva; a partir de pipelines de datos. Tecnologías: Data Lake, Modelamiento de Datos, Azure, Google Cloud Plataform (Cloud Composer, Cloud Storage, Cloud functions, Cloud Runs), Apache Airflow, Amazon Redshift, Git, GitLab, Python, Power BI, Power BI REST API, Power Automate

  • Senior Data Engineer at MDP CONSULTING S.A.C
    Mar 2021 - May 2021 · 3 mos

    • Levantamiento de necesidades de las jefaturas de una importante empresa de trenes. • Modelamiento de datos, Definición de alcances y requerimientos para la adecuación de un Data Warehouse con SQL Azure • Optimización y personalización de procesos ETL con Azure Data Factory (Blob, Pipelines, Data Flow) • Creación de Dashboards con Tableau, implementando RLS – Row-Level Security, conectándose a un modelo de datos en SQL Azure. Tecnologías: Modelamiento de Datos, SQL Azure, Dataprep, SQL Server, Data Flow, ETL, Azure Data Factory, Tableau, Tableau Server

  • Technical Leader at 4bitech
    Aug 2020 - Dec 2020 · 5 mos

    • Modelamiento de datos • Definición de alcances y requerimientos para la creación de un Data Warehouse con las herramientas de Google Cloud Plataform, • Creación, modelamiento, optimización y personalización de procesos ETL con Python para la ingesta de las diversas fuentes (Oracle Exadata, SQL Server, MySQL, PostgreSQL). • Construcción de procedimientos almacenados para la consolidación de información y cifrado de datos en BigQuery • Centralización de operaciones provenientes de fuentes on-premise y cloud. • Programación de jobs de ejecución de los datos consolidados con Dataprep. • Programación de soluciones en Python (Dataframes) para Data Enhancement • Creación de Dashboards con Tableau, implementando RLS – Row-Level Security, dentro de GCP, conectándose a un modelo de datos en BigQuery. Tecnologías: Modelamiento de Datos, Oracle Exadata, Google Cloud Plataform, Dataprep, SQL Server, MySQL, PostgreSQL, Data Warehouse, ETL, Python, Tableau