Víctor Manuel Rodríguez Moreno

Big Data and Senior Data Engineer

Greater Madrid Metropolitan Area

About

Soy un Ingeniero Informático con mas de diez años de experiencia profesional desarrollada en su mayoría en el ámbito de desarrollo de software. He trabajado para grandes proyectos en sectores que van desde la banca hasta las grandes compañías TELCO. Empresas como ISBAN, Banco Santander, Indra, Telefónica, Carrefour, Grupo Prisa, etc. Soy un profesional inquieto, tratando siempre de estar en contacto con las nuevas tecnologías y lenguajes de programación. Actualmente centrado en las tecnologías del mundo Big Data, la toma de decisiones y soluciones. Pienso que el mundo Big Data es como un triángulo donde cada uno de los tres lados son Arquitecturas, Desarrollo y Machine Learning. Mi idea es que hay que posicionarse en un punto central adquiriendo conocimiento de todas ellas para luego poder especializarse en la que nos sintamos más fuertes. Por ello. con una fuerte base en desarrollo, actualmente estoy enfocado en la ampliación y asentamiento de conceptos más profundos de entornos Cloud, sobre todo AWS y Google Cloud Platform, y Machine Learning, modelos, cuándo aplicarlos y cómo hacerlo. Para poder acercarme a este objetivo estudie el Master en Big Data y Data Scientists, adquiriendo una base sobre dichos conocimientos.

Experience

  • Senior Data Engineer at Clarity AI
    Oct 2021 - Present · 4 yrs 10 mos

    Durante mi etapa más reciente he trabajado en el diseño e implementación de una data platform moderna basada en una arquitectura Medallion, ingiriendo datos desde múltiples fuentes hacia un data lake y data warehouse. Para ello he utilizado: ETLs desarrolladas con Pandas y Dask Airflow sobre Kubernetes para la orquestación de pipelines, lanzando contenedores desplegados en AWS ECS S3 como sistema de almacenamiento de objetos Snowflake como data warehouse GitLab CI/CD para testeo, construcción y despliegue automatizado de imágenes Validación y control de calidad de datos con Pandera, Soda y JSON Schema DBT para la integración y transformación de datos en Snowflake Además, participé en la optimización de procesos de datos que originalmente no escalaban en Pandas, migrando de ETL a un enfoque ELT para aprovechar el rendimiento de Snowflake en las transformaciones. También contribuí en tareas de ingeniería de software, aplicando principios de Domain-Driven Design (DDD), arquitectura hexagonal, y trabajando con SQLAlchemy y Streamlit para construir interfaces y servicios desacoplados y robustos.

  • Big Data Specialist at StratioBD
    Mar 2016 - Oct 2021 · 5 yrs 8 mos

    Como Big Data Specialist he participado en el diseño y desarrollo de decisiones sobre ingesta de datos desde los distintos tipos de orígenes de datos (OLTP, structured, semi structured and unstructured data) hacía data sinks (data lakes, data warehouses). Para ello he hecho uso de ETL, ELT y EL para que los datos queden preparados de la manera más óptima y eficiente para que distintos stakeholders( Data Scientist, BI dashboards, otros data ware houses) puedan hacer un uso correcto de los mismos. He trabajado siempre en un entorno de trabajo basado en Metodologías Ágiles para proyectos del sector financiero, de comunicaciones y retail. El stack tecnológico que he usado: - Entornos: Cloudera on-premise, Google Cloud Platform on cloud - Procesamiento distribuido: Apache Spark 2+ (Batch y Streaming), Cloud Dataproc para ejecución de Spark en Google Cloud Platform. - Streaming Distribuido: Apache Kafka y Apache Kafka Connect. - Storage/Data Warehouse/Data Lake: HDFS, Google BigQuery, Apache Cassandra, Google Storage, Apache Hive, Apache Kudu, Apache Impala, PostgreSQL - Gestor de dependencias: Maven - Repositorios: Git con Git Flow - Lenguajes: Scala, Java, Shellscript. - Orquestador: Control-M

  • Analista Programador BIG DATA at GFT Technologies SE
    Mar 2015 - Mar 2016 · 1 yr 1 mo

    Trabajando como BigData Developer para el proyecto regulatorio Völcker del Deutsche Bank. Se obtienen datos de diferentes sistemas operacionales que se ingestan en el data lake. Con los datos raw obtenidos se diseña y enriquece un data warehouse que sirve como punto de partida para el cálculo de las diferentes métricas para realizar los reportes a entregar. Herramientas Big Data: - Hadoop - MapReduce - HDFS - Pig - Sqoop - Hive - Orquestación oozie - Entorno Cloudera - Metodologías Ágiles: Scrum - Lenguajes de Programación: Java, Shellscript Otras herramientas: - Shell Script UNIX - SVN - Putty - WinSCP

  • Arquitecto Software Telefónica Telco 3.0 at Entelgy
    Sep 2013 - Sep 2014 · 1 yr 1 mo

    Arquitecto Software en la capa de Presentación del proyecto de Telefónica Telco 3.0. Se ofrecen al proyecto distintos tipos de arquitecturas. - Arquitecturas basadas en Portlets con Vaadin + Liferay. - Arquitecturas basadas en Portlets con JSF + Liferay. - Arquitecturas basadas en Servlet con JSF + PrimeFaces - Arquitecturas Rest JSON + Servicios, Spring MVC Se opta por las arquitecturas Portal y en concreto Vaadin + Liferay. Una vez determinada la arquitectura se trabaja en una metodología para la Capa de Presentación y se crean Arquetipos Mavenizados que se utilizan para para la industrialización de los distintos proyectos de Telco 3.0 Las funciones desarrolladas son: - Establecer la arquitectura de la Capa de Presentación para el proyecto Telco 3.0 - Proporcionar las herramientas necesarias para la comunicación con el resto de las Capas del Proyecto (Bus, Núcleo, etc) - Industrializar y Mavenizar la Capa de Presentación para hacerla óptima en la Integración Continua del Proyecto. Tecnologías: - Capa de Presentación Liferay, JSF, Vaadin - Maven con Plugins como Metro, Jaxb, Coberture,

  • Analista Programador at TCP Sistemas e Ingeniería
    May 2013 - Sep 2013 · 5 mos

    Tratamiento de las operaciones del banco y persistencia de la información obtenida. Herramientas: Jaxb, xml, JPA, Hibernate, Oracle 11g