SEBASTIAN BUSTOS-CORDERO

Data Engineer | Data Science & Big Data | AI Automation

Cuenca, Azuay, Ecuador

About

Soy especialista en Soluciones de IA e Ingeniería de Datos con 8 años de experiencia en modelado de datos, construcción de pipelines ETL/ELT en entornos Big Data y automatización de flujos de información. Mi foco está en transformar datos en sistemas operativos inteligentes, donde los procesos se ejecutan de forma confiable, trazable y con mínima intervención humana. Trabajo desde el dato hacia arriba: cómo se modela, cómo fluye, cómo se transforma y cómo se usa para activar decisiones o procesos. He liderado soluciones que procesan más de 1.000 millones de operaciones diarias, integran más de 300 fuentes heterogéneas y reducen la intervención humana en un 98%. También he participado en proyectos que procesan más de 300 millones de registros al día, manteniendo SLA superiores al 99% en entornos de alta criticidad como financiero, retail y automotriz. Lo que mejor hago: Modelado de bases de datos y diseño de estructuras orientadas a analítica y alto volumen. - Construcción de pipelines ETL/ELT y procesos de agregación en entornos Big Data. - Automatización y orquestación de flujos de datos con manejo avanzado de errores. - Análisis de datos, regresión, clasificación y aplicación de modelos de Machine Learning. - Implementación de modelos de extracción de texto (OCR + ML) y agentes de IA para control y supervisión de flujos. Propuesta de valor: Diseño flujos y arquitecturas de datos que funcionan de forma casi autónoma, con automatización Zero-Touch y supervisión inteligente, permitiendo procesar volúmenes masivos de datos con alta disponibilidad y consistencia. Mi foco está en la eficiencia operativa, la calidad del dato y la capacidad de escalar sin fricción. Habilidades técnicas clave: Modelado de datos, MongoDB (Expert – Certified), Python, SQL, BigQuery, ETL/ELT, arquitecturas distribuidas AI-ready, Apache Spark, regresión y clasificación, LLMs (GPT, Gemini), agentes autónomos, Pinecone, OCR avanzado, Scikit-Learn, N8N, Docker, CI/CD, Git/GitHub, metodologías, Agile, Kanban Scrum y Operational Excellence.

Experience

  • SIDIS® Data Platform (Remote)
    • AI AGENTS & DATA SCIENTIST
      Oct 2025 - Present · 9 mos

      Liderazgo técnico en ecosistemas de agentes autónomos para optimización operativa en plataformas DMS/CRM enterprise. RESPONSABILIDADES CORE: - Diseño de agentic architectures para decision orchestration en tiempo real - Implementación de soluciones OCR avanzado (Cloud/On-Premise) con ML - Desarrollo de autonomous decision systems para workflows críticos LOGROS CUANTIFICABLES: - Reducción del 95% en intervención humana mediante agentes y workflows AI que evalúan escenarios y ejecutan decisiones autónomas. - Desarrollo de ecosistema de micro-agentes con error handling multicapa, garantizando continuidad operativa 24/7 con SLA del 99% - Lideré equipos cross-funcionales (Datos, DevOps, Producto) en migración hacia arquitecturas Zero-Touch

    • SENIOR DATA ENGINEER (BIG DATA & PIPELINES)
      Sep 2023 - Present · 2 yrs 10 mos

      Arquitectura y optimización de pipelines distribuidos para unificación de datos a escala enterprise con enfoque en Operational Excellence. RESPONSABILIDADES CORE: - Diseño e implementación de arquitecturas de datos AI-Ready para sectores Banca, Retail y Automotriz - Definición de mejores prácticas en modelado NoSQL y monitoreo de calidad - Implementación de resilient data architectures con compliance GDPR-ready LOGROS CUANTIFICABLES: - Orquestación de 1,000M+ operaciones mensuales procesando 300M registros/día sin supervisión manual mediante scalability by design - Eliminación del 85% de desperdicios digitales (redundancias, validaciones manuales, tiempos muertos), recuperando 1,000 horas/mes de capacidad operativa - Consolidación de infraestructura unificada integrando 1,000+ fuentes heterogéneas, habilitando Predictive Analytics at scale y personalización en tiempo real - Procesamiento de transacciones financieras para detección de anomalías con latencia <500ms en ambientes de alta criticidad

    • DATA ENGINEER & DATA SCIENTIST (JUNIOR)
      Oct 2022 - Sep 2023 · 1 yr

      Diseño de pipelines ETL/ELT resilientes con gestión avanzada de errores para sincronización crítica entre sistemas transaccionales. RESPONSABILIDADES CORE: - Apoyo en descubrimiento de datos, limpieza y análisis exploratorio (EDA) para modelos de ML - Implementación de workflows autogestionados con error handling multicapa - Reingeniería de procesos legados aplicando metodologías ágiles - Optimización de time-to-market mediante entregas incrementales LOGROS CUANTIFICABLES: - Integración de primeras 100 fuentes de datos externas a arquitectura central - Construcción de prototipos de automatización que sentaron bases para pipelines productivos actuales - Reducción de 20x en tiempos de procesamiento, transformando tareas manuales de 40h/semana en flujos autónomos de 2h con monitoreo KPI automatizado - Reducción del 60% en errores de sincronización mediante workflows autogestionados en N8N, alcanzando disponibilidad del 99.7% - Aceleración del 35% en tiempo de entrega mediante aplicación de principios de Operational Excellence y mejora continua

  • BUSINESS INTELLIGENCE & PROCESS ANALYST (JUNIOR) at TEDASA
    Sep 2020 - Apr 2022 · 1 yr 8 mos

    Aplicación de metodologías Lean Manufacturing y análisis de datos en 25 sucursales del sector automotriz para optimización operativa. LOGROS: - Levantamiento de procesos críticos - Implementación de herramientas digitales que eliminaron desperdicios operativos - Desarrollo de dashboards interactivos en Qlik Sense para análisis de KPIs operativos y toma de decisiones basada en datos - Gestión y análisis de datos mediante Excel Avanzado (tablas dinámicas, macros, análisis predictivo)

  • BUSINESS INTELLIGENCE & PROCESS ANALYST (JUNIOR) at kaizen
    Mar 2017 - Mar 2020 · 3 yrs 1 mo

    Aplicación de metodologías Lean Manufacturing y análisis de datos en 25 sucursales del sector automotriz para optimización operativa.