Carlos Muñoz-Romero

Cofounder @ Monoceros Labs & Fonos | Innovation | Generative & Conversational AI

Madrid, Community of Madrid, Spain

About

Como profesional multidisciplinar, cuento con más de 20 años de experiencia en innovación tecnológica, desarrollo de productos digitales, inteligencia artificial y gestión de equipos. Mi carrera ha estado marcada por la creación y liderazgo de proyectos innovadores en áreas tan diversas como la tecnología del habla, la inteligencia artificial generativa y la producción audiovisual. Al frente de Monoceros Labs, he impulsado la creación de experiencias conversacionales personalizadas para grandes empresas y medios de comunicación, aplicando IA generativa y modelos de Machine Learning. Como cofundador y CTO en Fonos, soy responsable del desarrollo de soluciones de voz sintética de última generación, enfocadas en la diversidad del español y lenguas cooficiales, permitiendo a empresas y creadores conectar con sus audiencias de manera única y escalable. Mi experiencia abarca desde la dirección de departamentos de innovación en grandes corporaciones, como BEEVA (actualmente BBVA Technology), hasta la fundación de startups que exploran las intersecciones entre la tecnología y la creatividad. He gestionado proyectos de alta complejidad en campos como el machine learning, la realidad aumentada y el diseño de interfaces conversacionales, siempre con un enfoque en la accesibilidad y la inclusión digital. Mi trayectoria se caracteriza por una visión estratégica a largo plazo, la capacidad de liderar equipos multidisciplinares en entornos de alta incertidumbre y mi pasión por aplicar tecnologías emergentes para resolver desafíos reales. Con una sólida formación en tecnología y negocios, combino el conocimiento técnico con una perspectiva de negocio orientada a la innovación y la creación de valor.

Experience

CEO & Co-founder at Monoceros Labs
Nov 2017 - Present · 8 yrs 8 mos
En Monoceros Labs somos un equipo dedicado a la innovación en tecnologías del habla y la inteligencia artificial conversacional, con un enfoque en la creación de experiencias personalizadas de voz y desarrollo de productos digitales. Nuestra misión es aplicar estas tecnologías emergentes para mejorar la interacción entre humanos y máquinas, y hacer el mundo digital más accesible e inclusivo. Al frente de Monoceros Labs, hemos formado parte de proyectos innovadores que abarcan desde la síntesis de voz personalizada (text-to-speech) hasta el diseño de experiencias multimodales para asistentes virtuales como Amazon Alexa y Google Assistant. Entre nuestros hitos más destacados está la creación de modelos de voz sintética de última generación para empresas como RTVE y Prisa Media, ayudando a estas organizaciones a ampliar su alcance mediante nuevas formas de interacción con sus audiencias. Además, hemos sido reconocidos como agencia destacada por Amazon Alexa en España, lo que nos ha permitido lanzar aplicaciones de voz en mercados de habla hispana, incluyendo España, México y Estados Unidos. Nuestras soluciones han sido utilizadas por millones de usuarios. La innovación en Monoceros Labs no se limita a la tecnología; también exploramos cómo las personas interactúan con las interfaces de voz, lo que nos ha impulsado a desarrollar productos más accesibles y fáciles de usar. Asimismo, aplicamos modelos de IA generativa en nuestras soluciones, lo que nos permite automatizar la creación de contenido y mejorar continuamente la experiencia del usuario. Mi papel como CEO implica no solo la dirección estratégica, sino también la gestión de I+D en tecnologías como el procesamiento del lenguaje natural (NLP) y la inteligencia artificial conversacional. En Monoceros Labs, trabajamos con empresas innovadoras para construir productos que aprovechen las tecnologías emergentes, siempre con un enfoque en hacer el mundo digital más inclusivo y eficiente.
Chief Technology Officer & Co-Founder at Fonos
Jan 2023 - Present · 3 yrs 6 mos
Como CTO y cofundador de Fonos, soy responsable del desarrollo tecnológico de una plataforma innovadora para la creación de contenido digital mediante voces sintéticas especializadas en la diversidad lingüística del español y las lenguas cooficiales. Mi responsabilidad principal ha sido diseñar y gestionar la implementación de modelos generativos de voz de última generación, que no solo permiten reproducir diferentes variedades del español —incluyendo acentos regionales como el andaluz— sino que también ofrecen la posibilidad de clonar voces para su uso en múltiples idiomas, como inglés, alemán o chino. En mi rol, he impulsado el desarrollo de una tecnología propia que permite a las empresas y creadores de contenido diseñar voces sintéticas personalizadas, proporcionando una experiencia única y escalable. Nuestra API y editor online permiten a los usuarios experimentar, generar y licenciar voces para su uso en diversos canales, como asistentes de voz, plataformas web y dispositivos como Alexa, contribuyendo a la expansión de sus marcas a nivel global. Entre los logros más destacados de este proyecto, hemos logrado posicionarnos como una solución de referencia para la creación de voces en español, ofreciendo un alto nivel de personalización y manteniendo un fuerte compromiso con la accesibilidad y la inclusión digital, adaptando nuestras voces para reflejar una amplia diversidad de tonos y géneros. Mi enfoque en Fonos ha sido aplicar tecnologías emergentes de inteligencia artificial generativa y síntesis de voz (text-to-speech) para crear una solución innovadora que conecte a las marcas con sus audiencias de una manera más auténtica y efectiva.
Docente en Máster de Inteligencia Artificial para la Ciencia del Comportamiento at UNIR
Jun 2024 - Present · 2 yrs 1 mo
Docente de la asignatura "Inteligencia Artificial Generativa" (6 ECTS) en el Máster de Formación Permanente en Inteligencia Artificial (1a edición, noviembre 2024) para la Ciencia del Comportamiento. Creación del material docente, incluyendo ideas clave, vídeos, ejercicios y test final.
Profesor Taller de Diseño de Interfaces de Voz (presencial / remoto) at LA NAVE NODRIZA
May 2019 - Jun 2020 · 1 yr 2 mos
Este taller fue el primero que se empezó a impartir en España sobre las bases universales del diseño de interfaces de voz, y su aplicación en Amazon Alexa y Google Assistant. Lideré el diseño de los contenidos y método de aprendizaje. Impartí clases en tres ediciones, dos presenciales en 2019, y una en remoto en 2020.
Profesor en Máster de Deep Learning e Inteligencia Artificial at KSchool
Apr 2020 - May 2020 · 2 mos
Profesor en el Máster de "Deep Learning e Inteligencia Artificial", responsable del bloque de tecnología síntesis de voz y text-to-speech (TTS).