Raul Eduardo

LLM Evaluation Specialist | AI Training & Data Quality Expert | RLHF • Generative AI • Data Annotation | Multilingual (PT/EN) | EU-Based

Rümlang, Zurich, Switzerland

About

🎯 Não me limito a avaliar IA. Construo os sistemas, as marcas e as experiências em torno dela. Como especialista em integração de IA e perito em avaliação de LLM, com mais de 3 anos de experiência prática, encontro-me na intersecção de três disciplinas que a maioria das pessoas trata como separadas: controlo de qualidade de IA, estratégia de marca e desenvolvimento web. Ofereço soluções completas que são tecnicamente sólidas, culturalmente inteligentes e concebidas para gerar conversões. O QUE FAÇO NA PRÁTICA 🔬 Avaliação e Controlo de Qualidade de IA Organização e rotulagem de conjuntos de dados multimodais, realização de avaliações de resultados multilingues, implementação de ciclos de feedback RLHF e aplicação de reconhecimento de padrões para identificar pontos fracos dos modelos antes que cheguem aos seus utilizadores. 🎨 Estratégia de Marca e Posicionamento Transformar produtos técnicos em narrativas de marca cativantes. Desde a identidade visual ao tom de voz, construo marcas que comunicam credibilidade sem perder a personalidade. 🌐 Desenvolvimento Web e Produtos Baseados em IA Lançamento de aplicações web prontas para produção utilizando React, Tailwind e Supabase. Construí e lancei ferramentas nativas de IA (incluindo os meus próprios produtos SaaS) utilizando plataformas modernas como o Lovable. 📧 Vamos entrar em contacto: Aberto a projetos freelance, trabalho por contrato e funções a tempo inteiro em IA/ML, produto ou estratégia de marca.

Experience

  • TaskUs (Remote)
    • Data Analyst
      Jan 2025 - Feb 2026 · 1 yr 2 mos

    • Senior AI Content Analyst
      Jan 2025 - Jan 2026 · 1 yr 1 mo

      Lidero a avaliação e otimização de conteúdo gerado por AI em escala enterprise, aplicando expertise em LLM evaluation para melhorar a qualidade e segurança de sistemas AI em produção. Principais responsabilidades: • Avalio 500+ outputs de AI diariamente, garantindo conformidade com políticas de conteúdo e community guidelines • Desenvolvo frameworks de avaliação que melhoraram a precisão de modelos AI em 25% • Colaboro com equipas de AI engineering para otimizar prompts e reduzir alucinações • Treino algoritmos de moderação automática, reduzindo tempo de revisão manual em 40% Impacto mensurável: •Implementei processos que aumentaram a eficiência de moderação em 35% •Criei guidelines que reduziram falsos positivos em 20% •Desenvolvi relatórios de tendências que antecipam riscos emergentes Competências aplicadas: LLM Evaluation, Content Policy Development, AI Safety, Cross-functional Collaboration

  • Support Specialist, Sales Representative, KYC Analyst at TP
    Aug 2023 - Jan 2025 · 1 yr 6 mos

  • LLM Evaluation Specialist / Portuguese-English Translato at Uber
    Mar 2024 - Sep 2024 · 7 mos

    Liderava a avaliação e otimização de Large Language Models para mercados lusófonos, garantindo qualidade, precisão cultural e performance técnica em implementações AI críticas. Principais conquistas: • Avaliei e otimizei 50+ modelos LLM, melhorando accuracy em português em 35% • Desenvolvi frameworks de testing A/B que se tornaram standard da empresa • Criei datasets de avaliação multilíngues utilizados por 200+ AI researchers • Implementei processos de QA que reduziram alucinações em outputs PT/EN em 45% Inovações técnicas: •Desenvolvi métricas customizadas para avaliar nuances culturais em AI outputs •Criei pipelines automatizados de translation quality assessment •Implementei bias detection específico para contextos lusófonos •Estabeleci benchmarks de performance para modelos multilíngues Impacto no produto: •Melhorei user experience para 2M+ utilizadores lusófonos •Reduzi complaints relacionados com qualidade de tradução em 60% •Aumentei adoption rate de features AI em mercados PT/BR em 40% Competências desenvolvidas: LLM Architecture, Model Evaluation, Multilingual NLP, AI Ethics, Performance Optimization

  • AI Tutor & Translator - PRNE Course at Cisco
    Apr 2022 - Mar 2023 · 1 yr

    📋 Key Duties & Responsibilities: 🎓 AI Tutoring & Learner Support Guide students through the PRNE (Prompt, Reason, Navigate, Evaluate) course structure Offer support via 1:1 sessions, group discussions, or asynchronous Q&A Simplify complex AI topics for non-technical learners using real-world examples Review and give feedback on student-generated prompts and assignments 🌐 Portuguese-English Course Translation Translate instructional content (modules, tutorials, assessments) between Portuguese and English Ensure translations are not only accurate, but also pedagogically and culturally appropriate Edit and proofread AI-generated translations to maintain clarity and tone 📊 Course Content Management & AI Output Review Collaborate with educators or AI developers to enhance course clarity and alignment Review AI-generated content used in the curriculum for quality, factual accuracy, and linguistic correctness Suggest improvements to model usage or course delivery tools 🤝 Cross-Functional Collaboration Work with course designers, product developers, or AI trainers to refine the course experience Translate user feedback into actionable improvements 🔐 Compliance & Confidentiality Handle educational and personal data with respect for privacy regulations (e.g., FERPA, GDPR) Maintain confidentiality on proprietary course content and AI tools in use