Post by Martin Pfeiffer

BEKO Solutions GmbH | Key Account Manager | BSc. (WU) | MSc. student (WU)

(๐˜Œ๐˜ฏ๐˜จ๐˜ญ๐˜ช๐˜ด๐˜ฉ ๐˜ต๐˜ฆ๐˜น๐˜ต ๐˜ท๐˜ฆ๐˜ณ๐˜ด๐˜ช๐˜ฐ๐˜ฏ ๐˜ฃ๐˜ฆ๐˜ญ๐˜ฐ๐˜ธ) ๐—œ๐—ป๐—ฑ๐˜‚๐˜€๐˜๐—ฟ๐˜† ๐—Ÿ๐—ฎ๐—ฏ ๐—ฒ๐—ฟ๐—ณ๐—ผ๐—น๐—ด๐—ฟ๐—ฒ๐—ถ๐—ฐ๐—ต ๐—ฎ๐—ฏ๐—ด๐—ฒ๐˜€๐—ฐ๐—ต๐—น๐—ผ๐˜€๐˜€๐—ฒ๐—ป: ๐—ข๐—ณ๐—ณ๐—น๐—ถ๐—ป๐—ฒ-๐—™๐—ถ๐—ฟ๐˜€๐˜ ๐—ฆ๐—ฝ๐—ฒ๐—ฒ๐—ฐ๐—ต ๐—ง๐—ฟ๐—ฎ๐—ป๐˜€๐—น๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐—ฃ๐—ฟ๐—ผ๐˜๐—ผ๐˜๐˜†๐—ฝ Vor zwei Wochen durften wir als Team beim Industry Lab Closing Event an der WU Wien unser Projekt vorstellen โ€“ einen offline-first Real-Time Speech Translation Prototypen, entwickelt in Kooperation mit dem ร–BB Business Competence Center. In meiner Rolle als Lead Developer verantwortete ich die technische Umsetzung als konfigurationsgesteuerte Pipeline in Python: โ€ข STT: faster-whisper mit deterministischen Einstellungen โ€ข MT: Argos Translate (offline) oder ModernMT (optional) โ€ข Terminologie & RAG: PostgreSQL-Termstore mit pgvector, semantische Retrieval via Sentence-Transformers (Top-K-Kandidaten) โ€ข Post-Editing: LanguageTool-basiert mit strikter Glossar-Policy โ€ข TTS: Piper fรผr lokale Synthese Eine wertvolle Lernerfahrung โ€“ von ML-Pipeline-Architektur รผber die Integration verschiedener KI-Komponenten bis zur praktischen Umsetzung. Bedanken mรถchte ich mich bei Johannes Z. und Stefan Vonblon-Bauer vom ร–BB.BCC fรผr die professionelle Projektbegleitung sowie bei meinem Team โ€“ Petra Tรถrkenczy, Anastasia Shardina und Stephan Schรถber โ€“ fรผr die exzellente Zusammenarbeit. Der Prototyp ist open source verfรผgbar: https://lnkd.in/ddugTZTt Weitere Details in der Projektbeschreibung auf meinem Profil. __________________________________________________________ ๐—œ๐—ป๐—ฑ๐˜‚๐˜€๐˜๐—ฟ๐˜† ๐—Ÿ๐—ฎ๐—ฏ ๐—ฆ๐˜‚๐—ฐ๐—ฐ๐—ฒ๐˜€๐˜€๐—ณ๐˜‚๐—น๐—น๐˜† ๐—–๐—ผ๐—บ๐—ฝ๐—น๐—ฒ๐˜๐—ฒ๐—ฑ: ๐—ข๐—ณ๐—ณ๐—น๐—ถ๐—ป๐—ฒ-๐—™๐—ถ๐—ฟ๐˜€๐˜ ๐—ฆ๐—ฝ๐—ฒ๐—ฒ๐—ฐ๐—ต ๐—ง๐—ฟ๐—ฎ๐—ป๐˜€๐—น๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐—ฃ๐—ฟ๐—ผ๐˜๐—ผ๐˜๐˜†๐—ฝ๐—ฒ Two weeks ago, our team presented our project at the Industry Lab Closing Event at WU Vienna โ€“ an offline-first real-time speech translation prototype developed in cooperation with ร–BB Business Competence Center. As Lead Developer, I was responsible for the technical implementation as a configuration-driven Python pipeline: โ€ข STT: faster-whisper with deterministic settings โ€ข MT: Argos Translate (offline) or ModernMT (optional) โ€ข Terminology & RAG: PostgreSQL term store with pgvector, semantic retrieval via Sentence-Transformers (Top-K candidates) โ€ข Post-Editing: LanguageTool-based with strict glossary policy โ€ข TTS: Piper for local synthesis A valuable learning experience โ€“ from ML pipeline architecture and integrating various AI components to practical implementation. I would like to thank Johannes Z. and Stefan Vonblon-Bauer from ร–BB.BCC as well as my team โ€“ Petra Tรถrkenczy, Anastasia Shardina, and Stephan Schรถber โ€“ for the excellent collaboration. The prototype is available as open source: https://lnkd.in/ddugTZTt Further details in the project description on my profile.

Post content