Post by Martin Pfeiffer
BEKO Solutions GmbH | Key Account Manager | BSc. (WU) | MSc. student (WU)
(๐๐ฏ๐จ๐ญ๐ช๐ด๐ฉ ๐ต๐ฆ๐น๐ต ๐ท๐ฆ๐ณ๐ด๐ช๐ฐ๐ฏ ๐ฃ๐ฆ๐ญ๐ฐ๐ธ) ๐๐ป๐ฑ๐๐๐๐ฟ๐ ๐๐ฎ๐ฏ ๐ฒ๐ฟ๐ณ๐ผ๐น๐ด๐ฟ๐ฒ๐ถ๐ฐ๐ต ๐ฎ๐ฏ๐ด๐ฒ๐๐ฐ๐ต๐น๐ผ๐๐๐ฒ๐ป: ๐ข๐ณ๐ณ๐น๐ถ๐ป๐ฒ-๐๐ถ๐ฟ๐๐ ๐ฆ๐ฝ๐ฒ๐ฒ๐ฐ๐ต ๐ง๐ฟ๐ฎ๐ป๐๐น๐ฎ๐๐ถ๐ผ๐ป ๐ฃ๐ฟ๐ผ๐๐ผ๐๐๐ฝ Vor zwei Wochen durften wir als Team beim Industry Lab Closing Event an der WU Wien unser Projekt vorstellen โ einen offline-first Real-Time Speech Translation Prototypen, entwickelt in Kooperation mit dem รBB Business Competence Center. In meiner Rolle als Lead Developer verantwortete ich die technische Umsetzung als konfigurationsgesteuerte Pipeline in Python: โข STT: faster-whisper mit deterministischen Einstellungen โข MT: Argos Translate (offline) oder ModernMT (optional) โข Terminologie & RAG: PostgreSQL-Termstore mit pgvector, semantische Retrieval via Sentence-Transformers (Top-K-Kandidaten) โข Post-Editing: LanguageTool-basiert mit strikter Glossar-Policy โข TTS: Piper fรผr lokale Synthese Eine wertvolle Lernerfahrung โ von ML-Pipeline-Architektur รผber die Integration verschiedener KI-Komponenten bis zur praktischen Umsetzung. Bedanken mรถchte ich mich bei Johannes Z. und Stefan Vonblon-Bauer vom รBB.BCC fรผr die professionelle Projektbegleitung sowie bei meinem Team โ Petra Tรถrkenczy, Anastasia Shardina und Stephan Schรถber โ fรผr die exzellente Zusammenarbeit. Der Prototyp ist open source verfรผgbar: https://lnkd.in/ddugTZTt Weitere Details in der Projektbeschreibung auf meinem Profil. __________________________________________________________ ๐๐ป๐ฑ๐๐๐๐ฟ๐ ๐๐ฎ๐ฏ ๐ฆ๐๐ฐ๐ฐ๐ฒ๐๐๐ณ๐๐น๐น๐ ๐๐ผ๐บ๐ฝ๐น๐ฒ๐๐ฒ๐ฑ: ๐ข๐ณ๐ณ๐น๐ถ๐ป๐ฒ-๐๐ถ๐ฟ๐๐ ๐ฆ๐ฝ๐ฒ๐ฒ๐ฐ๐ต ๐ง๐ฟ๐ฎ๐ป๐๐น๐ฎ๐๐ถ๐ผ๐ป ๐ฃ๐ฟ๐ผ๐๐ผ๐๐๐ฝ๐ฒ Two weeks ago, our team presented our project at the Industry Lab Closing Event at WU Vienna โ an offline-first real-time speech translation prototype developed in cooperation with รBB Business Competence Center. As Lead Developer, I was responsible for the technical implementation as a configuration-driven Python pipeline: โข STT: faster-whisper with deterministic settings โข MT: Argos Translate (offline) or ModernMT (optional) โข Terminology & RAG: PostgreSQL term store with pgvector, semantic retrieval via Sentence-Transformers (Top-K candidates) โข Post-Editing: LanguageTool-based with strict glossary policy โข TTS: Piper for local synthesis A valuable learning experience โ from ML pipeline architecture and integrating various AI components to practical implementation. I would like to thank Johannes Z. and Stefan Vonblon-Bauer from รBB.BCC as well as my team โ Petra Tรถrkenczy, Anastasia Shardina, and Stephan Schรถber โ for the excellent collaboration. The prototype is available as open source: https://lnkd.in/ddugTZTt Further details in the project description on my profile.