Germany
Search AI Mode
Software Development im Innovation Hacking Team: Entwicklung eines on-device SLM Text Summarizers
- Entwicklung und Integration des Produktionsplanungs-Moduls für adago's IntelliTwin - Implementierung und Training von RL Algorithmen (GRPO, PPO, RLOO) mit stable-baselines3, Erweiterung der RLHF Algorithmen auf Classic Control Tasks (gymnasium): https://github.com/floribau/stable-baselines3-contrib-grpo/tree/contrib-grpo
Beratung von Projektteams bei der Planung und Implementierung von Software Engineering-Projekten
Unterstützung der Go Live-Vorbereitungen mit Software Testing, Bug Fixes im Code und Automatisierung der Stammdatenverarbeitung