Hamburg, Hamburg, Germany
Data Scientist with a strong background in transforming complex data into actionable insights. Experienced in Python, R, and SQL, with a focus on building scalable data pipelines, automating analytical workflows, and applying statistical and machine learning methods to real-world problems. My current responsibilities include: - Maintaining and optimizing SQL databases - Designing and automating data pipelines, including reporting workflows, data validation, and harmonization processes - Applying AI-driven methods such as natural language processing for unstructured clinical text and machine learning models for outcome and recurrence prediction I am particularly interested in interdisciplinary collaboration at the intersection of data science, healthcare, and applied research.
- Medizinische Informationen aus Freitextfeldern extrahieren mit NLP - Machine Learning Modell zur Erkennung von Rezidiven (Tumor taucht an demselben Ort wieder auf) - Datenpipeline zum Zusammenführung und Harmonisieren von deutschlandweiten Krebsregisterdaten
- Analyse von regionalen Mortalitätsdaten nach Todesursachen - Aufbau einer Datenbank mit europäischen Daten nach Alter, Geschlecht, Todesursache und Region - Entwicklung statistischer Methoden
- Statistische und mathematische Methodenentwicklung - Empirische Forschung zur Langlebigkeit anhand von aggregierten Bevölkerungsdaten - Entwicklung einer ShinyApp zur Visualisierung des Indikators "Gesunde Lebenserwartung" für EU Länder