Data Science for Socioeconomists 2.0
- Veranstaltungstyp: Vorlesung und Übung
- Einrichtung: Fakultät für Wirtschafts- und Sozialwissenschaften
- Förderzeitraum: 01.09.2024 bis 31.07.2025
- Kurztitel: DDSOEC2
Ausrichtung des Projekts

Ziel des Projekts ist, Studierenden der Sozialökonomie Data Science näherzubringen. In einem hybriden Kurs sollen sie theoretisches und praktisches Wissen über Regressions- und Klassifikationsverfahren erlernen. Die Vorlesung wird durch Code-Beispiele ergänzt, sodass bereits hier "hands-on" Wissen vermittelt wird. In der Übung wird das erworbene Wissen durch kleine Übungsaufgaben praktisch angewendet. Die Studierenden arbeiten kollaborativ in Kleingruppen mit JupyterHub und dokumentieren ihre Ergebnisse in Quarto, erlernen Projektdokumentation und erwerben Wissen via Pair-Programming.
Zwei Übungsleiterinnen bereiten das Material vor und geben eine Einführung. Sie unterstützen die Studierenden auch in der Gruppenarbeitsphase, wobei die Studierenden ermuntert werden, sich gegenseitig zu helfen und Probleme gemeinsam zu lösen. Am Ende einer Übungssession werden verschiedene Lösungsansätze im Plenum besprochen.
Ziele des Kurses sind es, Unsicherheiten im Umgang mit Daten abzubauen und das Programmieren mit R anhand fachnaher Beispiele zu vermitteln. Nach Abschluss sollen die Studierenden selbstständig Datenanalysen für eigene Forschungsprojekte durchführen können. Zusätzlich bereitet der Kurs auf kollaboratives Arbeiten vor und ermutigt zur gemeinsamen Problemlösung.
Scott Graham / unsplash
Projektumsetzung

Folgende zentrale Ergebnisse sollen erreicht werden: Eine Einführung in die praktische Bedeutung von Daten, statistischen/machine learning-Methoden und "Big Data" für wirtschafts- und sozialwissenschaftliche Fragen.
Darauf folgt eine grundlegende Einführung in die Programmierung mit R, was den Studierenden ermöglicht, eigenständig kleinere Forschungsprojekte zu erstellen und den Code anderer Forschender nachzuvollziehen. Sie erlernen ein Spektrum von Data-Science-Methoden, einschließlich Datentransformationen, Visualisierung und einfachen Methoden des statistischen Lernens, wobei der Fokus auf "supervised learning" liegt.
Grundlegende Ideen zu in-sample/out-of-sample Prognose- bzw. Klassifikationsperformance sowie das Problem der Dimensionsreduktion (z.B. bei Lasso- und Ridge-Modellen oder Pruning von Regressionsbäumen) werden behandelt. Praktische Programmiererfahrung werden an konkreten Beispielen aus der Sozial- und Wirtschaftswissenschaft vermittelt. Quarto-Präsentationen in der Vorlesung erklären parallel zu theoretischen Konzepten die Umsetzung mit Code-Snippets, die als Basis für eigene Analysen in den Übungen dienen.
Die Erstellung von Grafiken und das theoretische Wissen über Design-Prinzipien für Datenvisualisierungen werden praktisch und theoretisch erlernt, um für empirische Daten in Studien- und Abschlussarbeiten nutzen zu können. Studierende werden zudem für Prinzipien von Open Science und Reproduzierbarkeit sensibilisiert.
Praxisvorträge von Absolvent:innen des Fachbereichs Sozialökonomie die gegen Ende des Semesters geplant sind, sollen Einblicke in berufliche Entwicklungsmöglichkeiten im Bereich Data Science geben und zur Berufsfeldorientierung beitragen.
Beteiligte Personen
Fakultät für Wirtschafts- und Sozialwissenschaften
Antragstellende: Prof. Dr. Ulrich Fritsche, Lisa Wegner, Junbo Huang
Mitarbeit/Konzeption: Victoria Hünewaldt
Förderlinie: Fachspezifische Data Literacy Education
Förderzeitraum: 01.09.2024 - 31.07.2025