Datenanalyse mit R
Bachelorstudiengang und Masterstudiengänge Psychologie (fakultativ)
Veranstaltungsleiter:
Lehrende:
Dr. Matthias Rudolf
Dipl.-Psych. Diana Vogel
cand. psych. Viviane Lange
Peggy Wehner, MSc.
- Studierende im Bachelorstudiengang Psychologie (ab 4. Semester)
- Studierende in den Masterstudiengängen Psychologie (ab 1. Semester)
Online-Durchführung während Uni-Schließung
Link zum Opal-Kurs:
https://bildungsportal.sachsen.de/opal/auth/RepositoryEntry/23082467351
Wegen der Corona-Krise werden wir mit Beginn der Vorlesungszeit, d.h. ab der ersten Woche des Semesters schrittweise
- einführende Videos zu den Themen der einzelnen Veranstaltungen zur Verfügung stellen
- die Aufgabenstellungen der einzelnen Veranstaltungen ins Netz stellen
- ausführliche Anleitungen und Lösungshilfen für die selbstständige Bearbeitung der Aufgaben online stellen
- ein Forum zur Diskussion der Inhalte anbieten
- die Möglichkeit anbieten, R-Skripte individuell korrigieren zu lassen.
Der unten angegebene Zeitplan bleibt davon unberührt.
Die Vorbereitungen laufen derzeit. Wir werden alle Materialien und das Forum höchstwahrscheinlich auf OPAL anbieten. Sobald die Vorbereitungen abgeschlossen sind, werden wir hier darüber informieren.
Durchführung im Sommersemester 2020
- Montag, 6. DS, SE 0101
- Beginn: 06.04.
Überblick:
R ist eine frei verfügbare Statistik-Software bzw. eine Statistik-Programmiersprache. Das Programmpaket ist über die Internet-Seite www.r-project.org frei verfügbar. Das Programmpaket wird von Statistikern und anderen Wissenschaftlern kontinuierlich weiterentwickelt und verfügt mittlerweile über einen Funktionsumfang, der auch großen kommerziellen Statistik-Paketen teilweise überlegen ist. R hat den Nachteil, dass der Einstieg im Vergleich zu Programmen wie SPSS weniger komfortabel ist. Zu SPSS ist umfangreiche Sekundärliteratur verfügbar, wodurch die Anwendung des Programms sehr erleichtert wird. Wenn man also nur gelegentlich statistische Analysen durchzuführen hat, ist in der Regel die Anwendung von SPSS zu empfehlen.
Für diejenigen Anwender, die zum Beispiel im Rahmen ihrer Forschungsarbeiten nahezu "ununterbrochen" Datenauswertungen incl. grafischer Darstellungen durchzuführen haben und die bereit sind, einen höheren Einarbeitungsaufwand zu investieren, bietet R dagegen eindeutige Vorteile. Der Hauptvorteil besteht darin, dass R kostenfrei nutzbar und damit überall verfügbar ist. Die Flexibilität des Programms ermöglicht die Programmierung eigener Routinen und Abläufe. Viele neu entwickelte statistische Verfahren werden heute zuerst in R umgeserzt, die grafischen Möglichkeiten von R sind eindrucksvoll.
In der Veranstaltung wird zunächst eine Einführung in die Arbeit mit R gegeben, daneben werden die statistischen und grafischen Möglichkeiten von R "ausprobiert". In den weiteren Veranstaltungen werden ausgewählte Verfahren umgesetzt und in den Veranstaltungen kleine Projekte bearbeitet. Die Veranstaltung findet ausschließlich im PC-Pool statt und ist sehr anwendungsorientiert. Im Zentrum vieler Veranstaltungen steht die aktive Lösung gegebener Aufgabenstellungen unter Nutzung der Möglichkeiten von R. Dabei werden die Teilnehmer zunehmend selbständig arbeiten. Ziel der Veranstaltung ist die Befähigung der Teilnehmer, statistische Probleme bzw. Aufgabenstellungen selbständig mit R bearbeiten zu können.
Inhaltliche Schwerpunkte:
- Datenverwaltung und Objektstrukturen in R
- Grafiken in R
- Statistische Tests in R
- Korrelations- und Regressionsanalyse in R
- Verallgemeinerte lineare Modelle (grundsätzliche Überlegungen) in R
- Grundlagen der Programmierung in R
- Resampling-Tests, Monte-Carlo-Simulationen, Power-Analysen, Berechnung optimaler Stichprobenumfänge in R
Prüfungsrelevanz:
- keine Prüfungsrelevanz
- Leistungsschein für erfolgreiche Teilnahme (Einzelheiten werden in der Veranstaltung bekannt gegeben)
Vorläufiger Ablaufplan für das SS 2020:
Datum |
Inhalt der Veranstaltung |
---|---|
06.04. | Einführung in R |
13.04. | frei |
20.04. | Datenverwaltung und Objektstrukturen |
27.04. | Umgang mit Daten |
04.05. | Grafiken (1) |
11.05. | Ausgewählte statistische Tests |
18.05. | Multiple Regressionsanalyse |
25.05. | Leistungsscheinaufgabe (1) |
01.06. | frei |
08.06. | Grundlagen der Programmierung: (1) |
15.06. | Wahlweise Grundlagen der Programmierung: (2) oder Grafiken (2) |
22.06. | Resampling-Verfahren |
29,06. | Monte Carlo-Simulationen: Teststärkeanalyse |
06.07. | Monte Carlo-Simulationen: Optimale Stichprobenumfänge |
13.07. | Leistungsscheinaufgabe (2) |
Lehrmaterial für das SS 2020:
Link zum Opal-Kurs:
https://bildungsportal.sachsen.de/opal/auth/RepositoryEntry/23082467351
Alle Dateien werden über Opal angeboten. Benutzername und Passwort werden in der ersten Veranstaltung bekannt gegeben. Die Materialien der ersten Veranstaltung sind bis zur ersten Veranstaltung ohne Passwort zugänglich.
Die Materialien stehen in der Regel ca. eine Woche vor der jeweiligen Veranstaltung an dieser Stelle zur Verfügung.
Bitte bringen Sie die Materialien zur jeweiligen Veranstaltung ausgedruckt oder auf einem separaten Laptop o.ä. lesbar mit.
Hinweis 1: Die Befehlsübersichten sollen Sie bitte während der jeweiligen Veranstaltung möglichst nicht verwenden. Die notwendigen Befehle sollen Sie sich mit den von R bereitgestellten Informationen erzeugen.
Hinweis 2: Eine Lösungsübersicht zu den jeweiligen Seminaren (R-Skript) finden Sie nach den jeweiligen Veranstaltungen auf dieser Seite.
Einführung
Einführung: Lösungsskript
Datenverwaltung und Objektstrukturen: Skript, Befehlsübersicht und Daten
Datenverwaltung und Objektstrukturen: Lösungsskript
Umgang mit Daten: Skript und Daten
Umgang mit Daten: Lösungsskript
Grafiken: Skript, Befehlsübersicht und Daten
Grafiken: Lösungsskript
Tests: Skript, Befehlsübersicht und Daten
Tests: Lösungsskript
Regression: Skript, Befehlsübersicht und Daten
Regression: Lösungsskript
Leistungsscheinaufgabe 1
Grundlagen der Programmierung: Schleifen (Skript und Befehlsübersicht)
Schleifen: Lösungsskript
Resampling: Skript und Daten
Resampling: Lösungsskript
Teststärke: Skript, Daten
Kurzvortrag Teststärke
Teststärke: Lösungsskript
Optimale Stichprobenumfänge: Skript
Optimale Stichprobenumfänge: Lösungsskript
Leistungsscheinaufgabe 2
Ergebnisse aktueller Lehrevaluationen:
Ergebnis der Lehrevaluation im WS 2012/2013
Ergebnis der Lehrevaluation im SS 2013
Ergebnis der Lehrevaluation im WS 2013/2014
Ergebnis der Lehrevaluation im SS 2014
Ergebnis der Lehrevaluation im WS 2014/15
Ergebnis der Lehrevaluation im SS 2015
Die Veranstaltung fand im WS 2015/16 und im SS 2016 nicht statt.
Ergebnis der Lehrevaluation im WS 2016/17
Ergebnis der Lehrevaluation im SS 2017
Ergebnis der Lehrevaluation im WS 2017/2018
Ergebnis der Lehrevaluation im SS 2018
Ergebnis der lehrevaluation im WS 2018/2019
Ergebnis der Lehrevaluation im SS 2019
Ergebnis der Lehrevaluation im WS 2019/2020