Angewandte Multivariate Statistik (Multivariate Verkehrsstatistik)

Welche Fragen beantwortet uns die Multivariate Statistik?

Welches Verkehrsmittel wird auf dem Weg von der Wohnung zur Arbeit gewählt?
Wer ist die Zielgruppe für Reisen auf einem Kreuzfahrtschiff? Durch welche Werbemaßnahmen wird die Zielgruppe am ehesten auf ein Schiff gelockt?
Wie können mit Hilfe geographischer Distanzen zwischen Städten gesamte Landkarten erstellt werden?
Welche Faktoren beeinflussen Aktienpreise?
Wie differenziert man zwischen Konsumentengruppen verschiedener Restaurants?
Mit welcher Wahrscheinlichkeit stammt ein, durch Archäologen, ausgegrabenes Buch von Shakespear?

Der Kurs befähigt, solche Fragen aus der Marktforschung zu beantworten. Dafür werden verschiedene Verfahren aus der multivariaten Statistik, wie zum Beispiel Hauptkomponenten-, Faktoren-, Diskriminanz- und Clusteranalyse besprochen. Zusätzlich gibt es eine Einführung in die Programmiersprache R, die ein sehr hilfreiches Werkzeug bei der statistischen Auswertung großer Datensätze darstellt.

Aktuelles

Die Klausur findet am 16.02.17 statt.

Die Wiederholungsklausur der Theoretischen Multivariaten Statistik findet am 15.02.17 statt.

Am 22./23.11.16 werden die Übung und Vorlesung von Dr. Abhay Singh übernommen zum Thema "Quantile Regression" sowie "Multivariate Analysis using Copula and bivariate Extreme Value Theory".

Am 29./30.11.16 werden die Übung und Vorlesung von Prof. Peter Song übernommen zum Thema "Sparse multivariate factor analysis regression model" sowie "Supervised principle component analysis and dimension reduction".

Alle Teilnehmer können zur Übung ihren eigenen Laptop mit installierter R Software (open source) nutzen (Bitte beachten Sie die GNU GENERAL PUBLIC LICENSE). Es stehen aber auch die PC im FAL/002 zur Verfügung.

Veranstaltungen

Veranstaltung Wochentag Zeit Raum Dozent
Vorlesung / Lecture Mittwoch / Wednesday 4.DS POT/361/H Prof. Ostap Okhrin
Übung / Excersise Dienstag / Tuesday 4.DS FAL/002 Dr. Kathrin Kormoll

Unterlagen

Alle Unterlagen (Vorlesungsskripte, Übungen) finden Sie bitte im OPAL Kurs. Das Passwort entspricht dem der Vorlesung Theoretische Multivariate Statistik.

Klausur

Die Vorlesung wird mit einer Klausur abgeschlossen. Der Termin wird noch genannt.

Projektarbeit

Alle Teilnehmer werden zudem eine Projektarbeit erstellen. Dazu bearbeiten Sie einen Datensatz und stellen Ihre Arbeit anschließend vor. Sie können sich dazu unter folgendem Link anmelden: https://dudle.inf.tu-dresden.de/r36lpd4s/  Nachfolgend ein paar Hinweise dazu:

1. Jede Gruppe besteht aus höchstens 3 Teilnehmern.
2. Jede Präsentation sollte nicht länger als 15 Minuten dauern.
3. Alle Teilnehmer einer Gruppe sollen vortragen.
4. Planen Sie ca. 2 Minuten je Folie ein.
5. In Doodle funktioniert das "first come, first serve" - Prinzip. Also bitte keine Anfragen, wie: "Der Slot wurde schon besetzt, könnte ich trotzdem noch der Vierte in der Gruppe werden?".
6. In Doodle registrieren Sie sich mit Ihrem Nachnamen, Vornamen und können anschließend einen Datensatz auswählen.
7. Sie müssen selber entscheiden, welchen Datensatz Sie bearbeiten möchten. Die Beschreibungen zu den Datensätzen finden Sie auf den entsprechenden Internetseiten.
8. Von jeder Gruppe erhält Dr. Kathrin Kormoll per E-Mail bis zum 26.01.2016 eine ZIP-Datei mit dem Dateinamen: MVA2_2016_{DieErstenDreiBuchstabenVonDenNachnamenDerMitglieder}_{AbkürzungDesDatensatzes}.zip
Zum Beispiel: In einer Gruppe ist Herr Okhrin, Herr Mustermann und Frau Beispiel und sie arbeiten an dem Thema über Boston Housing. Somit wäre der Name der Datei: MVA2_2016_BeiMusOkh_BosHous.zip
9. Das Archiv (bzw. die zip Datei) sollte 3 Dateien beiinhalten: DatenSatz, R-code und Folien (als PDF).
10. Während den Präsentationen sollen alle aktiv mitarbeiten und Fragen stellen.
11. Die Präsentationen finden am 31.01.2016 statt.


Folgende Datensätze stehen zur Auswahl:
 

1. Bank Marketing Data Set
http://archive.ics.uci.edu/ml/datasets/Bank+Marketing

2. Insurance Company Benchmark (COIL 2000) Data Set
http://archive.ics.uci.edu/ml/datasets/Insurance+Company+Benchmark+%28COIL+2000%29

3. Restaurant & consumer data Data Set
http://archive.ics.uci.edu/ml/datasets/Restaurant+%26+consumer+data

4. Galaxy dataset
http://astrostatistics.psu.edu/datasets/COMBO17.html

5. Voting and personal info: U.S. counties and 1992 presidential election dataset
http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets
http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/Ccounties.html

6. Temperature in china
http://sfb649.wiwi.hu-berlin.de/fedc/download/climatechina/climatechina.htm

7. Evaluation of Car data Set
http://archive.ics.uci.edu/ml/datasets/Car+Evaluation

8. GPS Trajectories of vehicles
http://archive.ics.uci.edu/ml/datasets/GPS+Trajectories

9. European Demograpic data set: please select the year 2005, and choose all age groups (5 years interval) with all nations it provides. This will give you a two dimension data, i.e. age groups and nations.
http://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=demo_pjangroup&lang=en

Literatur

Backhaus, K., Erichson, B., Plinke, W., Weiber, R. (2008), Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (12. Auflage), Springer Verlag.

Härdle, W., Simar, L. (2015), Applied Multivariate Statistical Analysis (4nd edititon), Springer Lehrbuch.

Härdle, W., Hlavka, Z. (2007), Multivariate Statistics: Exercises and Solutions, Springer Lehrbuch.

Zu dieser Seite

Stefanie Lösch
Letzte Änderung: 28.11.2016