10140408 Vertiefungsvorlesung

SoSe 21: Multivariate Verfahren (V)

Natalia Rojas Perilla

Kommentar

Inhalte & Qualifikationsziele

Die Studierenden erlangen vertiefte Kenntnisse an der Schnittstelle zwischen Multivariater Statistik, Statistical Learning und Data Mining. Sie werden in der Lage sein, Verfahren aus dem Bereich supervised und unsupervised learning in entsprechender Software eigenständig durchzuführen und die Ergebnisse zu visualisieren/ interpretieren. Dieses Wissen kann auf unterschiedliche Fragestellungen der Volkswirtschaftslehre, Wirtschaftsinformatik und Statistik angewendet werden.

Moderne statistische Methoden aus dem Bereich Multivariater Statistik, Statistical Learning und Data Mining.

Kurze Gliederung

  1. Einführung
  • Beispiel zur Motivation mit Mobilfunkdaten
  • Diskussion und Definition von Daten/ Big data
  • Einzelne Schritte in der Analyse
  • Diskussion von Grundbegriffen
  1. Spezielle Datensätze

  • Einführung grundlegender Datensätze, die im Kurs analysiert werden: Wettkampfergebnisse "Zehnkampf", Wohnungspreise in Boston, Flugverkehr, ...

  1. Visualisierung von Daten

  • Ziele der Visualisierung
  • R Pakete zur Erstellung von Grafiken
  • Einfache bis hin zu komplexen Visualisierungen: Bar-, Box- und Scatterplots; Tree- und Heatmaps; Mosaic plots; kombinierte Visualisierungen, ...
  1. Dimensionsreduktion mit Hilfe der Hauptkomponentenanalyse

  • Was muss/ soll die Dimension in Datensätzen reduziert werden?
  • (Mathematische) Herleitung der Hauptkomponentenanalyse
  • Hauptkomponentenanalyse in R mit Interpretation
  • Diskussion von anwendungsorientierten Aspekten am Beispiel des Datensatzes "Zehnkampf"
  1. Evaluierung von Methoden

  • Einführung einfacher Prädiktions- und Klassifikationsmethoden
  • Overfitting und Einteilung des Datensatzes (Training-, Validierungs- und Testdaten)
  • Qualitätsmaße für die Evaluierung
  • Kreuzvalidierung und Bootstrap
  1. Prädiktions- und Klassifikationsmethoden

  • Methoden basierend auf Entscheidungsbäumen
  • Bagging
  • Random Forest
  • Anwendungsbeispiele in R
  1. Clusteranalyse

  • Hierarchische Verfahren
  • Partitionierende Verfahren
  • Anwendungsbeispiele in R

Termine

Asynchrone Formate (zeitversetzte Aufzeichnung der Vorlesung),
verfügbar ab dienstags 8.00 Uhr

Anrechenbarkeit: Master Economics, Schwerpunktbereich Quantitative Analyse (6 LP)

Zugangsvoraussetzungen & Vorkenntnisse: Keine

Prüfungsleistung: Seminararbeit

Kurssprache: Englisch

Kontakt: Prof. Dr. Natalia Rojas

Schließen

14 Termine

Regelmäßige Termine der Lehrveranstaltung

Di, 13.04.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 20.04.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 27.04.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 04.05.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 11.05.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 18.05.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 25.05.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 01.06.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 08.06.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 15.06.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 22.06.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 29.06.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 06.07.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Di, 13.07.2021 08:00 - 10:00

Dozenten:
Prof. Dr. Natalia Rojas Perilla

Räume:
Online - zeitUNabhängig

Studienfächer A-Z