16692
Practice seminar
SoSe 14: Statistische Verfahren und quantitative Linguistik
Roland Schäfer
Information for students
Sie können sich zu dieser Übung nicht über Campus Management anmelden! Nach dem offiziellen Anmeldezeitraum werden Sie nachgebucht, wenn Sie das VS 16691 gebucht haben.
Comments
Es gibt keinen vertretbaren Grund, Linguistik ohne Empirie (und damit als Teilgebiet der Philosophie) zu betreiben. Sprachdaten sind in verschiedenster Form ohne nennenswerte Probleme beobachtbar (zum Beispiel Korpusdaten oder psycho- und neurolinguistische Experimentdaten). Eine jede linguistische Theorie muss sich daran messen lassen können, wie gut ihre Beschreibung zu den bekannten Daten passt und neue Daten zuverlässig vorhersagt. Eine Theorie, die aus irgendeinem Grund nicht überprüfbar ist oder nicht überprüft werden will, die also keine empirisch überprüfbaren
und damit falsifizierbaren Hypothesen anbietet, kann ohne weitere Umstände als disqualifiziert gelten.
Um die Linguistik als eine empirische Disziplin jenseits von Philosophie und Introspektion zu etablieren, müssen erstens experimentelle Techniken und zweitens statistische Verfahren zur Verfügung gestellt werden. Die statistischen Verfahren dienen der Überprüfung (dem Test) oder der Generierung von Hypothesen. Der erste und größere Teil des Moduls widmet sich diesen Verfahren, wobei als quasi-experimentelle Datenquelle ausschließlich sehr große Korpora des Deutschen verwendet werden.
Außerdem können mathematische Beschreibungsmethoden zum Einsatz gebracht werden, um Theorien selber zu formulieren. Hierbei wird z.B. festgestellt, nach welchen Gesetzmäßigkeiten sich Worthäufigkeiten, Wortlängen, Satzkomplexität usw. verteilen. Ein berühmtes Gesetz, das omnipräsent ist in vielen Bereichen der quantitativen Sprachbetrachtung ist dabei das Gesetz von Zipf. Der zweite
Teil des Moduls widmet sich dieser Art der Sprachbetrachtung.
Methodisch wird im Seminar vom Dozenten jeweils eine einstündige vorlesungsartige Einführung in ein Teilgebiet gegeben, zu dem i.d.R. vorher kürzere Texte (gelegentlich, aber möglichst selten in englischer Sprache) gelesen werden sollen. Das Seminar schließt mit einer ca. halbstündigen Diskussion zum Thema. Die Übung wird dann ausschließlich für die praktische Nachbereitung des Seminars verwendet. Besondere Vorkenntnis (z.B. Korpusbenutzung oder besondere mathematische
Fähigkeiten) sind ausdrücklich nicht erforderlich. Es muss keine Software installiert werden, da eine integrierte Software-Umgebung (RStudio mit Anbindung an die IMS Corpus Workbench) auf unseren Servern vorliegt und mit jedem Browser benutzt werden kann.
Die Art des Leistungsnachweises ist entweder eine Klausur oder eine Hausarbeit. Was von beidem wird für alle TeilnehmerInnen einheitlich durch einen Mehrheitsentscheid festgelegt.
http://hpsg.fu-berlin.de/~rsling/microsites/corpora/ close
14 Class schedule
Regular appointments
Tue, 2014-04-15 14:00 - 16:00
Tue, 2014-04-22 14:00 - 16:00
Tue, 2014-04-29 14:00 - 16:00
Tue, 2014-05-06 14:00 - 16:00
Tue, 2014-05-13 14:00 - 16:00
Tue, 2014-05-20 14:00 - 16:00
Tue, 2014-05-27 14:00 - 16:00
Tue, 2014-06-03 14:00 - 16:00
Tue, 2014-06-10 14:00 - 16:00
Tue, 2014-06-17 14:00 - 16:00
Tue, 2014-06-24 14:00 - 16:00
Tue, 2014-07-01 14:00 - 16:00
Tue, 2014-07-08 14:00 - 16:00
Tue, 2014-07-15 14:00 - 16:00