Applications of nonparametric methods in economic and political science
Anwendungen nichtparametrischer Verfahren in den Wirtschafts- und Staatswissenschaften
by Nils-Bastian Heidenreich
Date of Examination:2011-04-11
Date of issue:2011-05-18
Advisor:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Fred Böker
Referee:Prof. Dr. Maik Hammerschmidt
Files in this item
Name:heidenreich.pdf
Size:1.11Mb
Format:PDF
Abstract
English
Nonparametric statistics are used in a wide field of research. This thesis is split up into two parts. A more theoretical consideration about bandwidth choice and two practical applications of a semiparametric approach for modeling multicategorical data. The first essay is concerned with optimal bandwidth choice in kernel density estimation. Since about three decades the discussion on bandwidth selection has been going on. On the one hand, bandwidth choice for empirical studies is provided by many software packages. On the other hand, up to now no overall optimal bandwidth selection method has been established. This thesis reviews existing methods and compare them on a set of designs concentrating thereby on small and moderate sample sizes. The main focus is on practical issues like fully automatic procedures, implementation and performance. The second and third essay consider a solution for modeling multicategorical data with the aid of non- and semiparametric methods. A smoothed likelihood estimator is proposed that allows for flexible functional forms and interactions between covariates. Classic multinomial logit models often seem to be not sufficient. In a more complex world the outcomes of these models simplify too much and partly contradict general beliefs. Contrary, the semiparametric approach of this thesis allows flexible modeling of the covariates and hence a more detailed analysis of the outcome. In the second essay the model is used for analyzing voter profiles. The composition of the electorate and the list of influential parties has changed substantially in recent years. The model reveals strong interactions of age and income, as well as highly nonlinear and rather different shapes of the factor impacts for each party's likelihood to be voted. The third essay uses the model in the context of estimating urban transport demand. In this project, different approaches are compared: fully parametric, non- or semiparametric, binary as well as multinomial models, including only individual- or also mode-specific covariates. The thesis compares the results of the different models and gives recommendations as to which of the considered models provides the best conclusions in the context of transport policy.
Keywords: bandwidth choice; kernel density estimation; voter profiling; smoothed likelihood; semiparametric estimation; additivity; multiple choice models
Other Languages
Nichtparametrische Statistik wird in
vielen Forschungsgebieten verwendet. Diese Dissertation ist in zwei
Teile unterteilt. Einer eher theoretische Betrachtung der
Bandweitenwahl und zwei praktischen Anwendungen eines
semiparametrischen Ansatzes zur Modellierung von multikategorialen
Daten. Der erste Aufsatz befasst sich mit der Bestimmung der
optimalen Bandweite in der Kerndichteschätzung. Schon über drei
Jahrezehnte dauert die Diskussion über die Bandweitenwahl. Auf der
einen Seite wird die Bestimmung der Bandweite für empirische
Studien in vielen Softwareprogrammen zur Verfügung gestellt, auf
der anderen Seite hat sich bis heute keine allgemeine Methode zur
Bestimmung der optimalen Bandweite durchgesetzt. Diese Dissertation
bespricht alle existierenden Methoden und vergleicht sie in
verschiedenen Designs. Dabei werden kleine und mittlere
Stichprobengrößen betrachtet. Das Hauptaugenmerk liegt auf der
praktischen Anwendbarkeit, bezogen auf automatisierte Prozeduren,
Implementierung und Leistungsvermögen. Der zweite und dritte Teil
der Arbeit liefert eine Lösung zur Modellierung von
multikategorialen Daten mit Hilfe von nicht- und semiparametrischen
Methoden. Ein lokaler Likelihood Schätzer wird vorgestellt, der es
erlaubt flexible funktionale Formen und Interaktion zwischen den
Kovariablen zu modellieren. Klassische multinomiale Logit Modelle
sind oft unzureichend. In einer immer komplexeren Welt vereinfachen
solche Modelle das Ergebnis zu stark und können so den allgemeinen
Überzeugungen widersprechen. Das semiparametrische Modell dieser
Arbeit ermöglicht dagegen eine flexible Modellierung der
Einflussgrößen und somit eine detailliertere Analyse der
Zielvariablen. Im zweiten Aufsatz wird das Modell zur Analyse von
Wählerprofilen verwendet. Die Zusammensetzung der Wählerschaft und
die Liste der einflussreichen Parteien hat sich in den jüngeren
Jahren stark verändert. Unser Modell deckt starke Interaktionen
zwischen Alter und Einkommen sowie hochgradig nichtlineare und
unterschiedliche Srukturen der Einflussfaktoren der Likelihoods für
die betrachteten Parteien auf. Der dritte Aufsatz wendet das Modell
zur Schätzung der öffentlichen Verkehrsnachfrage an. In diesem
Projekt werden verschiedene Ansätze verglichen: voll parametrische
mit nicht und semiparametrischen Ansätzen; binäre und multinomiale
Modelle mit sowohl individuen-spezifischen als auch
alternativen-spezifischen Variablen. Die Ergebnisse der
verschiedenen Modelle werden gezeigt und Empfehlungen
ausgesprochen, welches der betrachteten Modelle die besten
Schlussfolgerungen für transportpolitische Entscheidungen
erlaubt.
Schlagwörter: Bandweite; Kerndichteschätzung; Multikategorial; Multinomial Logit Modell; Semiparatrische Schätzmethoden; Additivität; Lokale Likelihood; Wählerprofile; Entscheidungsmodelle