Three studies on semi-mixed effects models
Drei Studien über semi-Mixed Effects Modelle
by Duygu Savaşcı
Date of Examination:2011-09-28
Date of issue:2012-01-05
Advisor:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Martin Schlather
Referee:Prof. Dr. Inmaculada Martínez-Zarzoso
Files in this item
Name:savasci.pdf
Size:772.Kb
Format:PDF
Abstract
English
The applications of non- and semiparametric models are found in nearly all fields of empirical research. Since nonparametric methods do not have restrictive assumptions about the distribution of the observations or functional forms of the underlying data generating process, they are attractive methods when other necessary assumptions cannot be assured. However, nonparametric methods might be limited in practice due to other questions like the curse of dimensionality or the true underlying degrees of freedom. By introducing partial parametric components that may allow one to match structural conditions, such as linearity in some variables, the semiparametric modeling compromises between flexibility and simplicity in statistical procedures. One may consider, as the basis for many semiparametric models, the well known generalized linear model. A different but also popular extension is still parametric but is nowadays often used as a bridge between parametric and non- or semiparametric models; adding random effects in this generalized linear model leads us to a generalized linear mixed effects model. The application of these models is put into practice under the independence assumption between random effects and the covariates. This dissertation aims at relaxing the independence assumption by introducing semi-mixed effects models. For the practical implementation, the semiparametric modeling is done by using splines. The first chapter of the dissertation gives a detailed introduction about the overall study. The second chapter introduces the idea along with the model and mainly focuses on the extension to P-splines. The third chapter comprises the study in the field of small area estimation which is an application that addresses an environmental small area problem. To overcome the dependencies between the random effects and the covariates, area-specific effects plus the information of location are included in the model. Therefore, the estimation of the nonparametric functions in the semiparametric model is done by using P-splines and thin plate splines since thin plate splines are isotropic smoothers and thus especially appropriate for spatial coordinates, i.e. handling the effect of location and P-splines are easy to implement and allow for additivity. In the fourth chapter, we present an application with the gravity model to explain panel bilateral country trade flows. We apply our new semiparametric approach to panel gravity model via adding a nonparametric term in the transformed (via a known link function) conditional mean, which depends on observable proxy variables, in order to capture the dependency between the explanatory variables and the unobserved individual heterogeneity term.
Keywords: Semi-mixed effects models; semiparametric regression; small area estimation; P-splines; thin plate splines; panel data analysis; gravity model of trade
Other Languages
Die Anwendungen von Nicht- und
semiparametrischen Modellen sind in fast allen Bereichen der
empirischen Forschung zu finden. Da nichtparametrische Methoden
keine einschränkenden Annahmen über die Verteilung der
Beobachtungen oder funktionale Formen der zugrunde liegenden Daten
generierenden Prozesse haben, sind sie besonders attraktiv, wenn
die notwendigen Annahmen nicht gewährleistet werden können.
Allerdings sind nichtparametrische Methoden begrenzt, zumindest in
der Praxis, aufgrund von Fragen wie dem sogenannten Fluch der
Dimensionalität oder der zugrunde liegenden Freiheitsgrade. Die
Einführung von parametrische Komponenten erlauben es, strukturellen
Bedingungen entsprechen zu können, wie etwa der Linearität in
einigen Variablen. Die semiparametrische Modellierung ist insofern
ein Kompromiss zwischen Flexibilität und Einfachheit in
statistischen Modellen. Oft kann man als Grundlage vieler
semi-parametrischer Modelle die bekannten Verallgemeinerten
Linearen Modelle betrachten. Eine andere, aber auch recht populäre
Erweiterung von parametrischen Modellen, die heutzutage oft als
Brücke zwischen parametrischen und nicht- oder semi-parametrischen
Modellen benutzt wird, ist die Einführung zufälliger Effekte in
(verallgemeinerten) linearen Modellen. Die Anwendung dieser Modelle
ist in der Praxis unter der Annahme der Unabhängigkeit zwischen
zufälligen Effekten und Kovariaten möglich. Diese Dissertation
zielt darauf ab, eine Lockerung der Unabhängigkeitsannahme durch
die Einführung von semi-Mixed Effects Modellen zu ermöglichen. Für
die praktische Umsetzung wird die semi-parametrische Modellierung
mit Splines benutzt.
Das erste Kapitel der Dissertation gibt eine detaillierte
Einführung über das Problem innerhalb der aktuellen Forschung
insgesamt. Das zweite Kapitel führt die Idee ins Modell ein und
konzentriert sich hauptsächlich auf die Erweiterung von P-Splines.
Das dritte Kapitel umfasst die Studie im Bereich vom Small Area
Estimation, eine Anwendung, die ein Umweltmanagementsystem
betrachtet. Zur Überwindung der Abhängigkeiten zwischen den
zufälligen Effekten und Kovariaten, werden area-spezifischen
Effekten sowie die Information der Lage nichtparametrisch in das
Modell aufgenommen. Deshalb wird die Schätzung der
nichtparametrischen Funktionen im semi-parametrischen Modell mit
P-Splines und Thin Plate Splines vorgenommen, da Thin Plate Splines
isotropene Glätter sind und somit besonders geeignet für die
räumliche Koordinaten. Zudem sind P-Splines einfach zu
implementieren und erlauben Additivität. Im vierten Kapitel stellen
wir ein Gravity Model für Panel Daten vor: bilaterale Handelsstrome
sollen erklärt werden.
Wir setzen unser neuen semiparametrischen Ansatz um durch das
Hinzufügen eines nichtparametrischen Terms im transformierten (über
eine bekannte Link-Funktion) bedingten Mittelwert. Dieser Term ist
eine Funktion von beobachtbaren Proxy-Variablen, um die
Abhängigkeit zwischen den erklärenden Variablen und der
unbeobachteten einzelnen Heterogenität zu erfassen.
Schlagwörter: Semi-Mixed Effects Modelle; semiparametrischen Regression; Small Area Estimation; P-splines; Thin Plate Splines; Panel Data Analyse; Gravity Model von Trade