Simple Solutions to hard Problems in the Estimation and Prediction of Welfare Distributions
Einfache Lösungen für schwierige Probleme in der Schätzung und Vorhersage der Wohlfahrtsverteilung
by Jing Dai
Date of Examination:2011-04-08
Date of issue:2011-06-01
Advisor:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Walter Zucchini
Referee:Prof. Dr. Inmaculada Martínez-Zarzoso
Files in this item
Name:dai.pdf
Size:1003Kb
Format:PDF
Abstract
English
The aim of my PhD projects is to investigate various problems in applied parametric and nonparametric estimation, and eventually in prediction. The main focus is on welfare analysis. For instance, in both nonparametric density estimation and regression, the so-called boundary effects, i.e. the bias and variance increase due to one-sided data information, can be quite serious. Therefore, a new, straightforward and very simple boundary correction is proposed in the first essay, applying local bandwidth variation at the boundaries. In a comprehensive simulation study this method is shown to perform very well. Furthermore, it is an excellent method for estimating the world income distribution, and Engel curves in economics. In the second and third essays, an integration-based procedure is introduced for estimating and predicting of population distributions. This is done by data matching with applications to the economics of wealth and health. In conclusion, both essays 2 and 3, it is evident that the proposed method can be applied to estimate both (unconditional) discrete and continuous distributions. It is applicable irrespective of the mean regression or model, and can be easily extended to other contexts, such as small area statistics, nonparametric statistics, any latent variable model (e.g. Tobit regression), simultaneous equation systems, instrumental variable methods, etc. The fourth essay is concerned with the problem of estimating the income or consumption distribution even if only few quantiles (e.g. quartiles and quintiles) are available. A method for convex estimation of a regression function based on the spline smoothing technique is used to estimate the Lorenz curve from sparse data points. The main contribution of this paper is to show how, based on a few quantiles, one can apply a functional form for the Lorenz curve to obtain a parametric density that is consistent with the given quantiles. Furthermore, one can easily derive inequality measures, such as Gini coefficient, based on the same information.
Keywords: nonparametric density estimation and regression; boundary correction; world income distribution; Engel curve; income distribution; data matching; doctor visits; Lorenz curve; quantile; density
Other Languages
Das Ziel meiner Doktorarbeit ist es,
verschiedene Probleme in der angewandten parametrischen und
nichtparametrischen Schätzung, und schließlich für Voraussagen zu
untersuchen. Der Schwerpunkt liegt auf der Wohlfahrtsanalyse. Zum
Beispiel kann sowohl in der nichtparametrischen Dichteschätzung als
auch in der Regression der so genannte Rand effekt erheblich sein,
d.h., dass sich der Bias und die Varianz aufgrund einseitiger
Dateninformationen erhöhen. Daher wird im ersten Aufsatz eine neue,
direkte und sehr einfache Korrektur für den Rande effekt
vorgeschlagen: die Anwendung einer variierenden lokalen Bandweite
an den Rändern. In einer umfangreichen Simulationsstudie wird
gezeigt, dass diese Methode sehr gut funktioniert. Darüber hinaus
ist es eine ausgezeichnete Methode zur Schätzung der
Welteinkommensverteilung und von Engel-Kurven in den
Wirtschaftswissenschaften. Im zweiten und dritten Aufsatz, wird ein
integrationsbasiertes Verfahren für die Abschätzung und Vorhersage
der Bevölkerungsverteilungen eingeführt. Dieses wird durch “data
matching” anhand von Anwendungen in der Wohlfahrtsökonomie und der
Ökonomie des Gesundheitswesens gezeigt. Im Ergebnis beider Ansätze
(2 und 3) ist es o ffensichtlich, dass die vorgeschlagene Methode
angewendet werden kann, um sowohl (unbedingte) diskrete als auch
kontinuierliche Verteilungen zu schätzen. Die Methode funktioniert
unabhängig von der Mittelwertregression oder vom Modell und kann
leicht auf andere Kontexte, wie “small area”-Statistik,
nichtparametrische Statistik, jedes Modell mit latenten Variablen
(z.B. Tobit Regression), simultane Gleichungssysteme, Methoden mit
Instrumentalvariablen, etc. erweitert werden. Der vierte Aufsatz
befasst sich mit dem Problem der Schätzung der Einkommens- oder
Verbrauchsverteilung, wenn nur wenige Quantile (z.B. Quartile und
Quintile) zur Verfügung stehen. Eine Methode für die konvexe
Schätzung einer Regressionsfunktion basierend auf der Spline
Glättungstechnik wird benutzt, um die Lorenz-Kurve aus wenigen
Datenpunkten zu schätzen. Der wichtigste Beitrag dieser Arbeit ist
es, zu zeigen, wie man basierend auf ein paar Quantilen unter
Anwendung einer funktionalen Form für die Lorenz-Kurve, eine
parametrische Dichte, die im Einklang mit den angegebenen Quantilen
steht, erhalten kann. Darüber hinaus ist es leicht,
Ungleichheitsmaße, wie den Gini-Koeffizient, bezogen auf die
gleichen Informationen abzuleiten.