Bandwidth Selection in Nonparametric Kernel Estimation
Bandweitenwahl bei nichtparametrischer Kernschätzung
by Anja Schindler
Date of Examination:2011-09-29
Date of issue:2012-03-14
Advisor:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Stefan Sperlich
Referee:Prof. Dr. Inmaculada Martínez-Zarzoso
Referee:Prof. Dr. Thomas Keib
Files in this item
Name:schindler.pdf
Size:3.06Mb
Format:PDF
Description:Kumulative Dissertation
Abstract
English
Kernel estimation is a common nonparametric method for data based estimation of densities or regression functions. Although one may consider nonparametric estimation as a procedure that does not involve parameters, one has to estimate bandwidth parameters. The difference to parameter based estimation of e.g. density functions is that no specific form of the nonparametric density has to be assumed. This makes nonparametric estimation methods more flexible. This thesis compromises three parts. The first part covers bandwidth selection in kernel density estimation, which is a common tool for empirical studies in many research areas. The discussion about finding the optimal bandwidth based on the data has been going on over three decades. The typical aim of empirical studies in the past was mostly to show that a new method outperforms existing ones. Review articles on comparing methods are very rare and were written a long time ago. Hence, the first part of this thesis is an update review of existing methods comparing them on a set of different designs. The second part is on bandwidth selection in nonparametric kernel regression. The aim is similar to the first part: reviewing and comparing existing methods on a set of designs. In part one and two, smooth densities of a random variable X were assumed, therefore global bandwidth selection is adequate for the kernel estimation. In contrast to the first two parts we assume a density of X with a sharp peak and smooth areas in the third part. Usually local bandwidth selection is used in this case. However, we want to apply global bandwidth selection methods and hence, it is tested if good results can be obtained by a prior transformation. Therefore, part three covers a comparison between using a transformation and estimating the global bandwidth without a transformation. The main question is whether an improvement with respect to the typical error criteria in nonparametric regression can be made by using a prior transformation.
Keywords: nonparametric estimation; bandwidth selection; Kernel density estimation; Kernel regression; transformation
Other Languages
Kernschätzung ist eine weit verbreitete nichtparametrische Methode für eine datenbasierende Schätzung von Dichte- und Regressionsfunktionen. Obwohl man denken könnte, dass "nichtparametrisch" ohne Parameter bedeutet, muss man doch den Parameter der Bandweite schätzen. Der Unterschied zur parametrischen Schätzung besteht darin, dass keine bestimmte funktionale Form angenommen werden muss. Deshalb ist die nichtparametrische Schätzung wesentlich flexibler. Die Arbeit besteht aus drei Teilen. Das Thema im ersten Teil ist die Bandweitenwahl in der Kerndichteschätzung, die ein häufig verwendetes Hilfsmittel in empirischen Studien vieler Forschungsgebiete ist. Das Finden der datenbasierenden optimalen Bandweite wird schon seit über drei Jahrzehnten diskutiert. Dabei war meistens das typische Ziel von empirischen Studien der Vergangenheit zu zeigen, dass eine neu entwickelte Methode die existierenden übertrifft. Vergleichende Artikel zu den Methoden sind sehr selten und wurden vor sehr langer Zeit geschrieben. Der erste Teil dieser Arbeit ist daher eine aktualisierte Übersicht von existierenden Methoden, die für verschiedene Modelle verglichen werden. Im zweiten Teil geht es um Bandweitenwahl bei der Kernregression. Das Ziel ist ähnlich zum ersten Teil: Übersicht und Vergleich von existierenden Methoden für verschiedene Modelle. In den beiden ersten Teilen wurden sehr glatte Dichtefunktionen der Zufallsvariable X angenommen, deshalb ist eine globale Bandweitenwahl in diesen Fällen geeignet. Im Gegensatz dazu wird im dritten Teil eine Dichtefunktion von X angenommen, die einen sehr spitzen Modus und etwas glattere Bereiche hat. Normalerweise wird in solchen Fällen lokale Bandweitenwahl angewendet. Trotzdem soll auch in diesen Fällen eine globale Bandweite gewählt werden, dabei wird getestet, ob man gute Ergebnisse mit einer vorangestellten Transformation erhalten kann. Im dritten Teil wird deshalb die globale Bandweitenwahl mit und ohne die Verwendung der Transformation verglichen. Die Fragestellung ist daher, ob bei der Kernregressionsschätzung eine Verbesserung durch die Verwendung einer Transformation erreicht werden kann.
Schlagwörter: nichtparametrische Schätzung; Kern; Bandweitenwahl; Dichte; Kerndichteschätzung; Kern Regression; Transformation