RÉSUMÉ.
La méthode des noyaux est l’une des techniques d’estimation les plus répandues
en statistique non paramétrique. Nous introduisons un module en R, Disake, pour l’estimation
d’une distribution de probabilité par noyaux associés discrets. Dans l’estimation
par noyau, deux choix importants sont à faire : le choix du noyau et celui de la fenêtre de
lissage. Le module Disake implémente principalement les noyaux associés discrets ainsi que
la validation croisée et l’approche bayésienne locale pour la sélection du
paramètre de lissage. Des applications sur des données simulées et réelles
montrent que le noyau binomial est approprié pour les échantillons de petite ou moyenne
taille et, l’estimateur naïf ou le noyau triangulaire discret, indiqué pour les
échantillons de grande taille.
ABSTRACT.
Kernel smoothing is one of the most widely used nonparametric data smoothing techniques.
We introduce a new R package, Disake, for computing discrete associated kernel estimators
for probability mass function. When working with a kernel estimator, two choices must be made: the
kernel function and the smoothing parameter. The Disake package focuses on discrete associated
kernels and also on cross-validation and local Bayesian techniques to select the appropriate bandwidth.
Applications on simulated data and real data show that the binomial kernel is appropriate for
small or moderate count data while the empirical estimator or the discrete triangular kernel is indicated
for large samples.
MOTS-CLÉS :
Module R, noyau associé discret standard, validation croisée.
KEYWORDS:
R package, standard discrete associated kernel, cross-validation.
|