arima

Volume 19 - 2015

Fiche article :

bouclier
spacer

 

Nonparametric estimation for probability mass function with Disake: an R package for discrete associated kernel estimators

Estimation d'une distribution de probabilité par noyaux associés discrets avec le module Disake

W. E. Wansouwé* - C. C. Kokonendji** - D. T. Kolyang*

*Department of Computer Science
The University of Maroua
P.O. box 55 Maroua
Cameroon
ericwansouwe@gmail.com
dtaiwe@yahoo.fr

**Laboratoire de Mathématiques de Besançon-UMR 6623 CNRS-UFC
Université de Franche-Comté
16 route de Gray, 25030 Besançon Cedex
France
celestin.kokonendji@univ-fcomte.fr

RÉSUMÉ. La méthode des noyaux est l’une des techniques d’estimation les plus répandues en statistique non paramétrique. Nous introduisons un module en R, Disake, pour l’estimation d’une distribution de probabilité par noyaux associés discrets. Dans l’estimation par noyau, deux choix importants sont à faire : le choix du noyau et celui de la fenêtre de lissage. Le module Disake implémente principalement les noyaux associés discrets ainsi que la validation croisée et l’approche bayésienne locale pour la sélection du paramètre de lissage. Des applications sur des données simulées et réelles montrent que le noyau binomial est approprié pour les échantillons de petite ou moyenne taille et, l’estimateur naïf ou le noyau triangulaire discret, indiqué pour les échantillons de grande taille.

ABSTRACT. Kernel smoothing is one of the most widely used nonparametric data smoothing techniques. We introduce a new R package, Disake, for computing discrete associated kernel estimators for probability mass function. When working with a kernel estimator, two choices must be made: the kernel function and the smoothing parameter. The Disake package focuses on discrete associated kernels and also on cross-validation and local Bayesian techniques to select the appropriate bandwidth. Applications on simulated data and real data show that the binomial kernel is appropriate for small or moderate count data while the empirical estimator or the discrete triangular kernel is indicated for large samples.

MOTS-CLÉS : Module R, noyau associé discret standard, validation croisée.

KEYWORDS: R package, standard discrete associated kernel, cross-validation.

spacer
spacer
 présentation
    description

 accès aux articles
    online access

 nouvelles parutions
    recent articles

 comité de rédaction
    editorial board

 abonnements
    subscriptions

 soumission
    submission

 instructions auteurs
    author information

 contact

spacer

A R I M A  arima[dot]editorial[dot]board[at]inria[dot]fr

  haut de page