arima

Numéro spécial CARI'04 - novembre 2005

Fiche article :

bouclier
spacer

 

Extraction de règles d'association pour la prédiction de valeurs manquantes

Extraction of Association Rules for the Prediction of Missing Values

Sylvie Jami* - Tao-Yan Jen** - Dominique Laurent** - Georges Loizou* - Oumar Sy***

*Birkbeck College - University of London
London - United Kingdom
{s.jami,george}@dcs.bbk.ac.uk

** LICP - Université de Cergy-Pontoise
Cergy-Pontoise - France
{tao-yuan.jen,dominique.laurent}@dept-info-cergy.fr

** UFR Sciences Appliquées - Université Gaston Berger
Saint Louis - Sénégal
oumar@ugb.sn


RÉSUMÉ. La présence de valeurs manquantes ou valeurs nulles dans les bases de donnnées a suscité de nombreuses recherches dans le domaine de la découverte des connaissances, notamment en ce qui concerne la prédiction. Cependant, à notre connaissance, peu de telles approches utilisent les règles d'association pour la prédiction des valeurs manquantes. Dans cet article, il est montré comment adapter les différents concepts et algorithmes par niveau liés aux règles d'association, afin d'obtenir des règles fréquentes et de confiance 1, permettant la prédiction de valeurs manquantes dans une table relationnelle. La particularité des règles extraites dans notre approche est que leurs conséquents se présentent sous la forme d'intervalles ou d'ensembles de valeurs, selon que le domaine de l'attribut sur lequel les valeurs sont prédites est soit continu soit discret.

ABSTRACT. Missing values in databases have motivated many researches in the field of KDD, specially concerning prediction. However, to the best of our knowledge, few appraoches based on association rules have been proposed so far. In this paper, we show how to adapt the levelwise algorithm for the mining of association rules in order to mine frequent rules with a confidence equal to 1 from a relational table. In our approach, the consequents of extracted rules are either an interval or a set of values, according to whether the domain of the predicted attribute is continuous or discrete.

MOTS-CLÉS : Bases de données, valeurs manquantes, règles d'association, prédiction

KEYWORDS: Databases, missing values, association rules, prediction

spacer
spacer
 présentation
    description

 accès aux articles
    online access

 nouvelles parutions
    recent articles

 comité de rédaction
    editorial board

 abonnements
    subscriptions

 soumission
    submission

 instructions auteurs
    author information

 contact

spacer

A R I M A  arima-office@inria.fr

  haut de page