Numéro spécial CARI'04 - novembre 2005 Fiche article : |
Extraction de règles d'association pour la
prédiction de valeurs manquantes
|
RÉSUMÉ. La
présence de valeurs manquantes ou valeurs nulles dans les bases
de donnnées a suscité de nombreuses recherches dans le
domaine de la découverte des connaissances, notamment en ce qui
concerne la prédiction. Cependant, à notre connaissance,
peu de telles approches utilisent les règles d'association pour
la prédiction des valeurs manquantes. Dans cet article, il est
montré comment adapter les différents concepts et
algorithmes par niveau liés aux règles d'association,
afin d'obtenir des règles fréquentes et de confiance 1,
permettant la prédiction de valeurs manquantes dans une table
relationnelle. La particularité des règles extraites dans
notre approche est que leurs conséquents se présentent
sous la forme d'intervalles ou d'ensembles de valeurs, selon que le
domaine de l'attribut sur lequel les valeurs sont prédites est
soit continu soit discret. ABSTRACT. Missing
values in databases have motivated many researches in the field of KDD,
specially concerning prediction. However, to the best of our knowledge,
few appraoches based on association rules have been proposed so far. In
this paper, we show how to adapt the levelwise algorithm for the mining
of association rules in order to mine frequent rules with a confidence
equal to 1 from a relational table. In our approach, the consequents of
extracted rules are either an interval or a set of values, according to
whether the domain of the predicted attribute is continuous or discrete. MOTS-CLÉS :
Bases de données, valeurs manquantes, règles
d'association, prédiction KEYWORDS:
Databases, missing values, association rules, prediction |
A R I M A arima-office@inria.fr