RÉSUMÉ.
Cet article décrit un nouvel algorithme non supervisé de classification des
données multidimensionnelles. Il consiste à détecter les prototypes des
classes présentes dans un échantillon et à appliquer l'algorithme
KNN pour la classification de toutes les observations. La détection des prototypes
des classes est basée sur les processus ponctuels marqués, c'est d'une part
une adaptation de la méthode de Métropolis-Hasting-Green qui
génére des mouvements manipulant les objets du processus (naissance, mort...)
et d'autre part une modélisation de Gibbs qui introduit la fonction de potentiel
matérialisant les interactions du processus en termes d'énergie.
Plusieurs expérimentations ont été réalisées sur des
données ponctuelles multidimensionnelles où les classes sont non
linéairement séparables et des données réelles issues des
puces à ADN. Une comparaison avec des méthodes de classification
existantes a permis de montrer l'efficacité de ce nouvel algorithme.
ABSTRACT.
We present in this work a new unsupervised clustering algorithm, it detects the prototypes
of the classes and uses KNN algorithm to classify all available observations. The prototype
class detection is based on marked point processes. It is an adaptation of : the
Metropolis-Hasting-Green method that generate several movements to manipulate the
objects processes (birth, death ..); the Gibbs theory that models the potential function
of the process. Several experiments were performed on multidimensional data with non
linearly separable classes and on real microarray data. A comparison with existing
classification methods has shown the effectiveness of this new algorithm.
MOTS-CLÉS :
Classification automatique, Processus ponctuels marqué, Détection des modes,
Metropolis Hasting-Green.
KEYWORDS:
Automatic classification, Marked point process, Mode detection, Metropolis Hasting-Green.
|