arima

Volume 21 - 2015

Fiche article :

bouclier
spacer

 

Classification non Supervisée de Données Multidimensionnelles par les Processus Ponctuels Marqués

Unsupervised clustering of multidimensional data with marked point processes

Khadidja Henni* - Olivier Alata*** - Lynda Zaoui* - Abdellatif Elidrissi** - Ahmed Moussa**

*Laboratoire LSSD, Département d'informatique
Université des Sciences et Technologie Mohamed Boudiaf USTO-MB
Oran-Algérie
khadidja.henni@univ-usto.dz
lynda.zaoui@univ-usto.dz

**Laboratoire LabTIC, ENSAT
Université Abdelmalek Essaadi
BP 1818, Tanger-Maroc
amoussa@uae.ac.ma

***Laboratoire Hubert Curien, UMR 5516
Université Jean Monnet
Saint Etienne-France
olivier.alata@univ-stetienne.fr

RÉSUMÉ. Cet article décrit un nouvel algorithme non supervisé de classification des données multidimensionnelles. Il consiste à détecter les prototypes des classes présentes dans un échantillon et à appliquer l'algorithme KNN pour la classification de toutes les observations. La détection des prototypes des classes est basée sur les processus ponctuels marqués, c'est d'une part une adaptation de la méthode de Métropolis-Hasting-Green qui génére des mouvements manipulant les objets du processus (naissance, mort...) et d'autre part une modélisation de Gibbs qui introduit la fonction de potentiel matérialisant les interactions du processus en termes d'énergie. Plusieurs expérimentations ont été réalisées sur des données ponctuelles multidimensionnelles où les classes sont non linéairement séparables et des données réelles issues des puces à ADN. Une comparaison avec des méthodes de classification existantes a permis de montrer l'efficacité de ce nouvel algorithme.

ABSTRACT. We present in this work a new unsupervised clustering algorithm, it detects the prototypes of the classes and uses KNN algorithm to classify all available observations. The prototype class detection is based on marked point processes. It is an adaptation of : the Metropolis-Hasting-Green method that generate several movements to manipulate the objects processes (birth, death ..); the Gibbs theory that models the potential function of the process. Several experiments were performed on multidimensional data with non linearly separable classes and on real microarray data. A comparison with existing classification methods has shown the effectiveness of this new algorithm.

MOTS-CLÉS : Classification automatique, Processus ponctuels marqué, Détection des modes, Metropolis Hasting-Green.

KEYWORDS: Automatic classification, Marked point process, Mode detection, Metropolis Hasting-Green.

spacer
spacer
 présentation
    description

 accès aux articles
    online access

 nouvelles parutions
    recent articles

 comité de rédaction
    editorial board

 abonnements
    subscriptions

 soumission
    submission

 instructions auteurs
    author information

 contact

spacer

A R I M A  arima[dot]editorial[dot]board[at]inria[dot]fr

  haut de page