arima

Numéro spécial CARI'04 - novembre 2005

Fiche article :

bouclier
spacer

 

Nouvelle méthode de fusion de données pour l'apprentissage des systèmes hybrides MMC/RNA.
Application pour la reconnaissance automatique de la parole

A New Data Fusion Method for Hybrid MMC/RNA Learning with Application to Automatic Speech Recognition

Lilia Lazli* - Mohamed Tayeb Laskri*

*Laboratoire de Recherche en Informatique (LRI)
Groupe de Recherche en Intelligence Artificielle (GRIA)
Département d'Informatique
Faculté des Sciences de l'Ingénieur
Université Badji Mokhtar d'Annaba
B.P.12 Sidi Amar 23200 Annaba - Algérie
L_Lazli@yahoo.fr
laskri@univ-annaba.org


RÉSUMÉ. De nombreuses expériences ont déjà montré qu'une forte amélioration du taux de reconnaissance des systèmes MMC (Modèles de Markov Cachés) traditionnels est observée lorsque plus de données d'apprentissage sont utilisées. En revanche, l'augmentation du nombre de données d'apprentissage pour les modèles hybrides MMC/RNA (Modèles de Markov cachés/Réseaux de neurones artificiels) s'accompagne d'une forte augmentation du temps nécessaire à l'apprentissage des modèles mais pas ou peu des performances du système. Pour pallier cette limitation, nous rapportons dans ce papier les résultats obtenus avec une nouvelle méthode d'apprentissage basée sur la fusion de données. Cette méthode a été appliquée dans un système de reconnaissance de la parole arabe. Ce dernier est basé d'une part, sur une segmentation floue (application de l'algorithme c-moyennes floues) et d'une autre part, sur une segmentation à base des algorithmes génétiques.

ABSTRACT. It is well known that traditional Hidden Markov Models (HMM) systems lead to a considerable improvement when more training data or more parameters are used. However, using more data with hybrid Hidden Markov Models and Artificial Neural Networks (HMM/ANN) models results in increased training times without improvements in performance. We developed in this work a new method based on automatically separating data into several sets and training several neural networks of Multi-Layer Perceptrons (MLP) type on each set. During the recognition phase, models are combined using several criteria (based on data fusion techniques) to provide the recognized word. We showed in this paper that this method significantly improved the recognition accuracy. This method was applied in an Arabic speech recognition system. This last is based on the one hand, on a fuzzy clustering (application of the fuzzy c-means algorithm) and of another share, on a segmentation at base of the genetic algorithms.

MOTS-CLÉS : Reconnaissance de la parole arabe, segmentation floue, algorithmes génétiques, modèles de Markov cachés, réseaux de neurones artificiels, méthode de fusion de données.

KEYWORDS: Arabic speech recognition, fuzzy Clustering, genetic algorithms, hidden Markov models, artificial neural networks, data fusion method.

spacer
spacer
 présentation
    description

 accès aux articles
    online access

 nouvelles parutions
    recent articles

 comité de rédaction
    editorial board

 abonnements
    subscriptions

 soumission
    submission

 instructions auteurs
    author information

 contact

spacer

A R I M A  arima-office@inria.fr

  haut de page