Reconnaissance de la parole

La reconnaissance de la parole a recours à un vaste ensemble d’expertises afin de permettre à un ordinateur d’interpréter la voix humaine et d’y réagir correctement. Il faut pouvoir résoudre des problèmes allant des plus simples, comme détecter qu’une personne parle, ou réagir à une commande vocale, aux plus complexes telles que produire le sous-titrage d’une émission de télévision en direct ou déterminer le sujet dont il est question dans des conversations téléphoniques.

Technologies associées : détection de mots clés, indexation de contenu audio, sous-titrage, alignement texte/audio, moteur de reconnaissance, vérification de prononciation, transducteurs à états finis. 

Nos résultats dans les campagnes d’évaluation internationales telles que ETAPE 2011 confirment notre position parmi les meilleures équipes de recherche dans le domaine. Nous poursuivons activement nos recherches, par exemple en participant au groupe KALDI qui rassemble des chercheurs réputés.

 

Équipes

Réalisations

Nouvelles récentes

  • Blogue du CRIM - Manipuler les variables catégoriques dans un jeu de données
    12/07/2018

    Dans cet article, Farooq Sanni et Martin Sotir nous présentent différentes méthodes et astuces pour gérer les variables catégoriques.

    +

Événement à venir

  • QRS - SSCPS - IA 2018
    20/07/18 0h00
    Lisbonne, Portugal
    Le CRIM présentera trois articles scientifiques au QRS 2018.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +