Reconnaissance de la parole

La reconnaissance de la parole a recours à un vaste ensemble d’expertises afin de permettre à un ordinateur d’interpréter la voix humaine et d’y réagir correctement. Il faut pouvoir résoudre des problèmes allant des plus simples, comme détecter qu’une personne parle, ou réagir à une commande vocale, aux plus complexes telles que produire le sous-titrage d’une émission de télévision en direct ou déterminer le sujet dont il est question dans des conversations téléphoniques.

Technologies associées : détection de mots clés, indexation de contenu audio, sous-titrage, alignement texte/audio, moteur de reconnaissance, vérification de prononciation, transducteurs à états finis. 

Le CRIM participe à des compétitions et campagnes d'évaluation technologiques en reconnaissance de la parole et du locuteur depuis 1992. Nos résultats dans les campagnes d’évaluation internationales telles que ETAPE 2011 confirment notre position parmi les meilleures équipes de recherche dans le domaine. Nous poursuivons activement nos recherches, par exemple en participant au groupe KALDI qui rassemble des chercheurs réputés.

 

Équipes

Réalisations

Nouvelles récentes

  • CANARIE investit dans les logiciels de recherche du CRIM!
    18/10/2018

    Le CRIM est heureux d'annoncer que CANARIE financera l'évolution de ses plateformes de recherche afin de les rendre disponibles à d'autres équipes oeuvrant dans des disciplines différentes.

    +

Événement à venir

  • ICTAC 2018
    19/10/18 0h00
    Stellenbosch, Afrique du Sud
    Le CRIM présentera un papier à la "15th International Colloquium on the Theoretical Aspects of Computing" qui se tiendra du 12 au 19 octobre 2018 à Stellenbosch, Afrique du Sud.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • Intégration de VerbNet dans un réalisateur profond

    +