Reconnaissance de la parole

La reconnaissance de la parole a recours à un vaste ensemble d’expertises afin de permettre à un ordinateur d’interpréter la voix humaine et d’y réagir correctement. Il faut pouvoir résoudre des problèmes allant des plus simples, comme détecter qu’une personne parle, ou réagir à une commande vocale, aux plus complexes telles que produire le sous-titrage d’une émission de télévision en direct ou déterminer le sujet dont il est question dans des conversations téléphoniques.

Technologies associées : détection de mots clés, indexation de contenu audio, sous-titrage, alignement texte/audio, moteur de reconnaissance, vérification de prononciation, transducteurs à états finis. 

Nos résultats dans les campagnes d’évaluation internationales telles que ETAPE 2011 confirment notre position parmi les meilleures équipes de recherche dans le domaine. Nous poursuivons activement nos recherches, par exemple en participant au groupe KALDI qui rassemble des chercheurs réputés.

 

Équipes

Réalisations

Nouvelles récentes

  • La joie de la lecture, signée De Marque
    18/04/2018

    Avant la création du Web, on travaillait beaucoup dans les écoles et on avait la motivation d’offrir un contenu en mode numérique, francophone et québécois, car ce qui existait était principalement anglophone...

    +

Événement à venir

  • Séminaire R-D - Vers des systèmes de génération du langage naturel cohérents, fluides et adaptés au contexte
    24/04/18 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Une présentation de Jad Kabbara, boursier au sein de l'équipe Parole et Texte du CRIM et étudiant au doctorat à l'Université McGill (School of Computer Science). Présentation en anglais.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +