Reconnaissance de la parole

La reconnaissance de la parole a recours à un vaste ensemble d’expertises afin de permettre à un ordinateur d’interpréter la voix humaine et d’y réagir correctement. Il faut pouvoir résoudre des problèmes allant des plus simples, comme détecter qu’une personne parle, ou réagir à une commande vocale, aux plus complexes telles que produire le sous-titrage d’une émission de télévision en direct ou déterminer le sujet dont il est question dans des conversations téléphoniques.

Technologies associées : détection de mots clés, indexation de contenu audio, sous-titrage, alignement texte/audio, moteur de reconnaissance, vérification de prononciation, transducteurs à états finis. 

Le CRIM participe à des compétitions et campagnes d'évaluation technologiques en reconnaissance de la parole et du locuteur depuis 1992. Nos résultats dans les campagnes d’évaluation internationales telles que ETAPE 2011 confirment notre position parmi les meilleures équipes de recherche dans le domaine. Nous poursuivons activement nos recherches, par exemple en participant au groupe KALDI qui rassemble des chercheurs réputés.

 

Équipes

Réalisations

Nouvelles récentes

  • Technologie d’audio description du CRIM : Technoleads prend le relais
    10/12/2019

    Services Technoleads inc., un fournisseur de services innovants pour l’industrie des médias, annonce avoir franchi toutes les étapes lui permettant d’exploiter de façon autonome la technologie d’audio description du CRIM.

    +

Événement à venir

  • Transformation numérique - Secteur public - Événement Les Affaires
    29/01/20 7h00
    DoubleTree par Hilton, Montréal
    Le CRIM fier partenaire de la 1ère édition sur la Transformation numérique - Secteur public organisée par les Événement Les Affaires, qui se tiendra les 29 janvier 2020 au DoubleTree par Hilton, Montréal.
    +

Publications récentes

  • Deep learning speech recognition for low-resource languages

    +
  • Forage de données géospatiales, quelques applications

    +