Reconnaissance de la parole

La reconnaissance de la parole a recours à un vaste ensemble d’expertises afin de permettre à un ordinateur d’interpréter la voix humaine et d’y réagir correctement. Il faut pouvoir résoudre des problèmes allant des plus simples, comme détecter qu’une personne parle, ou réagir à une commande vocale, aux plus complexes telles que produire le sous-titrage d’une émission de télévision en direct ou déterminer le sujet dont il est question dans des conversations téléphoniques.

Technologies associées : détection de mots clés, indexation de contenu audio, sous-titrage, alignement texte/audio, moteur de reconnaissance, vérification de prononciation, transducteurs à états finis. 

Le CRIM participe à des compétitions et campagnes d'évaluation technologiques en reconnaissance de la parole et du locuteur depuis 1992. Nos résultats dans les campagnes d’évaluation internationales telles que ETAPE 2011 confirment notre position parmi les meilleures équipes de recherche dans le domaine. Nous poursuivons activement nos recherches, par exemple en participant au groupe KALDI qui rassemble des chercheurs réputés.

 

Équipes

Réalisations

Nouvelles récentes

  • GeoImageNet : l’intelligence artificielle appliquée aux images satellites!
    29/04/2019

    Le CRIM est fier de prendre part à un projet novateur qui permettra de soutenir le travail des chercheurs canadiens oeuvrant dans le domaine géospatial, afin d’accélérer l’innovation dans ce secteur de pointe.

    +

Événement à venir

  • Colloque canadien sur les logiciels de recherche 2019
    29/05/19 8h00
    Montréal
    Plusieurs experts du CRIM seront présents à ce Colloque qui se déroulera à Montréal les 28 et 29 mai 2019
    +

Publications récentes

  • Forage de données géospatiales, quelques applications

    +
  • Des technologies perturbatrices pour de futures applications du bâtiment intelligent utilisant AI

    +