Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • Vidéodescription - Entrevue avec le CRIM à l'émission Ça me regarde d'AMI-Télé
    22/02/2018

    Claude Chapdelaine, spécialiste en ergonomie cognitive et en interactions humains-ordinateurs au CRIM, était invitée à l’émission Ça me regarde, animée par Christine Rousseau et Kéven Breton et diffusée par AMI-télé.

    +

Événement à venir

  • La biométrie vocale : vers une identification incontournable
    1/03/18 12h00
    Desjardins Lab (Montréal)
    Gilles Boulianne, expert en reconnaissance de la parole et directeur de l'équipe Parole et Texte au CRIM, est le conférencier invité du prochain Desjardins Lab.
    +

Publications récentes

  • État des lieux des technologies web

    +
  • La science des données pour la prédiction des temps de réponse dans la gestion des services incendies : l'exemple de Montréal

    +