Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • Une assemblée générale et un cocktail annuel réussis!
    21/06/2018

    L'assemblée générale, présidée par M. Luc Gagnon, chef des technologies chez TELUS Santé et président du CA du CRIM, fut l'occasion de dresser un bilan des résultats dévoilés dans le rapport d'activités 2017-2018.

    +

Événement à venir

  • MLDM 2018
    14/07/18 8h00
    New York, U.S.A.
    Le CRIM présentera un article scientifique à la 14e édition de la conférence internationale sur l'apprentissage automatique et l'exploration de données (MLDM2018).
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +