À propos du CRIM

Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Événement à venir

  • Gala des Prix Innovation 2020 de l'ADRIQ
    19/11/20 0h00
    Palais des Congrès de Montréal
    Le Gala Prix Innovation 2020 de l'ADRIQ aura lieu le 19 novembre 2020, au Palais des congrès de Montréal.
    +
  • CSCIENCE IA RT @CSCIENCEIA: Une année marquante pour les membres du Centre de recherche informatique de Montréal (@CRIM_ca). L’organisme termine l’une…
  • PRIMA Québec RT @PRIMAQUEBEC: Bénéficiez d’une grande notoriété auprès de l’écosystème de la recherche et de l’innovation du Québec en appliquant sur le…

Publications récentes

  • On The Performance of Time-Pooling Strategies for End-to-End Spoken Language Identification

    +
  • An ensemble Based Approach for Generalized Detection of Spoofing Attacks to Automatic Speaker Recognizers

    +