À propos du CRIM

Indexation d’images ou de vidéos à partir du contenu

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google. 

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d’orthographe, et le manque de vocabulaire du système de reconnaissance. 

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l’Office national du film (ONF) ou les témoignages recueillis dans la commission d’enquête Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Événement à venir

  • Séminaire R-D : Transcription automatisée de la parole au texte des langues autochtones
    28/02/20 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Un conférence de Gilles Boulianne et Vishwa Gupta, chercheurs séniors en traitement automatique de la parole au CRIM.
    +
  • Le 4 mars, participez au Webinaire sur le DATALAB pour découvrir comment cette approche progressive peut vous aider… https://t.co/zJmrfNB84I
  • CANARIE RT @CANARIE_Inc: VESTA recueille les données des systèmes d'apprentissage en ligne quand les élèves lisent l'écran, sont distraits ou pense…

Publications récentes

  • Validating BGP Update Using Blockchain-Based Infrastructure

    +
  • Efficient Inference of Optimal Decision Trees

    +