Indexation d’images ou de vidéos à partir du contenu

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google. 

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d’orthographe, et le manque de vocabulaire du système de reconnaissance. 

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l’Office national du film (ONF) ou les témoignages recueillis dans la commission d’enquête Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • UEAT et le CRIM : Une collaboration gagnante
    23/11/2020

    CRIM collabore avec UEAT pour développer un moteur de suggestion pour les commandes en ligne basé sur les préférences du consommateur.

    +

Événement à venir

  • DevOps - Événement Les Affaires
    9/12/20 9h00
    Présentation en ligne
    Le CRIM est fier d'être partenaire de la 3e édition de la conférence DevOps - Passez de la théorie à la pratique pour une implantation réussie organisée par les Événement Les Affaires. Présentation en ligne.
    +

Publications récentes

  • An end-to-end approach for the verification problem: learning the right distance

    +
  • The Indigenous Languages Technology Project at NRC Canada: an empowerment-oriented approach to developing language software

    +