Indexation d’images ou de vidéos à partir du contenu

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google. 

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d’orthographe, et le manque de vocabulaire du système de reconnaissance. 

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l’Office national du film (ONF) ou les témoignages recueillis dans la commission d’enquête Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • La joie de la lecture, signée De Marque
    18/04/2018

    Avant la création du Web, on travaillait beaucoup dans les écoles et on avait la motivation d’offrir un contenu en mode numérique, francophone et québécois, car ce qui existait était principalement anglophone...

    +

Événement à venir

  • Séminaire R-D - Vers des systèmes de génération du langage naturel cohérents, fluides et adaptés au contexte
    24/04/18 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Une présentation de Jad Kabbara, boursier au sein de l'équipe Parole et Texte du CRIM et étudiant au doctorat à l'Université McGill (School of Computer Science). Présentation en anglais.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +