Indexation d’images ou de vidéos à partir du contenu

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google. 

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d’orthographe, et le manque de vocabulaire du système de reconnaissance. 

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l’Office national du film (ONF) ou les témoignages recueillis dans la commission d’enquête Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • Blogue du CRIM - Manipuler les variables catégoriques dans un jeu de données
    12/07/2018

    Dans cet article, Farooq Sanni et Martin Sotir nous présentent différentes méthodes et astuces pour gérer les variables catégoriques.

    +

Événement à venir

  • QRS - SSCPS - IA 2018
    20/07/18 0h00
    Lisbonne, Portugal
    Le CRIM présentera trois articles scientifiques au QRS 2018.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +