Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • Classo : L'expertise du CRIM mise à contribution dans le développement de solutions destinées au milieu de l'éducation
    03/09/2019

    La plateforme Classo vise à faciliter l'accès aux ressources numériques pour les professionnels du milieu de l'éducation.

    +

Événement à venir

  • ICoCSec2019
    26/09/19 0h00
    Malaisie
    Le CRIM présentera 2 articles lors de l'International Conference on Cybersecurity 2019 (ICoC2019). Organisé par Universiti Sains Islam Malaysia en Malaisie, les 25 et 26 septembre 2019.
    +

Publications récentes

  • Forage de données géospatiales, quelques applications

    +
  • Des technologies perturbatrices pour de futures applications du bâtiment intelligent utilisant AI

    +