Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Réalisations

Nouvelles récentes

  • Valorisation de la recherche québécoise
    16/09/2020

    Le CRIM salue l’importance que le Ministre Pierre Fitzgibbon accorde à la valorisation de la recherche québécoise et l’ampleur des ressources qu’il y consacrera.

    +

Événement à venir

  • Santé et sécurité du travail 2020 - Événement les Affaires
    23/09/20 8h30
    Présentation en ligne
    Le CRIM est fier d'être partenaire de la 10e édition de la conférence Santé et sécurité du travail organisée par les Événement Les Affaires. Présentation en ligne.
    +

Publications récentes

  • An end-to-end approach for the verification problem: learning the right distance

    +
  • The Indigenous Languages Technology Project at NRC Canada: an empowerment-oriented approach to developing language software

    +