À propos du CRIM

Indexation de contenu audio

En créant un index à partir du contenu parlé de très grandes bases de données audio, on en rend le contenu accessible à des moteurs de recherche semblables à Google.

Pour ce faire, il faut combiner la reconnaissance vocale avec une autre expertise en indexation et repérage qui permet de retrouver les termes recherchés malgré les erreurs de reconnaissance, les variantes de prononciation ou d'orthographe, et le manque de vocabulaire du système de reconnaissance.

Nous avons appliqué cette expertise dans quelques projets portant sur les archives cinématographiques de l'Office national du film (ONF) ou les témoignages recueillis dans la commission d'enquète Bastarache.

Technologies associées : moteur de reconnaissance, transducteurs à états finis.

Équipes

Événement à venir

  • IWCS 2017
    22/09/17 0h00
    Montpellier, France
    L'équipe Parole et Texte présentera deux publications lors de la 12ième "International Conference on Computational Semantics (IWCS) 2017.
    +
  • Saviez-vous que Le Solutionneur a été utilisé pr 120 écoles sec QC pr faire horaires #rentree2017 de 101 000 élèves… https://t.co/b2Nr7NfJrD
  • CRIM is happy to present 2 papers at #IWCS2017! https://t.co/wcH8i2mTdZ https://t.co/Hc9IDNvwhj

Publications récentes

  • PeopleBot

    +
  • Fine-grained domain classification of text using TERMIUM Plus

    +