À propos du CRIM

Analytique audio

On retrouve dans notre équipe un ensemble d’expertises consacrées à l’extraction d’information à partir du signal audio.

Un enregistrement audio contient souvent plus d’un locuteur. La diarisation permet de segmenter le signal audio en locuteurs, même si les locuteurs ne sont pas connus à l’avance. La détection de mots clés permet d’identifier la présence de certains mots dans des enregistrements audio alors que la détection de thèmes permet de détecter si un sujet donné a été abordé lors d’une conversation. Pour déterminer avec précision la position de chaque mot ou phonème d’un enregistrement, on parle alors de synchronisation texte/audio. Nous avons également développé des algorithmes afin de détecter les émotions d’une personne à partir d’un enregistrement audio. Il est ainsi possible, dans un système automatique, de modifier le comportement d’un système à partir des données vocales et ainsi être en mesure de répondre plus adéquatement aux attentes de l’interlocuteur. 

Technologies associées : détection de mots clés, indexation de contenu audio, détection des émotions.

Équipes

Réalisations

Événement à venir

  • Séminaire R-D : Transcription automatisée de la parole au texte des langues autochtones
    28/02/20 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Un conférence de Gilles Boulianne et Vishwa Gupta, chercheurs séniors en traitement automatique de la parole au CRIM.
    +
  • Le 4 mars, participez au Webinaire sur le DATALAB pour découvrir comment cette approche progressive peut vous aider… https://t.co/zJmrfNB84I
  • CANARIE RT @CANARIE_Inc: VESTA recueille les données des systèmes d'apprentissage en ligne quand les élèves lisent l'écran, sont distraits ou pense…

Publications récentes

  • Validating BGP Update Using Blockchain-Based Infrastructure

    +
  • Efficient Inference of Optimal Decision Trees

    +