Audio analytics

Our team encompasses a set of skills dedicated to the extraction of information from an audio signal. 

An audio recording often contains more than one speaker. The process of diarisation partitions the audio signal into speaker segments, even when speaker are not known beforehand. Keyword detection consists in identifying the presence of certain words within audio recordings, whereas topic detection determines if a given subject has been discussed during a conversation. When the task is to accurately determine the position of each word or phoneme of a recording, we  speak of text/audio synchronization. We have also developed algorithms aimed at detecting a person’s emotions from an audio recording. It then becomes possible, in an automated system, to modify the system’s behavior according to the user’s reaction in order to adequately satisfy his interlocutor.

Related technologies: keyword detection, audio content indexing, emotion detection 

 

Teams

Releases

Recent news

  • Vidéodescription - Entrevue avec le CRIM à l'émission Ça me regarde d'AMI-Télé
    22/02/2018

    Claude Chapdelaine, spécialiste en ergonomie cognitive et en interactions humains-ordinateurs au CRIM, était invitée à l’émission Ça me regarde, animée par Christine Rousseau et Kéven Breton et diffusée par AMI-télé.

    +

Upcoming event

  • La biométrie vocale : vers une identification incontournable
    1 March 2018 12:00
    Desjardins Lab (Montréal)
    Gilles Boulianne, expert en reconnaissance de la parole et directeur de l'équipe Parole et Texte au CRIM, est le conférencier invité du prochain Desjardins Lab.
    +

Recent Publications

  • État des lieux des technologies web

    +
  • La science des données pour la prédiction des temps de réponse dans la gestion des services incendies : l'exemple de Montréal

    +