Analytique audio

On retrouve dans notre équipe un ensemble d’expertises consacrées à l’extraction d’information à partir du signal audio.

Un enregistrement audio contient souvent plus d’un locuteur. La diarisation permet de segmenter le signal audio en locuteurs, même si les locuteurs ne sont pas connus à l’avance. La détection de mots clés permet d’identifier la présence de certains mots dans des enregistrements audio alors que la détection de thèmes permet de détecter si un sujet donné a été abordé lors d’une conversation. Pour déterminer avec précision la position de chaque mot ou phonème d’un enregistrement, on parle alors de synchronisation texte/audio. Nous avons également développé des algorithmes afin de détecter les émotions d’une personne à partir d’un enregistrement audio. Il est ainsi possible, dans un système automatique, de modifier le comportement d’un système à partir des données vocales et ainsi être en mesure de répondre plus adéquatement aux attentes de l’interlocuteur. 

Technologies associées : détection de mots clés, indexation de contenu audio, détection des émotions.

Équipes

Réalisations

Nouvelles récentes

  • La joie de la lecture, signée De Marque
    18/04/2018

    Avant la création du Web, on travaillait beaucoup dans les écoles et on avait la motivation d’offrir un contenu en mode numérique, francophone et québécois, car ce qui existait était principalement anglophone...

    +

Événement à venir

  • Séminaire R-D - Vers des systèmes de génération du langage naturel cohérents, fluides et adaptés au contexte
    24/04/18 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Une présentation de Jad Kabbara, boursier au sein de l'équipe Parole et Texte du CRIM et étudiant au doctorat à l'Université McGill (School of Computer Science). Présentation en anglais.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +