Analytique audio

On retrouve dans notre équipe un ensemble d’expertises consacrées à l’extraction d’information à partir du signal audio.

Un enregistrement audio contient souvent plus d’un locuteur. La diarisation permet de segmenter le signal audio en locuteurs, même si les locuteurs ne sont pas connus à l’avance. La détection de mots clés permet d’identifier la présence de certains mots dans des enregistrements audio alors que la détection de thèmes permet de détecter si un sujet donné a été abordé lors d’une conversation. Pour déterminer avec précision la position de chaque mot ou phonème d’un enregistrement, on parle alors de synchronisation texte/audio. Nous avons également développé des algorithmes afin de détecter les émotions d’une personne à partir d’un enregistrement audio. Il est ainsi possible, dans un système automatique, de modifier le comportement d’un système à partir des données vocales et ainsi être en mesure de répondre plus adéquatement aux attentes de l’interlocuteur. 

Technologies associées : détection de mots clés, indexation de contenu audio, détection des émotions.

Équipes

Réalisations

Nouvelles récentes

  • Blogue du CRIM - Manipuler les variables catégoriques dans un jeu de données
    12/07/2018

    Dans cet article, Farooq Sanni et Martin Sotir nous présentent différentes méthodes et astuces pour gérer les variables catégoriques.

    +

Événement à venir

  • QRS - SSCPS - IA 2018
    20/07/18 0h00
    Lisbonne, Portugal
    Le CRIM présentera trois articles scientifiques au QRS 2018.
    +

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • État des lieux des technologies web

    +