Analytique audio

On retrouve dans notre équipe un ensemble d’expertises consacrées à l’extraction d’information à partir du signal audio.

Un enregistrement audio contient souvent plus d’un locuteur. La diarisation permet de segmenter le signal audio en locuteurs, même si les locuteurs ne sont pas connus à l’avance. La détection de mots clés permet d’identifier la présence de certains mots dans des enregistrements audio alors que la détection de thèmes permet de détecter si un sujet donné a été abordé lors d’une conversation. Pour déterminer avec précision la position de chaque mot ou phonème d’un enregistrement, on parle alors de synchronisation texte/audio. Nous avons également développé des algorithmes afin de détecter les émotions d’une personne à partir d’un enregistrement audio. Il est ainsi possible, dans un système automatique, de modifier le comportement d’un système à partir des données vocales et ainsi être en mesure de répondre plus adéquatement aux attentes de l’interlocuteur. 

Technologies associées : détection de mots clés, indexation de contenu audio, détection des émotions.

Équipes

Réalisations

Nouvelles récentes

  • Retour sur l'AGA 2020
    06/07/2020

    Le CRIM a tenu sa 35e assemblée générale annuelle le 18 juin 2020. Plusieurs membres étaient présents pour souligner une année de croissance importante pour l’organisme.

    +

Événement à venir

  • Gala des Prix Innovation 2020 de l'ADRIQ
    19/11/20 0h00
    Palais des Congrès de Montréal
    Le Gala Prix Innovation 2020 de l'ADRIQ aura lieu le 19 novembre 2020, au Palais des congrès de Montréal.
    +

Publications récentes

  • On The Performance of Time-Pooling Strategies for End-to-End Spoken Language Identification

    +
  • An ensemble Based Approach for Generalized Detection of Spoofing Attacks to Automatic Speaker Recognizers

    +