Séminaire R-D : Transcription automatisée de la parole au texte des langues autochtones

Séminaire R-D : Transcription automatisée de la parole au texte des langues autochtones
12/12/19 11h00
CRIM (405, avenue Ogilvy, bureau 101, Montréal)

Présentation en anglais

Transcription automatisée de la parole au texte des langues autochtones

CONFÉRENCIERS

Gilles Boulianne et Vishwa Gupta, chercheurs séniors en traitement automatique de la parole au CRIM.


Automated speech-to-text transcription of Indigenous Languages

SPEAKERS

Gilles Boulianne and Vishwa Gupta, Senior Researchers in Automatic Speech Processing, CRIM.

ABSTRACT

This presentation will outline the progress CRIM has made in automated transcription of audio from Indigenous languages. Automated transcription of Indigenous languages is part of the audio segmentation and indexation project launched by NRC (Indigenous Language Revitalization Using Digital Technology). In this presentation we show the progress we have made in automatically transcribing Inuktitut and Cree. We will also outline methods and tools CRIM has made available for researchers and communities involved in language documentation and preservation.

Many Indigenous languages are polysynthetic. For example, Inuktitut is highly polysynthetic, like many of the 900 Indigenous languages spoken in the Americas. In addition, Inuktitut is a low resource language. The only data available are texts from Nunavut parliament proceedings, plus 23 hours of transcribed oral stories. Using this corpus, we can show that Inuktitut displays a much higher degree of polysynthesis than other agglutinative languages usually considered in ASR, such as Finnish or Turkish.  Even with a vocabulary of 1.3 million words derived from Nunavut parliament proceedings and stories, held-out stories still contain more than 60% out-of-vocabulary words. Therefore, our solution was to train bi-directional LSTM acoustic models, then investigate word and subword units, morphemes and syllables, as well as a deep neural network that finds word boundaries in subword sequences.  We will show that acoustic decoding using syllables with word boundary markers results in the lowest word error rate.


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les étudiants du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.


Conférence gratuite. Inscription requise.

Événement à venir

  • Gala des Prix Innovation 2019 de l'ADRIQ
    21/11/19 0h00
    Palais des Congrès de Montréal
    Le CRIM est heureux d'être partenaire des Prix Innovation 2019 de l'ADRIQ et de contribuer ainsi au rayonnement et à la reconnaissance des innovations technologiques. Période de mise en candidature jusqu'au 10 mai 2019.
    +
  • #Demain ???? Détection de signes de maladie mentale et de troubles du comportement à partir de la communication en lig… https://t.co/y8ZEQDBYsc
  • CNRC RT @CNRC_NRC: Le Gala des Prix Innovation 2019 de l’@ADRIQ_RCTi aura lieu demain! Des scientifiques d’#AutomobileCNRC et #TransportsCNRC so…