Application des technologies vocales du CRIM aux langues autochtones

5 décembre 2018

COMMUNIQUÉ | Pour diffusion immédiate

Le CRIM partie prenante d’un vaste projet technologique autour des langues autochtones canadiennes

Montréal, le 5 décembre 2018 – Le CRIM est fier d’annoncer le début d’une collaboration à long terme avec le Conseil national de recherches du Canada (CNRC) dans le cadre d’un projet visant à encourager la revitalisation et la préservation des langues autochtones grâce aux technologies textuelles et fondées sur la parole. Le CRIM mettra à contribution son expertise afin d’adapter ses technologies de reconnaissance vocale aux langues autochtones.

Le Projet sur les technologies pour les langues autochtones canadiennes est une initiative du CRNC financée par le gouvernement fédéral dans le budget de 2017. Le CRIM travaillera également avec des chercheurs de l’Université Carleton et de l’Université d’Alberta qui s’impliquent auprès des communautés autochtones depuis de nombreuses années. Les équipes travailleront en partenariat avec des organismes communautaires autochtones et des communautés autochtones partout au Canada.

Notre équipe est très heureuse de collaborer avec le CRIM, qui est mondialement reconnu pour ses technologies textuelles et fondées sur la parole, sur ce défi culturel et linguistique d’importance.
– Roland Kuhn, CNRC

Rôle du CRIM

Le CRIM réalisera deux projets principaux qui serviront de base au développement d’une douzaine de systèmes liés à la reconnaissance de la parole et adaptés aux langues visées.

  • Le premier projet mènera au développement d’outils de segmentation des enregistrements audio, permettant de distinguer la parole de la musique ou du bruit, d’identifier les langues parlées et de séparer les différents locuteurs. Ces outils faciliteront l’annotation et la transcription des contenus pour accélérer la documentation des corpus existants pour chaque langue.
  • Le second projet est centré autour de la conception d’un outil d’indexation servant à identifier et à organiser des contenus audio existants pour chacune des langues cibles. Cela permettra de naviguer aisément parmi les nombreux enregistrements disponibles, par exemple pour trouver des séquences vidéo où l’on parle d’un sujet précis ou découvrir comment sont utilisées certaines expressions.

Un projet crucial, tant par son impact social que pour l’avancement scientifique

Le chercheur Roland Kuhn, chef du Projet sur les technologies pour les langues autochtones canadienne au CNRC, décrit en quoi cette recherche conjointe avec le CRIM est importante pour les communautés autochtones du Canada : « Il existe des milliers d’heures d’enregistrements de langues autochtones, mais ceux-ci sont malheureusement rarement annotés ou indexés dû au manque de technologies pour le faire : ce corpus non-annoté ne cesse de croître. Cette situation est frustrante pour les membres des communautés concernées, qui aimeraient pouvoir faire des recherches à l’aide de mots-clés pour trouver des enregistrements pertinents à leurs besoins actuels. Une personne ne devrait pas avoir à écouter 10 000 heures d’audio pour espérer trouver un enregistrement portant sur une cérémonie traditionnelle de leur communauté, par exemple. Notre équipe est très heureuse de collaborer avec le CRIM, qui est mondialement reconnu pour ses technologies textuelles et fondées sur la parole, sur ce défi culturel et linguistique d’importance. »

La structure des langues autochtones est très différente de celle de l’anglais ou du français, ce qui rend plusieurs des méthodes de reconnaissance vocale actuelles insuffisantes. Cela pose un défi de taille et exige le développement de nouvelles approches qui mèneront certainement à des innovations dans le domaine.

Les deux parties visent à fournir des outils technologiques de qualité pour l’enseignement, la valorisation et la préservation des langues pour les communautés autochtones. Par ailleurs, les experts du CRIM espèrent que les méthodes développées pour les langues ciblées au début du projet (l’Inuktitut et le Cri) puissent être appliquées à plusieurs autres des 70 langues autochtones parlées au Canada.

À propos du CRIM

Le CRIM est un centre de recherche appliquée et d’expertise en technologies de l’information qui rend les organisations plus performantes et compétitives par le développement de technologies innovatrices et le transfert de savoir-faire de pointe, tout en contribuant à l’avancement scientifique.

Il permet aux organisations, principalement les PME, de démystifier et d’avoir accès aux technologies de pointe comme celles de l’intelligence artificielle afin de résoudre efficacement les problématiques technologiques auxquelles elles sont confrontées. Ses chercheurs et professionnels en TI développent un large éventail d’applications dans des secteurs diversifiés et oeuvrent dans des domaines d’expertises tels que l’apprentissage automatique, la vision par ordinateur, la reconnaissance de la parole, le traitement automatique des langues naturelles, la science des données et la recherche opérationnelle.

Le CRIM est un organisme sans but lucratif et sa neutralité et la force de son réseau en font une ressource incontournable. Son action s’inscrit dans les politiques et stratégies pilotées par le ministère de l’Économie et de l’Innovation, son principal partenaire financier.

– 30 –

Source : CRIM

Mots-clés

Partager sur vos médias sociaux

Group 2Created with Sketch.
button upCreated with Sketch.

Abonnez-vous à notre infolettre

*Champs requis

Hidden