Recherche en cours : le CRIM rend disponibles de nouveaux outils technologiques adaptés aux langues autochtones

Recherche en cours : le CRIM rend disponibles de nouveaux outils technologiques adaptés aux langues autochtones

Publié le 5/12/19

COMMUNIQUÉ
Pour diffusion immédiate

 

Recherche en cours : le CRIM rend disponibles de nouveaux outils technologiques adaptés aux langues autochtones

 

Montréal, le 5 décembre 2019 – L’an dernier, le CRIM annonçait le début d’une collaboration à long terme avec le Conseil national de recherches du Canada (CNRC) dans le cadre du Projet sur les technologies pour les langues autochtones canadiennes. Le 19 novembre 2019, des experts du CRIM, du CNRC, des communautés autochtones et du milieu de la recherche se réunissaient dans le cadre de HUB Montréal pour présenter certaines des avancées du projet.

S’y retrouver dans la mer de contenus
Le problème central des chercheurs et communautés autochtones dans le domaine de la langue est l’absence de données annotées ou classifiées. Cela signifie que des milliers d’heures de contenu ont été enregistrées, mais qu’il est difficile, voire impossible, de trouver rapidement des extraits de parole dans une langue spécifique (parmi les 70 langues autochtones parlées au pays) ou de trouver rapidement du contenu audio lié à un sujet précis.
 
Afin de répondre à cette problématique le plus efficacement possible, le CRIM a créé des outils de segmentation qui faciliteront l’accès et l’utilisation des données sonores existantes dans les langues ciblées. Ces outils pourront ensuite être adaptés à d’autres langues autochtones.
 
 
  1. Détecteur d'activité vocale (« voice activity detection »)
    Sépare les segments parlés des segments ne contenant que du bruit ou de la musique, à l'aide de réseaux neuronaux profonds adaptés à une diversité de langues
  2. Repérage du locuteur (« speaker retrieval »)
    Permet de retrouver les segments d'un enregistrement où un locuteur donné parle, peu importe sa langue, grâce à un système faisant appel aux i-vecteurs et à l’apprentissage profond.
  3. Outil d'étiquetage linguistique (« language retrieval »)
    Permet de retrouver les segments d'un enregistrement dits dans une langue donnée, parmi 32 langues incluant le Cri de l'Est et l'Inuktitut
  4. Segmentation par locuteurs (« speaker diarisation »)
    Distingue chacun des intervenants dans une conversation, peu importe la langue
  5. Séparation multicanale
    Outil destinée aux entrevues linguistiques où plusieurs locuteurs portent chacun un microphone rapproché
 
Rendre les fruits de la recherche accessibles à tous
Les outils créés dans le cadre du projet seront offerts aux chercheurs et aux communautés par l'entremise de deux plateformes ouvertes reconnues : VESTA et ELAN.
 
Grâce à un module d’extension téléchargeable, de nombreux partenaires pourront se servir des outils de VESTA dans l'interface ELAN, qui leur est familière, pour collaborer à la création d'un corpus de données audio annotées en langues autochtones.
 
À propos du projet
Le Projet sur les technologies pour les langues autochtones canadiennes est une initiative du CNRC
financée par le gouvernement fédéral dans le budget de 2017. Le CRIM travaille également avec
des chercheurs de l’Université Carleton et de l’Université d’Alberta qui s’impliquent auprès des
communautés autochtones depuis de nombreuses années. Les équipes travaillent en partenariat
avec des organismes communautaires autochtones et des communautés autochtones partout au
Canada.
 
L’intégration de VESTA à ELAN est soutenue par CANARIE via son programme Logiciels de
recherche.
 
À propos du CRIM
Le CRIM est un centre de recherche appliquée et d’expertise en technologies de l’information qui
rend les organisations plus performantes et compétitives par le développement de technologies
innovatrices et le transfert de savoir-faire de pointe, tout en contribuant à l’avancement scientifique.
 
Il permet aux organisations, principalement les PME, de démystifier et d'avoir accès aux
technologies de pointe comme celles de l'intelligence artificielle afin de résoudre efficacement les
problématiques technologiques auxquelles elles sont confrontées. Ses chercheurs et
professionnels en TI développent un large éventail d’applications dans des secteurs diversifiés et
oeuvrent dans des domaines d'expertises tels que l'apprentissage automatique, la vision par
ordinateur, la reconnaissance de la parole, le traitement automatique des langues naturelles, la
science des données et la recherche opérationnelle.
 
Le CRIM est un organisme sans but lucratif et sa neutralité et la force de son réseau en font une
ressource incontournable. Son action s’inscrit dans les politiques et stratégies pilotées par le
ministère de l'Économie et de l'Innovation, son principal partenaire financier.
 
 
– 30 –

Source et renseignements :

Antonia Leney-Granger, agente de communications
CRIM – Centre de recherche informatique de Montréal
medias@crim.ca | www.crim.ca | Tél. : 514 840-1234

[PDF]

Devenez membre du CRIM

Devenir membre du CRIM, c’est bénéficier du plus grand réseau d’entreprises en TI au Québec. C’est un accès privilégié à notre expertise en recherche et développement. Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

514 840-7993

Événement à venir

  • Santé et sécurité du travail 2020 - Événement les Affaires
    23/09/20 8h30
    Présentation en ligne
    Le CRIM est fier d'être partenaire de la 10e édition de la conférence Santé et sécurité du travail organisée par les Événement Les Affaires. Présentation en ligne.
    +
  • Merci @Grenier_enbref! #donnees #geospatial @opengeospatial @NASA @environnementca @ESA_EO @RNCan
  • @economie_quebec @SciChefQC @lsirois007 @inocanada @FPInnovations #Technologie #Recherche #Industrie #Investissement #Croissance