{"id":28127,"date":"2025-10-21T09:28:05","date_gmt":"2025-10-21T13:28:05","guid":{"rendered":"https:\/\/www.crim.ca\/?p=28127"},"modified":"2026-04-17T10:14:35","modified_gmt":"2026-04-17T14:14:35","slug":"banc-essai-parole","status":"publish","type":"post","link":"https:\/\/www.crim.ca\/fr\/banc-essai-parole\/","title":{"rendered":"Le Banc d\u2019essai de grands mod\u00e8les de parole en fran\u00e7ais qu\u00e9b\u00e9cois spontan\u00e9 : entrevue avec Gilles Boulianne et Amira Morsli"},"content":{"rendered":"<p><strong>Dans le monde de l\u2019intelligence artificielle, la reconnaissance de la parole progresse \u00e0 grands pas. Mais qu\u2019en est-il du fran\u00e7ais qu\u00e9b\u00e9cois, cette langue vivante, color\u00e9e et parfois insaisissable pour les grands mod\u00e8les de langues.<\/strong><\/p>\n<p><strong>C\u2019est la question \u00e0 laquelle s\u2019attaque le projet de banc d\u2019essai pilot\u00e9 par Amira Morsli, scientifique des donn\u00e9es et Gilles Boulianne, directeur scientifique et responsable de pratique, parole.<\/strong><\/p>\n<p><strong>Ce projet interne du CRIM, financ\u00e9 en partie par le CRSNG, vise \u00e0 \u00e9valuer et am\u00e9liorer les performances des mod\u00e8les de reconnaissance vocale sur le fran\u00e7ais qu\u00e9b\u00e9cois spontan\u00e9.<\/strong><\/p>\n<p><strong>Le tout fut r\u00e9parti en deux projets cons\u00e9cutifs, avec Amira Morsli comme responsable du premier projet. Les r\u00e9sultats du deuxi\u00e8me projet, dont le travail principal fut effectu\u00e9 par Coralie Serrand, n\u2019ont pas encore \u00e9t\u00e9 publi\u00e9s au moment de la r\u00e9daction de ce billet.<\/strong><\/p>\n<h2>Pourquoi un banc d\u2019essai\u2009?<\/h2>\n<p>\u00ab\u2009On entend souvent que les solutions de Google ou Microsoft fonctionnent moins bien en qu\u00e9b\u00e9cois, mais on n\u2019avait pas de preuve\u2009\u00bb, explique Gilles Boulianne.<\/p>\n<p>L\u2019id\u00e9e est donc n\u00e9e de cr\u00e9er un <a href=\"https:\/\/www.researchgate.net\/publication\/395124910_Benchmarking_Large_Pretrained_Multilingual_Models_on_Quebec_French_Speech_Recognition\">banc d\u2019essai capable d\u2019int\u00e9grer et de tester diff\u00e9rents mod\u00e8les<\/a> \u2013 qu\u2019ils soient propri\u00e9taires, open source ou d\u00e9velopp\u00e9s localement \u2013 sur un corpus authentique de fran\u00e7ais qu\u00e9b\u00e9cois spontan\u00e9, constitu\u00e9 gr\u00e2ce au travail d\u2019Amira Morsli.<\/p>\n<p>\u00ab La plupart des syst\u00e8mes couvrent une centaine de langues, mais il en existe plus de 7000. La question qui se pose alors c&#8217;est comment inclure les dialectes, les accents r\u00e9gionaux ou les vari\u00e9t\u00e9s locales \u00bb, explique Amira Morsli.<\/p>\n<p>Ce banc d\u2019essai permet de mesurer non seulement le taux d\u2019erreur des mod\u00e8les, mais aussi leur vitesse d\u2019ex\u00e9cution, leur consommation de m\u00e9moire et, surtout, leur capacit\u00e9 \u00e0 pr\u00e9server le sens des propos malgr\u00e9 les erreurs. \u00ab\u2009Compter les erreurs de mots, c\u2019est bien, mais si le sens est conserv\u00e9, l\u2019impact est moindre\u2009\u00bb, souligne Gilles Boulianne.<\/p>\n<h2>Un processus de collecte et d\u2019alignement exigeant<\/h2>\n<p>La cr\u00e9ation du corpus a \u00e9t\u00e9 un v\u00e9ritable d\u00e9fi.<\/p>\n<p>Amira Morsli raconte\u2009: \u00ab\u2009On a transform\u00e9 des vid\u00e9os en audio, puis extrait et nettoy\u00e9 les transcriptions PDF, souvent issues de commissions publiques comme Bastarache et Charbonneau. Il a fallu aligner chaque segment audio avec son texte et son locuteur, un travail long et it\u00e9ratif\u2009\u00bb. Ce corpus, riche en accents et en \u00e9motions, refl\u00e8te la diversit\u00e9 du fran\u00e7ais qu\u00e9b\u00e9cois, m\u00eame si, faute d\u2019annotations d\u00e9mographiques, il est difficile d\u2019en mesurer pr\u00e9cis\u00e9ment la vari\u00e9t\u00e9.<\/p>\n<h2>Un enjeu scientifique et sociolinguistique<\/h2>\n<p>Pourquoi s\u2019int\u00e9resser au fran\u00e7ais qu\u00e9b\u00e9cois\u2009? Parce que, comme le rappelle Gilles Boulianne, peu de donn\u00e9es existent pour entra\u00eener les mod\u00e8les, contrairement \u00e0 l\u2019anglais ou au fran\u00e7ais international. Les mod\u00e8les multilingues peinent donc \u00e0 bien reconna\u00eetre le qu\u00e9b\u00e9cois, ce qui limite leur utilit\u00e9 pour les utilisateurs locaux et les entreprises.<\/p>\n<p>Le projet vise aussi \u00e0 inspirer la communaut\u00e9 scientifique. \u00ab\u2009On esp\u00e8re que d\u2019autres chercheurs utiliseront et enrichiront le corpus, pour la reconnaissance de la parole, mais aussi pour des \u00e9tudes sociolinguistiques\u2009\u00bb, explique Gilles Boulianne. Le r\u00eave\u2009? Un jour, voir \u00e9merger un mod\u00e8le de fondation qu\u00e9b\u00e9cois, capable de comprendre et de parler avec l\u2019accent local, \u00e0 l\u2019image de ce qui se fait en Islande ou ailleurs.<\/p>\n<h2>Une reconnaissance \u00e0 Interspeech 2025<\/h2>\n<p>C\u2019est dans ce contexte que les r\u00e9sultats du premier projet ont \u00e9t\u00e9 pr\u00e9sent\u00e9s \u00e0 <a href=\"https:\/\/www.interspeech2025.org\/home\">Interspeech 2025<\/a>, la plus grande conf\u00e9rence internationale d\u00e9di\u00e9e \u00e0 la recherche sur la parole et le langage, qui s\u2019est tenue du 17 au 21 ao\u00fbt \u00e0 Rotterdam, aux Pays-Bas. Cette 26e \u00e9dition avait pour th\u00e8me <strong>\u00ab Fair and Inclusive Speech Science and Technology \u00bb<\/strong>, mettant l\u2019accent sur la diversit\u00e9 linguistique et individuelle comme source de richesse pour des technologies vocales plus \u00e9quitables, robustes et personnalis\u00e9es.<\/p>\n<figure id=\"attachment_28133\" aria-describedby=\"caption-attachment-28133\" style=\"width: 768px\" class=\"wp-caption alignnone\"><img fetchpriority=\"high\" decoding=\"async\" class=\"wp-image-28133 size-large\" src=\"https:\/\/www.crim.ca\/wp-content\/uploads\/2025\/10\/IMG_1783-768x1024.jpg\" alt=\"Pr\u00e9sentation de posters scientifiques lors d\u2019une conf\u00e9rence internationale, montrant Amira Morsli du CRIM \u00e9changeant devant des affiches de recherche sur la reconnaissance de la parole.\" width=\"768\" height=\"1024\" srcset=\"https:\/\/www.crim.ca\/wp-content\/uploads\/2025\/10\/IMG_1783-768x1024.jpg 768w, https:\/\/www.crim.ca\/wp-content\/uploads\/2025\/10\/IMG_1783-225x300.jpg 225w, https:\/\/www.crim.ca\/wp-content\/uploads\/2025\/10\/IMG_1783-1152x1536.jpg 1152w, https:\/\/www.crim.ca\/wp-content\/uploads\/2025\/10\/IMG_1783.jpg 1440w\" sizes=\"(max-width: 768px) 100vw, 768px\" \/><figcaption id=\"caption-attachment-28133\" class=\"wp-caption-text\">Amira Morsli \u00e0 Interspeech 2025<\/figcaption><\/figure>\n<p>Pendant quatre jours, des milliers de chercheurs, \u00e9tudiants et professionnels se sont r\u00e9unis pour assister \u00e0 des conf\u00e9rences pl\u00e9ni\u00e8res, des sessions orales et des pr\u00e9sentations de posters. \u00ab\u2009Il y avait des sessions en parall\u00e8le toute la journ\u00e9e, des \u00e9changes passionnants, et une vraie effervescence autour des projets innovants\u2009\u00bb, raconte Gilles Boulianne.<\/p>\n<p>Amira Morsli, qui pr\u00e9sentait le projet, se souvient de l\u2019int\u00e9r\u00eat suscit\u00e9. \u00ab\u2009Les gens voulaient savoir comment reproduire notre travail, dans d\u2019autres langues ou contextes. Certains ont m\u00eame propos\u00e9 de collaborer pour enrichir le corpus.\u2009\u00bb<\/p>\n<h2>Une aventure humaine et professionnelle<\/h2>\n<p>Pour Amira Morsli, ce projet a \u00e9t\u00e9 un projet professionnel marquant. \u00ab\u2009Il s&#8217;agit de mon premier stage au Canada et de ma premi\u00e8re conf\u00e9rence internationale. J\u2019ai appris \u00e0 aimer le qu\u00e9b\u00e9cois et \u00e0 comprendre ses expressions.\u2009\u00bb.<\/p>\n<p>Gilles Boulianne y voit aussi une reconnexion avec la \u00ab\u2009science de la parole\u2009\u00bb, au-del\u00e0 des r\u00e9seaux de neurones et des mod\u00e8les de langue.<\/p>\n<p>Le banc d\u2019essai de grands mod\u00e8les de parole en fran\u00e7ais qu\u00e9b\u00e9cois spontan\u00e9 est bien plus qu\u2019un outil technique. C\u2019est une invitation \u00e0 reconna\u00eetre la richesse et la complexit\u00e9 des langues, \u00e0 les valoriser dans l\u2019\u00e9cosyst\u00e8me num\u00e9rique et \u00e0 r\u00eaver du futur de ce projet porteur, \u00e0 suivre de pr\u00e8s.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dans le monde de l\u2019intelligence artificielle, la reconnaissance de la parole progresse \u00e0 grands pas. Mais qu\u2019en est-il du fran\u00e7ais qu\u00e9b\u00e9cois, cette langue vivante, color\u00e9e et parfois insaisissable pour les grands mod\u00e8les de langues. C\u2019est la question \u00e0 laquelle s\u2019attaque le projet de banc d\u2019essai pilot\u00e9 par Amira Morsli, scientifique des donn\u00e9es et Gilles Boulianne, [&hellip;]<\/p>\n","protected":false},"author":409,"featured_media":28131,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[55],"tags":[645,642,644,646,643],"class_list":["post-28127","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-nouvelle","tag-corpus-linguistique","tag-ia-quebec","tag-interspeech-025","tag-technologie-vocale","tag-traitement-du-langage"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/posts\/28127","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/users\/409"}],"replies":[{"embeddable":true,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/comments?post=28127"}],"version-history":[{"count":7,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/posts\/28127\/revisions"}],"predecessor-version":[{"id":29421,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/posts\/28127\/revisions\/29421"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/media\/28131"}],"wp:attachment":[{"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/media?parent=28127"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/categories?post=28127"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.crim.ca\/fr\/wp-json\/wp\/v2\/tags?post=28127"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}