À propos du CRIM

Sous-titrage en direct d’émissions (Groupe TVA)


Définition de la problématique du client

Au Québec, 750 000 personnes vivent avec une déficience auditive. Comme il n’existait pas de moyens technologiques performants pour sous-titrer l’ensemble des émissions mises en ondes en direct, les personnes sourdes et malentendantes n’avaient pas accès aux nouvelles d’actualité de dernière minute, à la description des rencontres sportives et aux autres évènements diffusés en direct.

Pour remédier à cette situation, le CRTC (Conseil de la radiodiffusion et des télécommunications canadiennes) a mis en œuvre une nouvelle réglementation qui oblige les télédiffuseurs à sous-titrer l’ensemble de leur contenu télévisuel.

Dans le but de répondre aux nouvelles exigences du CRTC, le Groupe TVA nous a demandé de vérifier si la reconnaissance de la parole pouvait être utilisée pour effectuer le sous-titrage des émissions en direct.

Défi du mandat

Pour être compréhensibles, les sous-titres ne doivent pas contenir plus de 10 % de mots erronés. De plus, le délai entre ce qui est dit et la transcription affichée doit être minimal.

Dans le contexte d’un environnement parfois fortement bruité, avec un nombre important d’intervenants, la transcription de la parole spontanée est une tâche impossible à réaliser avec moins de 10% d’erreur.

Les mots hors vocabulaire sont un autre défi. Il est fréquent que des mots inconnus du système (noms étranger, régions, etc.) apparaissent soudainement dans l’actualité. Ces mots hors vocabulaire causent plusieurs erreurs dans la transcription et doivent donc être évités à tout prix. 

Solution développée par le CRIM

Un taux d’erreur de moins de 10 % peut être atteint dans le contexte de la parole lue dans un environnement contrôlé. Pour obtenir un contexte semblable, nous avons fait intervenir des sous-titreurs vocaux. Leur tâche consiste principalement à répéter tout ce que l’intervenant dit.  

Au lieu de traiter l’audio d’un intervenant possiblement inconnu, se trouvant dans un environnement potentiellement bruité et improvisant son texte, nous traitons un signal provenant d’un environnement parfaitement contrôlé.  

Pour pallier au problème des mots hors vocabulaire, qui sont fréquents dans la transcription de nouvelles d’actualité, notre système parcourt les sites de nouvelles disponibles sur le Web afin d’enrichir son vocabulaire. Les nouveaux mots faisant partie de l’actualité sont automatiquement détectés et ajoutés au vocabulaire du système de sous-titrage.

Impact dans son entreprise

L’intégration du logiciel chez le Groupe TVA a permis le renouvellement de sa licence auprès du CRTC. Depuis, TVA est en mesure de rendre accessible aux personnes sourdes et malentendantes 100 % de son contenu télévisuel.

Le CRIM se démarque

Le système STDirect permet le sous-titrage d’émissions diffusées en direct à faible coût. Il s’adapte automatiquement à l’actualité et peut facilement être adapté à une autre langue.

Après l’intégration de STDirect chez le Groupe TVA, une nouvelle entreprise a été créée, SOVO technologies, qui utilise STDirect pour assurer le service de sous-titrage de : 

  • Tous les sports en direct sur RDS, RDS2 et RDS Info Sports
  • Plusieurs émissions pour Télé-Québec, TVA, Canal Vie, CBC, RDI, TFO, CPAC
  • Évènements spéciaux tels que la coupe du Monde FIFA 2010, la couverture en direct de la commission Bastarache, ou les Jeux Olympiques d’hiver Vancouver 2010.

SOVO Technologies, créée en 2010, compte environ quatre-vingt employés.

Équipes

Événement à venir

  • IWCS 2017
    22/09/17 0h00
    Montpellier, France
    L'équipe Parole et Texte présentera deux publications lors de la 12ième "International Conference on Computational Semantics (IWCS) 2017.
    +
  • Saviez-vous que Le Solutionneur a été utilisé pr 120 écoles sec QC pr faire horaires #rentree2017 de 101 000 élèves… https://t.co/b2Nr7NfJrD
  • CRIM is happy to present 2 papers at #IWCS2017! https://t.co/wcH8i2mTdZ https://t.co/Hc9IDNvwhj

Publications récentes

  • PeopleBot

    +
  • Fine-grained domain classification of text using TERMIUM Plus

    +