Projets

Logiciel de positionnement automatique de sous-titres

L’application SmartCaption est un logiciel qui vise à minimiser le travail humain lors du sous-titrage d’une vidéo, soit en mode « roll-up » ou « pop-on ». Le logiciel permet l’exécution des trois tâches principales d’une session de sous-titrage: l’édition du texte, sa synchronisation pour faciliter sa lecture et son positionnement automatique pour éviter l’affichage sur des éléments visuels importants (texte ou visage humain). Ce projet a été financé en partie par le CRSNG.

Service expérimental de diffusion de vidéodescription pour des contenus sur DVD

Le projet Accès-VD vise à parfaire et étudier l’utilisation d’un lecteur DVD développé par l'équipe pour l’accessibilité aux aveugles et malvoyants de tout DVD ne contenant pas de bande sonore de videodescription. Il est offert sur ordinateur à des utilisateurs aveugles ou malvoyants. Le lecteur utilise une technologie de synchronisation qui ne modifie en rien le contenu visuel ou sonore du DVD brute. Ce projet est financé en partie par l'Office des Personnes Handicapées du Québec (OPHQ).

Participation à l’évaluation technologique TRECVID du NIST

Depuis 4 ans, l'équipe participe sur une base régulière à l'évaluation technologique TREC Video Retrieval du National Institute of Standards and Technologies (NIST). Cette « compétition » donne l'occasion aux grands groupes de recherches internationaux de comparer les performances de leurs technologies de traitement vidéos sur des jeux de données neutres. L'équipe Vision et imagerie a ainsi eu l'occasion de parfaire ses outils d'analyse de scène pour des applications de sécurité et surveillance vidéo et développé, en collaboration avec l'équipe Reconnaissance de la parole, des technologies de détection de copie vidéo frauduleuses.

 

Outils de capture, d’analyse et d’indexation vidéo pour le support à l’entraînement sportif d’élite

Depuis 2007, l'équipe a rempli plusieurs mandats visant le développent de technologies vidéos pour l'aide à l'entraînement sportif d'élite. Ce type d'application nécessite plusieurs expertises, dont l'installation de systèmes de capture multi-caméra et le développement de logiciels dédiés pour la manipulation, l'analyse et la simulation de données vidéos. Ces mandats sont actuellement réalisés pour les utilisateurs de Patinage de Vitesse Canada et du Centre National Multisport de Montréal.

 

Évaluation d'une librairie d'extraction automatique de couronnes d'arbres

L'objectif de ce mandat était d'évaluer et de migrer une partie d'une librairie de détection automatique de couronnes d'arbres vers des logiciels ouverts pour améliorer les performances et poser les assises pour le développement d'un logiciel de production.

Extraction automatique de l'hydrographie sur les images du satellite SPOT

Ces mandats, réalisés pour Ressources Naturelles Canada, ont menés au développement d’un logiciel « stand alone » permettant la mise à jour semi-automatique des cartes de contour des zones hydrographiques canadiennes (lacs et rivières) à partir d’images du satellite SPOT. Une version Web fonctionnant en mode service est en court de développement.

Logiciel de manipulation de micros-films numérisés

Ce mandat contractuel porte sur l'implémentation d'un logiciel de manipulation et traitement à gros volume de micros-films numérisés de documents textes (journaux, revues, dépliants, etc.).

Le logiciel combine diverses fonctions de filtrage, rehaussement, découpage et de redressements nécessaires aux applications d'archivage et d'indexation. 

Partenaire du Réseau de recherche E-Inclusion

L'objectif du Réseau de recherche E-Inclusion est de développer des outils de traitement audio-vidéo et de produire des lignes directrices pour producteurs de contenu, afin d'améliorer la richesse de l'expérience multimédia pour les personnes ayant une déficience sensorielle auditive ou visuelle. Ce projet est financé en partie par Patrimoine canadien.

Dans le cadre de deux projets de E-Inclusion, l'équipe contribue au développement d'outils pour le positionnement intelligent du sous-titrage pour les sourds et les malentendants, ainsi que pour la description assistée par ordinateur du contenu visuel pour les non-voyants et les malvoyants.

Partenaire des projets COBVIS-D et SPEED-Q

Comportement céphalo-oculaire des conducteurs automobiles

Le projet COBVIS-D a pour but de développer un environnement de simulation pour l'analyse des comportements céphalo-oculaires des conducteurs automobiles âgés. Il doit permettre d'élaborer des programmes de rééducation plus appropriés et des outils pour mieux identifier les conducteurs à risque. Le projet SPEED-Q vise à adapter ce simulateur à une plate-forme automobile. Le maître-d'œuvre du projet est le Laboratoire de vision et systèmes numériques de l'Université Laval.

L'équipe du CRIM contribue au niveau de la détection et de la reconnaissance automatique des expressions faciales, via le « Facial Action Coding System » dans des contextes de conduite difficile. Le projet est financé par le Centre d'excellence canadien Auto21 et la Société d'assurance automobile du Québec (SAAQ).

Analyse multirésolution d'images radar polarimétriques

Ce projet vise en premier lieu à simuler des images radar polarimétriques (PolSAR) artificielles reproduisant aussi fidèlement que possible les caractéristiques statistiques attendues. Financé par le CRSNG, ce projet sera d'une durée de 5 ans.

En deuxième lieu, de nouvelles techniques d'analyse multiéchelle dans un espace géométrique sont implémentées. Elles visent à fournir de nouveaux outils pour l'extraction d'information des images PolSAR.

Partenaire du projet PTZ

Intelligent Pan/Tilt/Zoom Camera for Security Applications

Le projet PTZ visait le développement d'une caméra Pan/Tilt/Zoom intelligente pour des logiciels de surveillance vidéo. Le maître d'œuvre était la firme VideoWave Networks.

L'équipe du CRIM était partenaire pour le développement et l'implémentation des algorithmes de suivi et reconnaissance d'objets. PTZ a été financé en partie par le Programme Alliance Precarn-CRIM.

Ce projet a remporté le Prix OCTAS de l'innovation technologique 2006, décerné par la Fédération de l'informatique du Québec (maintenant Réseau Action TI) conjointement à VideoWave Networks et au CRIM.

Partenaire du projet SIMIPE-Ciné

Système d'interprétation et de monitoring intégré des paysages et de l'environnement adapté à l'industrie cinématographique

Le projet SIMIPE-Ciné avait pour but de développer un logiciel de reconnaissance des paysages servant au repérage de lieux de tournage.

L'équipe a contribué au moteur de recherche d'images par le contenu visuel. Le maître-d'œuvre de SIMIPE-Ciné était la Chaire en paysage et environnement de l'Université de Montréal (CPEUM). Ce projet était financé par le Conseil régional de développement de la Montérégie.

Partenaire du projet C³GRID

Closed Captioning Computing GRID

Le projet C³GRID visait le développement d'une grille de calcul pour l’apprentissage distribué des modèles acoustiques, visuels et de langage en reconnaissance de la parole.

L'équipe a contribué au module d'extraction de caractéristiques visuelles sur la forme de la bouche, afin d'augmenter la robustesse de la reconnaissance en environnement sonore bruité. Ce projet était financé en partie par le programme ARIM de CANARIE.

Partenaire du projet MONNET

Monitoring of Extended Premises: Tracking Pedestrians Using a Network of Loosely Coupled Cameras

Le projet MONNET a été mis en œuvre par le Laboratoire de vision et systèmes numériques de l'Université Laval. MONNET avait pour but de développer un système intelligent de vision pour la surveillance de personnes dans des endroits publics.

L'équipe du CRIM a contribué au niveau du module de reconnaissance de visages et d'expressions faciales. Ce projet était financé en partie par le programme de Precarn visant la recherche pilotée par les universités (PUL).

Partenaire du projet S3I

Station d'inspection industrielle intelligente

Le projet S3I visait le développement d'une station d'inspection visuelle pour les petits objets de plastique.

Le maître d'œuvre était la firme I.C. Vision de Montréal. L'équipe était partenaire avec le Département de génie de la production automatisée de l'École de technologie supérieure, pour le perfectionnement du module d'acquisition et de traitement des images. Ce projet était financé en partie par le Programme Alliance Precarn-CRIM.

Partenaire du projet MADIS

MPEG-7 Audio-visual Document Indexation System

Le projet MADIS visait le développement d'un banc d'essai pour l'indexation et la recherche par contenu de films dans le cadre du standard MPEG-7.

Les partenaires du projet étaient les équipes Vision et imagerie et Reconnaissance de la parole du CRIM, ainsi que l'Office national du film du Canada (ONF). Le projet MADIS était financé en partie par le programme E-content de CANARIE.

Fusion audio-vidéo pour la reconnaissance de la parole

Ce projet de recherche avait pour objectif d'explorer des approches de fusion audio-vidéo pour la reconnaissance du français québécois parlé, dans le cadre de la lecture de bulletins de nouvelles. Le projet visait aussi à développer un environnement de test pour l'extraction des descripteurs audio-visuels.

Il a été effectué en collaboration avec l'équipe Reconnaissance de la parole du CRIM.

Environnement de recherche d'images par contenu compatible MPEG-7

ERIC7

Le système développé dans le cadre de ce projet produit automatiquement des descriptions MPEG-7. Celles-ci permettent d'indexer des banques d'images par les caractéristiques visuelles de celles-ci (couleur, forme, texture, etc.).

Des fonctionnalités de recherche, d'analyse et d'exploration des descriptions, ainsi que de classification des images ont été développées.

Partenaire pour la mise en place d'une plate-forme technologique pour la recherche sur l'oeil et la vision au Québec

L'équipe a développé des algorithmes de traitement et d'analyse d'images ophtalmiques pour ce projet collectif, piloté par l'Université de Montréal.

Elle était partenaire d'une subvention d'infrastructure à la Fondation canadienne de l'innovation (FCI).

Segmentation de lésions dans des images de fluorescence

Ce mandat contractuel consistait à réaliser une application permettant de faire la segmentation automatique ou semi-automatique de lésions apparaissant dans une séquence d'images de fluorescence et d'estimer la surface de celles-ci.

Moteur de création de mosaïques d'images aériennes infrarouges et optiques

Ce contrat consistait à développer un moteur permettant de faire le balancement radiométrique de photographies aériennes infrarouges et optiques couleurs pour la création de mosaïques d'images.

Le mosaïquage comprenait les opérations de compensation radiométrique et colorimétrique, de mise en place et d'assemblage des images composantes (tuiles) prétraitées.

Outils d'analyse d'images de la rétine

Ce projet avait pour objectif de construire une boîte à outils d'algorithmes d'analyse d'images couleurs ophtalmiques pour l'aide au diagnostic de maladies de la rétine.

Le bien livrable principal a été un logiciel prototype (Retsoft) d'aide au diagnostic de la rétinopathie diabétique pour les usagers médicaux.

 
boite_recherche_g

Recherche

boite_recherche_d

CONTACT

Langis Gagnon, Ph. D.

Directeur de l'équipe Vision et imagerie et chercheur principal

514 840-1235, poste 8959

Langis Gagnon, Ph. D.