|
|

|
|
Projets
Logiciel de positionnement automatique de sous-titres
L’application SmartCaption est un logiciel qui vise à minimiser le travail humain lors du
sous-titrage d’une vidéo, soit en mode « roll-up » ou « pop-on ». Le logiciel permet l’exécution
des trois tâches principales d’une session de sous-titrage: l’édition du texte, sa synchronisation
pour faciliter sa lecture et son positionnement automatique pour éviter l’affichage sur des
éléments visuels importants (texte ou visage humain). Ce projet a été financé en partie par le
CRSNG. |
 |
Service expérimental de diffusion de vidéodescription pour des contenus sur DVD
Le projet Accès-VD vise à parfaire et étudier l’utilisation d’un lecteur DVD développé par
l'équipe pour l’accessibilité aux aveugles et malvoyants de tout DVD ne contenant pas de bande
sonore de videodescription. Il est offert sur ordinateur à des utilisateurs aveugles ou malvoyants.
Le lecteur utilise une technologie de synchronisation qui ne modifie en rien le contenu visuel ou
sonore du DVD brute. Ce projet est financé en partie par
l'Office des Personnes Handicapées du
Québec (OPHQ). |
 |
Participation à l’évaluation technologique TRECVID du NIST
Depuis 4 ans, l'équipe participe sur une base régulière à l'évaluation technologique TREC Video
Retrieval du
National Institute of Standards and
Technologies (NIST). Cette « compétition » donne l'occasion aux grands groupes de recherches
internationaux de comparer les performances de leurs technologies de traitement vidéos sur des jeux
de données neutres. L'équipe
Vision et imagerie a ainsi
eu l'occasion de parfaire ses outils d'analyse de scène pour des applications de sécurité et
surveillance vidéo et développé, en collaboration avec l'équipe
Reconnaissance de la
parole, des technologies de détection de copie vidéo frauduleuses. |
Outils de capture, d’analyse et d’indexation vidéo pour le support à l’entraînement sportif d’élite
Depuis 2007, l'équipe a rempli plusieurs mandats visant le développent de technologies vidéos
pour l'aide à l'entraînement sportif d'élite. Ce type d'application nécessite plusieurs expertises,
dont l'installation de systèmes de capture multi-caméra et le développement de logiciels dédiés
pour la manipulation, l'analyse et la simulation de données vidéos. Ces mandats sont actuellement
réalisés pour les utilisateurs de
Patinage de Vitesse Canada et du
Centre National
Multisport de Montréal. |
 |
Évaluation d'une librairie d'extraction automatique de couronnes d'arbres
L'objectif de ce mandat était d'évaluer et de migrer une partie d'une librairie de détection
automatique de couronnes d'arbres vers des logiciels ouverts pour améliorer les performances et
poser les assises pour le développement d'un logiciel de production. |
 |
Extraction automatique de l'hydrographie sur les images du satellite SPOT
Ces mandats, réalisés pour
Ressources Naturelles Canada,
ont menés au développement d’un logiciel « stand alone » permettant la mise à jour semi-automatique
des cartes de contour des zones hydrographiques canadiennes (lacs et rivières) à partir d’images du
satellite SPOT. Une version Web fonctionnant en mode service est en court de développement. |
 |
Logiciel de manipulation de micros-films numérisés
Ce mandat contractuel porte sur l'implémentation d'un logiciel de manipulation et traitement à
gros volume de micros-films numérisés de documents textes (journaux, revues, dépliants, etc.).
Le logiciel combine diverses fonctions de filtrage, rehaussement, découpage et de redressements
nécessaires aux applications d'archivage et d'indexation. |
 |
Partenaire du Réseau de recherche E-Inclusion
L'objectif du
Réseau de recherche
E-Inclusion est de développer des outils de traitement audio-vidéo et de produire des lignes
directrices pour producteurs de contenu, afin d'améliorer la richesse de l'expérience multimédia
pour les personnes ayant une déficience sensorielle auditive ou visuelle. Ce projet est financé en
partie par
Patrimoine
canadien.
Dans le cadre de
deux projets de
E-Inclusion, l'équipe contribue au développement d'outils pour le positionnement intelligent du
sous-titrage pour les sourds et les malentendants, ainsi que pour la description assistée
par ordinateur du contenu visuel pour les non-voyants et les malvoyants.
|
 |
Partenaire des projets COBVIS-D et SPEED-Q
Comportement céphalo-oculaire des conducteurs automobiles
Analyse multirésolution d'images radar polarimétriques
Ce projet vise en premier lieu à simuler des images radar polarimétriques (PolSAR) artificielles
reproduisant aussi fidèlement que possible les caractéristiques statistiques attendues. Financé par
le
CRSNG, ce projet sera d'une durée
de 5 ans.
En deuxième lieu, de nouvelles techniques d'analyse multiéchelle dans un espace géométrique sont
implémentées. Elles visent à fournir de nouveaux outils pour l'extraction d'information des images
PolSAR. |
 |
Partenaire du projet PTZ
Intelligent Pan/Tilt/Zoom Camera for Security Applications
Le projet
PTZ visait le développement d'une
caméra Pan/Tilt/Zoom intelligente pour des logiciels de surveillance vidéo. Le maître d'œuvre était
la firme VideoWave Networks.
L'équipe du CRIM était partenaire pour le développement et l'implémentation des algorithmes de
suivi et reconnaissance d'objets. PTZ a été financé en partie par le Programme
Alliance
Precarn-CRIM.
Ce projet a remporté le Prix OCTAS de l'innovation technologique 2006, décerné par la
Fédération de l'informatique du Québec (maintenant
Réseau Action TI) conjointement à
VideoWave Networks
et au CRIM.
|
 |
Partenaire du projet SIMIPE-Ciné
Système d'interprétation et de monitoring intégré des paysages et de l'environnement adapté à l'industrie cinématographique
Partenaire du projet C³GRID
Closed Captioning Computing GRID
Le projet
C³GRID visait le développement
d'une grille de calcul pour l’apprentissage distribué des modèles acoustiques, visuels et de
langage en reconnaissance de la parole.
L'équipe a contribué au module d'extraction de caractéristiques visuelles sur la forme de la
bouche, afin d'augmenter la robustesse de la reconnaissance en environnement sonore bruité. Ce
projet était financé en partie par le programme ARIM de
CANARIE. |
 |
Partenaire du projet MONNET
Monitoring of Extended Premises: Tracking Pedestrians Using a Network of Loosely Coupled Cameras
Le projet
MONNET a été mis en œuvre
par le
Laboratoire de vision et systèmes numériques de l'Université
Laval. MONNET avait pour but de développer un système intelligent de vision pour la
surveillance de personnes dans des endroits publics.
L'équipe du CRIM a contribué au niveau du module de reconnaissance de visages et d'expressions
faciales. Ce projet était financé en partie par le programme de Precarn visant la recherche pilotée
par les universités (PUL).
|
 |
Partenaire du projet S3I
Station d'inspection industrielle intelligente
Le projet
S3I visait le développement d'une
station d'inspection visuelle pour les petits objets de plastique.
Le maître d'œuvre était la firme I.C. Vision de Montréal. L'équipe était partenaire avec le
Département de génie de la
production automatisée de l'École de technologie supérieure, pour le perfectionnement du module
d'acquisition et de traitement des images. Ce projet était financé en partie par le Programme
Alliance
Precarn-CRIM.
|
 |
Partenaire du projet MADIS
MPEG-7 Audio-visual Document Indexation System
Le projet
MADIS visait le développement d'un
banc d'essai pour l'indexation et la recherche par contenu de films dans le cadre du standard
MPEG-7.
Les partenaires du projet étaient les équipes Vision et imagerie et
Reconnaissance de la parole
du CRIM, ainsi que l'Office national du film du Canada (ONF). Le projet
MADIS était financé en partie par le programme E-content de
CANARIE.
|
 |
Fusion audio-vidéo pour la reconnaissance de la parole
Ce projet de recherche avait pour objectif d'explorer des approches de fusion audio-vidéo pour
la reconnaissance du français québécois parlé, dans le cadre de la lecture de bulletins de
nouvelles. Le projet visait aussi à développer un environnement de test pour l'extraction des
descripteurs audio-visuels.
Il a été effectué en collaboration avec l'équipe
Reconnaissance de la parole
du CRIM. |
 |
Environnement de recherche d'images par contenu compatible MPEG-7
ERIC7
Le système développé dans le cadre de ce projet produit automatiquement des descriptions MPEG-7.
Celles-ci permettent d'indexer des banques d'images par les caractéristiques visuelles de celles-ci
(couleur, forme, texture, etc.).
Des fonctionnalités de recherche, d'analyse et d'exploration des descriptions, ainsi que de
classification des images ont été développées.
|
 |
Partenaire pour la mise en place d'une plate-forme technologique pour la recherche sur l'oeil et la vision au Québec
L'équipe a développé des algorithmes de traitement et d'analyse d'images ophtalmiques pour ce
projet collectif, piloté par
l'Université de
Montréal.
Elle était partenaire d'une subvention d'infrastructure à la Fondation canadienne de
l'innovation (FCI). |
 |
Segmentation de lésions dans des images de fluorescence
Ce mandat contractuel consistait à réaliser une application permettant de faire la segmentation
automatique ou semi-automatique de lésions apparaissant dans une séquence d'images de fluorescence
et d'estimer la surface de celles-ci.
|
 |
Moteur de création de mosaïques d'images aériennes infrarouges et optiques
Ce contrat consistait à développer un moteur permettant de faire le balancement radiométrique de
photographies aériennes infrarouges et optiques couleurs pour la création de mosaïques
d'images.
Le mosaïquage comprenait les opérations de compensation radiométrique et colorimétrique, de mise
en place et d'assemblage des images composantes (tuiles) prétraitées.
|
 |
Outils d'analyse d'images de la rétine
Ce projet avait pour objectif de construire une boîte à outils d'algorithmes d'analyse d'images
couleurs ophtalmiques pour l'aide au diagnostic de maladies de la rétine.
Le bien livrable principal a été un logiciel prototype (Retsoft) d'aide au diagnostic de la
rétinopathie diabétique pour les usagers médicaux. |
 |
|
|
|
|