Séminaire R-D - Lire entre les lignes : Découvrir les propriétés cachées d'un texte et de son auteur

Séminaire R-D - Lire entre les lignes : Découvrir les propriétés cachées d'un texte et de son auteur
24/02/16 11h00
CRIM (405, avenue Ogilvy, bureau 101)

Lire entre les lignes : Découvrir les propriétés cachées d'un texte et de son auteur

Conférencier : Cyril Goutte, agent de recherche senior dans l'équipe Traitement Multilingue de Textes du Conseil national de recherches (CNRC). 

Résumé : La catégorisation automatique de texte est une technologie qui a atteint un haut niveau de maturité et de performance, souvent proche des performances humaines, sur des tâches comme la prédiction du sujet ou du genre d'un document, ou encore pour d'autres propriétés liées à son contenu. Dans cette présentation, on s'intéresse à des problèmes dans lesquels on cherche à découvrir des propriétés moins évidentes d'un texte, sur lesquelles des évaluateurs humains eux-mêmes ont de la difficulté à s'accorder.  On présentera des résultats obtenus sur trois tâches: prédire si un texte est une traduction ou un original, prédire la langue maternelle d'un rédacteur en langue seconde, et prédire les variantes locales d'une langue. Certains de ces résultats ont été obtenus dans le cadre d'évaluations internationales.

Biographie : Cyril Goutte est agent de recherche senior dans l'équipe "Traitement Multilingue de Textes" du Conseil national de recherches Canada. Il a obtenu une thèse de doctorat de l'université Paris 6, et travaillé à l'université technologique du Danemark, Nokia Mobile Phones et Xerox Research Centre Europe, avant de se joindre au CNRC en 2006. Ses activités de recherche se concentrent sur les applications de l'apprentissage automatique aux données textuelles, et en particulier sur le traitement de l'information multilingue, ainsi qu'aux données issues de l'éducation et de la formation.


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les boursiers de 2e et 3e cycles du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.

INSCRIPTION : Carmen.Robert@crim.ca ou 514 840-7992.
Conférence gratuite. Mercredi, le 24 février 2016, de 11 h à 12 h. Salle 11.
Au CRIM, 405, avenue Ogilvy, bureau 101, Montréal.

 

Ajouter au calendrier 24-02-2016 11:00 24-02-2016 12:00 15 Séminaire: Découvrir les propriétés cachées d'un texte et de son auteur Gratuit, réservation à carmen.robert@crim.ca Détails de la présentation: http://www.crim.ca/fr/evenements/seminaire-r-d-lire-entre-les-lignes-decouvrir-les-proprietes-cachees-d-un-texte-et-de-son-auteur CRIM (405, avenue Ogilvy, bur. 101, Montréal, Salle 11) CRIM info@crim.ca false DD/MM/YYYY

 
  • #Demain ???? Détection de signes de maladie mentale et de troubles du comportement à partir de la communication en lig… https://t.co/y8ZEQDBYsc
  • CNRC RT @CNRC_NRC: Le Gala des Prix Innovation 2019 de l’@ADRIQ_RCTi aura lieu demain! Des scientifiques d’#AutomobileCNRC et #TransportsCNRC so…