PACTE - Plateforme d’Annotation Collaborative de Textes Électroniques


PACTE est une plateforme web d’annotation collaborative de contenu textuel intégrant plusieurs outils pratiques pour les groupes de recherche. Elle offre notamment deux modes d’annotation soient manuelle et automatique et est disponible en version bilingue afin de faciliter le travail des chercheurs.

L’annotation manuelle est réalisée à l’aide d’une interface optimisée pour la saisie rapide des informations enrichissant un texte. L’ensemble des services d’annotation spécialisés et configurables (entités nommées, terminologie désambiguïsée, etc.) constituent le mode automatique.

À l’aide d’annotation guidée par un algorithme d’apprentissage actif, le module d’annotation semi-automatique permettra d’entraîner un modèle de prédiction en annotant un minimum d’instances, minimisant ainsi l’effort nécessaire pour annoter un corpus de grande taille (fonction à venir). 

Par le fait que PACTE est une plateforme web collaborative, chaque chercheur peut décider de partager ses analyses et annotations à d’autres utilisateurs, augmentant ainsi la coopération et ouvrant la porte à des études multipartenaires à grand déploiement. L’utilisation de PACTE résulte en des gains considérables en productivité par la réduction significative du temps d’analyse tout en augmentant leur cohérence.  

Services

 

Analyse morphosyntaxique

Déterminez, pour chaque mot, son rôle morphosyntaxique, son genre, son nombre, son lemme, etc.

 

Profilage de document 

Identifiez les domaines probables d’un document basé sur un lexique de termes spécialisés.

 

Désambiguïsation terminologique 

Annotez uniquement les termes d’un lexique lorsqu’ils sont utilisés dans le sens visé par un ou plusieurs domaines choisis.

 

Identification d’entité nommée 

Trouvez les expressions dénotant des entités nommées: nom de personne, lieu, organisation, entités géopolitiques...

 

Apprentissage actif (à venir)

Entraînez un modèle de prédiction pour annoter des propriétés spécifiques d’un type d’annotation en annotant les instances qui fournissent le plus d’information au modèle, minimisant ainsi votre effort d’annotation.

 

Fonctions principales

  • Créez, manipulez et consultez vos corpus. 
  • Importez des documents textes de différents formats (doc, docx, pdf, html, etc.).
  • Créez et modifiez vos schémas d'annotation.
  • Consultez une banque lexicale existante ou créez la vôtre.
  • Distribuez les tâches d’annotation à travers votre équipe.
  • Lancez un de nos outils d’annotation linguistique, lexicale ou sémantique.
  • Travaillez en français ou en anglais, selon les préférences des membres de votre équipe.
  • Structurez les informations nécessaires pour l’enrichissement de vos documents.
  • Aucun service ne fait la tâche désirée ? Entraînez votre propre annotateur personnalisé. (à venir)

 

Découvrez PACTE et faites-en l'essai ici !

 

 

Consultez la fiche

Publications scientifiques

Ménard, P. A. et Barrière, C. "PACTE: a collaborative platform for textual annotation" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier, France, du 19 au 22 septembre 2017 
 
Bernier-Colborne, G., Barrière, C. et Ménard, P. A. "Fine-grained domain classification of text using TERMIUM Plus" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier (France), du 19 au 22 septembre 2017 
 

Plateformes de recherche

Créées dans le cadre de projets financés par CANARIE, les plateformes de recherche élaborées par le CRIM sont disponibles sur le Portail des logiciels de recherche de CANARIE, qui met à la disposition des chercheurs des plateformes et des services logiciels afin d’accélérer la découverte.

 Découvrez aussi VESTA : une plateforme web d’annotation collaborative de contenu multimédia

 

Équipes

Nouvelles récentes

  • Le CRIM, partie prenante d'un des 100 meilleurs projets de R-D au monde de l'année 2017!
    12/12/2017

    L'initiative ESGF a été sélectionnée parmi les 100 meilleurs projets de recherche et développement de l'année 2017 dans le cadre des R&D 100 Awards. ESGF (Earth System Grid Federation) est un effort de développement concerté en science du climat et du...

    +

Événement à venir

  • Séminaire R-D : Partage de connaissances en Radio-oncologie au Centre universitaire de santé McGill
    16/01/18 11h00
    CRIM (405, avenue Ogilvy, bureau 101, Montréal)
    Une conférence du professeur John Kildea du Centre universitaire de santé de l'Université McGill.
    +
  • Montréal InVivo RT @Montreal_InVivo: MEDTEQ organisera son 6e Forum annuel « Innover au-delà des frontières » le 17 janvier prochain, à la Grande Bibliothè…
  • Le CRIM est partout! Pour les dernières nouvelles, consultez l'infolettre! https://t.co/rqohY13zFg

Publications récentes

  • Projet patrimoine TARV

    +
  • PeopleBot

    +