PACTE - Plateforme d’Annotation Collaborative de Textes Électroniques


PACTE est une plateforme web d’annotation collaborative de contenu textuel intégrant plusieurs outils pratiques pour les groupes de recherche. Elle offre notamment deux modes d’annotation, soit manuel et automatique, et est disponible en version bilingue afin de faciliter le travail des chercheurs.

L’annotation manuelle est réalisée à l’aide d’une interface optimisée pour la saisie rapide des informations enrichissant un texte. Le mode automatique regroupe plusieurs services d’annotation spécialisés et configurables (entités nommées, terminologie désambiguïsée, etc.)

Les utilisateurs peuvent interagir avec PACTE à partir de l'interface utilisateur en ligne ou par l'interface de programmation d'application (API REST) pour accéder à l'ensemble de leurs données et faciliter le développement d'algorithmes à l'aide de ressources riches.

PACTE étant une plateforme web collaborative, chaque chercheur peut décider de partager ses analyses et annotations avec d’autres utilisateurs, favorisant ainsi la coopération et ouvrant la porte à des études multipartenaires à grand déploiement. L’utilisation de PACTE entraîne des gains considérables en productivité par la réduction significative du temps d'annotation tout en facilitant l'analyse des données annotées.

Services

 

Analyse morphosyntaxique

Déterminez pour chaque mot son rôle morphosyntaxique, son genre, son nombre, son lemme, etc.

 

Profilage de document 

Identifiez les domaines probables d’un document à partir d'un lexique de termes spécialisés.

 

Désambiguïsation terminologique 

Annotez uniquement les termes d’un lexique lorsqu’ils sont utilisés dans le sens visé par un ou plusieurs domaines choisis.

 

Identification d’entités nommées 

Trouvez les expressions dénotant des entités nommées : nom de personne, lieu, organisation, entités géopolitiques...

 

Apprentissage actif (à venir)

Entraînez un modèle de prédiction pour annoter des propriétés spécifiques d’un type d’annotation en annotant les instances qui fournissent le plus d’information au modèle, minimisant ainsi votre effort d’annotation.

 

Fonctions principales

  • Gestion de corpus de grande taille : Créez, manipulez et consultez vos corpus. 
  • Annotation manuelle : Créez et modifiez vos schémas d'annotation.
  • Définition de votre terminologie : Consultez une banque lexicale existante ou créez la vôtre.
  • Création de projets complets : Distribuez les tâches d’annotation au sein de votre équipe.
  • Partagez vos ressources : Gérez vos contacts et partagez-leur vos corpus et schémas d'annotation.
  • Définition des schémas d'annotation personnalisés : Structurez les informations nécessaires pour l’enrichissement de vos documents.

 

Découvrez PACTE et faites-en l'essai ici !

 

 

Consultez la fiche

Publications scientifiques

Ménard, P. A. et Barrière, C. "PACTE: a collaborative platform for textual annotation" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier, France, du 19 au 22 septembre 2017 
 
Bernier-Colborne, G., Barrière, C. et Ménard, P. A. "Fine-grained domain classification of text using TERMIUM Plus" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier (France), du 19 au 22 septembre 2017 
 

Plateformes de recherche

Créées dans le cadre de projets financés par CANARIE, les plateformes de recherche élaborées par le CRIM sont disponibles sur le Portail des logiciels de recherche de CANARIE, qui met à la disposition des chercheurs des plateformes et des services logiciels afin d’accélérer la découverte.

 Découvrez aussi VESTA : une plateforme web d’annotation collaborative de contenu multimédia

 

Équipes

Nouvelles récentes

  • Le CRIM partie prenante d'un vaste projet technologique autour des langues autochtones canadiennes!
    05/12/2018

    Le CRIM est fier d’annoncer le début d’une collaboration à long terme avec le Conseil national de recherches du Canada (CNRC) dans le cadre d’un projet visant à encourager la revitalisation et la préservation des langues autochtones grâce aux technologies

    +

Événement à venir

  • HASE 2019
    3/01/19 2019h00
    Hangzhou, China
    Le CRIM présentera deux articles à la 19e édition du IEEE International Symposium on High Assurance Systems Engineering, qui se déroulera du 3 au 5 janvier 2019 à Hangzhou, Chine
    +
  • Montréal International RT @MTLINTL: #DYK Montréal has one of the deepest #AI talent pools in the world ???? More details ???? https://t.co/R073su8k8z #NeurIPS #NeurIPS2…
  • Tom Landry RT @Tom_Landry_: Hey @opengeospatial and @CRIM_ca ! Poster is set up at #AGU18 to present (draft) work of #MachineLearning task of Testbed-…

Publications récentes

  • Towards Automatic Feature Extraction for Activity Recognition from Wearable Sensors: A Deep Learning Approach

    +
  • Checking Sequence Generation for Symbolic Input/Output FSMs by Constraint Solving

    +