PACTE - Plateforme d’Annotation Collaborative de Textes Électroniques


PACTE est une plateforme web d’annotation collaborative de contenu textuel intégrant plusieurs outils pratiques pour les groupes de recherche. Elle offre notamment deux modes d’annotation, soit manuel et automatique, et est disponible en version bilingue afin de faciliter le travail des chercheurs.

L’annotation manuelle est réalisée à l’aide d’une interface optimisée pour la saisie rapide des informations enrichissant un texte. Le mode automatique regroupe plusieurs services d’annotation spécialisés et configurables (entités nommées, terminologie désambiguïsée, etc.)

Les utilisateurs peuvent interagir avec PACTE à partir de l'interface utilisateur en ligne ou par l'interface de programmation d'application (API REST) pour accéder à l'ensemble de leurs données et faciliter le développement d'algorithmes à l'aide de ressources riches.

PACTE étant une plateforme web collaborative, chaque chercheur peut décider de partager ses analyses et annotations avec d’autres utilisateurs, favorisant ainsi la coopération et ouvrant la porte à des études multipartenaires à grand déploiement. L’utilisation de PACTE entraîne des gains considérables en productivité par la réduction significative du temps d'annotation tout en facilitant l'analyse des données annotées.

Services

 

Analyse morphosyntaxique

Déterminez pour chaque mot son rôle morphosyntaxique, son genre, son nombre, son lemme, etc.

 

Profilage de document 

Identifiez les domaines probables d’un document à partir d'un lexique de termes spécialisés.

 

Désambiguïsation terminologique 

Annotez uniquement les termes d’un lexique lorsqu’ils sont utilisés dans le sens visé par un ou plusieurs domaines choisis.

 

Identification d’entités nommées 

Trouvez les expressions dénotant des entités nommées : nom de personne, lieu, organisation, entités géopolitiques...

 

Apprentissage actif (à venir)

Entraînez un modèle de prédiction pour annoter des propriétés spécifiques d’un type d’annotation en annotant les instances qui fournissent le plus d’information au modèle, minimisant ainsi votre effort d’annotation.

 

Fonctions principales

  • Gestion de corpus de grande taille : Créez, manipulez et consultez vos corpus. 
  • Annotation manuelle : Créez et modifiez vos schémas d'annotation.
  • Définition de votre terminologie : Consultez une banque lexicale existante ou créez la vôtre.
  • Création de projets complets : Distribuez les tâches d’annotation au sein de votre équipe.
  • Partagez vos ressources : Gérez vos contacts et partagez-leur vos corpus et schémas d'annotation.
  • Définition des schémas d'annotation personnalisés : Structurez les informations nécessaires pour l’enrichissement de vos documents.

 

Découvrez PACTE et faites-en l'essai ici !

 

 

Consultez la fiche

Publications scientifiques

Ménard, P. A. et Barrière, C. "PACTE: a collaborative platform for textual annotation" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier, France, du 19 au 22 septembre 2017 
 
Bernier-Colborne, G., Barrière, C. et Ménard, P. A. "Fine-grained domain classification of text using TERMIUM Plus" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier (France), du 19 au 22 septembre 2017 
 

Plateformes de recherche

Créées dans le cadre de projets financés par CANARIE, les plateformes de recherche élaborées par le CRIM sont disponibles sur le Portail des logiciels de recherche de CANARIE, qui met à la disposition des chercheurs des plateformes et des services logiciels afin d’accélérer la découverte.

 Découvrez aussi VESTA : une plateforme web d’annotation collaborative de contenu multimédia

 

Équipes

Nouvelles récentes

  • Retour sur l'AGA 2020
    06/07/2020

    Le CRIM a tenu sa 35e assemblée générale annuelle le 18 juin 2020. Plusieurs membres étaient présents pour souligner une année de croissance importante pour l’organisme.

    +

Événement à venir

  • Gala des Prix Innovation 2020 de l'ADRIQ
    19/11/20 0h00
    Palais des Congrès de Montréal
    Le Gala Prix Innovation 2020 de l'ADRIQ aura lieu le 19 novembre 2020, au Palais des congrès de Montréal.
    +
  • CSCIENCE IA RT @CSCIENCEIA: Une année marquante pour les membres du Centre de recherche informatique de Montréal (@CRIM_ca). L’organisme termine l’une…
  • PRIMA Québec RT @PRIMAQUEBEC: Bénéficiez d’une grande notoriété auprès de l’écosystème de la recherche et de l’innovation du Québec en appliquant sur le…

Publications récentes

  • On The Performance of Time-Pooling Strategies for End-to-End Spoken Language Identification

    +
  • An ensemble Based Approach for Generalized Detection of Spoofing Attacks to Automatic Speaker Recognizers

    +