PACTE - Plateforme d’Annotation Collaborative de Textes Électroniques


PACTE est une plateforme web d’annotation collaborative de contenu textuel intégrant plusieurs outils pratiques pour les groupes de recherche. Elle offre notamment deux modes d’annotation, soit manuel et automatique, et est disponible en version bilingue afin de faciliter le travail des chercheurs.

L’annotation manuelle est réalisée à l’aide d’une interface optimisée pour la saisie rapide des informations enrichissant un texte. Le mode automatique regroupe plusieurs services d’annotation spécialisés et configurables (entités nommées, terminologie désambiguïsée, etc.)

Les utilisateurs peuvent interagir avec PACTE à partir de l'interface utilisateur en ligne ou par l'interface de programmation d'application (API REST) pour accéder à l'ensemble de leurs données et faciliter le développement d'algorithmes à l'aide de ressources riches.

PACTE étant une plateforme web collaborative, chaque chercheur peut décider de partager ses analyses et annotations avec d’autres utilisateurs, favorisant ainsi la coopération et ouvrant la porte à des études multipartenaires à grand déploiement. L’utilisation de PACTE entraîne des gains considérables en productivité par la réduction significative du temps d'annotation tout en facilitant l'analyse des données annotées.

Services

 

Analyse morphosyntaxique

Déterminez pour chaque mot son rôle morphosyntaxique, son genre, son nombre, son lemme, etc.

 

Profilage de document 

Identifiez les domaines probables d’un document à partir d'un lexique de termes spécialisés.

 

Désambiguïsation terminologique 

Annotez uniquement les termes d’un lexique lorsqu’ils sont utilisés dans le sens visé par un ou plusieurs domaines choisis.

 

Identification d’entités nommées 

Trouvez les expressions dénotant des entités nommées : nom de personne, lieu, organisation, entités géopolitiques...

 

Apprentissage actif (à venir)

Entraînez un modèle de prédiction pour annoter des propriétés spécifiques d’un type d’annotation en annotant les instances qui fournissent le plus d’information au modèle, minimisant ainsi votre effort d’annotation.

 

Fonctions principales

  • Gestion de corpus de grande taille : Créez, manipulez et consultez vos corpus. 
  • Annotation manuelle : Créez et modifiez vos schémas d'annotation.
  • Définition de votre terminologie : Consultez une banque lexicale existante ou créez la vôtre.
  • Création de projets complets : Distribuez les tâches d’annotation au sein de votre équipe.
  • Partagez vos ressources : Gérez vos contacts et partagez-leur vos corpus et schémas d'annotation.
  • Définition des schémas d'annotation personnalisés : Structurez les informations nécessaires pour l’enrichissement de vos documents.

 

Découvrez PACTE et faites-en l'essai ici !

 

 

Consultez la fiche

Publications scientifiques

Ménard, P. A. et Barrière, C. "PACTE: a collaborative platform for textual annotation" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier, France, du 19 au 22 septembre 2017 
 
Bernier-Colborne, G., Barrière, C. et Ménard, P. A. "Fine-grained domain classification of text using TERMIUM Plus" dans Proc of the 12th International Conference on Computational Semantics (IWCS 2017). Montpellier (France), du 19 au 22 septembre 2017 
 

Plateformes de recherche

Créées dans le cadre de projets financés par CANARIE, les plateformes de recherche élaborées par le CRIM sont disponibles sur le Portail des logiciels de recherche de CANARIE, qui met à la disposition des chercheurs des plateformes et des services logiciels afin d’accélérer la découverte.

 Découvrez aussi VESTA : une plateforme web d’annotation collaborative de contenu multimédia

 

Équipes

Nouvelles récentes

  • Recherche et innovation internationale : Le CRIM et le CETIC annoncent une entente de collaboration
    10/04/2019

    Le Centre de Recherche Informatique de Montréal (CRIM) annonce le début d’une collaboration internationale avec le Centre d’Excellence en Technologies de l’Information et de la Communication (CETIC), un centre de recherche de Wallonie-Bruxelles.

    +

Événement à venir

  • ICST 2019
    22/04/19 0h00
    Xi'an, China
    Le CRIM présentera un article lors de la '12th IEEE International Conference on Software Testing, Verification and Validation' en Chine du 22 au 27 avril 2019.
    +
  • Le @CRIM_ca en action à #Connexion ! #numeriqueLA @la_lesaffaires #innovation #recherche #IA #PME… https://t.co/UvSAd0uZ17
  • L'#IA débarque en #agriculture! Le CRIM est fier d'être hôte de cet événement et de fournir son expertise en #IA et… https://t.co/RzxjuuSusa

Publications récentes

  • Forage de données géospatiales, quelques applications

    +
  • Des technologies perturbatrices pour de futures applications du bâtiment intelligent utilisant AI

    +