Veille et meilleures pratiques

Réduction de la masse documentaire par détection de quasi-doublons

Lavallée, J.-F. Réduction de la masse documentaire par détection de quasi-doublons. Montréal, CRIM, 2011. 2 p.
[Texte complet]

Tant de documents comportent de mineures variations les uns avec les autres, et une réduction de la masse documentaire peut être obtenue en cherchant ces « quasi-doublons ». L'équipe a développé une technologie qui vous permet de découvrir et regrouper automatiquement les « quasi-doublons » dans votre masse de documents.