Séminaire R-D: Apprentissage spectral multitâche d'automates pondérés

Séminaire R-D: Apprentissage spectral multitâche d'automates pondérés
23/10/18 11h00
CRIM (405, avenue Ogilvy, bureau 101, Montréal)

APPRENTISSAGE SPECTRAL MULTITÂCHE D'AUTOMATES PONDÉRÉS

CONFÉRENCIER

Guillaume Rabusseau, professeur adjoint, Université de Montréal

RÉSUMÉ (conférence en français)

Les objets structurés tels que les chaînes de caractères, les arbres et les graphiques sont omniprésents dans la science des données, mais les fonctions d'apprentissage définies sur ces objets peuvent être fastidieuses. Les automates pondérés sont des outils puissants qui permettent de modéliser efficacement ces fonctions et sont donc particulièrement pertinents pour l'apprentissage machine. En particulier, l'algorithme d'apprentissage spectral offre un moyen efficace d'apprendre les automates pondérés avec de solides garanties théoriques.

Dans cet exposé, je présenterai une extension récente de l'algorithme d'apprentissage spectral au réglage multitâche qui aborde le problème suivant : comment peut-on tirer parti des relations entre deux ou plusieurs automates pondérés afin d'apprendre plus efficacement ? Par exemple, considérez une modélisation en langage naturel où l'on doit faire des prédictions dans différents contextes (par exemple, clavardage en ligne et articles de journaux) et avoir accès à des ensembles de données dans chacun d'eux ; il est naturel de s'attendre à ce que la grammaire de base soit partagée entre les ensembles de données et que l'on puisse bénéficier d'apprendre simultanément ces deux tâches.

Je commencerai par introduire une notion naturelle de la relation entre les automates finis pondérés en examinant dans quelle mesure plusieurs automates finis pondérés peuvent partager un espace de représentation sous-jacent commun, et je présenterai le nouveau modèle d’automates finis pondérés à valeur vectorielle qui aide avantageusement à formaliser cette notion de relation. Je présenterai ensuite l'algorithme d'apprentissage spectral pour les automates finis pondérés à valeur vectorielle afin de résoudre le problème de l'apprentissage multitâche. En apprenant conjointement des tâches multiples sous la forme d'automates finis pondérés à valeur vectorielle, notre algorithme impose la découverte d'un espace de représentation partagé entre les tâches. Pour conclure, je présenterai des expériences sur des données synthétiques et sur une tâche de modélisation en langage naturel sur des données réelles afin de démontrer les avantages de l'approche multitâche proposée.

Conférence gratuite. Inscription requise. 

S'inscrire 

 

 

  • #Bientôt ???? Le CRIM présentera le projet Application des technologies vocales aux langues autochtones le 19 novembre… https://t.co/FnO5IKw79H
  • Tom Landry RT @Tom_Landry_: Ce fût un réel plaisir que de partager ma vision de l'avenir de la géomatique. Et que dire des mots-clés sélectionné par l…