Scientifique – Traitement
automatique du langage naturel (TALN)

Type de candidature : Poste régulier - Temps plein

* Le masculin est utilisé uniquement dans le but d’alléger le texte.

Date de début souhaité:

> Dès que possible

Sommaire du poste

Nous recherchons un scientifique spécialisé en traitement automatique du langage naturel (TALN) motivé à se joindre à un groupe de scientifiques et de développeurs expérimentés en TALN, en représentation des connaissances ainsi qu’en apprentissage automatique. Le candidat doit avoir une expérience concrète d’implémentation de solutions en TALN et démontrer un intérêt à travailler sur des données réelles portant sur des problématiques industrielles comme l’extraction d’information, la classification, la reconnaissance d’entités nommées ou encore l’analyse de sentiments. Il participera activement à l’élaboration de preuves de concept, de prototypes d’avant-garde, à des projets de développement expérimental et de recherche appliquée. Il sera appelé à collaborer avec des experts spécialisés dans différents domaines scientifiques dont la science des données, la vision par ordinateur ou encore le traitement de la parole. Le candidat devra aussi démontrer une expérience dans la création et la diffusion de contenu scientifique (billets, blogues, revues, conférences, etc.), dans l’analyse de besoins clients, de même qu’en résolution de problèmes complexes.

Pour réussir à ce poste, le candidat retenu devra combiner des passions pour la linguistique, l’informatique ainsi que pour l’apprentissage automatique. Il devra avoir un intérêt marqué pour la communication et les relations clients afin de comprendre des défis industriels et partager son expertise de pointe.

Description des principales fonctions

  • Participer simultanément à la réalisation et à l’encadrement de plusieurs projets en TALN portant sur des problématiques industrielles
  • Participer à des activités de développement expérimental et de recherche appliquée en TALN, et en apprentissage automatique, dont l’apprentissage profond, pour répondre aux besoins des entreprises et partenaires du CRIM
  • Participer à l’évaluation de nouveaux projets (complexité technique, enjeux, faisabilité, etc.)
  • Participer à la rédaction d’offres de service
  • Participer au rayonnement scientifique et technique du CRIM par l’organisation d’activités ou en disséminant les avancées pertinentes à la communauté par divers modes de diffusion
  • Maintenir ses connaissances à jour, contribuer aux séminaires scientifiques internes et externes pour partager son savoir-faire.
  • Assurer et documenter des activités de veille scientifique en TALN

Qualifications recherchées

  • Diplôme de deuxième ou troisième cycle en informatique, mathématiques, ou en linguistique avec spécialisation en TALN et apprentissage automatique
  • Expérience minimale de cinq années en TALN et apprentissage automatique, préférablement dans des contextes industriels
  • Expérience démontrable en matière de classification de textes, de reconnaissance d’entités nommées, d’extraction et recherche de l’information
  • Maîtrise de Python et d’une librairie d’apprentissage profond (Pytorch, Tensorflow)
  • Excellente connaissance des librairies de TALN comme Spacy, HuggingFace, Stanza
  • Excellente compréhension de l’apprentissage profond appliqué au TALN, en particulier des Transformers
  • Bonnes connaissances théoriques en apprentissage automatique : fonctions de coût, gradient, optimisation, convergence, fonctions d’activation, régularisation, architectures, etc.
  • Expérience en utilisation de grands modèles de langues tels que Bert et GPT
  • Capacité à comprendre les besoins des utilisateurs/experts de domaine et d’en extraire des requis techniques, d’élaborer un plan de travail et de mener une équipe dans la réalisation de solutions

Les connaissances suivantes seraient un atout

  • Connaissances en analyse lexicale, syntaxique, sémantique et pragmatique
  • Expérience en représentation des connaissances (ontologies, graphes de connaissance, WordNet, OWL)
  • Expérience en raisonnement et inférence
  • Expérience avec des modèles multilingues
  • Maitrise des techniques d’apprentissage par transfert
  • Expérience en données massives et projets de grande envergure
  • Expérience en exploitation de GPUs, clusters de calcul, et déploiement de modèles
  • Connaissance d’outils MLOps (Kedro, TensorBoard, MLFlow)
  • Historique de publications scientifiques, billets, podcasts
  • Contributions à des projets Open Source

Qualités recherchées

  • Rapidité d’apprentissage et d’adaptation. Autonomie et initiative. Facilité à travailler à plusieurs projets en parallèle
  • Esprit de synthèse et capacité décisionnelle face à des enjeux scientifiques et techniques au cœur des mandats clients
  • Habileté de communication, d’écoute et de partage de connaissances
  • Intérêt à recevoir et donner du feedback constructif

 

Le CRIM est un employeur équitable et la diversité lui tient à cœur. Nous valorisons le développement d’idées en équipe et cultivons un environnement de travail ouvert et respectueux des différences. Le masculin est utilisé uniquement dans le but d’alléger le texte. Nous encourageons tous les candidats et toutes les candidates à postuler sur ce poste, cependant seules les personnes sélectionnées seront contactées. Merci de votre intérêt envers le CRIM !

Joignez-vous à l’équipe du CRIM et travaillez avec des gens passionnés et dynamiques !

 

Postuler

Joignez-vous à l’équipe du CRIM et travaillez avec des gens passionnés et dynamiques !

* champs requis