­
Chargement Ateliers ou Conférences
  • Cet Atelier ou Conférence est passé

Cette formation de niveau intermédiaire, d’une demi-journée, présentera certaines des techniques les plus récentes pour traiter le langage naturel dans un contexte d’apprentissage machine. Vous utiliserez des packages R pour effectuer les tâches suivantes:

  • Manipuler des chaînes de caractères.
  • Explorer une liste de documents.
  • Corriger les erreurs d’orthographe et extraire les racines des mots.
  • Identifier les contextes négatifs en utilisant des collocations.
  • Calculer la matrice de fréquence des termes dans des documents.
  • Explorer l’utilité des plongements avec des vecteurs globaux pour la représentation de mots.
  • Transformer une liste de documents en attributs pour l’apprentissage machine.

Au terme de cette formation, vous devriez avoir assez d’outils pour entreprendre un mandat de traitement de language naturel avec R.

Packages présentés: base, tidytext, tm, hunspell, text2vec, SnowballC