Cet atelier de niveau intermédiaire portera sur le développement et le déploiement d’un processus complet de modélisation en utilisant R.
Plusieurs professionnels oeuvrant dans le milieu de la science des données jugent que R n’est pas un langage suffisamment stable et robuste pour être utilisé dans un contexte de production. Cet atelier a pour objectif de démontrer le contraire.
Les participants seront amenés à bâtir un processus complet et robuste de modélisation avec R. Ce processus comprendra notamment les étapes suivantes : la collecte et l’importation de données, la visualisation, la transformation de données, l’entraînement d’un modèle prédictif et le déploiement de celui-ci vers un service web. Toutes ces étapes s’assembleront pour résoudre une problématique réaliste proposée au départ et seront mises en application à partir du même jeu de données réelles. Pour chacune des ces étapes, l’atelier proposera des techniques, librairies et méthodologies permettant de tirer profit de R dans un contexte de production et de performance.
Tout au long de l’atelier, qui se déroulera sur deux jours, des concepts théoriques et pratiques seront présentés en alternance sous forme de volets magistraux (théoriques) et expérimentaux (pratiques). Il sera nécessaire de participer à la première journée pour suivre et participer à la deuxième. Les participants devront avoir avec eux un ordinateur portable avec une version récente de R (>= 3.5.0) préalablement installée sur leur système Windows, Mac ou Linux ainsi qu’une version récente de l’éditeur RStudio.
Après cet atelier, les participants seront en mesure d’utiliser le langage R dans un contexte de modélisation prédictive et seront également en mesure de déployer des modèles de manière robuste.