­
Chargement Ateliers ou Conférences
  • Cet Atelier ou Conférence est passé

Le langage de programmation R offre la possibilité de généraliser et d’automatiser des tâches via la programmation fonctionnelle afin de gagner en temps et en efficacité dans le traitement et l’analyse de données. Dans cet exercice, deux points paraissent importants dans le développement des fonctions: Construire des fonctions qui sont facilement transférables et construire des fonctions qui prennent un minimum d’argument et renvoient un maximum d’information via des objets prêts à être intégrés dans des langages de programmation balisés générateurs des rapports dynamiques.

Nous nous sommes donc intéressés au problème de la compréhension et du nettoyage des donnée qui est une étape cruciale et récurrente à toute modélisation. Nous avons développé quelques fonctions « Tri_data », « Desc_data», etc., disponible sur Github, et une Shiny-App. Ces fonctions prennent un minimum d’argument et permettent de faire des étapes préliminaires de nettoyage et de description de donnée. Elles renvoient un maximum d’information sur la qualité des données (valeurs aberrantes, données manquantes, etc.), le descriptif des variables, etc… Les résultats sont renvoyés sous formes des tableaux facilement intégrables dans les langages de programmation générateurs des rapports dynamiques comme R-Markdown.