Les notions statistiques de base sont réputées d’être mal comprises par la majorité des scientifiques — et c’est vrai que beaucoup de ces notions en statistique conventionnelle ne sont pas du tout intuitives. Pour cette raison et aussi pour sa plus grande polyvalence, l’utilisation de la statistique bayésienne continue d’augmenter. Ces principes peuvent être enseignés sans trouble aux débutants parce qu’ils sont plus limpides que ceux de la statistique fréquentiste. Malheureusement, le système R de base ne contient presque pas de fonctions bayésiennes, bien qu’il existe beaucoup de packages bayésiens. J’en ai écrit un autre : l’évaluation d’évidence scientifique ou Évidence. L’approche fréquentiste étant plus orientée vers les tests d’hypothèses, l’approche bayésienne met plutôt l’accent sur la modélisation — comme d’ailleurs la statistique fréquentiste moderne. Au lieu de tests d’hypothèses, le package favorise des graphiques et la modélisation. Par exemple, le package contient des fonctions pour l’analyse de proportions, de tableaux de contingence et de modèles linéaires simples. Pour des modèles plus complexes utilisant MCMC, rstan et rstanarm sont utilisés. J’ai écrit un livre de cours pour accompagner ce package. Ces approches redonnent à l’analyste un rôle actif plutôt que celui d’un utilisateur d’un livre de recettes. Il est devenu urgent de moderniser notre enseignement des principes de l’inférence statistique pour la recherche scientifique. C’est mon espoir que ce genre d’efforts puissent aider à maintenir la place importante que R s’est acquise comme outil essentiel pour l’analyse statistique.
- Cet Atelier ou Conférence est passé