Nous nous intéressons à l’utilisation d’algorithmes en R pour la caractérisation systématique des discours (203) et des réponses (3501) apportées par les trois présidents successifs de la Banque centrale européenne (BCE). Inaugurée en 1999, la BCE a pour mission de gérer la politique monétaire au sein de la zone euro. Avec la crise économique de 2008, l’objectif d’inflation qui prévalait auparavant va être remplacé par l’objectif d’absorption de la crise ainsi que de la relance de l’économie avec le dernier président Mario Draghi en particulier. Chaque mois, le Président de la BCE rapporte à la presse les discussions du Conseil des Gouverneurs. L’impact de ces discours a été illustré dans la littérature à plusieurs niveaux, notamment sur les marchés financiers.
Ces présentations sont structurées en deux parties: une première décrivant les annonces de la BCE et une seconde où le Président répond aux questions des journalistes. De par l’ampleur des communications, le nombre de réponses apportées et la fréquence des discours, ancrer notre recherche dans le cadre de la recherche reproductible avec R s’avère essentiel. En effet, la base de données complète depuis 1998 équivaut à plus de 900 000 mots, et augmente chaque mois.
À partir d’une plateforme de sciences de données utilisant R (Nüance-R), ces algorithmes nous permettent d’effectuer la collecte des données (gsheet), la structuration de la base de données (RTextTools, tm, tidyr), de déterminer la polarité et la teneur lexicale des différentes communications (sentiment, ggplot2) et l’intégration des résultats (rmarkdown) dans un processus reproductible.