Où ? Quand ?

La station biologique de Roscoff a accueilli la troisième édition du R Bootcamp du groupe State Of The R du 26 août au 30 août 2019.

Qui

Équipe finistR2019

Équipe finistR2019

1er rang

2ème rang

3ème rang

Quoi

Cette semaine a été consacrée à l’approfondissement de diverses thématiques (méthodologiques, techniques) autour du logiciel R: ce site proposera un compte rendu des différents thèmes abordés. Les participants collaborent tous au contenu de ce site lors d’ateliers organisés en petits groupes.

Le compte rendu des éditions précédentes sont disponibles

Programme

Le programme proposé est le suivant

Les séquences en vert correspondent à des séances d’atelier en sous groupes. Les séquences en orange correspondent à un panorama du sujet indiqué, tandis que les séquences en bleu correspondent à des temps de réflexion et rédaction sur le rendu final.

Atelier 1 : Distill, communication et diffusion avec R

Exploration du package distill pour la creation de document scientifique

Une présentation de distill

R pour la communication

  • Des nouvelles de blogdown
  • Le site de mon package avec pkgdown : le tuto de C. Gillespie à useR2019
  • Des sites web avec R
  • Des livres avec bookdown
  • Des tables avec flextable

Idées de réalisation

  • Mise en place du site de rendu
  • Structuration d’un document distill pour la soumission dans des conférences (RencontreR 2020 : ajout de tags, customiser la mise en forme, importer une contribution depuis un dépot github)
  • Écrire une thèse avec bookdown

Atelier 2 : R écosysteme, Docker, R et Python, R et …

Docker

  • Mettre en place les élements pour créer une image Docker, tester différentes instances pour utiliser différentes versions de R sur la même machine
  • packrat pour la gestion de packages
  • renv pour la gestion de packages

Interfaces

  • reticulate pour lier Python et R

Idées de réalisation

  • Comparer les résultats (performance et temps de calcul) d’une approche de classification par forêts aléatoires en R et Python
  • Mettre en place une image docker pour le contenu de la semaine.

Atelier 3 : R for big data

Manipuler des données massives sous R

Machine learning

  • R et H2O
  • caret
  • parsnip

Idées de réalisation

  • Un gros jeu de données, on compare les performances de différents modèles d’apprentissage

Atelier 4 : tidyverse : quoi de neuf ?

  • Un tour des nouveautés dans le tidyverse
  • Programmation dans le tidyverse avec rlang

Atelier 5 : Modèle mixte avec R : quelles sont les bonnes options ?

  • Les packages à comparer lme4, lmerTest, MCMCglmm, mlmRev, broom.mixed, nlme, glmmmTMB
  • spaMM