Le groupe se réunit à AgroParisTech au cours d’ateliers mensuels de 3 heures autour d’un thème prédéfini. Chaque atelier est animé par quelques membres (généralement deux ou trois) qui se chargent de présenter les enjeux du thème, fournir le bagage méthodologique nécessaire, et proposer des travaux pratiques.
Nous pensons qu’il est important que l’ensemble des participants s’investissent dans l’animation pour préserver l’esprit des ateliers. Les places sont donc limitées à une trentaine par séance.
Pour participer à ces ateliers, un aspirant membre peut assister à une séance pour jauger la teneur des séances et évaluer le niveau des participants. Il s’engage ensuite à animer une séance en proposant un atelier.
La gestion du groupe (site web, liste de diffusion, bootcamp, recherche de financement, organisation des séances) est assurée par Julie Aubert, Julien Chiquet et Marie-Pierre Étienne. Vous pouvez nous contacter à l’adresse stateofr@gmail.com.
La plupart des ateliers ont lieu dans la salle ACTIA à AgroParisTech.
Mahendra nous offre un tour su la plateforme Migale et plus généralement sur la soumission de job sur un serveur de calcul via qsub et les packages purrr, future and furrr.
Antoine nous parlera de la manipulation des objets un peu particuliers de R que sont les facteurs, les dates et les heures, et les chaines de caractères et expressions régulières. Ceci finira notre tour du tidyverse avec forcats, lubridate et stringr, qui permettent de manipuler très facilement et lisiblement ces objets.
Le programme de l’atelier proposé sur des développements autour de R Markdown Créer des contenus pour R Markdown et shiny – Reporting tabulaire avec le package flextable Les fonctionnalités du package Les techniques utilisées pour l’intégration avec knitr Pratiquons : Créer une méthode d’impression tabulaire avec knitr et flextable pour les documents R Markdown – htmlwidgets : package ggiraph Les fonctionnalités du package Intégration dans le contexte shiny et dans le contexte R Markdown Implémentation du htmlwidget Pratiquons : Créer un simple htmlwidget Personnalisation des documents R Markdown Le triptyque CSS/JavaScript/HTML Exemples de thèmes xaringan, pagedown, blogdown Pratiquons : personnalisation d’un thème pagedown et d’un thème xaringan (https://github.
Christophe Botella nous a preparé un atelier pratique présentant le deep learning et comment le mettre en application avec le package R-Mxnet. _ Le code de l’atelier Et la présentation
Pierre et Benjamin nous ont préparé ‘quelque chose sur Shiny’: La présentation
Au cours d’une séance découverte un peu spécial, donnée lors de l’assemblée générale du département de mathématique et informatique de l’INRA, Mahendra nous a fait découvrir les potentialités de {plotly,ggplotly,crosscall}
Matthieu et Éric nous propose une séance sur {rSTAN}, l’interface R à la bibliothèque C++ Stan. Il s’agit d’algorithme inférence b yésienne utilisant une variante du Monte-Carlo Hamiltonien. On peut aussi faire de l’inférence fréquentiste par optimisation.
Dans la continuité de ce qui a été fait à Beg-meil](https://stateofther.github.io/finistR2018/atelier3_package_creation.html), je vous propose un tour d’horizon des bonnes pratiques et de l’ensemble des outils disponibles pour réaliser le développement d’un package R.
Séance dédiée à la préparation des satRday du lendemain: https://paris2019.satrdays.org Avec tous les bénévoles du groupe !
R package {bigstatsr} provides a special class of matrix whose data is stored on the disk instead of the RAM, but you can still access the data almost as if it were in memory.
Marco et Vincent vous proposent de prendre un peu de temps pour apprendre à se servir du package exams (disponible sur le CRAN) pour générer automatiquement des examens (QCM ou autres), corriger automatiquement ces examens, gérer un ensemble d’exercices collectivement, mettre en place une plateforme de e-learning.
Antoine, notre fanatique du tidyverse, nous propose de jeter un coup d’oeil à broom et rsample, des packages de tidymodels, pour travailler proprement (aka en format tibble) avec les sorties S3 des méthodes statistiques comme lm ou kmeans et faciliter l’utilisation des méthodes de rééchantillonage.
Un duo de choc, Raphaëlle et Marie, pour une séance dense sur laquelle était posée l’ombre du data imaginist – et vive Harry Potter. L’intégrale des slides
Les trois mousquetaires Timothée, Mathieu et Félix (a.k.a riri fifi loulou) proposent une séances complète d’introduction à Rcpp accompagné de travaux pratiques. Les documents de la séances: Introduction Rappel d’architecture machine Rappel en C++ RcppArmadillo Fonctions Astuces Pour compléter, voir la page du bootcamp finistR2018 dédiée aux modules Rcpp.
Séverine et Tristan nous proposent une introduction à quelques outils permettant de manipuler (en particulier charger) de “grosses” tables de données sous R. bigmemory for loading large matrices bigalgebra provides BLAS and LAPACK linear algebra sparklyr for interfacing R with Spark Apache Les documents de la séances
Sophie et Christophe nous proposent une séance complète sur le deep-learning et l’interfaçage existant sous R: Une brève histoire du Deep-Learning Une introduction au Deep-Learning sous R travaux pratiques
Antoine nous propose une introduction dense et déjà avancée en passant en revue l’ensemble du tidyverse Les slides Xaringan de Antoine
Éric nous présente les suites de l’introdution de Jessica aux très nombreux outils disponibles pour les statistiques spatiales sous R, notamment autour des packages sf et sp. slides et exercices, partie 1 slides et exercices, partie 2
Mahendra nous propose un retour d’expérience et quelques exercices sur le package DT pour la manipulation interactive de table. Les slides de Mahendra
Dans le même esprit que les ateliers mensuels, les bootcamp Finist’R (c) sont des ateliers d’une semaine que nous avons organisés en 2017 et 2018 à Roscoff et à Beg-Meil.
Les participants à State of the R sont issus de la recherche académique en statistique et dans des disciplines connexes (machine learning, optimisation, analyse numérique). Nous concourons dans notre quotidien au développement de nouvelles méthodes d’analyse de données, en nous appuyant sur des outils informatiques et de data science issus de la communauté de recherche académique et des grands acteurs du numériques. Notre position de chercheur(es) en statistique nous impose une veille constante sur les innovations et l’évolution permanente des outils offerts par la communauté (R
, Python
, Julia
, TensorFlow
, calcul GPU, etc.).
Dans ce contexte, R
/Rstudio
sont nos références car nous pensons qu’ils sont des outils d’interface extraordinaires permettant d’intégrer toutes les phases de l’analyse (collecte, prétraitement, ajustement des modèles et calcul, écriture scientifique, diffusion des résultats) en communiquant facilement avec les nombreux outils et langages informatiques spécialisés pour chacune de ces phases: R
/Rstudio
sont donc parfaitement adaptés à la recherche, à l’enseignement, au développement et à la diffusion des connaissance.
Fort de ce constat, le groupe State of the R a vu le jour fin août 2017 au cours d’un atelier “bootcamp” d’une semaine à Roscoff réunissant une dizaine de personnes. Sa liste de diffusion comporte désormais une quarantaine d’inscrits. Le groupe réunit des utilisateurs quotidiens du logiciel R
/Rstudio
, dans la perspective de partager et d’approfondir les savoir-faire, d’échanger autour des dernières innovations et d’en favoriser la diffusion. Son objectif majeur est de définir un espace qui permette d’adopter un vocabulaire commun, des pratiques de programmation performantes et des modes de représentation standardisées pour une meilleure généricité des outils statistiques développés par notre communauté.