State of The R

Groupe de chercheurs et d’ingénieurs se réunissant pour approfondir leur savoir-faire, perfectionner la diffusion de leurs méthodes statistiques et échanger autour des dernières innovations de R et Rstudio. en savoir plus

groupe github slack

Organisation

Fonctionnement des ateliers participatifs

Le groupe se réunit à AgroParisTech au cours d’ateliers mensuels de 3 heures autour d’un thème prédéfini. Chaque atelier est animé par quelques membres (généralement deux ou trois) qui se chargent de présenter les enjeux du thème, fournir le bagage méthodologique nécessaire, et proposer des travaux pratiques.

Nous pensons qu’il est important que l’ensemble des participants s’investissent dans l’animation pour préserver l’esprit des ateliers. Les places sont donc limitées à une trentaine par séance.

Voir les ateliers passés

Devenir membre

Pour participer à ces ateliers, un aspirant membre peut assister à une séance pour jauger la teneur des séances et évaluer le niveau des participants. Il s’engage ensuite à animer une séance en proposant un atelier.

participer ?

Animation

La gestion du groupe (site web, liste de diffusion, bootcamp, recherche de financement, organisation des séances) est assurée par Julie Aubert, Julien Chiquet et Marie-Pierre Étienne. Vous pouvez nous contacter à l’adresse stateofr@gmail.com.

Ateliers à venir

La plupart des ateliers ont lieu dans la salle ACTIA à AgroParisTech.

R package {bigstatsr} provides a special class of matrix whose data is stored on the disk instead of the RAM, but you can still access the data almost as if it were in memory. It is particularly useful is you have a large matrix to analyze but not enough RAM on your computer. It can still be useful for matrices that fit in your RAM because package {bigstatsr} provides very efficient and parallelized algorithms (have you ever found cor or svd too slow?). I will present the statistical and helper functions that are provided by package {bigstatsr} for this kind of matrices. R package {bigsnpr}, on top of {bigstatsr}, provides some tools that are specific to the analysis of genetic data. We’ll see what I can predict from your DNA using these two packages.

Pour cette prochaine séance, Marco et Vincent vous proposent de prendre un peu de temps pour apprendre à se servir du package exams (disponible sur le CRAN) pour générer automatiquement des examens (QCM ou autres), corriger automatiquement ces examens, gérer un ensemble d’exercices collectivement, mettre en place une plateforme de e-learning. Gros programme mais un joli cadeau de Noël, puisque tout se fait en quelques lignes de code R !

Ateliers passés

More Posts

Antoine, notre fanatique du tidyverse, nous propose de jeter un coup d’oeil à broom et rsample, des packages de tidymodels, pour travailler proprement (aka en format tibble) avec les sorties S3 des méthodes statistiques comme lm ou kmeans et faciliter l’utilisation des méthodes de rééchantillonage.

CONTINUE READING

Un duo de choc, Raphaëlle et Marie, pour une séance dense sur laquelle était posée l’ombre du data imaginist – et vive Harry Potter.

CONTINUE READING

Les trois mousquetaires Timothée, Mathieu et Félix (a.k.a riri fifi loulou) proposent une séances complète d’introduction à Rcpp accompagné de travaux pratiques.

Les documents de la séances:

Pour compléter, voir la page du bootcamp finistR2018 dédiée aux modules Rcpp.

CONTINUE READING

Séverine et Tristan nous proposent une introduction à quelques outils permettant de manipuler (en particulier charger) de “grosses” tables de données sous R.

  • bigmemory for loading large matrices
  • bigalgebra provides BLAS and LAPACK linear algebra
  • sparklyr for interfacing R with Spark Apache

Les documents de la séances

CONTINUE READING

Sophie et Christophe nous proposent une séance complète sur le deep-learning et l’interfaçage existant sous R:

CONTINUE READING

Antoine nous propose une introduction dense et déjà avancée en passant en revue l’ensemble du tidyverse

CONTINUE READING

Éric nous présente les suites de l’introdution de Jessica aux très nombreux outils disponibles pour les statistiques spatiales sous R, notamment autour des packages sf et sp.

CONTINUE READING

Mahendra nous propose un retour d’expérience et quelques exercices sur le package DT pour la manipulation interactive de table.

CONTINUE READING

L’atelier du jour avait pour objectif la découvert du package data.table au travers d’exercises proposés lors de la dernière édition de UseR. Les slides avec les énoncés sont disponibles ici. L’apport de notre atelier est d’avoir systématiquement essayé de traiter les questions avec - les fonctionalités R de base - les fonctionalités offertes par le tidyverse (principalement dplyr) - les fonctionnalités du package data.table Pour les animateurs : vous êtes libre de compléter le post de blog.

CONTINUE READING

Bootcamp

Dans le même esprit que les ateliers mensuels, les bootcamp Finist’R © sont des ateliers d’une semaine que nous avons organisés en 2017 et 2018 à Roscoff et à Beg-Meil.

FinistR'18

Page web résumant les activités de la semaine d’ateliers à Beg Meil 2018

FinistR'17

Mini poly bookdown résumant les activités de la semaine d’ateliers à Roscoff 2017