workshop

Organisation des premières satRday française à Paris du 23 février

Séance dédiée à la préparation des satRday du lendemain: https://paris2019.satrdays.org Avec tous les bénévoles du groupe !

Efficient analysis of large-scale matrices with two R packages: bigstatsr and bigsnpr

R package {bigstatsr} provides a special class of matrix whose data is stored on the disk instead of the RAM, but you can still access the data almost as if it were in memory. It is particularly useful is you have a large matrix to analyze but not enough RAM on your computer. It can still be useful for matrices that fit in your RAM because package {bigstatsr} provides very efficient and parallelized algorithms (have you ever found cor or svd too slow?

Pimp my exam

Marco et Vincent vous proposent de prendre un peu de temps pour apprendre à se servir du package exams (disponible sur le CRAN) pour générer automatiquement des examens (QCM ou autres), corriger automatiquement ces examens, gérer un ensemble d’exercices collectivement, mettre en place une plateforme de e-learning. Gros programme mais un joli cadeau de Noël, puisque tout se fait en quelques lignes de code R ! L’intégrale des slides

Modeling in the Tidyverse and applications to metagenomics data

Antoine, notre fanatique du tidyverse, nous propose de jeter un coup d’oeil à broom et rsample, des packages de tidymodels, pour travailler proprement (aka en format tibble) avec les sorties S3 des méthodes statistiques comme lm ou kmeans et faciliter l’utilisation des méthodes de rééchantillonage. L’intégrale des slides

Fancy plotting with ggraph, gganimate

Un duo de choc, Raphaëlle et Marie, pour une séance dense sur laquelle était posée l’ombre du data imaginist – et vive Harry Potter. L’intégrale des slides

Bases en Rcpp

Les trois mousquetaires Timothée, Mathieu et Félix (a.k.a riri fifi loulou) proposent une séances complète d’introduction à Rcpp accompagné de travaux pratiques. Les documents de la séances: Introduction Rappel d’architecture machine Rappel en C++ RcppArmadillo Fonctions Astuces Pour compléter, voir la page du bootcamp finistR2018 dédiée aux modules Rcpp.

Manipulation de (quasi) big data en R

Séverine et Tristan nous proposent une introduction à quelques outils permettant de manipuler (en particulier charger) de “grosses” tables de données sous R. bigmemory for loading large matrices bigalgebra provides BLAS and LAPACK linear algebra sparklyr for interfacing R with Spark Apache Les documents de la séances Présentation des enjeux, slides travaux pratiques (PDF), source Markdown code source: R base vs bigxx code source: R base vs sparklyr

Introduction au Deep Learning sous R

Sophie et Christophe nous proposent une séance complète sur le deep-learning et l’interfaçage existant sous R: Une brève histoire du Deep-Learning Une introduction au Deep-Learning sous R travaux pratiques

Une introduction au tidyverse

Antoine nous propose une introduction dense et déjà avancée en passant en revue l’ensemble du tidyverse Les slides Xaringan de Antoine

Introduction au Spatial sous R

Éric nous présente les suites de l’introdution de Jessica aux très nombreux outils disponibles pour les statistiques spatiales sous R, notamment autour des packages sf et sp. slides et exercices, partie 1 slides et exercices, partie 2