Cours EPHE

Apprentissage du logiciel R

Formations professionnelles courtes
Certificat
Sciences, technologie, santé
Outils et méthodes communes
photo-de-villemereuil
Pierre
de VILLEMEREUIL
Sciences de la Vie et de la Terre

L’EPHE − PSL propose une formation pratique à l’utilisation du logiciel libre R pour la gestion et la manipulation des données avant l’analyse statistique (non traitée dans cette formation).

Le contenu de cette formation vise à obtenir les bons réflexes pour gérer, importer, visualiser et formater ses données, quel que soit le traitement statistique envisagé.

Les données sont centrales à toute approche scientifique, et peuvent représenter véritable un casse-tête à organiser, traiter ou visualiser. Ces tâches peuvent s’avérer très laborieuses à effectuer sur un logiciel type « tableur ».  La formation « Apprentissage du logiciel R » permet l'acquisition de compétences pour une approche efficace de la gestion des données grâce à l’utilisation du logiciel R à travers 4 modules de 2 jours allant de l’apprentissage des bases à la maîtrise des différents outils proposés par R pour automatiser les tâches rébarbatives. Chaque module peut être pris indépendamment pour une formation à la carte.

Infographie des modules de la formation logiciel R

 

Les plus de la formation ?

Un apprentissage en petits effectifs, sur des projets concrets et personnalisés permettant aux apprenants de gagner en autonomie, efficacité et professionnalisme.

Pourquoi cette formation ?

Le logiciel libre R est un logiciel extrêmement utilisé pour l’analyse statistique des données. Cependant, avant tout type d’analyses statistiques, il est important d’importer correctement les données sous R, en visualiser le contenu et les transformer dans un format adéquat. Ces étapes, souvent peu abordées dans les formations dédiées aux statistiques par manque de temps, sont pourtant cruciales à deux titres. Premièrement, en fonction de la complexité du jeu de données originel, elles peuvent constituer l’essentiel du temps total consacré au traitement des données. La connaissance des bons outils peut transformer un travail laborieux de plusieurs heures en une tâche de quelques dizaines de minutes. Deuxièmement, l’utilisation d’outils « clique-bouton » (type tableur Excel) lors de ces étapes entraîne un fort risque d’introduction d’erreurs humaines et d’une difficulté à reproduire à nouveau le même travail simplement. Les outils que propose le langage R permettent d’optimiser, d’automatiser, de rendre reproductible et facilement communicable toutes ces étapes cruciales, mais ils sont trop peu souvent enseignés.

Pour qui est cette formation ?

La formation est ouverte à toutes les disciplines de la biologie : du domaine de la santé à celui des sciences de l’environnement. Elle s’adresse à toute personne (technicien, ingénieur, gestionnaire, chercheur) voulant monter en compétence sur la manipulation de données, transformant des heures de manipulations « clique-bouton » rébarbatives sur un tableur en quelques secondes d’exécution sur R.

Note importante sur l’analyse statistique

Cette formation se concentre sur le travail de nettoyage, mise en forme, visualisation des données à l’aide du logiciel R et ne porte pas sur leur analyse statistique en soi. Pour une formation sur l’analyse statistique des données, voir le certificat pour l’analyse de données pour l’écologie et la gestion de la biodiversité, ou l’UE d’analyse statistique des données.